Официальный интернет-магазин
Издательского Дома «Финансы и Кредит»

Телефон: +7 (925) 966-46-90
Адрес: 111397, г. Москва, ул. Зеленый проспект, д. 20
Электронная почта: shop@fin-izdat.ru

Статья

Инструменты машинного обучения в задачах отбора детерминант социально-экономического положения и потенциала развития регионов России


Артикул: FA-01-2024-37
250 руб
  • Описание
  • Характеристики


Статья опубликована в журнале: Финансовая аналитика: проблемы и решения, 2024, Т. 17, № 1, С. 37 – 55

Автор(ы): Граница Ю.В.

Рубрика: Математический анализ и моделирование в экономике

Аннотация

Предмет. Отбор детерминант, значимых для оценки уровня социально-экономического положения и потенциала развития регионов России.

Цели. Исследование алгоритмов машинного обучения для отбора детерминант – предикторов уровня социально-экономического положения и потенциала развития регионов России. Построение моделей классификации регионов по уровню социально-экономического положения с применением различных алгоритмов машинного обучения.

Методология. Для построения моделей классификации использованы данные Федеральной службы государственной статистики, Института научных коммуникаций, информационного агентства РИА Новости и интернет-портала TAdviser. Процедуры классификации данных, оценки параметров модели, отбора значимых детерминант и визуализации результатов выполнены с применением основных функций библиотеки PyCaret. В качестве приоритетных метрик оценки продуктивности моделей использованы статистика Каппа Коэна и коэффициент корреляции Мэтьюса. Алгоритмы отбора детерминант реализованы в аналитической среде Google Colab.

Результаты. Построены модели многоклассовой классификации, основанные на простых и ансамблевых алгоритмах машинного обучения. Простые алгоритмы классификации, включающие модели логистической и ридж-регрессии, наивный байесовский алгоритм, дерево решений, методы опорных векторов и k-ближайших соседей, характеризуются значениями точности на уровне 77%, однако статистика Каппа Коэна и коэффициент корреляции Мэтьюса свидетельствуют только лишь об удовлетворительной связи между фактическим и прогнозным значением класса региона. Ансамблевые алгоритмы в числе которых случайныйлес, градиентный бустинг и экстремальный градиентный бустинг характеризуются тесной связью между фактической и прогнозной оценками классификатора на уровне более 70%.

Выводы. Наиболее эффективной моделью классификации признан алгоритм случайного леса. Информативными детерминантами для определения уровня социально-экономического положения являются валовой региональный продукт, инвестиции в основной капитал.

Ключевые слова: регион, социально-экономическое положение, потенциал, классификация, ансамблевый алгоритм

Тип публикации: Статья
Формат: PDF
Журнал: Финансовая аналитика: проблемы и решения
Год публикации: 2024
Месяц публикации: февраль

Главное меню

Каталог

Полезные ссылки

Цена
от
до
0 Корзина: 0 руб