Официальный интернет-магазин
Издательского Дома «Финансы и Кредит»
Телефон: +7 (925) 966-46-90
Адрес: 111397, г. Москва, ул. Зеленый проспект, д. 20
Электронная почта: shop@fin-izdat.ru
Статья опубликована в журнале: Финансовая аналитика: проблемы и решения, 2024, Т. 17, № 1, С. 37 – 55
Автор(ы): Граница Ю.В.
Рубрика: Математический анализ и моделирование в экономике
Аннотация
Предмет. Отбор детерминант, значимых для оценки уровня социально-экономического положения и потенциала развития регионов России.
Цели. Исследование алгоритмов машинного обучения для отбора детерминант – предикторов уровня социально-экономического положения и потенциала развития регионов России. Построение моделей классификации регионов по уровню социально-экономического положения с применением различных алгоритмов машинного обучения.
Методология. Для построения моделей классификации использованы данные Федеральной службы государственной статистики, Института научных коммуникаций, информационного агентства РИА Новости и интернет-портала TAdviser. Процедуры классификации данных, оценки параметров модели, отбора значимых детерминант и визуализации результатов выполнены с применением основных функций библиотеки PyCaret. В качестве приоритетных метрик оценки продуктивности моделей использованы статистика Каппа Коэна и коэффициент корреляции Мэтьюса. Алгоритмы отбора детерминант реализованы в аналитической среде Google Colab.
Результаты. Построены модели многоклассовой классификации, основанные на простых и ансамблевых алгоритмах машинного обучения. Простые алгоритмы классификации, включающие модели логистической и ридж-регрессии, наивный байесовский алгоритм, дерево решений, методы опорных векторов и k-ближайших соседей, характеризуются значениями точности на уровне 77%, однако статистика Каппа Коэна и коэффициент корреляции Мэтьюса свидетельствуют только лишь об удовлетворительной связи между фактическим и прогнозным значением класса региона. Ансамблевые алгоритмы в числе которых случайныйлес, градиентный бустинг и экстремальный градиентный бустинг характеризуются тесной связью между фактической и прогнозной оценками классификатора на уровне более 70%.
Выводы. Наиболее эффективной моделью классификации признан алгоритм случайного леса. Информативными детерминантами для определения уровня социально-экономического положения являются валовой региональный продукт, инвестиции в основной капитал.
Ключевые слова: регион, социально-экономическое положение, потенциал, классификация, ансамблевый алгоритм
Тип публикации: | Статья |
Формат: | |
Журнал: | Финансовая аналитика: проблемы и решения |
Год публикации: | 2024 |
Месяц публикации: | февраль |