АНАЛІЗ АЛГОРИТМІВ МАШИННОГО НАВЧАННЯ ДЛЯ ЗАДАЧІ БІНАРНОЇ КЛАСИФІКАЦІЇ

Main Article Content

Олександр Варфоломійович ПІСКУН

Abstract

У роботі був проведений аналіз існуючих найбільш поширених методів класифікації на предмет їх використання в задачі діагностики серцевих захворювань. Розглянуто основні метрики якості моделей бінарної класифікації, які можуть бути використані при ухваленні рішення про оптимальність розробленої моделі. Дослідження моделей проводились без і з оптимізацією параметрів. Оптимізація параметрів моделей проведена, використовуючи криві валідації з подальшим пошуком по сітці з крос-валідацією кожної комбінації параметрів. Найкращі результати показали методи DecisionTreeClassifier, GradientBoostingClassifier та GaussianNB.

Article Details

Section
Computer Science
Author Biography

Олександр Варфоломійович ПІСКУН, Черкаський національний університет імені Богдана Хмельницького

кандидат технічних наук, доцент, завідувач кафедри прикладної математики та інформатики

References

Do we Need Hundreds of Classifiers to Solve Real World Classification Problems? / M.F. Delgado, E. Cernadas, S. Barro, D. Amorim // Journal of Machine Learning Research. - 2014. - V. 15. - P. 3133-3181.

Лабинцев, Е. Метрики в задачах машинного обучения [Електронний ресурс] / Е. Лабинцев. – Режим доступу: https://habr.com/ru/company/ods/blog/328372/

Narkhede, S. Understanding Confusion Matrix [Електронний ресурс] / S. Narkhede. – Режим доступу: https://towardsdatascience.com/understanding-confusion-matrix-a9ad42dcfd62

Афанасьев, С. Gini & ROC & Precision-Recall: проблемы метрик в банковском моделировании [Електронний ресурс] / С. Афанасьев, А. Смирнова. – Режим доступу: http://futurebanking.ru/post/3761

Encyclopedia of Machine Learning / C. Sammut and G.I. Webb, Eds. - New York: Springer, 2011. - 892 р.

Statlog (Heart) Data Set [Електронний ресурс]. – Режим доступу: http://archive.ics.uci.edu/ml/datasets/ statlog+(heart).

Van der Maaten, L.J.P.. Visualizing High-Dimensional Data Using t-SNE / L.J.P. van der Maaten, G.E. Hinton // Journal of Machine Learning Research. – 2008. – № 9. – P. 2579 – 2605.

Supervised learning [Електронний ресурс]. – Режим доступу: https://scikit-learn.org/stable/supervised_learning.html

Піскун, О.В. Застосування методів машинного навчання для побудови моделі рішення задачі класифікації / О.В. Піскун // Вісник Черкаського університету. Серія: Прикладна математика. Інформатика. – 2019. - №1. – С. 41-52.