СТАТИСТИЧНИЙ АНАЛІЗ КОЛІРНИХ ПРОФІЛІВ ЦИФРОВИХ ЗОБРАЖЕНЬ ТА ЇХ КЛАСТЕРИЗАЦІЯ МЕТОДОМ K-СЕРЕДНІХ
##plugins.themes.bootstrap3.article.main##
Анотація
У статті розглянуто методи статистичного аналізу цифрових зображень з метою
виявлення характерних колірних ознак та їх автоматизованого групування. Предметом
дослідження є колірні профілі цифрових зображень у просторах RGB та HSV, а також їх
кластеризація за допомогою алгоритму k-середніх. Цифрове зображення формалізовано як
статистичну вибірку у вигляді множини піксельних векторів, над якою виконуються операції
обчислення основних числових характеристик: середнього значення, дисперсії, стандартного
відхилення та моди для кожного з колірних каналів. Для побудови колірних профілів зображень
використано гістограми яскравості та кольору, а для порівняння розподілів застосовано
евклідову метрику подібності.
Алгоритм k-середніх реалізовано як метод некерованої кластеризації, що ітеративно
мінімізує суму квадратів відстаней між колірними профілями зображень і центроїдами
кластерів. Оптимальна кількість кластерів визначається за допомогою методу Elbow (аналіз
SSE) та коефіцієнта Silhouette Score. Для оцінки статистичної значущості відмінностей між
кластерами застосовано дисперсійний аналіз (ANOVA).
Програмна реалізація виконана мовою Python з використанням бібліотек OpenCV,
NumPy, scikit-learn, Matplotlib, Pandas та Tkinter. Проведено експериментальне дослідження на
наборі з десяти тестових зображень різних категорій. Порівняльний аналіз результатів у
просторах RGB та HSV показав, що колірний простір HSV забезпечує вищу якість
кластеризації та більш змістовну інтерпретацію статистичних характеристик, оскільки
краще відповідає особливостям людського зорового сприйняття. Практичне значення
результатів полягає у можливості застосування розробленої методики для автоматизованого
сортування та класифікації фотографій, систем комп'ютерного зору, медичної діагностики
та аналізу супутникових знімків.
##plugins.themes.bootstrap3.article.details##

Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.
Посилання
Kolomiiets, A. S., & Marchenko, O. H. (2015). Osnovy klasternoho analizu ta yoho zastosuvannia. Kyiv:
National University.
Kovalenko, I. V. (2017). Analiz metodiv klasteryzatsii u systemakh obrobky danykh [Analysis of clustering
methods in data processing systems]. Journal of Modern Information Technologies, 3(5), 75–81.
Skliar, V. M. (2020). Metody klasternoho analizu u mashynnomu navchanni [Methods of cluster analysis in
machine learning]. Mathematical Research, 1(4), 112–119.
Tsymbal, A. (2002). Vstup do klasternoho analizu: osnovni pidkhody ta metody [Introduction to cluster
analysis: basic approaches and methods]. Kharkiv: Naukova Dumka.
Vlasenko, O. A. (2016). Metryky dlia klasternoho analizu danykh: teoretychni osnovy ta praktychni aspekty
[Metrics for cluster data analysis: theoretical foundations and practical aspects]. Kyiv: KNEU Publishing
House.
Demchenko, O. B. (2018). Klasteryzatsiia yak metod obrobky danykh u suchasnykh doslidzhenniakh
[Clustering as a method of data processing in modern research]. Information Systems and Technologies,
(8), 50–57.
Shvets, K. V. (2024). Doslidzhennia modelei evoliutsii klasteriv v zadachakh rozpiznavannia obraziv [Study
of cluster evolution models in pattern recognition tasks]. Retrieved October 30, 2024, from
https://openarchive.nure.ua/server/api/core/bitstreams/4b7cf3f6-1df4-4f0f-b180-4beb0ca94454/content
Jain, A. K. (2010). Data clustering: 50 years beyond k-means. Pattern Recognition Letters, 31(8), 651–666.
Marchenko, O. O., & Rossada, T. V. (2017). Aktualni problemy Data Mining [Current problems of Data
Mining]. Kyiv.
Dudko, O. V., & Poliakov, S. V. (2018). Osnovy klasternoho analizu: metody ta alhorytmy [Fundamentals
of cluster analysis: methods and algorithms]. Scientific Notes of NaUKMA. Computer Science, 1, 23–32.
Demianchuk, I. S. (2019). Klasteryzatsiia danykh: ohliad suchasnykh metodiv ta pidkhodiv [Data clustering:
review of modern methods and approaches]. Bulletin of Taras Shevchenko National University of Kyiv, 4,
–56.
Taranenko, A. I. (2020). Metryky u zadachakh klasteryzatsii: ohliad ta rekomendatsii [Metrics in clustering
problems: review and recommendations]. Problems of Applied Mathematics and Informatics, 2, 5–15.
Honcharenko, S. U., & Zlepko, S. M. (2015). Kompiuterne rozpiznavannia obraziv [Computer pattern
recognition]. Vinnytsia: VNTU.
Pankratova, N. D., & Yashyn, S. N. (2006). Kolirnyi analiz zobrazhen u kompiuternykh systemakh obrobky
informatsii [Color image analysis in computer information processing systems]. Kyiv: Naukova Dumka.