Page 55 - Microsoft Word - Дисертація.docx
P. 55

55

                  значень  (центрами  кластерів).  В  процесі  розбиття  виконується


                  ітеративна мінімізація внутрішньокластерних відстаней. Обчислювальна

                  складність алгоритму k-середніх поліноміальна, але йому властивий ряд

                  недоліків.  Незважаючи  на  доведену  в  [58]  збіжність  ітераційного

                  процесу,  він  не  гарантує  знаходження  глобального  мінімуму  цільової

                  функції  (оптимального  розбиття).  Тому  для  отримання  хорошого


                  розбиття  необхідно  вибрати  осмислені  початкові  центри  кластерів.

                  Існують  ефективні  методи  вибору  стартових  центрів  кластерів,  що

                  гарантують        отримання        якісних      результатів       кластеризації,       але

                  універсального  ефективного  методу  знаходження  оптимальних  центрів


                  кластерів,  котрий  залежить  від  структури  даних  і  специфіки

                  розв'язуваної задачі, не може існувати навіть теоретично [59]. Крім того,

                  алгоритм k-середніх не здатний виділяти кластери різної структури. Для

                  усунення цього недоліку в роботі [60] пропонується розбивати вихідну


                  вибірку  на  сферичні  кластери,  які  згодом  використовуються  для

                  побудови  результуючого  розбиття.  Ще  одним  серйозним  недоліком

                  алгоритму  k-середніх  є  необхідність  задання  числа  кластерів,  яке  на

                  практиці  найчастіше  невідомо  і  не  існує  ефективних  методів  його

                  знаходження,  а  використовують  евристичні  методів  оцінювання  їх


                  кількості [54].

                         Загальним недоліком цього виду методів є відносно великі часові

                  затрати  при  розділенні  на  більшу  за  два  кількість  кластерів  та

                  суб’єктивна  оцінка  самої  кількості  кластерів.  Тому  основні  зусилля  у

                  дослідженнях таких методів направлені на зменшення часових затрат та


                  виборі оптимальної кількості кластерів.

                         Наведені вище групи методів визначення порогу ще поділяють на

                  два  великі  класи:  глобальні  методи  та  локальні  методи  [47].  Глобальні

                  методи  визначають  єдиний  поріг  для  всього  зображення  на  основі
   50   51   52   53   54   55   56   57   58   59   60