Качество кластеризации — степень приближения результата кластеризации к идеальному решению. Для большинства задач идеальное решение неизвестно.
Оценка качества кластеризации может быть произведена двумя способами:
- Формальный способ. Формальный способ основан на определении формальных критериев. Наилучшим считается решение, для которого значение формального критерия максимально.
- Экспертный способ. Решение оценивается специалстами заданной предметной области.
Основные этапы оценки качества кластеризации:
- Алгоритм кластеризации, построение модели данных.
- Вычесление критерия качества кластеризации. Критерии вычисляются на основе получившейся в ходе работы алгоритма кластеризации матрицы принадлежности и/или множества кластерных центров.
- Определение параметров настройки алгоритма.
Критерии качества:
- Показатели четкости: коэффициент разбиения, модифицированный коэффициент разбиения, индекс четкости.
- Энтропийные критерии: энтропия разбиения, модифицированная энтропия.
- Показатель компактности и изолированности
- Индекс эффективности