Методы классификации и кластеризации
-
Интерактивные
-
Поиск сгущений
-
К-средних
-
-
Иерархические
-
Агломеративные
-
Одиночные связи
-
Полные связи
-
Средней
-
Метод Уорда
-
-
Дивизимные
-
Кластерный анализ (КлА) - это статистический метод, применяемый для выявления групп подобных объектов (кластеров)
Машинное обучение
-
Без учителя
(unsupervised learning)
- в задачах кластеризации -
С учителем
(supervised learning)
- в задачах классификации- от задачи
(предсказание следующего значения)
- от задачи
-
Частичное привлечение учителя
(semi-supervised learning) -
С подкреплением
(reinforcement learning)
Машинное зрение
(computer vision, CV)
-
Выделение сущностей определенных классов в изображении
-
Распознавание людей по их лицам
-
Медицинская диагностика
-
Автоматическое вождение автомобиля
-
Воздушная разведка
-
Автоматическая генерация изображений
Обработка естественного языка
(natural language processing, NLP)
-
Распознавание речи
-
Синтез речи
-
Автоматическая генерация текста
-
Выделение заданных сущностей из текста
-
Поиск ответов на вопросы
-
Анализ тональности текста
-
Машинный перевод с одного языка на другой
Основные этапы КлА
-
отбор выборки для кластеризации
-
определение множества переменных,
по которым будут оцениваться объекты в выборке -
вычисление той или иной меры сходства между объектами (метрики)
-
обычное евклидово расстояние
-
взвешенное евклидово расстояние
-
манхеттенское расстояние (городских кварталов)
-
расстояние Минковского
-
расстояние Махаланобиса
-
-
применение метода КлА для создания групп сходных объектов
-
проверка достоверности результатов кластерного решения