Loading...

Методы классификации и кластеризации

  • Интерактивные

    • Поиск сгущений

    • К-средних

  • Иерархические

    • Агломеративные

      • Одиночные связи

      • Полные связи

      • Средней

      • Метод Уорда

    • Дивизимные

Кластерный анализ (КлА) - это статистический метод, применяемый для выявления групп подобных объектов (кластеров)

Машинное обучение

  • Без учителя
    (unsupervised learning)

    - в задачах кластеризации

  • С учителем
    (supervised learning)

    - в задачах классификации

    • от задачи
      (предсказание следующего значения)
  • Частичное привлечение учителя
    (semi-supervised learning)

  • С подкреплением
    (reinforcement learning)

Машинное зрение
(computer vision, CV)

  • Выделение сущностей определенных классов в изображении

  • Распознавание людей по их лицам 

  • Медицинская диагностика

  • Автоматическое вождение автомобиля

  • Воздушная разведка

  • Автоматическая генерация изображений

Обработка естественного языка
(natural language processing, NLP)

  • Распознавание речи

  • Синтез речи

  • Автоматическая генерация текста

  • Выделение заданных сущностей из текста

  • Поиск ответов на вопросы

  • Анализ тональности текста

  • Машинный перевод с одного языка на другой

Основные этапы КлА

  • отбор выборки для кластеризации

  • определение множества переменных,
    по которым будут оцениваться объекты в выборке

  • вычисление той или иной меры сходства между объектами (метрики)

    • обычное евклидово расстояние

    • взвешенное евклидово расстояние

    • манхеттенское расстояние (городских кварталов)

    • расстояние Минковского

    • расстояние Махаланобиса

  • применение метода КлА для создания групп сходных объектов

  • проверка достоверности результатов кластерного решения