Джагдиш Г
Кластеризация заключается в том, что задача деления популяции или точек данных на множество групп, такие точки данных в пределах одних и тех же групп больше похожи на другие точки данных в пределах одной группы, чем на точки данных в других группах. Проще говоря, цель состоит в том, чтобы разделить группы со схожими чертами и распределить их по кластерам. Это серьезная задача исследовательской обработки данных и стандартный метод статистического анализа данных, используемый во многих областях, включая распознавание образов, анализ изображений, поиск информации, биоинформатику, сжатие данных, специальные эффекты и машинное обучение.