Mail.ruПочтаМой МирОдноклассникиВКонтактеИгрыЗнакомстваНовостиКалендарьОблакоЗаметкиВсе проекты

Подсажите решение задачи, пожалуйста!

Eric Agenov Гуру (4361), закрыт 16 лет назад
У меня есть данные в текстовом виде: id_пользователя и его web-запрос.
Цель:
Выделить группы пользователей с близкими интересами на основе анализа их запросов к поисковым системам.

Для решения задачи можно использовать кластерный анализ. Данных порядка 60 000 и они не числовые, а символьные.
Как решить задачу? Кто-нибудь может посоветовать?
Лучший ответ
Ангидрид Сернистый Мудрец (18322) 16 лет назад
Для каждой пары пользователей посчитать число одинаковых (похожих) запросов (или, лучше, отношение похожих запросов к общему числу их запросов) . Если это число больше некоторого значения, считать, что эти пользователи "связаны". Дальше можно рассматривать все это как граф. Есть алгоритм выделения компонент связности, сильно связных подграфов и т. п. см. Роберт Седжвик - Фундаментальные алгоритмы на С++.
Остальные ответы
igor volkov Ученик (122) 16 лет назад
Так используй кластерный анализ - чего тебе не хватает?? ?

Алгоритмы выделения компонент связности и сильно связных подграфов - это теория Графов а не кластерный анализ - хотя и это работает!

Не важно каким МЕЧОМ разрубать Гордиев узел ВАЖНО его разрубить!!!
Похожие вопросы