сравнение текстов
Добавлено: 15 июн 2014, 11:01
Ребят, Яндекс на основе этой штуки года 3-4 назад так точно успешно удалял дупликаты в своих миллионных объемах. Мне кажется, что это о чем-то говорит.
При нормализации, можно сортировать слова внутри предложения.
Любопытно, но смущает чувствительность к перестановке слов.
При нормализации, можно сортировать слова внутри предложения.