Поиск: непохожие пути к похожим результатам. Часть 1
Ключевые слова
⚡ Как и обещали, начинаем интересный рассказ о методах поиска информации. Сегодня заглянем в прошлое и познакомимся с базой, на которой выросли современные подходы к поиску. Главные выводы — в карточках.
Самый первый и самый простой вид поиска — поиск по ключевым словам. В основе подхода — присвоение индексов всем словам во всех документах и выдача результата на основе простых алгоритмов сопоставления.
Минус подхода в том, что выдаются все найденные совпадения, вне зависимости от того, насколько они действительно подходят под запрос (привет омонимам!). При этом результаты с синонимичными выражениями, напротив, будут скрыты.
Ранжировать результаты и повысить релевантность в этом случае возможно за счет введения статистики слов, например, TF-IDF...
Узнать больше
#реклама 16+
О рекламодателе