Один и тот же вопрос можно задать десятком способов. Например, для пользователей запросы "как узнать адрес по номеру телефона", "поиск адреса по номеру телефона" и "найти адрес по номеру телефона" имеют одинаковый смысл, это запросы-синонимы.
Запросы-синонимы появляются по разным причинам:
- при использовании общепринятых сокращений – "погода в Санкт-Петербурге" и "погода в Спб";
- использовании транслитераций – "характеристики toyota camry" и "характеристики тойота камри";
- использовании разных падежей – "сценарий встречи Нового Года" и "сценарий встреча Новый Год";
- использовании перестановок слов – "ремонт АКПП", "АКПП ремонт";
- использовании жаргонизмов – "скачать мультфильмы", "скачать мультики";
- использовании слов, не несущих смысловой нагрузки – "быстрый интернет", "супер быстрый интернет";
- использовании синонимов слов, входящих в запрос – "грустные стихи", "печальные стихи".
Поисковые системы в ответ на запрос должны подобрать наилучший набор ссылок. И, конечно, чаще всего в результатах поиска люди ожидают увидеть информацию, соответствующую смыслу, а не букве запроса. Из этого следует, что выдача в ответ на синонимичные запросы должна быть одинаковой, несмотря на то, что формулировки отличаются друг от друга.
Анализатор поиска по запросам-синонимам проверяет, насколько совпадает выдача по разным запросам, имеющим одинаковое значение. Образно можно сказать, что анализатор в какой-то мере показывает способность поисковика "понимать" смысл запроса. В информере поисковые системы отсортированы по убыванию этого показателя.
Все примеры, используемые в данном анализаторе, реальные, они получены с помощью сервиса статистики поисковых запросов "Рамблера" (
http://adstat.rambler.ru/wrds/)
Отметим, что мы не рассматриваем здесь варианты запросов с ошибками и опечатками.