01
декабря
2007

Простые методы эффективного поиска

Несколько лет назад, Яндекс анонсировал поиск по запросам, задаваемым на «человеческом» языке. По лексически несложным вопросам поисковый сервис начал выдавать вполне релевантные результаты. Особенно это стало заметно при поиске определений различных терминов (по крайней мере, по субъективным ощущениям). Изначально такая возможность мне показалась не более чем забавным дополнением к сервису, потому что сложно было представить, кто станет забивать в поисковик вопросы типа «Кто такой адмирал Иван Федорович Крузенштерн?», по какой-то иной причине, чем ради разлечения. Как оказалось, напрасно. Большая часть людей, которые ищут в интернете в первый раз (или в сто первый, но не хотят при этом заморачиваться «компьютерной херомантией»), формулируют запросы безумно неэффективно. И простой вопрос вроде «что такое…» или «где найти…» — еще не самый тяжелый случай.

Этот пост я решил написать для улучшения (в локальных масштабах) ситуации с пониманием основ техники поиска по вебу. Некоторое время назад я переводил статью с описанием расширенных возможностей поиска в Google (ее можно найти на paradigm.ru и на Хабре). Так вот, текущий текст — это сиквел-наоборот по отношению к той статье, расчитанный на более массовую аудиторию менее подготовленных пользователей. В большинстве случаев, любые предложения прочитать инструкцию, вместо того, чтобы приставать с вопросами, воспринимаются как личное оскорбление. Поэтому здесь я постараюсь доходчиво и сжато описать наиболее простые и при том значимые способы повышения эффективности поисковых запросов.

  • Первое, что необходимо, это умение грамотно сформулировать название искомого предмета. Под словом «грамотно» подразумевается максимально точно и однозначно. Без соблюдения этого условия поисковик скорее всего выдаст не то, что вы хотели. Например, если нужно найти инструкцию для телефона, бесммысленно формулировать вопрос в как «мне нужна инструкция для моего телефона, а то я свою где-то потерял и никак не могу найти». Эффективный запрос в таком случае должен содержать максимально точное название искомого премета: «иснтрукция Panasonic KX-TG8225».
  • Исключайте из запроса лишние слова, оставляя только значимые. Очень часто запросы формулируют в виде вопросительных предложений. Умные поисковики уже давно научились распознавать такие запросы, автоматически выделяя из них значимые слова. Например, задав Яндексу вопрос «Что такое дискурс?», на первой странице можно будет увидеть ссылки на соответствующие статьи в словарях и страницу Википедии.

    То же относится к любым другим несложным по структуре вопросам. Тем не менее, добавляя в запрос слова, не имеющие прямого отношения к предмету поиска, всегда увеличивается вероятность неправильной интерпретации такого запроса поисковой машиной, что приведет к снижению точности поиска.

  • Определяйте точное написание слов и фраз, когда необходимо найти конкретный текст. Часто возникает потребность отыскать не просто материалы на заданную тему, а конкретный текст по его фрагменту. Например, для идентификации книги по цитате из нее, или песню, которую только что услышал на радио и запомнил из нее только пару строк. В таких случаях, во-первых, нужно выбирать цитаты, которые заведомо редко встречаются в текстах. Во-вторых, нужно отключить поиск словоформ, заключив цитату в кавычки. Такой прием действует на всех распространенных поисковиках одинакого, сообщая сервису, что искать нужно конкретную фразу, а не набор заданных слов, последовательность и склонение которых может меняться.

    При необходимости, можно приводить сразу несколько цитат, заключив каждую в отдельные кавычки. Чем цитата длиннее и сложнее, тем релевантнее будут результаты поиска (прада слишком длинная цитата может не дать результата вообще, поэтому не стоит переусердствовать). Стоит еще отметить, что пунктуация в закавыченных запросах значения не имеет, и это удобно. Пример: по запросу «When we dance, angels will run and hide their wings» Яндекс и Гугл однозначно находят искомую песню.

  • Последовательность слов в запросе имеет значение. Если не требуется искать конкретные фразы, как в предыдущем случае, лучше всего выстраивать слова запроса в соответствии с их весомостью. То-есть в порядке значимости при идентификации искомых фрагментов текста, а не так, как этого требует грамматика.
  • Используйте поиск по конкретным сайтам. Часто бывает, что встроенной поисковой системой не получается найти нужный контент на каком-нибудь форуме или в блоге. В таком случае, вместо того чтобы опускать руки, можно воспользоваться сторонними сервисами. На всех развитых поисковиках есть возможнсоть уточнить поисковый запрос, задав конкретный сайт, на котором нужно искать. Поисковые скрипты, встраиваемые в различные CMS, часто не умеют работать со словоформами (особенно это касается неанглийских языков), поэтому использование внешних сервисов будет эффективнее. Кроме того, отчеты Яндекса и Гугла оформлены, как правило, удобнее и функциональнее, чем отчеты большинства встроенных систем поиска.
  • Если нет уверенности, что поисковик разбирается в морфологии, можно составлять запросы, используя только корни нужных слов, отбрасывая приставки и окончания. При этом нужно выбирать такие слова, «упрощенная» форма которых не будет совпадать с другими, неинтересующими вас словами. Эта рекомендация так же относится к встроенным поисковым системам.

Любые дополнения приветствуются в комментах.

Ссылки по теме:

Написать комментарий

Можно использовать следующие HTML теги: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong> .