stringtranslate.com

Веб-запрос

Веб -запрос или поисковый запрос в Интернете — это запрос, который пользователь вводит в поисковую систему в Интернете для удовлетворения своих информационных потребностей . Поисковые запросы в Интернете отличаются тем, что они часто представляют собой обычный текст, а логические поисковые директивы используются редко. Они сильно отличаются от стандартных языков запросов , которые регулируются строгими правилами синтаксиса как командные языки с ключевыми словами или позиционными параметрами .

Типы

Существует три основные категории, которые охватывают большинство поисковых запросов в Интернете: информационные, навигационные и транзакционные. [1] Их также называют «сделать, узнать, пойти». [2] Хотя эта модель поиска не была выведена теоретически, классификация была эмпирически подтверждена реальными поисковыми запросами. [3]

Поисковые системы часто поддерживают четвертый тип запросов, который используется гораздо реже:

Характеристики

Список поисковых предложений для поискового запроса

Большинство коммерческих поисковых систем не раскрывают свои журналы поиска, поэтому информацию о том, что пользователи ищут в Интернете, получить сложно. [5] Тем не менее, исследования начали появляться в 1998 году. [6] [7] Исследование 2001 года, [8] в котором анализировались запросы поисковой системы Excite , выявило некоторые интересные характеристики веб-поиска:

Исследование тех же журналов запросов Excite показало, что 19% запросов содержали географический термин (например, названия мест, почтовые индексы, географические объекты и т. д.) [9] .

Исследования также показывают, что, помимо коротких запросов (запросов с небольшим количеством терминов), существуют предсказуемые закономерности того, как пользователи изменяют свои запросы. [10]

Исследование журналов запросов Yahoo, проведенное в 2005 году, показало, что 33% запросов от одних и тех же пользователей были повторными запросами, и что в 87% случаев пользователь нажимал на тот же результат. [11] Это говорит о том, что многие пользователи используют повторные запросы для повторного посещения или повторного поиска информации. Этот анализ подтверждается записью в блоге поисковой системы Bing, в которой говорится, что около 30% запросов являются навигационными запросами. [12]

Кроме того, исследования показали, что распределение частот терминов запроса соответствует степенному закону или кривым распределения с длинным хвостом . То есть, небольшая часть терминов, наблюдаемых в большом журнале запросов (например, > 100 миллионов запросов), используется чаще всего, в то время как остальные термины используются реже по отдельности. [13] Этот пример принципа Парето (или правила 80–20 ) позволяет поисковым системам использовать методы оптимизации, такие как индексирование или разбиение базы данных , кэширование и предварительная выборка. Кроме того, были проведены исследования лингвистически-ориентированных атрибутов, которые могут распознавать, является ли веб-запрос навигационным, информационным или транзакционным. [14]

Исследование 2011 года показало, что средняя длина запросов неуклонно росла с течением времени, а средняя длина запросов на языках, отличных от английского, увеличилась больше, чем на языках, отличных от английского. [15] Google внедрила обновление «Колибри» в августе 2013 года для обработки более длинных поисковых запросов, поскольку большинство поисковых запросов являются разговорными (например, «где находится ближайшая кофейня?»). [16]

Структурированные запросы

С поисковыми системами, которые поддерживают булевы операторы и скобки, можно применить метод, традиционно используемый библиотекарями. Пользователь, который ищет документы, охватывающие несколько тем или аспектов, может захотеть описать каждый из них дизъюнкцией характерных слов, таких как vehicles OR cars OR automobiles. Фасетный запрос представляет собой конъюнкцию таких аспектов; например, такой запрос, как , (electronic OR computerized OR DRE) AND (voting OR elections OR election OR balloting OR electoral)скорее всего, найдет документы об электронном голосовании, даже если в них пропущено одно из слов «электронный» или «голосование», или даже оба. [17]

Смотрите также

Ссылки

  1. ^ Бродер, А. (2002). Таксономия веб-поиска. Форум SIGIR, 36(2), 3–10.
  2. ^ Гиббонс, Кевин (2013-01-11). «Делай, знай, иди: как создавать контент на каждом этапе цикла покупки». Search Engine Watch . Получено 24 мая 2014 г.
  3. ^ Янсен, Б. Дж., Бут, Д. и Спинк, А. (2008) Определение информационного, навигационного и транзакционного назначения веб-запросов, Обработка и управление информацией. 44(3), 1251-1266.
  4. ^ Мур, Росс. "Серверы подключений". Cambridge University Press . Получено 24 мая 2014 г.
  5. Дон Кавамото и Элинор Миллс (2006), AOL приносит извинения за публикацию данных поиска пользователей
  6. ^ Янсен, Б. Дж., Спинк, А., Бейтман, Дж. и Сарацевич, Т. 1998. Реальный поиск информации: исследование пользовательских запросов в Интернете. Форум SIGIR, 32(1), 5-17.
  7. ^ Silverstein, C., Henzinger, M., Marais, H., & Moricz, M. (1999). Анализ очень большого журнала запросов поисковой системы в Интернете. SIGIR Forum, 33(1), 6–12.
  8. ^ Аманда Спинк; Дитмар Вольфрам; Майор Б. Дж. Янсен; Тефко Сарацевич (2001). «Поиск в Интернете: общественность и ее запросы» (PDF) . Журнал Американского общества информационной науки и технологий . 52 (3): 226–234. CiteSeerX 10.1.1.23.9800 . doi :10.1002/1097-4571(2000)9999:9999<::AID-ASI1591>3.3.CO;2-I. 
  9. ^ Марк Сандерсон и Джанет Колер (2004). «Анализ географических запросов». Труды семинара по географической информации (SIGIR '04) .
  10. ^ Jansen, BJ, Booth, DL, & Spink, A. (2009). Модели изменения запросов во время веб-поиска. Журнал Американского общества информационной науки и технологий. 60(3), 557-570. 60(7), 1358-1371.
  11. ^ Хайме Тиван; Эйтан Адар; Рози Джонс; Майкл Поттс (2005). «История повторяется: повторные запросы в журналах запросов Yahoo» (PDF) . Труды 29-й ежегодной конференции ACM по исследованиям и разработкам в области информационного поиска (SIGIR '06) . стр. 703–704. doi :10.1145/1148170.1148326.[ постоянная мертвая ссылка ]
  12. ^ "Bing Making search yours - Блог поиска - Блоги сайта - Сообщество Bing". Архивировано из оригинала 2011-03-14 . Получено 2011-03-01 .
  13. ^ Рикардо Баеза-Йейтс (2005). «Применение интеллектуального анализа веб-запросов». Достижения в области информационного поиска . Конспект лекций по информатике. Том 3408. Springer Berlin / Heidelberg. С. 7–22. doi :10.1007/978-3-540-31865-1_2. ISBN 978-3-540-25295-5.
  14. ^ Алехандро Фигероа (2015). «Изучение эффективных функций для распознавания намерений пользователя, стоящих за веб-запросами». Компьютеры в промышленности . 68. Elsevier: 162–169. doi :10.1016/j.compind.2015.01.005.
  15. ^ Мона Тагави; Ахмед Патель; Никита Шмидт; Кристофер Уиллс; Ици Тью (2011). «Анализ журналов веб-прокси с подходом шаблона распределения запросов для поисковых систем». Журнал компьютерных стандартов и интерфейсов . 34 (1): 162–170. doi :10.1016/j.csi.2011.07.001.
  16. ^ Салливан, Дэнни (2013-09-26). "FAQ: Все о новом алгоритме Google "Hummingbird"". Search Engine Land . Получено 24 мая 2014 г.
  17. ^ Войкан Михайлович; Джорд Химстра; Хенк Эрнст Блок; Питер М.Г. Аперс (октябрь 2006 г.). «Использование структуры запроса и структуры документа для повышения эффективности поиска документов» (PDF) . {{cite journal}}: Цитировать журнал требует |journal=( помощь )