График знаний Google – это база знаний , из которой Google предоставляет соответствующую информацию в информационном поле рядом с результатами поиска . Это позволяет пользователю сразу увидеть ответ, как мгновенный ответ . Данные генерируются автоматически из различных источников, охватывая места, людей, предприятия и многое другое. [1] [2]
Информация, включенная в Knowledge Graph Google, быстро выросла после запуска, утроив объем данных за семь месяцев (охватывая 570 миллионов объектов и 18 миллиардов фактов [3] ). К середине 2016 года Google сообщил, что хранит 70 миллиардов фактов [4] и отвечает «примерно на треть» из 100 миллиардов ежемесячных поисковых запросов, которые они обрабатывают. К маю 2020 года это число выросло до 500 миллиардов фактов по 5 миллиардам объектов. [5]
Официальной документации о том, как реализован Google Knowledge Graph, не существует. [6] По данным Google, информация получена из многих источников, включая Всемирную книгу фактов ЦРУ и Википедию . [7] Он используется для ответа на прямые устные вопросы в Google Assistant [8] [9] и голосовых запросах Google Home . [10] Его критиковали за предоставление ответов без указания источника или цитат . [11]
16 мая 2012 года компания Google анонсировала свою систему знаний как способ значительно повысить ценность информации, возвращаемой поисковыми запросами Google. [7] Первоначально доступный только на английском языке, в декабре 2012 года он был расширен до испанского , французского , немецкого , португальского , японского , русского и итальянского языков . [12] Поддержка бенгальского языка была добавлена в марте 2017 года. [13]
График знаний частично создан на базе Freebase . [7]
В августе 2014 года журнал New Scientist сообщил, что Google запустил проект Knowledge Vault . [14] После публикации Google обратился к Search Engine Land , чтобы объяснить, что Knowledge Vault — это исследовательский отчет, а не активный сервис Google. Search Engine Land указал на то, что Google экспериментировал с «многочисленными моделями» извлечения смысла из текста. [15]
Хранилище знаний Google было предназначено для обработки фактов, автоматического сбора и объединения информации из Интернета в базу знаний, способную отвечать на прямые вопросы, такие как «Где родилась Мадонна ?» В отчете за 2014 год сообщалось, что в Хранилище собрано более 1,6 миллиарда фактов, 271 миллион из которых считались «достоверными фактами», которые считались правдивыми более чем на 90%. Сообщалось, что он отличается от Knowledge Graph тем, что собирает информацию автоматически, а не опирается на факты, полученные из краудсорсинга, собранные людьми. [15]
К маю 2016 года ящики со знаниями появлялись «примерно для трети» из 100 миллиардов ежемесячных поисковых запросов, которые обрабатывала компания. [11] Дарио Тараборелли, руководитель исследовательского отдела Фонда Викимедиа , рассказал The Washington Post , что упущение Google источников в своих ящиках знаний «подрывает способность людей проверять информацию и, в конечном итоге, вырабатывать обоснованные мнения». Издание также сообщило, что коробки «часто не указаны», например, коробка со сведениями о возрасте актрисы Бетти Уайт , которая «настолько не имеет источников и абсолютна, как если бы она была передана Богом». [11]
По данным The Register, в 2014 году отображение прямых ответов в панелях знаний рядом с результатами поиска Google привело к значительному снижению читательской аудитории Википедии , из которой панели получили часть своей информации. [16] Также в 2014 году The Daily Dot отметила, что «У Википедии до сих пор нет реального конкурента в том, что касается реального контента. Все, что можно получить, — это статистика трафика. А для некоммерческой организации цифры трафика не приравниваются к доходу в так же, как они делают это для коммерческого медиа-сайта». После публикации статьи представитель Фонда Викимедиа , который управляет Википедией, заявил, что он «приветствует» функциональность панели знаний, что он «изучает» падение трафика и что «Мы также не заметили значительного падения в рефералах из поисковых систем. Мы также ведем постоянный диалог с сотрудниками Google, работающими над панелью знаний». [17]
В своей книге 2020 года Дариуш Емельняк отметил, что, поскольку большинство пользователей Google не осознают, что многие ответы на их вопросы, которые появляются в «Графике знаний», исходят из Википедии, это снижает популярность Википедии и, в свою очередь, ограничивает способность сайта собирать новые средства и привлекать новые волонтеры. [18]
Алгоритм подвергался критике за представление предвзятой или неточной информации, обычно из-за получения информации с веб-сайтов с высокой поисковой оптимизацией . В 2014 году было отмечено, что, хотя для большинства крупных исторических или псевдоисторических религиозных деятелей, таких как Моисей , Мухаммед и Гаутама Будда , существовала Графа знаний, ее не было для Иисуса , центральной фигуры христианства . [19] [20] 3 июня 2021 года в блоке знаний каннада был назван самым уродливым языком в Индии, что вызвало возмущение сообщества, говорящего на каннада; штат Карнатака , где проживает большинство говорящих на каннада, также пригрозил подать в суд на Google за нанесение ущерба общественному имиджу языка. Google оперативно изменил выделенный фрагмент для поискового запроса и принес официальные извинения. [21] [22]
Это система, которая распознает факты и информацию о сущностях из материалов, размещенных в Интернете, а также из баз данных с открытым исходным кодом и лицензированных баз данных.
Он накопил более 500 миллиардов фактов о пяти миллиардах объектов.