Поиск знаний стремится вернуть информацию в структурированной форме, соответствующей когнитивным процессам человека , а не простым спискам элементов данных. Он опирается на ряд областей, включая эпистемологию (теорию познания), когнитивную психологию , когнитивную нейронауку , логику и вывод , машинное обучение и обнаружение знаний , лингвистику и информационные технологии .
Обзор
В области поисковых систем устоявшиеся подходы включают:
Оба подхода требуют от пользователя чтения и анализа зачастую длинных списков наборов данных или документов для извлечения смысла.
Цель систем поиска знаний — снизить нагрузку на эти процессы за счет улучшения поиска и представления. Это улучшение необходимо для использования растущих объемов данных, доступных в Интернете. [1] [2] [3] [4] [5 ] [6 ] [7] [ 8 ] [9] [10] [11]
Сравнение с данными и поиском информации
Извлечение данных и извлечение информации являются более ранними и базовыми формами доступа к информации. [12]
Извлечение знаний фокусируется на уровне знаний. Нам нужно изучить, как извлекать, представлять и использовать знания в данных и информации. [13] Системы извлечения знаний предоставляют знания пользователям структурированным образом. По сравнению с извлечением данных и извлечением информации они используют разные модели вывода , методы извлечения, организацию результатов и т. д. Таблица 1, расширяющая сравнение ван Рейсбергена о разнице между извлечением данных и извлечением информации, [14] суммирует основные характеристики извлечения данных, извлечения информации и извлечения знаний. [15] Ядром извлечения данных и извлечения информации являются подсистемы извлечения. Извлечение данных получает результаты через булево соответствие. [16] Извлечение информации использует частичное соответствие и наилучшее соответствие. Извлечение знаний также основано на частичном соответствии и наилучшем соответствии.
С точки зрения вывода, поиск данных использует дедуктивный вывод , а поиск информации использует индуктивный вывод. [14] Учитывая ограничения, связанные с предположениями различных логик, традиционные логические системы (например, подмножество Хорна логики первого порядка ) не могут рассуждать эффективно. [17] Ассоциативные рассуждения, аналоговые рассуждения и идея объединения рассуждений и поиска могут быть эффективными методами рассуждений в веб-масштабе. [17] [18]
С точки зрения поиска, системы поиска знаний фокусируются на семантике и лучшей организации информации. Поиск данных и поиск информации организуют данные и документы путем индексации, в то время как поиск знаний организует информацию путем указания связей между элементами в этих документах.
Фреймворки для систем поиска знаний
С точки зрения компьютерной науки была предложена и подробно исследована логическая структура, концентрирующаяся на нечеткости запросов знаний. [19] Были исследованы языки разметки для обоснования знаний и соответствующие стратегии, которые могут служить возможными основами логического обоснования для поиска знаний на основе текста. [3]
С точки зрения когнитивной науки , особенно с точки зрения когнитивной психологии и когнитивной нейронауки, была исследована нейробиологическая основа поиска знаний в человеческом мозге , и она может служить когнитивной моделью для поиска знаний. [20] [21]
Смежные дисциплины
Извлечение знаний может основываться на следующих связанных теориях и технологиях: [12]
- Теория познания : приобретение знаний, организация знаний, представление знаний , проверка знаний, управление знаниями.
- Когнитивная наука : когнитивная психология, когнитивная нейронаука, когнитивная информатика, формирование концепций и обучение, принятие решений, взаимодействие человека и компьютера .
- Машинное обучение и обнаружение знаний : предварительная обработка, классификация, кластеризация, прогнозирование, постобработка, статистическая теория обучения .
- Логика и вывод : пропозициональная логика , логика предикатов, логика атрибутов, универсальная логика , индуктивный вывод , дедуктивный вывод, ассоциативные рассуждения, аналоговые рассуждения, приблизительные рассуждения.
- Информационные технологии : теория информации , информатика , поиск информации, системы баз данных, системы, основанные на знаниях , системы, основанные на правилах, экспертные системы , системы поддержки принятия решений , технология интеллектуальных агентов .
- Лингвистика : компьютерная лингвистика , понимание естественного языка , обработка естественного языка .
Темы, перечисленные под каждой записью, служат примерами и не образуют полный список. И многие смежные дисциплины должны быть добавлены по мере того, как область становится более зрелой.
Ссылки
- ^
Фриш, А. М. Извлечение знаний как специализированный вывод, докторская диссертация, Рочестерский университет , 1986.
- ^
Каме, М. и Кинтана, Й. Система поиска знаний на основе графов, Труды Международной конференции IEEE 1990 года по системам, человеку и кибернетике, 1990: 269-275.
- ^ ab Martin, P. и Eklund, PW Поиск знаний и Всемирная паутина, IEEE Intelligent Systems , 2000, 15(3): 18-25.
- ^
Эртель, П. и Амир, Э. Структура поиска знаний здравого смысла, Труды 7-го Международного симпозиума по логическим формализациям рассуждений здравого смысла , 2005.
- ^
Трэверс, М. Визуальное представление структур знаний, Труды 2-й ежегодной конференции ACM по гипертексту и гипермедиа, 1989: 147-158.
- ^
Яо, YY Системы поддержки поиска информации, Труды Международной конференции IEEE 2002 года по нечетким системам, 2002, 1092-1097.
- ^
Чжоу, Н., Чжан, Ю.Ф. и Чжан, Л.Ю. Визуализация информации и поиск знаний [на китайском языке], Science Press, 2005.
- ^
Роберт Лоу, Катрин Кюммель, Джудит Рупрехт, Удо Блейманн, Пол Уолш. Подходы к персонализированному поиску знаний, Internet Research , 17(1), 2007
- ^
Стефания Мариано, Андреа Кейси. Процесс извлечения знаний: пример американской высокотехнологичной исследовательской, инжиниринговой и консалтинговой компании. VINE: Журнал систем управления информацией и знаниями , 37(3), 2007.
- ^
Йенс Гаммельгаард, Томас Риттер. Матрица извлечения знаний: кодификация и персонификация как отдельные стратегии, Журнал управления знаниями, 9(4), 133-143, 2005.
- ^
Дж. Э. Л. Фаррадейн. Анализ и организация знаний для поиска, Труды ASLIB, 22(12), 607-616, 1970.
- ^ ab Yiyu Yao, Yi Zeng, Ning Zhong, Xiangji Huang. Извлечение знаний (KR). В: Труды Международной конференции IEEE/WIC/ACM 2007 года по веб-разведке, IEEE Computer Society , Кремниевая долина , США, 2–5 ноября 2007 г., 729–735.
- ^ Беллинджер, Г., Кастро, Д. и Миллс, А. Данные, информация, знания и мудрость, http://www.systemsthinking.org/dikw/dikw.htm Архивировано 17 октября 2016 г. на Wayback Machine
- ^ Аб ван Рейсберген, Информационный поиск CJ, Баттервортс, 1979.
- ^
Цзэн, И., Яо, И.Й. и Чжун, Н. Извлечение знаний на основе гранулярной структуры [на китайском языке], Труды совместной конференции Седьмой конференции по грубым и мягким вычислениям , Первого форума по гранулярным вычислениям и Первого форума по веб-разведке, 2007.
- ^
Баеза-Йейтс, Р. и Рибейро-Нето, Б. Современный информационный поиск, AddisonWesley, 1999.
- ^ ab Fensel, D. и van Harmelen, F. Объединение рассуждений и поиска в масштабе сети, IEEE Internet Computing, 2007, 11(2): 96, 94-95.
- ^
Бернерс-Ли, Т., Холл, В., Хендлер, Дж. А., О'Хара, К., Шедболт, Н. и Вайцнер, Д. Х. Основы веб-науки, Основы и тенденции в веб-науке, 2006, 1(1): 1-130.
- ^ Чэнь, BC и Сян, Дж. Логическая структура поиска знаний с нечеткостью, Труды Международной конференции IEEE/WIC/ACM 2004 года по веб-разведке, 2004: 524-528.
- ^
Транел, Даниэль, Дамасио, Антонио. Нейробиология извлечения знаний. Behavioral and Brain Science, 22(2): 303-303, 1999.
- ^
Дженнифер Х. Пфайфер, Мэтью Д. Либерман , Мирелла Дапретто. «Я знаю, что ты есть, но кто я?!»: нейронные основы поиска само- и социальных знаний у детей и взрослых, Журнал когнитивной нейронауки , 19(8), MIT Press , август 2007 г.