Американский ученый-компьютерщик (1927–1995).
Джерард А. «Джерри» Солтон (8 марта 1927 – 28 августа 1995) был профессором компьютерных наук в Корнелльском университете . Солтон был, пожалуй, ведущим ученым-компьютерщиком, работавшим в области поиска информации в свое время, и «отцом поиска информации». [2] Его группа в Корнелле разработала информационно-поисковую систему SMART , которую он инициировал, когда учился в Гарварде. Это была самая первая система, использовавшая ныне популярную модель векторного пространства для поиска информации.
Образование и карьера
Солтон родился Герхард Антон Зальманн в Нюрнберге, Германия . Он приехал в Соединенные Штаты в 1947 году и был натурализован в 1952 году. Он получил степени бакалавра (1950 г.) и магистра (1952 г.) по математике в Бруклинском колледже , а также степень доктора философии. Он окончил Гарвард по специальности прикладная математика в 1958 году, был последним из докторантов Говарда Эйкена и преподавал там до 1965 года, когда он поступил в Корнелльский университет и стал соучредителем его факультета компьютерных наук.
Солтон был, пожалуй, наиболее известен благодаря разработке широко используемой сейчас модели векторного пространства для поиска информации. [3] В этой модели и документы, и запросы представлены как векторы количества терминов, а сходство между документом и запросом определяется косинусом между вектором термина и вектором документа. В этой статье он также представил TF-IDF , или частоту терминов, обратную частоте документа, модель, в которой оценка термина в документе представляет собой отношение количества терминов в этом документе к частоте встречаемости термина. количество документов, в которых встречается этот термин. (Понятие обратной частоты документов, меры специфичности, было введено в 1972 году Карен Спарк-Джонс . [4] ). Позже он заинтересовался автоматическим обобщением и анализом текста, [5] , а также автоматическим гипертекстом. поколение. [6] За свою жизнь он опубликовал более 150 научных статей и 5 книг.
Почести и награды
Солтон был главным редактором «Коммуникаций ACM» и « Журнала ACM» , а также возглавлял специальную группу по поиску информации (SIGIR). Он был заместителем редактора журнала ACM Transactions on Information Systems . Он был членом ACM (избран в 1995 г.), [7] получил Почетную награду Американского общества информатики (1989 г.) и был первым лауреатом премии SIGIR за выдающийся вклад в изучение информационного поиска (1983 г.) - — теперь называется Премией Джерарда Солтона .
Библиография
- Солтон, Автоматическая организация и поиск информации , 1968.
- Джерард Солтон (1975). Теория индексации . Общество промышленной и прикладной математики. п. 56. ИСБН 9780898710151.
- --- и Майкл Дж. МакГилл, Введение в современный поиск информации , 1983. ISBN 0-07-054484-0 .
- Джерард Солтон (1989). Автоматическая обработка текста. Издательство Аддисон-Уэсли. п. 530. ИСБН 978-0-201-12227-5.
- Джерард Солтон на библиографическом сервере DBLP
- Г. Салтон, А. Вонг и К.С. Ян (1975), «Векторная пространственная модель для автоматического индексирования», Communications of the ACM , vol. 18, номер 1. 11, страницы 613–620. (Статья, в которой была представлена модель векторного пространства)
- Г. Солтон. (1980). «На пути к динамической библиотеке». В книге Ф. Уилфрида Ланкастера, под ред. « Роль библиотеки в электронном обществе: Клиника библиотечных приложений обработки данных». Урбана-Шампейн: Высшая школа библиотечного дела Университета Иллинойса.
Смотрите также
Рекомендации
- ^ Алла, Джеймс. Автоматическое построение гипертекста. Cornell University . Проверено 3 декабря 2023 г.
- ^ ab «Отец информационного поиска» (PDF) . cs.cornell.edu . Проверено 10 марта 2015 г.
один из основателей отдела и отец информационного поиска.
- ^ Солтон, Г.; Вонг, А.; Ян, CS (1975). «Модель векторного пространства для автоматического индексирования». Коммуникации АКМ . 18 (11): 613. дои : 10.1145/361219.361220. hdl : 1813/6057 . S2CID 6473756.
- ^ Сперк Джонс, К. (1972). «Статистическая интерпретация специфичности термина и ее применение в поиске». Журнал документации . 28 : 11–21. CiteSeerX 10.1.1.115.8343 . дои : 10.1108/eb026526. S2CID 2996187.
- ^ Солтон, Г.; Аллан, Дж.; Бакли, К.; Сингхал, А. (1994). «Автоматический анализ, создание тем и обобщение машиночитаемых текстов». Наука . 264 (5164): 1421–1426. Бибкод : 1994Sci...264.1421S. дои : 10.1126/science.264.5164.1421. PMID 17838425. S2CID 32296317.
- ^ "Джерард Солтон". Cs.cornell.edu . Проверено 14 сентября 2013 г.
- ^ "Стипендиаты Джерарда Солтона ACM 1995" . acm.org . Проверено 10 марта 2015 г.
вклад более 30 лет в организацию и поиск информации
Внешние ссылки
- В память
- Фракталы перемен: поиск в глубине памяти
- «Самая влиятельная статья, которую Джерард Солтон никогда не писал». Дубин Д. Эта статья Дэвида Дубина «Тенденции в библиотеке» 2004 года (2004;52(4):748-764) служит историческим обзором метаморфозы модели значения дискриминации терминов (TDV) в модель векторного пространства как модель поиска информации. (VSM как IR-модель). Эта статья ставит под сомнение то, что, по мнению исследовательского сообщества в области информационного поиска, изначально предназначалось для моделирования модели векторного пространства Солтона. То, что намного позже стало моделью поиска информации, изначально было ориентированной на данные математико-вычислительной моделью, используемой в качестве объяснительного устройства. Кроме того, в статье Дубина указывается, что часто цитируемая статья Солтона 1975 года не существует, а, вероятно, представляет собой комбинацию двух других статей, ни одна из которых на самом деле не относится к VSM как к модели IR.