Американский теоретик информации
Дугласс Рид Каттинг — разработчик программного обеспечения , сторонник и создатель технологии поиска с открытым исходным кодом . Он основал два технологических проекта, Lucene и Nutch , вместе с Майком Кафареллой . Apache Software Foundation теперь управляет обоими проектами. Каттинг и Кафарелла также были соучредителями Apache Hadoop . [1]
Образование и начало карьеры
Каттинг окончил Стэнфордский университет в 1985 году, получив степень бакалавра . [2] [3]
До разработки Lucene Каттинг занимал должности в сфере технологий поиска в Xerox PARC , где работал над алгоритмом Scatter/Gather [4] [5] и над вычислительной стилистикой . [6] Он также работал в Excite , где был одним из главных разработчиков поисковой системы , и в Apple Inc. , где был основным автором фреймворка текстового поиска V-Twin . [7]
Проекты с открытым исходным кодом
Lucene, поисковый индексатор , и Nutch, паук или краулер , являются двумя ключевыми компонентами общей поисковой платформы с открытым исходным кодом , которая сначала сканирует Интернет в поисках контента, а затем структурирует его в индекс для поиска. Руководство Каттинга этими двумя проектами расширило концепции и возможности общих проектов программного обеспечения с открытым исходным кодом, таких как Linux и MySQL , в вертикальную область поиска. [8] В статье 2017 года Каттинг был процитирован с утверждением: «Открытый исходный код — это требование для бизнеса». [9]
Использование парадигмы MapReduce
В декабре 2004 года Google Research опубликовала статью об алгоритме MapReduce , который позволяет очень крупномасштабным вычислениям быть тривиально распараллеленными на больших кластерах серверов. Каттинг и Майк Кафарелла, понимая важность этой статьи для расширения Lucene в область чрезвычайно больших задач поиска, создали фреймворк Hadoop с открытым исходным кодом. Этот фреймворк позволяет приложениям, основанным на парадигме MapReduce, запускаться на больших кластерах обычного оборудования. Каттинг был сотрудником Yahoo !, где он руководил проектом Hadoop на постоянной основе; позже он перешел на работу в Cloudera . [10]
Фонды и награды с открытым исходным кодом
В июле 2009 года Каттинг был избран в совет директоров Apache Software Foundation , а в сентябре 2010 года он был избран председателем. [11]
В 2015 году Cutting был удостоен премии O'Reilly Open Source Award . [12]
Ссылки
- ^ Каттинг, Майк Кафарелла, Бен Лорика, Дуг (2016-03-31). "Следующие 10 лет Apache Hadoop". O'Reilly Media . Получено 2018-04-16 .
{{cite news}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ "Doug Cutting—The Father of Search - Code World". www.codetd.com . Получено 18 мая 2022 г. .
- ^ "Cloudera management team". Cloudera . Получено 2016-08-17 .
- ^ Каттинг, Дугласс Р., Дэвид Р. Каргер, Ян О. Педерсен и Джон В. Тьюки. «Разброс/сбор: кластерный подход к просмотру больших коллекций документов». SIGIR '92 Труды 15-й ежегодной международной конференции ACM SIGIR по исследованиям и разработкам в области информационного поиска. (Перепечатано в ACM SIGIR Forum, т. 51, № 2, стр. 148-159. ACM, 2017.)
- ^ Педерсен, Ян О., Дэвид Каргер, Дугласс Р. Каттинг и Джон В. Тьюки. «Рассеивание-сбор: кластерный метод и устройство для просмотра больших коллекций документов». Патент США 5,442,778, выдан 15 августа 1995 г.
- ^ Карлгрен, Юсси ; Каттинг, Дуглас. «Распознавание жанров текста с помощью простых метрик с использованием дискриминантного анализа». Труды 15-й конференции по компьютерной лингвистике — Том 2. Ассоциация компьютерной лингвистики, 1994.
- ^ "Поисковая система Lucene: мощная, гибкая и бесплатная". JavaWorld (опубликовано 15.09.2000). 15 сентября 2000 г. Получено 25.01.2017 г. Каттинг
— основной автор поисковой системы V-Twin (часть операционной системы Copland от Apple)…
- ^ "Wikipedia: Powered by Lucene". Lucene . Получено 5 сентября 2007 г. .
- ^ "Doug Cutting, 'отец' Hadoop, рассказывает об эволюции технологий больших данных". ComputerWeekly.com . Получено 26 июня 2018 г. .
- ^ Handy, Alex (10 августа 2009 г.). «Создатель Hadoop переходит в Cloudera». Software Development Times. Архивировано из оригинала 13 марта 2012 г. Получено 22.03.2011 .
- ^ Салли (2010-07-15). "Apache Software Foundation объявляет о назначении новых членов правления". Блог Apache Software Foundation . Получено 2023-05-02 .
- ^ "O'Reilly Open Source Awards - OSCON 2015". YouTube . O'Reilly. Архивировано из оригинала 2021-12-14 . Получено 27 июля 2015 .
Статьи
- Запись в блоге Тома Уайта о том, как Даг Каттинг создал Hadoop Обратите внимание, что эта запись была написана, когда Hadoop был еще безымянным ответвлением Nutch . Том обновил свою предыдущую запись, указав здесь название Hadoop .
- Статья в соавторстве с Дугом Каттингом в ACM Queue, «Building Nutch: Open Source Search»
Внешние ссылки
- «Блог Дуга Каттинга».
- Публикации и патенты Дуга Каттинга
- Даг Каттинг присоединяется к Yahoo!