Джон Уайлдер Тьюки ( / ˈ t uː k i / ; 16 июня 1915 — 26 июля 2000) — американский математик и статистик , наиболее известный благодаря разработке алгоритма быстрого преобразования Фурье (БПФ) и коробчатой диаграммы . [2] Критерий диапазона Тьюки , лямбда-распределение Тьюки , критерий аддитивности Тьюки и лемма Тейхмюллера-Тьюки — все они носят его имя. Ему также приписывают создание термина « бит» и первое опубликованное использование слова «программное обеспечение» .
Тьюки родился в Нью-Бедфорде, штат Массачусетс , в 1915 году в семье учителя латыни и частного репетитора. В основном его учила мать, и он посещал регулярные занятия только по определенным предметам, например французскому. [3] Тьюки получил степень бакалавра в 1936 году и степень магистра химии в 1937 году в Университете Брауна , а затем перешел в Принстонский университет , где в 1939 году он получил докторскую степень по математике после завершения докторской диссертации под названием «О счетности в топологии ». [4] [5] [6]
Во время Второй мировой войны Тьюки работал в Исследовательском бюро управления огнем и сотрудничал с Сэмюэлем Уилксом и Уильямом Кокраном . Утверждается, что он участвовал в разработке самолета-разведчика U-2. После войны он вернулся в Принстон, деля свое время между университетом и AT&T Bell Laboratories . В 1962 году Тьюки был избран членом Американского философского общества . [7] Он стал профессором в 35 лет и председателем-основателем статистического факультета Принстона в 1965 году. [3]
Помимо большого вклада в гражданское общество , Тьюки работал в комитете Американской статистической ассоциации , который подготовил отчет, критикующий статистическую методологию отчета Кинси , «Статистические проблемы отчета Кинси о сексуальном поведении мужчин », в котором резюмировался «случайный выбор». из трех человек было бы лучше, чем группа из 300 человек, выбранная г-ном Кинси».
С 1960 по 1980 год Тьюки помогал разрабатывать опросы телевизионной сети NBC, используемые для прогнозирования и анализа выборов. Он также был консультантом Службы образовательного тестирования, корпорации Xerox и Merck & Company.
В 1970-х и начале 1980-х годов Тьюки сыграл ключевую роль в разработке и проведении Национальной оценки прогресса в образовании .
Он был награжден Национальной медалью науки от президента Никсона в 1973 году. [3] Он был награжден Почетной медалью IEEE в 1982 году «За вклад в спектральный анализ случайных процессов и алгоритм быстрого преобразования Фурье (БПФ) ».
Тьюки вышел на пенсию в 1985 году. Он умер в Нью-Брансуике, штат Нью-Джерси , 26 июля 2000 года.
В начале своей карьеры Тьюки работал над разработкой статистических методов для компьютеров в Bell Labs , где в 1947 году он изобрел термин « бит » .
Его статистические интересы были многочисленны и разнообразны. Его особенно помнят за его разработку вместе с Джеймсом Кули алгоритма БПФ Кули-Тьюки . В 1970 году он внес значительный вклад в создание того, что сегодня известно как складной нож , также называемый складным ножом Кенуя-Тьюки. Он представил коробчатую диаграмму в своей книге 1977 года «Исследовательский анализ данных».
Тест диапазона Тьюки , лямбда-распределение Тьюки , тест аддитивности Тьюки , лемма Тьюки и окно Тьюки — все они носят его имя. Он также является создателем нескольких малоизвестных методов, таких как тримеан и медиана-медиана , более простая альтернатива линейной регрессии .
В 1974 году он вместе с Джеромом Х. Фридманом разработал концепцию проекционного преследования . [11]
Джон Тьюки внес большой вклад в статистическую практику и анализ данных в целом. Фактически, некоторые считают Джона Тьюки отцом науки о данных. По крайней мере, он заложил многие ключевые основы того, что позже стало известно как наука о данных. [12]
Осмысление данных имеет долгую историю, и им уже много лет занимаются статистики, математики, ученые и другие люди. В 1960-е годы Тьюки бросил вызов доминированию того, что он называл «анализом подтверждающих данных», статистическим анализом, основанным на жестких математических конфигурациях. [13] Тьюки подчеркнул важность более гибкого подхода к анализу данных и тщательного изучения данных, чтобы увидеть, какие структуры и информация могут в них содержаться. Он назвал это «исследовательским анализом данных» (EDA). Во многих отношениях EDA была предшественником науки о данных.
Тьюки также осознавал важность информатики для EDA. Графика является неотъемлемой частью методологии EDA, и хотя большая часть работы Тьюки была сосредоточена на статических изображениях (например, коробчатых диаграммах), которые можно было рисовать вручную, он понял, что компьютерная графика будет гораздо более эффективной для изучения многомерных данных. ПРИМ-9, первая программа для просмотра многомерных данных, была задумана им в начале 1970-х годов. [14]
Это сочетание анализа данных и информатики сейчас называется наукой о данных.
Тьюки сформулировал важное различие между исследовательским анализом данных и подтверждающим анализом данных , полагая, что во многих статистических методологиях слишком большое внимание уделяется последнему. Хотя он верил в полезность разделения двух типов анализа, он указывал, что иногда, особенно в естествознании , это проблематично, и называл такие ситуации неудобной наукой .
А. Д. Гордон предложил следующее краткое изложение принципов Тьюки для статистической практики: [15]
... полезность и ограниченность математической статистики; важность наличия методов статистического анализа, устойчивых к нарушениям предположений, лежащих в основе их использования; необходимость накопить опыт поведения конкретных методов анализа, чтобы дать рекомендации по их использованию; важность предоставления возможности влияния данных на выбор метода их анализа; необходимость того, чтобы статистики отвергли роль «хранителей доказанной истины» и сопротивлялись попыткам найти разовые решения и аккуратному чрезмерному объединению предмета; итеративный характер анализа данных; последствия растущей мощности, доступности и дешевизны вычислительных мощностей; подготовка статистиков.
Лекции Тьюки были описаны как необычные. МакКаллах описал свою лекцию, прочитанную в Лондоне в 1977 году: [15] [16]
Тьюки неторопливой походкой поднялся на подиум, огромный мужчина, одетый в мешковатые штаны и черную вязаную рубашку. Возможно, когда-то это была одна и та же пара, но год изготовления вина был таким, что определить его было трудно. ... Тщательно и обдуманно мелом на доске был написан список рубрик. Слова тоже приходили, не так много, как тяжелые посылки, доставляемые медленно и неуклонно. ... Когда все было готово, Тьюки повернулся лицом к публике и трибуне... «Комментарии, вопросы, предложения?» - спросил он у аудитории... Ожидая ответа, он забрался на трибуну и маневрировал, пока не сел, скрестив ноги, лицом к публике. ... Мы в зале сидели, как зрители в зоопарке, ожидая, пока большой медведь пошевелится или скажет что-нибудь. Но большой медведь, похоже, делал то же самое, и это было некомфортно.
Работая с Джоном фон Нейманом над проектами первых компьютеров, Тьюки представил слово « бит» как двоичную цифру . [17] Термин « бит» впервые был использован в статье Клода Шеннона в 1948 году.
Выбору основания логарифма соответствует выбору единицы измерения информации. Если используется база 2, то полученные единицы можно назвать двоичными цифрами или, короче ,
битами
— слово, предложенное Дж. У. Тьюки.
{{cite journal}}
: CS1 maint: периодическое издание без названия ( ссылка ){{cite journal}}
: CS1 maint: периодическое издание без названия ( ссылка ){{cite journal}}
: CS1 maint: периодическое издание без названия ( ссылка ){{cite journal}}
: CS1 maint: периодическое издание без названия ( ссылка )