Джон Уайлдер Тьюки ( / ˈ t uː k i / ; 16 июня 1915 — 26 июля 2000) — американский математик и статистик , наиболее известный разработкой алгоритма быстрого преобразования Фурье (БПФ) и диаграммы ящиков . [2] Тест размаха Тьюки , лямбда-распределение Тьюки , тест аддитивности Тьюки и лемма Тейхмюллера–Тьюки носят его имя. Ему также приписывают введение термина бит и первое опубликованное использование слова программное обеспечение .
Тьюки родился в Нью-Бедфорде, штат Массачусетс , в 1915 году в семье учителя латыни и частного репетитора. Его в основном обучала мать, и он посещал регулярные занятия только по определенным предметам, таким как французский. [3] Тьюки получил степень бакалавра в 1936 году и степень магистра в 1937 году по химии в Университете Брауна , прежде чем перешел в Принстонский университет , где в 1939 году получил степень доктора философии по математике , защитив докторскую диссертацию под названием «О счетности в топологии ». [4] [5] [6]
Во время Второй мировой войны Тьюки работал в Исследовательском бюро управления огнем и сотрудничал с Сэмюэлем Уилксом и Уильямом Кохраном . Утверждается, что он помог разработать шпионский самолет U-2. После войны он вернулся в Принстон, разделив свое время между университетом и лабораториями AT&T Bell . В 1962 году Тьюки был избран в Американское философское общество . [7] Он стал профессором в 35 лет и основателем кафедры статистики Принстона в 1965 году. [3]
Помимо многих других вкладов в гражданское общество , Тьюки работал в комитете Американской статистической ассоциации , который подготовил доклад, критикующий статистическую методологию доклада Кинси , «Статистические проблемы доклада Кинси о сексуальном поведении самцов », в котором подытоживалось: «Случайный выбор трех человек был бы лучше, чем группа из 300 человек, выбранная г-ном Кинси».
С 1960 по 1980 год Тьюки помогал разрабатывать опросы для телевизионной сети NBC, которые использовались для прогнозирования и анализа выборов. Он также был консультантом Educational Testing Service, Xerox Corporation и Merck & Company.
В 1970-х и начале 1980-х годов Тьюки играл ключевую роль в разработке и проведении Национальной оценки образовательного прогресса .
В 1973 году президент Никсон наградил его Национальной медалью науки. [3] В 1982 году он был награжден Почетной медалью IEEE «За вклад в спектральный анализ случайных процессов и алгоритм быстрого преобразования Фурье (БПФ) ».
Тьюки вышел на пенсию в 1985 году. Он умер в Нью-Брансуике, штат Нью-Джерси , 26 июля 2000 года.
В начале своей карьеры Тьюки работал над разработкой статистических методов для компьютеров в Bell Labs , где в 1947 году он придумал термин «бит». [8] [9] [10]
Его статистические интересы были многочисленны и разнообразны. Он особенно запомнился своей разработкой с Джеймсом Кули алгоритма Кули–Тьюки FFT . В 1970 году он внес значительный вклад в то, что сегодня известно как складной нож — также называемый складным ножом Кенуйля–Тьюки. Он представил диаграмму ящиков в своей книге 1977 года «Исследовательский анализ данных».
Тест размаха Тьюки , лямбда-распределение Тьюки , тест аддитивности Тьюки , лемма Тьюки и окно Тьюки — все носят его имя. Он также является создателем нескольких малоизвестных методов, таких как тримедиа и медиана-медианная линия , более простая альтернатива линейной регрессии .
В 1974 году он совместно с Джеромом Х. Фридманом разработал концепцию проекционного преследования . [11]
Джон Тьюки внес большой вклад в статистическую практику и анализ данных в целом. Фактически, некоторые считают Джона Тьюки отцом науки о данных. По крайней мере, он был пионером многих ключевых основ того, что позже стало известно как наука о данных. [12]
Осмысление данных имеет долгую историю и на протяжении многих лет им занимались статистики, математики, ученые и другие. В 1960-х годах Тьюки бросил вызов доминированию того, что он называл «подтверждающим анализом данных», статистическим анализом, основанным на жестких математических конфигурациях. [13] Тьюки подчеркивал важность более гибкого отношения к анализу данных и тщательного изучения данных, чтобы увидеть, какие структуры и информация могут в них содержаться. Он назвал это «исследовательским анализом данных» (EDA). Во многих отношениях EDA был предшественником науки о данных.
Тьюки также осознал важность компьютерной науки для EDA. Графика является неотъемлемой частью методологии EDA, и хотя большая часть работы Тьюки была сосредоточена на статических отображениях (таких как диаграммы ящиков), которые можно было бы нарисовать вручную, он понял, что компьютерная графика будет гораздо более эффективной для изучения многомерных данных. PRIM-9, первая программа для просмотра многомерных данных, была задумана им в начале 1970-х годов. [14]
Такое сочетание анализа данных и компьютерной науки сейчас называется наукой о данных.
Тьюки сформулировал важное различие между разведывательным анализом данных и подтверждающим анализом данных , полагая, что большая часть статистической методологии уделяет слишком большое внимание последнему. Хотя он верил в полезность разделения двух типов анализа, он указывал, что иногда, особенно в естественных науках , это было проблематично, и называл такие ситуации неудобной наукой .
А.Д. Гордон предложил следующее резюме принципов Тьюки для статистической практики: [15]
... полезность и ограниченность математической статистики; важность наличия методов статистического анализа, устойчивых к нарушениям предположений, лежащих в основе их использования; необходимость накопления опыта поведения конкретных методов анализа с целью предоставления рекомендаций по их использованию; важность допущения возможности влияния данных на выбор метода, с помощью которого они анализируются; необходимость для статистиков отказаться от роли «хранителей доказанной истины» и противостоять попыткам предоставить раз и навсегда решения и аккуратные сверхунификации предмета; итеративный характер анализа данных; последствия растущей мощности, доступности и дешевизны вычислительных средств; подготовка статистиков.
Лекции Тьюки были описаны как необычные. МакКаллах описал его лекцию, прочитанную в Лондоне в 1977 году: [15] [16]
Таки неторопливо поднялся на трибуну, огромный медведь, одетый в мешковатые штаны и черную трикотажную рубашку. Когда-то это могла быть пара, но винтаж был таким, что трудно было сказать. ... Тщательно и преднамеренно на доске был написан список заголовков. Слова тоже приходили, не так много, как перегруженные посылки, доставленные медленным, неторопливым шагом. ... Когда все было закончено, Таки повернулся лицом к аудитории и трибуне... "Комментарии, вопросы, предложения?" - спросил он аудиторию... Ожидая ответа, он взобрался на трибуну и маневрировал, пока не сел, скрестив ноги, лицом к аудитории. ... Мы в аудитории сидели, как зрители в зоопарке, ожидая, что большой медведь пошевелится или что-то скажет. Но большой медведь, казалось, делал то же самое, и ощущение было неуютным.
Работая с Джоном фон Нейманом над ранними компьютерными проектами, Тьюки ввел слово « бит» как производное от «binary digit» (двоичная цифра) . [17] Термин «бит» впервые был использован в статье Клода Шеннона в 1948 году.
Выбор логарифмического основания соответствует выбору единицы измерения информации. Если используется основание 2, то полученные единицы можно назвать двоичными цифрами или, короче,
битами
, слово, предложенное Дж. У. Тьюки.
{{cite journal}}
: CS1 maint: безымянное периодическое издание ( ссылка ){{cite journal}}
: CS1 maint: безымянное периодическое издание ( ссылка ){{cite journal}}
: CS1 maint: безымянное периодическое издание ( ссылка ){{cite journal}}
: CS1 maint: безымянное периодическое издание ( ссылка )