stringtranslate.com

Джон Тьюки

Джон Уайлдер Тьюки ( / ˈ t k i / ; 16 июня 1915 — 26 июля 2000) — американский математик и статистик , наиболее известный разработкой алгоритма быстрого преобразования Фурье (БПФ) и диаграммы ящиков . [2] Тест размаха Тьюки , лямбда-распределение Тьюки , тест аддитивности Тьюки и лемма Тейхмюллера–Тьюки носят его имя. Ему также приписывают введение термина бит и первое опубликованное использование слова программное обеспечение .

Биография

Тьюки родился в Нью-Бедфорде, штат Массачусетс , в 1915 году в семье учителя латыни и частного репетитора. Его в основном обучала мать, и он посещал регулярные занятия только по определенным предметам, таким как французский. [3] Тьюки получил степень бакалавра в 1936 году и степень магистра в 1937 году по химии в Университете Брауна , прежде чем перешел в Принстонский университет , где в 1939 году получил степень доктора философии по математике , защитив докторскую диссертацию под названием «О счетности в топологии ». [4] [5] [6]

Во время Второй мировой войны Тьюки работал в Исследовательском бюро управления огнем и сотрудничал с Сэмюэлем Уилксом и Уильямом Кохраном . Утверждается, что он помог разработать шпионский самолет U-2. После войны он вернулся в Принстон, разделив свое время между университетом и лабораториями AT&T Bell . В 1962 году Тьюки был избран в Американское философское общество . [7] Он стал профессором в 35 лет и основателем кафедры статистики Принстона в 1965 году. [3]

Помимо многих других вкладов в гражданское общество , Тьюки работал в комитете Американской статистической ассоциации , который подготовил доклад, критикующий статистическую методологию доклада Кинси , «Статистические проблемы доклада Кинси о сексуальном поведении самцов », в котором подытоживалось: «Случайный выбор трех человек был бы лучше, чем группа из 300 человек, выбранная г-ном Кинси».

С 1960 по 1980 год Тьюки помогал разрабатывать опросы для телевизионной сети NBC, которые использовались для прогнозирования и анализа выборов. Он также был консультантом Educational Testing Service, Xerox Corporation и Merck & Company.

В 1970-х и начале 1980-х годов Тьюки играл ключевую роль в разработке и проведении Национальной оценки образовательного прогресса .

В 1973 году президент Никсон наградил его Национальной медалью науки. [3] В 1982 году он был награжден Почетной медалью IEEE «За вклад в спектральный анализ случайных процессов и алгоритм быстрого преобразования Фурье (БПФ) ».

Тьюки вышел на пенсию в 1985 году. Он умер в Нью-Брансуике, штат Нью-Джерси , 26 июля 2000 года.

Научный вклад

В начале своей карьеры Тьюки работал над разработкой статистических методов для компьютеров в Bell Labs , где в 1947 году он придумал термин «бит». [8] [9] [10]

Его статистические интересы были многочисленны и разнообразны. Он особенно запомнился своей разработкой с Джеймсом Кули алгоритма Кули–Тьюки FFT . В 1970 году он внес значительный вклад в то, что сегодня известно как складной нож — также называемый складным ножом Кенуйля–Тьюки. Он представил диаграмму ящиков в своей книге 1977 года «Исследовательский анализ данных».

Тест размаха Тьюки , лямбда-распределение Тьюки , тест аддитивности Тьюки , лемма Тьюки и окно Тьюки — все носят его имя. Он также является создателем нескольких малоизвестных методов, таких как тримедиа и медиана-медианная линия , более простая альтернатива линейной регрессии .

В 1974 году он совместно с Джеромом Х. Фридманом разработал концепцию проекционного преследования . [11]

Анализ данных и основы науки о данных

Джон Тьюки внес большой вклад в статистическую практику и анализ данных в целом. Фактически, некоторые считают Джона Тьюки отцом науки о данных. По крайней мере, он был пионером многих ключевых основ того, что позже стало известно как наука о данных. [12]

Осмысление данных имеет долгую историю и на протяжении многих лет им занимались статистики, математики, ученые и другие. В 1960-х годах Тьюки бросил вызов доминированию того, что он называл «подтверждающим анализом данных», статистическим анализом, основанным на жестких математических конфигурациях. [13] Тьюки подчеркивал важность более гибкого отношения к анализу данных и тщательного изучения данных, чтобы увидеть, какие структуры и информация могут в них содержаться. Он назвал это «исследовательским анализом данных» (EDA). Во многих отношениях EDA был предшественником науки о данных.

Тьюки также осознал важность компьютерной науки для EDA. Графика является неотъемлемой частью методологии EDA, и хотя большая часть работы Тьюки была сосредоточена на статических отображениях (таких как диаграммы ящиков), которые можно было бы нарисовать вручную, он понял, что компьютерная графика будет гораздо более эффективной для изучения многомерных данных. PRIM-9, первая программа для просмотра многомерных данных, была задумана им в начале 1970-х годов. [14]

Такое сочетание анализа данных и компьютерной науки сейчас называется наукой о данных.

Тьюки сформулировал важное различие между разведывательным анализом данных и подтверждающим анализом данных , полагая, что большая часть статистической методологии уделяет слишком большое внимание последнему. Хотя он верил в полезность разделения двух типов анализа, он указывал, что иногда, особенно в естественных науках , это было проблематично, и называл такие ситуации неудобной наукой .

А.Д. Гордон предложил следующее резюме принципов Тьюки для статистической практики: [15]

... полезность и ограниченность математической статистики; важность наличия методов статистического анализа, устойчивых к нарушениям предположений, лежащих в основе их использования; необходимость накопления опыта поведения конкретных методов анализа с целью предоставления рекомендаций по их использованию; важность допущения возможности влияния данных на выбор метода, с помощью которого они анализируются; необходимость для статистиков отказаться от роли «хранителей доказанной истины» и противостоять попыткам предоставить раз и навсегда решения и аккуратные сверхунификации предмета; итеративный характер анализа данных; последствия растущей мощности, доступности и дешевизны вычислительных средств; подготовка статистиков.

Лекции Тьюки были описаны как необычные. МакКаллах описал его лекцию, прочитанную в Лондоне в 1977 году: [15] [16]

Таки неторопливо поднялся на трибуну, огромный медведь, одетый в мешковатые штаны и черную трикотажную рубашку. Когда-то это могла быть пара, но винтаж был таким, что трудно было сказать. ... Тщательно и преднамеренно на доске был написан список заголовков. Слова тоже приходили, не так много, как перегруженные посылки, доставленные медленным, неторопливым шагом. ... Когда все было закончено, Таки повернулся лицом к аудитории и трибуне... "Комментарии, вопросы, предложения?" - спросил он аудиторию... Ожидая ответа, он взобрался на трибуну и маневрировал, пока не сел, скрестив ноги, лицом к аудитории. ... Мы в аудитории сидели, как зрители в зоопарке, ожидая, что большой медведь пошевелится или что-то скажет. Но большой медведь, казалось, делал то же самое, и ощущение было неуютным.

Создание терминакусочек

Работая с Джоном фон Нейманом над ранними компьютерными проектами, Тьюки ввел слово « бит» как производное от «binary digit» (двоичная цифра) . [17] Термин «бит» впервые был использован в статье Клода Шеннона в 1948 году.

Смотрите также

Публикации

Собрание сочинений Джона У. Тьюки под редакцией Уильяма С. Кливленда
О Джоне Тьюки

Ссылки

  1. ^ ab Джон Тьюки в проекте «Генеалогия математики»
  2. ^ Сэнд, Гордон (июль 2001 г.). «Некролог: Джон Уайлдер Тьюки». Physics Today . 54 (7): 80–81. doi : 10.1063/1.1397408 .
  3. ^ abc Леонхардт, Дэвид (28.07.2000). «Джон Тьюки, 85 лет, статистик; придумал слово „программное обеспечение“». New York Times . Получено 24.09.2012 .
  4. ^ "Джон Тьюки". Проект генеалогии математики . Получено 2022-07-02 .
  5. ^ Тьюки, Джон У. (1939). О счетности в топологии.
  6. ^ "Джон Тьюки". IEEE Global History Network . IEEE . Получено 2011-07-18 .
  7. ^ "История члена APS". search.amphilsoc.org . Получено 28.01.2021 .
  8. ^ Шеннон, Клод Элвуд (июль 1948 г.). "Математическая теория связи" (PDF) . Bell System Technical Journal . 27 (3): 379–423. doi :10.1002/j.1538-7305.1948.tb01338.x. hdl : 11858/00-001M-0000-002C-4314-2 . Архивировано из оригинала (PDF) 15.07.1998. Выбор логарифмического основания соответствует выбору единицы измерения информации. Если используется основание 2, то полученные единицы можно назвать двоичными цифрами или, короче, битами , слово, предложенное Дж. У. Тьюки.
  9. Шеннон, Клод Элвуд (октябрь 1948 г.). «Математическая теория связи». Bell System Technical Journal . 27 (4): 623–666. doi :10.1002/j.1538-7305.1948.tb00917.x. hdl : 11858/00-001M-0000-002C-4314-2 .
  10. ^ Шеннон, Клод Элвуд ; Уивер, Уоррен (1949). Математическая теория связи (PDF) . Издательство Иллинойсского университета . ISBN 0-252-72548-4. Архивировано из оригинала (PDF) 15.07.1998.
  11. ^ Фридман, Джером Х.; Тьюки, Джон Уайлдер (сентябрь 1974 г.). «Алгоритм поиска проекций для разведочного анализа данных». IEEE Transactions on Computers . C-23 (9): 881–890. doi :10.1109/TC.1974.224051. ISSN  0018-9340. OSTI  1442925. S2CID  7997450.
  12. ^ Дэвид Донохо (2017), 50 лет науки о данных, Журнал вычислительной и графической статистики, 2017, https://doi.org/10.1080/10618600.2017.1384734
  13. ^ Джон В. Тьюки (1962) Будущее анализа данных. Ann. Math. Statist. 33(1): 1-67. DOI: 10.1214/aoms/1177704711.
  14. ^ Фридман, Дж. Х. и Штюцле, В. (2002). Работа Джона В. Тьюки по интерактивной графике. Анналы статистики, 30(6), 1629-1639. http://www.jstor.org/stable/1558733
  15. ^ ab "Джон Тьюки - Биография". История математики . Получено 2022-02-18 .
  16. ^ П. МакКаллах, Джон Уайлдер Тьюки, Биографические мемуары членов Королевского общества 49 (2003), 538-559.
  17. ^ "Определение бита от Linux Information Project (LINFO)". www.linfo.org .
  18. ^ Talbot, M. (июнь 2000 г.). Биометрия . 56 (2): 649–650. doi :10.1111/j.0006-341X.2000.00647.x. JSTOR  2677019.{{cite journal}}: CS1 maint: безымянное периодическое издание ( ссылка )
  19. Купер, Марк (июль–август 2000 г.). Crop Science . 40 (4): 1184. doi :10.2135/cropsci2000.0015br.{{cite journal}}: CS1 maint: безымянное периодическое издание ( ссылка )
  20. ^ Хеклер, Чарльз Э. (февраль 2001 г.). Технометрика . 43 (1): 97–98. doi :10.1198/tech.2001.s547. JSTOR  1270862. S2CID  26430218.{{cite journal}}: CS1 maint: безымянное периодическое издание ( ссылка )
  21. ^ Broadfoot, L. (июнь 2001 г.). Журнал сельскохозяйственной науки . 136 (4): 471–475. doi :10.1017/s002185960124893x. S2CID  86230606.{{cite journal}}: CS1 maint: безымянное периодическое издание ( ссылка )

Внешние ссылки