stringtranslate.com

Маргарет Мастерман

Маргарет Мастерман (4 мая 1910 г. – 1 апреля 1986 г.) была британским лингвистом и философом , наиболее известной своими пионерскими работами в области компьютерной лингвистики и особенно машинного перевода . Она основала Cambridge Language Research Unit.

Биография

Маргарет Мастерман родилась в Лондоне 4 мая 1910 года в семье Чарльза Ф. Г. Мастермана , радикального британского политика Либеральной партии и главы Бюро военной пропаганды , и Люси Бланш Литтелтон , политика, поэтессы и писательницы. В 1932 году она вышла замуж за Ричарда Бевана Брейтуэйта , философа. У них был сын Льюис Чарльз (родился в 1937 году) и дочь Кэтрин Люси (родилась в 1940 году).

Работа

Маргарет Мастерман была одной из шести студентов курса Витгенштейна 1933–34 годов, чьи заметки были собраны в «Синюю книгу» . [1] В 1955 году она основала и возглавила Кембриджский исследовательский центр языка (CLRU), который вырос из неформальной дискуссионной группы в крупный исследовательский центр в области компьютерной лингвистики своего времени. Она была студенткой Ньюнхэм-колледжа в Кембридже и изучала современные языки, а затем моральные науки (как тогда называлась философия). Кембриджский исследовательский центр языка был основан в небольшом, но красивом здании под названием Музей Эйди, в котором размещалось дальневосточное искусство: небольшие буддийские скульптуры были встроены в его стены и резные двери. В течение двадцати лет, начиная с 1953 года, он был источником значительных исследований в области машинного перевода, компьютерной лингвистики и квантовой физики, хотя и находился за пределами официальных университетских структур в Кембридже. Он финансировался грантами от агентств США (AFOSR, ONR, NSF), правительственных агентств Великобритании (OSTI) и позднее из фондов ЕС в Люксембурге. Его вычислительные мощности были примитивными — древний компьютер ICL 1202 — и большинство его более серьезных вычислений выполнялось либо на машине Кембриджского университета, в тогдашней Математической лаборатории, либо посетителями CLRU на объектах в США. Одним из показателей его влияния, и от штата, который никогда не превышал десяти человек, были ежегодные награды за достижения в жизни от Ассоциации компьютерной лингвистики в США, три из которых были вручены выпускникам CLRU: Мартину Кею , Карен Спарк Джонс и Йорику Уилксу .

Маргарет Мастерман опередила свое время примерно на двадцать лет: многие из ее убеждений и предложений по обработке языка компьютером теперь стали частью общего запаса идей в области искусственного интеллекта (ИИ) и машинного перевода (МП). Она так и не смогла адекватно заявить о своих правах на них, поскольку они были неприемлемы, когда она их публиковала, и поэтому, когда они были позже записаны ее учениками или независимо «открыты» другими, не было никаких следов, ведущих к ней, особенно в этих областях, где мало или вообще ничего, что было написано более десяти лет назад, когда-либо перечитывалось.

Суть ее убеждений относительно обработки языка заключалась в том, что она должна отражать связность языка, его избыточность как сигнала. Эта идея была частичным наследием старого "информационно-теоретического" взгляда на язык: для нее это означало, что процессы, анализирующие язык, должны учитывать его повторяющиеся и избыточные структуры и что писатель продолжает говорить одно и то же снова и снова разными способами; только если писатель делает это, двусмысленности могут быть удалены из сигнала. Это иногда приводило ее к чрезмерному акцентированию реальной и явной избыточности, которую она находила в ритмичных и повторяющихся стихах, и неправдоподобному утверждению, что нормальный английский был именно таким, если бы мы могли видеть его правильно.

Это привело в последующие годы к ключевой роли, которую она отвела ритму, ударению, группам дыхания и границам, которые они накладывают на текст и процессы понимания. Грубо говоря, ее утверждение состояло в том, что языки являются такими, какие они есть, по крайней мере отчасти, потому что они производятся существами, которые дышат с довольно регулярными интервалами. Будет очевидно, почему такие утверждения даже не могли быть приняты во внимание, пока взгляды Хомского были выдающимися в языковых исследованиях. Однако она никогда не могла дать систематических поверхностных критериев, по которым группы дыхания и модели ударения должны были быть идентифицированы поверхностными сигналами или могли быть сведены к другим критериям, таким как синтаксис или морфология, и она не стала заниматься фактической физикой моделей голоса.

Ее взгляды на важность семантики в обработке языка (которые она продолжала защищать в годы расцвета синтаксиса Хомского между 1951 и 1966 годами) во многом были обусловлены взглядами Р. Х. Риченса на классификацию и описание посредством языка семантических примитивов с его собственным синтаксисом. Они, наряду с соответствующими утверждениями о сопоставлении семантических шаблонов с поверхностным текстом, были разработаны в реальных программах, из чего можно было бы предположить, что она была прямым сторонником существования семантических примитивов в некотором смысле Каца или Шенка. Ничто не могло быть дальше от истины: поскольку она была слишком скептиком Витгенштейна относительно способности любого ограниченного подъязыка или логики взять на себя роль всего языка. Она всегда утверждала, что семантические примитивы будут иметь смысл только в том случае, если будут эмпирические критерии для их открытия и теория, которая допускала тот факт, что они тоже будут развивать в точности полисемию любого более высокого или естественного языка; и она всегда подчеркивала функциональную роль примитивов, например, в разрешении смысловой неоднозначности и в качестве языка-посредника для машинного перевода.

Она надеялась, что выход из проблемы происхождения семантических примитивов будет заключаться либо в эмпирических процедурах классификации, работающих с реальными текстами (так, как некоторые сейчас говорят о получении примитивов путем массового коннекционистского обучения), либо в наличии адекватной формальной теории структуры тезаурусов, которая, как она считала, сделает явными определенные базовые структуры семантических отношений в естественном языке: теория, такая, что «примитивы» возникнут естественным образом как организующая классификация тезаурусов. В течение нескольких лет она и ее коллеги исследовали теорию решеток как базовую формальную структуру таких тезаурусов.

Два других вопроса, которые прошли через ее интеллектуальную жизнь, во многом обязаны периоду, когда Майкл Холлидей , как университетский преподаватель китайского языка в Кембридже, был коллегой в CLRU. Она получила от него идею о том, что синтаксическая теория была фундаментально семантической или прагматической, либо в своих категориях и их фундаментальном определении, либо с точки зрения роли синтаксиса как принципа организации семантической информации. Она была первым исследователем ИИ, на которого повлиял Холлидей, задолго до Терри Винограда . Опять же, она была озабочена в течение значительного периода природой и функцией китайских идеограмм, потому что она чувствовала, что они проясняют эмпирическим образом проблемы, с которыми Витгенштейн боролся в своей так называемой картинной теории истины. Это привело ее к преувеличению общности идеограмматических принципов и, по-видимому, к утверждению, что английский язык на самом деле довольно похож на китайский, если только смотреть на него правильно, с его атомами значений, весьма неоднозначными и практически неизменяемыми. Эта точка зрения не нашла особой поддержки в доминирующих лингвистических и компьютерных течениях того времени.

Ее главным детищем в 1953 году, которое просуществовало двадцать лет, было Cambridge Language Research Unit, которое выросло из неформальной дискуссионной группы с очень разнородным составом участников, интересовавшихся языком с философской и вычислительной точек зрения. Впоследствии попытка создания программ обработки языка, имевших прочную философскую основу, стала отличительной чертой работы Unit. Этот подход к обработке языка и конкретная форма, которую он принял в использовании тезауруса в качестве основного средства для семантических операций, вероятно, будут рассматриваться как основные вклады Unit в эту область в целом, и именно Маргарет была основной ответственной за них. Ее видение обработки языка и ее возможностей было замечательным в то время, когда компьютеры были очень примитивными: действительно, большую часть работы CLRU приходилось выполнять на предшественниках компьютеров, а именно на машинах с перфокартами Холлерита. Равным образом, решимость Маргарет в создании и поддержании Подразделения, с огромными усилиями по сбору средств, которые это потребовало, была очень поразительной: тот факт, что оно могло продолжаться десятилетиями, и в периоды, когда государственная поддержка такой работы была труднодоступной, является данью уважения настойчивости и обаянию Маргарет. Сейчас, в эти дни искусственного интеллекта на обычном рынке и очень мощных персональных компьютеров, нам трудно осознать, как трудно было получить финансовые ресурсы, необходимые для исследований в области обработки языка, и технические ресурсы для проведения реальных экспериментов.

Возможно, лучший комментарий об инициативе Маргарет в начале исследований обработки языка и, в частности, работы по машинному переводу, исходит из несколько неожиданного источника. Машинный перевод, после первоначального периода больших надежд и некоторых крупных заявлений, был брошен во тьму в 1966 году финансирующими агентствами, которые не увидели большой отдачи от своих денег. Обзор двадцати пяти лет исследований искусственного интеллекта в своем президентском обращении к Американской ассоциации искусственного интеллекта в 1985 году, Вуди Бледсоу, один из давних лидеров этой области, хотя и в областях, совершенно не связанных с языком, сказал о тех, кто пытался машинный перевод в пятидесятых и шестидесятых годах: «Они, возможно, потерпели неудачу, но они были правы, что попытались; мы так многому научились из их попыток сделать что-то столь сложное».

То, что она и CLRU пытались сделать, намного опередило свое время. Были предприняты усилия по решению фундаментальных проблем с помощью компьютеров того времени, которые имели мощность современных цифровых наручных часов. Несмотря на все виды проблем, Подразделение выпустило множество публикаций по языку и связанным с ним предметам, включая поиск информации и автоматическую классификацию. Более десяти лет присутствие Подразделения было сильно ощутимо в этой области, всегда с акцентом на основные семантические проблемы понимания языка. У Маргарет не было времени на тех, кто считал, что все, что нужно сделать, это синтаксический анализ или что полный анализ необходим, прежде чем делать что-либо еще. Теперь, когда семантика языка рассматривается как базовая часть его понимания машиной, идеи CLRU кажутся на удивление современными.

Главный вклад Маргарет в жизнь CLRU состоял в постоянном интеллектуальном стимулировании, которое она давала его исследованиям, а через них и более широкому сообществу обработки естественного языка: у нее были широкие интересы и сторонние идеи, которые привели ее, например, к предложению тезауруса как средства выполнения многих отдельных задач обработки языка, таких как индексация и перевод. Акцент Маргарет на алгоритмах и на их тестировании был жизненно важен для развития работы CLRU по обработке языка; но ее идеи были примечательны, особенно для тех, кто работал с ней, не только своими интеллектуальными качествами, но и своей чистой радостью.

Серьёзные исследования в CLRU прекратились около 1978 года, и Маргарет попыталась перезапустить CLRU в 1980 году с Уильямом Уильямсом [2] в надежде, что новое поколение микрокомпьютеров может быть использовано для разработки её алгоритмов для перевода на естественный язык. Маргарет прошла 7 миль от Миллингтон-роуд в Кембридже до Оруэлла и купила два компьютера North Star Horizon у Intelligent Artefacts (см. ST Robotics ). Они были установлены с языком программирования Forth , написанным Дэвидом Сэндсом, и использовались различными студентами из Кембриджского университета, которые программировали алгоритмы Маргарет в компьютерах. Подход Маргарет к переводу на естественный язык в то время заключался в разбиении предложения на сегменты «групп дыхания». Поскольку каждая группа дыхания имела уникальное значение, её можно было перевести на целевой язык, а целевое предложение реконструировать с помощью переведенных групп дыхания. Это контрастировало с преобладающими методами перевода на язык того времени, в частности с Systran , который использовал словарь и систему на основе правил, которая используется и сегодня. После смерти Маргарет в 1986 году Уильям Уильямс закрыл CLRU, а его уникальную библиотеку ранних документов MT выбросили в мусорное ведро, хотя два университетских органа предлагали предоставить ей свое жилье.

Она была одним из основателей колледжа Люси Кавендиш и его первым вице-президентом (1965–1975). Она была внучатой ​​племянницей Люси Кавендиш, в честь которой назван колледж. Она также была основателем и главным вдохновителем группы Epiphany Philosophers , которая разделяла часть членства с CLRU и была посвящена изучению взаимосвязи науки и религии и форм религиозной практики.

В 1965 году Маргарет Мастерман прочитала работу: «Природа парадигмы» на Четвертом международном коллоквиуме по философии науки в Лондоне. [3] Она провела подробную текстовую критику книги Томаса С. Куна «Структура научных революций» (1962), охарактеризовав книгу как «одновременно научно ясную и философски неясную». Мастерман похвалила Куна как «одного из выдающихся философов науки нашего времени», а его концепцию парадигм — как «фундаментальную идею и новую в философии науки». Она критиковала Томаса Куна за его расплывчатое и непоследовательное использование понятия «парадигма», отметив, что оно используется по крайней мере в 21 различном смысле, которые можно обобщить в три группы: метапарадигмы, социологические парадигмы и парадигмы артефактов или конструкций. Мастерман предположил, что критики Куна в философии науки имели дело только с метапарадигмами и исследовали прозрения и следствия различных концепций. Эта критика была принята Томасом Куном и сыграла решающую роль в изменении понятия «Парадигма» на «Несоизмеримость». [4]

Примечания

  1. ^ Эмброуз, Элис; Лазеровиц, Моррис (2002). Людвиг Витгенштейн: Философия и язык . Лондон: Routledge. стр. 16. ISBN 978-0415488440.
  2. Уильямс, Уильям; Ноулз, Фрэнк (1 января 1987 г.). «Маргарет Мастерман: В память о ней». Компьютеры и перевод . 2 (4): 197–203. doi :10.1007/bf01682179. JSTOR  25469921. S2CID  10246232.
  3. ^ Мастерман, Маргарет (1970) [1965], «Природа парадигмы», в Лакатос, Имре; Масгрейв, Алан (ред.), Критика и рост знания, Труды Международного коллоквиума по философии науки 1965 года, т. 4 (3-е изд.), Кембридж: Cambridge University Press, стр. 59–90, ISBN 9780521096232
  4. ^ Kuhn, TS (1970) [1969], «Размышления о моих критиках», в Lakatos, Imre; Musgrave, Alan (ред.), Criticism and the Growth of Knowledge, Proceedings of the 1965 International Colloquium in the Philosophy of Science, т. 4 (3-е изд.), Cambridge: Cambridge University Press, стр. 231–278, ISBN 9780521096232

Ссылки