Маргарет Мастерман

Маргарет Мастерман (4 мая 1910 — 1 апреля 1986) — британский лингвист и философ , наиболее известная своими новаторскими работами в области компьютерной лингвистики и особенно машинного перевода . Она основала Кембриджский отдел языковых исследований.

биография

Маргарет Мастерман родилась в Лондоне 4 мая 1910 года в семье Чарльза Ф. Г. Мастермана , британского радикального политика Либеральной партии и главы Бюро военной пропаганды , и Люси Бланш Литтелтон , политика, поэта и писательницы. В 1932 году она вышла замуж за Ричарда Бевана Брейтуэйта , философа. У них были сын Льюис Чарльз (1937 г.р.) и дочь Кэтрин Люси (1940 г.р.).

Работа

Маргарет Мастерман была одной из шести студенток курса Витгенштейна в 1933–1934 годах, чьи записи были собраны в «Синюю книгу» . ^[1] В 1955 году она основала и возглавила Кембриджское отделение языковых исследований (CLRU), которое в свое время превратилось из неформальной дискуссионной группы в крупный исследовательский центр в области компьютерной лингвистики . Она была студенткой Ньюнхэм-колледжа в Кембридже и изучала современные языки, а затем нравственные науки (так тогда называлась философия). Кембриджский отдел исследования языка был основан в небольшом, но красивом здании под названием «Музей Ади», в котором хранилось искусство Дальнего Востока: в его стены были встроены небольшие буддийские скульптуры , а в резные двери. В течение двадцати лет, начиная с 1953 года, он был источником значительных исследований в области машинного перевода, компьютерной лингвистики и квантовой физики, хотя и находился за пределами официальных университетских структур Кембриджа. Он финансировался за счет грантов агентств США (AFOSR, ONR, NSF), правительственных агентств Великобритании (OSTI), а затем и фондов ЕС в Люксембурге. Его вычислительное оборудование было примитивным — древний компьютер ICL 1202 — и большая часть более серьезных вычислений выполнялась либо на машинах Кембриджского университета, в тогдашней математической лаборатории, либо посетителями CLRU на объектах в США. Одним из показателей его влияния, а также со стороны штата, который никогда не превышал десяти человек, было вручение ежегодных наград за заслуги перед жизнью от Ассоциации компьютерной лингвистики в США. Трое из них были присуждены выпускникам CLRU: Мартину Кею , Карен Сперк Джонс и Йорику . Уилкс .

Маргарет Мастерман опередила свое время примерно на двадцать лет: многие из ее убеждений и предложений по компьютерной обработке речи теперь стали частью общего запаса идей в области искусственного интеллекта (ИИ) и машинного перевода (МП). Она никогда не могла предъявить им адекватных прав, потому что они были неприемлемы, когда она их опубликовала, и поэтому, когда они были позже записаны ее учениками или независимо «открыты» другими, от нее не осталось и следа, особенно в этих областях. где мало или вообще ничего из произведений старше десяти лет никогда не перечитывается.

Суть ее убеждений о языковой обработке заключалась в том, что она должна отражать связность языка, его избыточность как сигнала. Эта идея была частичным наследием старого «теоретического информационного» взгляда на язык: для нее это означало, что процессы анализа языка должны учитывать его повторяющиеся и избыточные структуры и что писатель продолжает говорить одно и то же снова и снова на разных языках. пути; только если автор сделает это, двусмысленность может быть удалена из сигнала. Иногда это приводило к тому, что она переоценивала реальную и явную избыточность, которую она находила в ритмичных и повторяющихся стихах, и утверждала (и это неправдоподобно), что нормальный английский был бы именно таким, если бы мы только могли видеть его правильно.

В последующие годы это привело к тому, что она отвела ключевую роль ритму, стрессу, группам дыхания и границам, которые они накладывают на текст и процессы понимания. Грубо говоря, ее утверждение заключалось в том, что языки такие, какие они есть, по крайней мере частично, потому, что они создаются существами, которые дышат через довольно регулярные промежутки времени. Станет очевидным, почему такие утверждения не могли быть даже приняты во внимание, в то время как взгляды Хомского были доминирующими в языковых исследованиях. Однако она никогда не могла дать систематических поверхностных критериев, по которым группы дыхания и паттерны напряжения можно было бы идентифицировать по поверхностным сигналам или можно было бы свести к другим критериям, таким как синтаксис или морфология, и она не стала бы заниматься реальной физикой голосовых паттернов.

На ее взгляды на важность семантики в языковой обработке (которые она продолжала защищать в период расцвета синтаксиса Хомского между 1951 и 1966 годами) большое влияние оказали взгляды Р. Х. Риченса на классификацию и описание с помощью языка семантических примитивов с свой собственный синтаксис. Они, наряду с соответствующими утверждениями о сопоставлении семантических шаблонов с поверхностным текстом, были развиты в реальных программах, из чего можно было предположить, что она искренне верила в существование семантических примитивов в некотором смысле Каца или Шанка. Ничто не могло быть дальше от истины: она была слишком большим скептиком Витгенштейна в отношении способности любого ограниченного подъязыка или логики взять на себя роль всего языка. Она всегда утверждала, что семантические примитивы имели бы смысл только в том случае, если бы существовали эмпирические критерии их открытия и теория, допускающая тот факт, что они тоже разовьют в точности полисемию любого высшего или естественного языка; и она всегда подчеркивала функциональную роль примитивов, например, в разрешении смысловой двусмысленности и в качестве интерлингвы для машинного перевода.

Она надеялась, что решение проблемы происхождения семантических примитивов будет заключаться либо в эмпирических процедурах классификации, действующих на реальных текстах (так, как некоторые сейчас говорят о получении примитивов путем массового коннекционистского обучения), либо в наличии адекватной формальной теории структура тезаурусов, которая, по ее мнению, делает явными определенные основные структуры семантических отношений в естественном языке: теория, согласно которой «примитивы» естественным образом возникают как организующая классификация тезаурусов. В течение нескольких лет она и ее коллеги исследовали теорию решеток как основную формальную структуру таких тезаурусов.

Две другие проблемы, которые прошли через ее интеллектуальную жизнь, во многом связаны с тем периодом, когда Майкл Холлидей , преподаватель китайского языка в Кембридже, был коллегой в CLRU. От него она получила идею о том, что синтаксическая теория является фундаментально семантической или прагматической, в любом категории и их фундаментальное определение, или с точки зрения роли синтаксиса как организующего принципа семантической информации. Она была первым исследователем искусственного интеллекта, на которого повлиял Холлидей, задолго до Терри Винограда . И снова она в течение значительного периода времени была озабочена природой и функцией китайских иероглифов, поскольку чувствовала, что они эмпирическим путем проясняют проблемы, с которыми Витгенштейн боролся в своей так называемой картинной теории истины. Это заставило ее преувеличивать общность идеограмматических принципов и, по-видимому, считать, что английский язык действительно очень похож на китайский, если только его правильно рассматривать, с его смысловыми атомами, весьма двусмысленными и практически неизменяемыми. Эта точка зрения практически не нашла поддержки в доминирующих лингвистических и вычислительных течениях того времени.

Ее главным творением в 1953 году, просуществовавшим двадцать лет, было Кембриджское отделение языковых исследований, выросшее из неформальной дискуссионной группы с весьма разнородным составом членов, интересующихся языком с философской и вычислительной точек зрения. Впоследствии отличительной особенностью работы Отдела стала попытка создать программы обработки языков, имеющие здравую философскую основу. Этот подход к языковой обработке и конкретная форма, которую он принял при использовании тезауруса в качестве основного средства для семантических операций, вероятно, будут рассматриваться как главный вклад Подразделения в эту область в целом, и именно Маргарет главная ответственность за них. Ее видение языковой обработки и ее возможностей было замечательным в то время, когда компьютеры были очень зачаточными: действительно, большая часть работы CLRU должна была быть выполнена на предшественниках компьютеров, а именно на перфокарточных машинах Холлерита. Точно так же решимость Маргарет в создании и поддержании Подразделения, с огромными усилиями по сбору средств, которые для этого были необходимы, была очень поразительной: тот факт, что оно могло продолжаться десятилетиями, и в периоды, когда общественную поддержку такой работы было трудно получить, это дань настойчивости и обаянию Маргарет. Сейчас, в наши дни искусственного интеллекта на обычном рынке и очень мощных персональных компьютеров, нам трудно осознать, насколько трудно было получить финансовые ресурсы, необходимые для исследований в области обработки речи, и технические ресурсы для реальных задач. эксперименты.

Возможно, лучший комментарий об инициативе Маргарет по исследованию языковой обработки и, в частности, работы по машинному переводу, исходит из несколько неожиданного источника. Машинный перевод, после первоначального периода больших надежд и некоторых крупных претензий, был брошен во тьму в 1966 году финансирующими агентствами, которые не видели никакой отдачи от своих денег. Подводя итог двадцатипятилетнему исследованию искусственного интеллекта в своем президентском обращении к Американской ассоциации искусственного интеллекта в 1985 году, Вуди Бледсо, один из давних лидеров в этой области, хотя и в областях, совершенно не связанных с языком, сказал о тех, кто пытался сделать машинный перевод: в пятидесятых и шестидесятых годах: «Возможно, они потерпели неудачу, но они были правы, попытавшись; мы многому научились из их попыток сделать что-то столь сложное».

То, что она и CLRU пытались сделать, намного опередило свое время. Были предприняты усилия для решения фундаментальных проблем, связанных с компьютерами того времени, которые имели мощность современных цифровых наручных часов. Несмотря на всевозможные проблемы, Группа выпустила многочисленные публикации по языку и смежным темам, включая поиск информации и автоматическую классификацию. На протяжении более десяти лет присутствие Подразделения сильно ощущалось на местах, всегда с упором на основные семантические проблемы понимания языка. У Маргарет не было времени для тех, кто считал, что все, что нужно сделать, — это синтаксический анализ или что полный анализ необходим, прежде чем делать что-либо еще. Теперь, когда семантика языка рассматривается как основная часть его машинного понимания, идеи CLRU кажутся удивительно современными.

Главный вклад Маргарет в жизнь CLRU заключался в постоянном интеллектуальном стимулировании его исследований, а через это и более широкого сообщества, занимающегося обработкой естественного языка: у нее были широкие интересы и нестандартные идеи, которые привели ее, например, к предложить тезаурус как средство выполнения многих различных задач языковой обработки, таких как индексирование и перевод. Акцент Маргарет на алгоритмах и их тестировании был жизненно важен для развития работы CLRU по языковой обработке; но ее идеи были примечательны, особенно для тех, кто работал с ней, не только своими интеллектуальными качествами, но и чистой радостью.

Серьезные исследования в CLRU прекратились примерно в 1978 году, и Маргарет попыталась возобновить работу CLRU в 1980 году вместе с Уильямом Уильямсом ^[2] в надежде, что новое поколение микрокомпьютеров можно будет использовать для разработки ее алгоритмов перевода на естественный язык. Маргарет прошла 7 миль от Миллингтон-роуд в Кембридже до Оруэлла и купила два компьютера North Star Horizon в компании Intelligent Artefacts (см. ST Robotics ). Они были установлены с помощью языка программирования Форт , написанного Дэвидом Сэндсом и используемого различными студентами Кембриджского университета, которые программировали алгоритмы Маргарет в компьютерах. Подход Маргарет к переводу на естественный язык в то время заключался в разделении предложения на сегменты «группы дыхания». Поскольку каждая группа дыхания имела уникальное значение, ее можно было перевести на целевой язык, а целевое предложение реконструировать с использованием переведенных групп дыхания. Это контрастировало с преобладающими методами языкового перевода того времени, особенно с Systran , который использовал систему, основанную на словаре и правилах, которая используется до сих пор. Когда в 1986 году умерла Маргарет, Уильям Уильямс закрыл CLRU, а его уникальная библиотека ранних документов MT была выброшена на свалку, хотя два университетских учреждения предложили предоставить ей дом.

Она была одним из сооснователей Колледжа Люси Кавендиш и его первым вице-президентом (1965–1975). Она была внучатой племянницей Люси Кавендиш, в честь которой назван колледж. Она также была основателем и главным вдохновителем группы « Философы Богоявления» , группы, которая в некоторой степени разделяла членство с CLRU и занималась изучением взаимоотношений науки и религии, а также форм религиозной практики.

В 1965 году Маргарет Мастерман прочитала работу «Природа парадигмы» на Четвертом Международном коллоквиуме по философии науки в Лондоне. ^[3] Она провела подробную текстовую критику книги Томаса С. Куна «Структура научных революций» (1962), охарактеризовав книгу как «одновременно ясную с научной точки зрения и неясную с философской точки зрения». Мастерман похвалил Куна как «одного из выдающихся философов науки нашего времени», а его концепцию парадигм как «фундаментальную и новую идею в философии науки». Она раскритиковала Томаса Куна за его расплывчатое и непоследовательное использование понятия «Парадигма», отметив, что оно используется как минимум в 21 различном смысле, которые можно обобщить в три группы: метапарадигмы, социологические парадигмы и артефактные или конструктные парадигмы. Мастерман предположил, что критики Куна в философии науки занимались только метапарадигмами и исследовали идеи и последствия различных концепций. Эта критика была принята Томасом Куном и сыграла решающую роль в сдвиге понятия «Парадигма» к «Несоизмеримости». ^[4]

Примечания

^ Амвросий, Алиса; Лазеровтиз, Моррис (2002). Людвиг Витгенштейн: Философия и язык . Лондон: Рутледж. п. 16. ISBN 978-0415488440.
^ Уильямс, Уильям; Ноулз, Фрэнк (1 января 1987 г.). «Маргарет Мастерман: Памяти». Компьютеры и перевод . 2 (4): 197–203. дои : 10.1007/bf01682179. JSTOR 25469921. S2CID 10246232.
^ Мастерман, Маргарет (1970) [1965], «Природа парадигмы», в Лакатосе, Имре; Масгрейв, Алан (ред.), Критика и рост знаний, Труды Международного коллоквиума 1965 года по философии науки, том. 4 (3-е изд.), Кембридж: Издательство Кембриджского университета, стр. 59–90, ISBN 9780521096232
^ Кун, Т.С. (1970) [1969], «Размышления о моих критиках», в Лакатосе, Имре; Масгрейв, Алан (ред.), Критика и рост знаний, Труды Международного коллоквиума 1965 года по философии науки, том. 4 (3-е изд.), Кембридж: Издательство Кембриджского университета, стр. 231–278, ISBN 9780521096232

Маргарет Мастерман

биография

Работа

Примечания

Рекомендации