AN/GSQ-16 Автоматический переводчик языка

Автоматический переводчик языка IBM был системой машинного перевода , которая преобразовывала русские документы в английские . Он использовал оптический диск , на котором хранилось 170 000 дословных и пословных переводов, и специальный компьютер для их быстрого поиска. Созданный для Отдела иностранных технологий ВВС США, AN /GSQ-16 (или XW-2 ), как его называли в ВВС, в основном использовался для преобразования советских технических документов для распространения среди западных ученых. Транслятор был установлен в 1959 году, существенно модернизирован в 1964 году и в конечном итоге был заменен мэйнфреймом, работающим под управлением SYSTRAN в 1970 году.

История

Фотоскопический магазин

Переводчик был начат в июне 1953 года по контракту между ВМС США и Международной телеметрической корпорацией (ITC) из Лос-Анджелеса. Это была не система перевода, а чисто научно-исследовательский контракт для высокопроизводительного фотографического онлайн-носителя данных, состоящего из небольших черных прямоугольников, встроенных в пластиковый диск. Когда первоначальный контракт закончился, то, что тогда называлось Римским центром развития авиации (RADC), занялось дальнейшим финансированием в 1954 году и далее. ^[1]

Система была разработана Гилбертом Кингом, главным инженером ITC, вместе с командой, в которую входил Луи Риденур . Она превратилась в 16-дюймовый пластиковый диск с данными, записанными в виде серии микроскопических черных прямоугольников или прозрачных пятен. Только самые внешние 4 дюйма диска использовались для хранения, что увеличивало линейную скорость части, к которой осуществлялся доступ. Когда диск вращался со скоростью 2400 об/мин, он имел скорость доступа около 1 Мбит/с. В общей сложности система хранила 30 Мбит, что делало ее самой плотной онлайн-системой своей эпохи. ^[1]^[a]

Марк I

В 1954 году IBM провела влиятельную демонстрацию машинного перевода, известную сегодня как « эксперимент Джорджтауна–IBM ». Работая на мэйнфрейме IBM 704 , система перевода знала только 250 слов русского языка, ограниченных областью органической химии, и только 6 грамматических правил для их объединения. Тем не менее, результаты были чрезвычайно многообещающими и широко освещались в прессе. ^[2]

В то время большинство исследователей в зарождающейся области машинного перевода считали, что основной проблемой для предоставления разумных переводов было создание большой библиотеки, поскольку устройства хранения данных той эпохи были и слишком маленькими, и слишком медленными, чтобы быть полезными для этой роли. ^[3] Кинг посчитал, что фотоскопическое хранилище было естественным решением проблемы, и представил идею автоматизированной системы перевода на основе фотохранилища Военно-воздушным силам. RADC проявил интерес и предоставил исследовательский грант в мае 1956 года. В то время Военно-воздушные силы также предоставили грант исследователям из Вашингтонского университета , которые работали над проблемой создания оптимального словаря перевода для проекта.

Кинг выступал за простой подход к переводам «слово в слово». Он считал, что естественная избыточность в языке позволит понять даже плохой перевод, и что одного локального контекста достаточно, чтобы обеспечить разумные догадки при столкновении с двусмысленными терминами. Он утверждал, что «успех человека в достижении вероятности 0,50 в предвосхищении слов в предложении во многом обусловлен его опытом и реальными значениями уже обнаруженных слов». ^[4] Другими словами, простой перевод одних только слов позволит человеку эффективно читать документ, поскольку он сможет вычленить правильное значение из контекста, предоставленного более ранними словами.

В 1958 году Кинг перешел в исследовательский центр IBM Thomas J. Watson Research Center и продолжил разработку переводчика на основе фотохранилища. Со временем Кинг изменил подход с чистого пословного переводчика на тот, который хранил «основы и окончания», что разбивало слова на части, которые можно было объединить обратно, чтобы снова сформировать целые слова. ^[4]

Первая машина, «Mark I», была продемонстрирована в июле 1959 года и состояла из словаря на 65 000 слов и специального компьютера на основе трубок для выполнения поиска. ^[3] Тексты вручную копировались на перфокарты с использованием специальных кириллических терминалов, а затем вводились в машину для перевода. Результаты были не слишком впечатляющими, но их было достаточно, чтобы предположить, что более крупная и быстрая машина будет разумной разработкой. Тем временем, Mark I применялась для переводов советской газеты « Правда» . Результаты продолжали оставаться сомнительными, но Кинг объявил ее успешной, заявив в Scientific American , что система была «...признана правительством в ходе эксплуатационной оценки весьма полезной». ^[3]

Марк II

4 октября 1957 года СССР запустил Спутник-1 , первый искусственный спутник. Это вызвало волну беспокойства в США, чей собственный проект «Авангард» был застигнут врасплох, а затем неоднократно проваливался в зрелищной манере. Этот неловкий поворот событий привел к огромным инвестициям в американскую науку и технику, включая формирование DARPA , NASA и различных разведывательных усилий, которые попытались бы избежать неожиданностей подобного рода снова.

После короткого периода разведывательные усилия были сосредоточены на базе ВВС Райт-Паттерсон в качестве Подразделения иностранных технологий (FTD, теперь известного как Национальный центр воздушной и космической разведки ), которым управляли ВВС при участии DIA и других организаций. FTD было поручено переводить советские и другие технические и научные журналы Варшавского блока , чтобы исследователи на «западе» могли быть в курсе событий за железным занавесом . Большинство этих документов были общедоступны, но FTD также делала ряд разовых переводов других материалов по запросу.

Предполагая, что квалифицированных переводчиков не хватает, FTD чрезвычайно заинтересовался усилиями Кинга в IBM. Финансирование для модернизированной машины вскоре появилось, и работа началась над системой «Mark II», основанной на транзисторном компьютере с более быстрым и высокопроизводительным 10-дюймовым стеклянным оптическим диском, вращающимся со скоростью 2400 об/мин. Другим дополнением стал оптический считыватель символов, предоставленный третьей стороной, который, как они надеялись, устранит трудоемкий процесс копирования русского текста на машиночитаемые карты. ^[3]

В 1960 году команда Вашингтона также присоединилась к IBM, принеся с собой свои усилия по созданию словаря. Словарь продолжал расширяться по мере того, как появлялось дополнительное хранилище, достигнув 170 000 слов и терминов к моменту его установки в FTD. В Mark II также было включено крупное обновление программного обеспечения, которое Кинг назвал «набивкой словаря». Набивка была попыткой решить проблемы неоднозначных слов путем «набивки» префиксов из более ранних слов в тексте. ^[3] Эти измененные слова совпадали с аналогичными заполненными словами в словаре, что уменьшало количество ложных срабатываний.

В 1962 году Кинг ушел из IBM в Itek , военного подрядчика, который быстро приобретал новые технологии. Разработка в IBM продолжалась, и система полностью вошла в эксплуатацию в FTD в феврале 1964 года. Система была продемонстрирована на Всемирной выставке в Нью-Йорке 1964 года . Версия на выставке включала словарь на 150 000 слов, из которых около 1/3 были фразами. Около 3500 из них хранились в оперативной памяти для повышения производительности, и была заявлена средняя скорость 20 слов в минуту. Результаты тщательно отобранного входного текста были весьма впечатляющими. ^[5] После возвращения в FTD она использовалась непрерывно до 1970 года, когда ее заменила машина, работающая под управлением SYSTRAN . ^[6]

Отчет АЛПАК

В 1964 году Министерство обороны США поручило Национальной академии наук США (NAS) подготовить отчет о состоянии машинного перевода. NAS сформировала «Консультативный комитет по автоматической обработке языка» ( ALPAC ) и опубликовала свои выводы в 1966 году. Отчет « Язык и машины: компьютеры в переводе и лингвистике » был весьма критически настроен по отношению к существующим усилиям, демонстрируя, что системы были не быстрее, чем человеческие переводы, а также демонстрируя, что предполагаемая нехватка переводчиков на самом деле была излишком, и в результате проблем со спросом и предложением человеческий перевод был относительно недорогим — около 6 долларов за 1000 слов. Хуже того, FTD также был медленнее; тесты с использованием статей по физике в качестве входных данных показали, что переводчик был «на 10 процентов менее точным, на 21 процент медленнее и имел уровень понимания на 29 процентов ниже, чем при использовании человеческого перевода». ^[7]

Отчет ALPAC имел такое же влияние, как и эксперимент в Джорджтауне десятилетием ранее; сразу после его публикации правительство США приостановило почти все финансирование исследований в области машинного перевода. ^[8] Текущая работа в IBM и Itek завершилась к 1966 году, оставив поле деятельности европейцам, которые продолжили разработку таких систем, как SYSTRAN и Logos.

Примечания

^ Эти цифры для ранних дисковых систем, по-видимому, неточны — другой документ того же автора предполагает, что эти цифры на самом деле относятся к более поздней версии, использовавшейся в трансляторе Mark II.

Ссылки

Цитаты

^ ab Hutchins, стр. 171
↑ Джон Хатчинс, «Первая публичная демонстрация машинного перевода: система Джорджтаун-IBM, 7 января 1954 г.» Архивировано 3 марта 2016 г. на Wayback Machine
^ abcde Хатчинс, стр. 172
^ Эб Кинг, 1956
^ Хатчинс, стр. 174
^ Хатчинс, стр. 175
^ ALPAC, стр. 20
↑ Джон Хатчинс, «ALPAC: (печально)известный отчет». Архивировано 6 октября 2007 г. на Wayback Machine.

Библиография

GW King, GW Brown и LN Ridenour, «Фотографические методы хранения информации», Труды IRE , том 41, выпуск 10 (октябрь 1953 г.), стр. 1421–1428
GW King, «Стохастические методы механического перевода», Механический перевод , том 3, выпуск 2 (1956), стр. 38–39
JL Craft, EH Goldman, WB Strohm, «Машина просмотра таблиц для обработки естественных языков», IBM Journal , июль 1961 г., стр. 192–203
Консультативный комитет по языковой обработке, «Язык и машины: компьютеры в переводе и лингвистике», Национальный исследовательский совет , 1966 (широко известен как «Отчет ALPAC»)
Джон Хатчинс (редактор), «Гилберт У. Кинг и переводчик IBM-USAF», Early Years in Machine Translation , Joh Benjamins, 2000, ISBN 90-272-4586-X (RADC-TDR-62-105)
Чарльз Борн и Труди Беллардо Хан, «История онлайновых информационных служб, 1963–1976», MIT Press, 2003, ISBN 0-262-02538-8

Смотрите также

Список военной электроники США