stringtranslate.com

AN/GSQ-16 Автоматический переводчик языка

Автоматический переводчик языка IBM был системой машинного перевода , которая преобразовывала русские документы в английские . Он использовал оптический диск , на котором хранилось 170 000 дословных и пословных переводов, и специальный компьютер для их быстрого поиска. Созданный для Отдела иностранных технологий ВВС США, AN /GSQ-16 (или XW-2 ), как его называли в ВВС, в основном использовался для преобразования советских технических документов для распространения среди западных ученых. Транслятор был установлен в 1959 году, существенно модернизирован в 1964 году и в конечном итоге был заменен мэйнфреймом, работающим под управлением SYSTRAN в 1970 году.

История

Фотоскопический магазин

Переводчик был начат в июне 1953 года по контракту между ВМС США и Международной телеметрической корпорацией (ITC) из Лос-Анджелеса. Это была не система перевода, а чисто научно-исследовательский контракт для высокопроизводительного фотографического онлайн-носителя данных, состоящего из небольших черных прямоугольников, встроенных в пластиковый диск. Когда первоначальный контракт закончился, то, что тогда называлось Римским центром развития авиации (RADC), занялось дальнейшим финансированием в 1954 году и далее. [1]

Система была разработана Гилбертом Кингом, главным инженером ITC, вместе с командой, в которую входил Луи Риденур . Она превратилась в 16-дюймовый пластиковый диск с данными, записанными в виде серии микроскопических черных прямоугольников или прозрачных пятен. Только самые внешние 4 дюйма диска использовались для хранения, что увеличивало линейную скорость части, к которой осуществлялся доступ. Когда диск вращался со скоростью 2400 об/мин, он имел скорость доступа около 1 Мбит/с. В общей сложности система хранила 30 Мбит, что делало ее самой плотной онлайн-системой своей эпохи. [1] [a]

Марк I

В 1954 году IBM провела влиятельную демонстрацию машинного перевода, известную сегодня как « эксперимент Джорджтауна–IBM ». Работая на мэйнфрейме IBM 704 , система перевода знала только 250 слов русского языка, ограниченных областью органической химии, и только 6 грамматических правил для их объединения. Тем не менее, результаты были чрезвычайно многообещающими и широко освещались в прессе. [2]

В то время большинство исследователей в зарождающейся области машинного перевода считали, что основной проблемой для предоставления разумных переводов было создание большой библиотеки, поскольку устройства хранения данных той эпохи были и слишком маленькими, и слишком медленными, чтобы быть полезными для этой роли. [3] Кинг посчитал, что фотоскопическое хранилище было естественным решением проблемы, и представил идею автоматизированной системы перевода на основе фотохранилища Военно-воздушным силам. RADC проявил интерес и предоставил исследовательский грант в мае 1956 года. В то время Военно-воздушные силы также предоставили грант исследователям из Вашингтонского университета , которые работали над проблемой создания оптимального словаря перевода для проекта.

Кинг выступал за простой подход к переводам «слово в слово». Он считал, что естественная избыточность в языке позволит понять даже плохой перевод, и что одного локального контекста достаточно, чтобы обеспечить разумные догадки при столкновении с двусмысленными терминами. Он утверждал, что «успех человека в достижении вероятности 0,50 в предвосхищении слов в предложении во многом обусловлен его опытом и реальными значениями уже обнаруженных слов». [4] Другими словами, простой перевод одних только слов позволит человеку эффективно читать документ, поскольку он сможет вычленить правильное значение из контекста, предоставленного более ранними словами.

В 1958 году Кинг перешел в исследовательский центр IBM Thomas J. Watson Research Center и продолжил разработку переводчика на основе фотохранилища. Со временем Кинг изменил подход с чистого пословного переводчика на тот, который хранил «основы и окончания», что разбивало слова на части, которые можно было объединить обратно, чтобы снова сформировать целые слова. [4]

Первая машина, «Mark I», была продемонстрирована в июле 1959 года и состояла из словаря на 65 000 слов и специального компьютера на основе трубок для выполнения поиска. [3] Тексты вручную копировались на перфокарты с использованием специальных кириллических терминалов, а затем вводились в машину для перевода. Результаты были не слишком впечатляющими, но их было достаточно, чтобы предположить, что более крупная и быстрая машина будет разумной разработкой. Тем временем, Mark I применялась для переводов советской газеты « Правда» . Результаты продолжали оставаться сомнительными, но Кинг объявил ее успешной, заявив в Scientific American , что система была «...признана правительством в ходе эксплуатационной оценки весьма полезной». [3]

Марк II

4 октября 1957 года СССР запустил Спутник-1 , первый искусственный спутник. Это вызвало волну беспокойства в США, чей собственный проект «Авангард» был застигнут врасплох, а затем неоднократно проваливался в зрелищной манере. Этот неловкий поворот событий привел к огромным инвестициям в американскую науку и технику, включая формирование DARPA , NASA и различных разведывательных усилий, которые попытались бы избежать неожиданностей подобного рода снова.

После короткого периода разведывательные усилия были сосредоточены на базе ВВС Райт-Паттерсон в качестве Подразделения иностранных технологий (FTD, теперь известного как Национальный центр воздушной и космической разведки ), которым управляли ВВС при участии DIA и других организаций. FTD было поручено переводить советские и другие технические и научные журналы Варшавского блока , чтобы исследователи на «западе» могли быть в курсе событий за железным занавесом . Большинство этих документов были общедоступны, но FTD также делала ряд разовых переводов других материалов по запросу.

Предполагая, что квалифицированных переводчиков не хватает, FTD чрезвычайно заинтересовался усилиями Кинга в IBM. Финансирование для модернизированной машины вскоре появилось, и работа началась над системой «Mark II», основанной на транзисторном компьютере с более быстрым и высокопроизводительным 10-дюймовым стеклянным оптическим диском, вращающимся со скоростью 2400 об/мин. Другим дополнением стал оптический считыватель символов, предоставленный третьей стороной, который, как они надеялись, устранит трудоемкий процесс копирования русского текста на машиночитаемые карты. [3]

В 1960 году команда Вашингтона также присоединилась к IBM, принеся с собой свои усилия по созданию словаря. Словарь продолжал расширяться по мере того, как появлялось дополнительное хранилище, достигнув 170 000 слов и терминов к моменту его установки в FTD. В Mark II также было включено крупное обновление программного обеспечения, которое Кинг назвал «набивкой словаря». Набивка была попыткой решить проблемы неоднозначных слов путем «набивки» префиксов из более ранних слов в тексте. [3] Эти измененные слова совпадали с аналогичными заполненными словами в словаре, что уменьшало количество ложных срабатываний.

В 1962 году Кинг ушел из IBM в Itek , военного подрядчика, который быстро приобретал новые технологии. Разработка в IBM продолжалась, и система полностью вошла в эксплуатацию в FTD в феврале 1964 года. Система была продемонстрирована на Всемирной выставке в Нью-Йорке 1964 года . Версия на выставке включала словарь на 150 000 слов, из которых около 1/3 были фразами. Около 3500 из них хранились в оперативной памяти для повышения производительности, и была заявлена ​​средняя скорость 20 слов в минуту. Результаты тщательно отобранного входного текста были весьма впечатляющими. [5] После возвращения в FTD она использовалась непрерывно до 1970 года, когда ее заменила машина, работающая под управлением SYSTRAN . [6]

Отчет АЛПАК

В 1964 году Министерство обороны США поручило Национальной академии наук США (NAS) подготовить отчет о состоянии машинного перевода. NAS сформировала «Консультативный комитет по автоматической обработке языка» ( ALPAC ) и опубликовала свои выводы в 1966 году. Отчет « Язык и машины: компьютеры в переводе и лингвистике » был весьма критически настроен по отношению к существующим усилиям, демонстрируя, что системы были не быстрее, чем человеческие переводы, а также демонстрируя, что предполагаемая нехватка переводчиков на самом деле была излишком, и в результате проблем со спросом и предложением человеческий перевод был относительно недорогим — около 6 долларов за 1000 слов. Хуже того, FTD также был медленнее; тесты с использованием статей по физике в качестве входных данных показали, что переводчик был «на 10 процентов менее точным, на 21 процент медленнее и имел уровень понимания на 29 процентов ниже, чем при использовании человеческого перевода». [7]

Отчет ALPAC имел такое же влияние, как и эксперимент в Джорджтауне десятилетием ранее; сразу после его публикации правительство США приостановило почти все финансирование исследований в области машинного перевода. [8] Текущая работа в IBM и Itek завершилась к 1966 году, оставив поле деятельности европейцам, которые продолжили разработку таких систем, как SYSTRAN и Logos.

Примечания

  1. ^ Эти цифры для ранних дисковых систем, по-видимому, неточны — другой документ того же автора предполагает, что эти цифры на самом деле относятся к более поздней версии, использовавшейся в трансляторе Mark II.

Ссылки

Цитаты

  1. ^ ab Hutchins, стр. 171
  2. Джон Хатчинс, «Первая публичная демонстрация машинного перевода: система Джорджтаун-IBM, 7 января 1954 г.» Архивировано 3 марта 2016 г. на Wayback Machine
  3. ^ abcde Хатчинс, стр. 172
  4. ^ Эб Кинг, 1956
  5. ^ Хатчинс, стр. 174
  6. ^ Хатчинс, стр. 175
  7. ^ ALPAC, стр. 20
  8. Джон Хатчинс, «ALPAC: (печально)известный отчет». Архивировано 6 октября 2007 г. на Wayback Machine.

Библиография

Смотрите также