Автоматический переводчик языка IBM был системой машинного перевода , которая преобразовывала русские документы в английские . Он использовал оптический диск , на котором хранилось 170 000 дословных и пословных переводов, и специальный компьютер для их быстрого поиска. Созданный для Отдела иностранных технологий ВВС США, AN /GSQ-16 (или XW-2 ), как его называли в ВВС, в основном использовался для преобразования советских технических документов для распространения среди западных ученых. Транслятор был установлен в 1959 году, существенно модернизирован в 1964 году и в конечном итоге был заменен мэйнфреймом, работающим под управлением SYSTRAN в 1970 году.
Переводчик был начат в июне 1953 года по контракту между ВМС США и Международной телеметрической корпорацией (ITC) из Лос-Анджелеса. Это была не система перевода, а чисто научно-исследовательский контракт для высокопроизводительного фотографического онлайн-носителя данных, состоящего из небольших черных прямоугольников, встроенных в пластиковый диск. Когда первоначальный контракт закончился, то, что тогда называлось Римским центром развития авиации (RADC), занялось дальнейшим финансированием в 1954 году и далее. [1]
Система была разработана Гилбертом Кингом, главным инженером ITC, вместе с командой, в которую входил Луи Риденур . Она превратилась в 16-дюймовый пластиковый диск с данными, записанными в виде серии микроскопических черных прямоугольников или прозрачных пятен. Только самые внешние 4 дюйма диска использовались для хранения, что увеличивало линейную скорость части, к которой осуществлялся доступ. Когда диск вращался со скоростью 2400 об/мин, он имел скорость доступа около 1 Мбит/с. В общей сложности система хранила 30 Мбит, что делало ее самой плотной онлайн-системой своей эпохи. [1] [a]
В 1954 году IBM провела влиятельную демонстрацию машинного перевода, известную сегодня как « эксперимент Джорджтауна–IBM ». Работая на мэйнфрейме IBM 704 , система перевода знала только 250 слов русского языка, ограниченных областью органической химии, и только 6 грамматических правил для их объединения. Тем не менее, результаты были чрезвычайно многообещающими и широко освещались в прессе. [2]
В то время большинство исследователей в зарождающейся области машинного перевода считали, что основной проблемой для предоставления разумных переводов было создание большой библиотеки, поскольку устройства хранения данных той эпохи были и слишком маленькими, и слишком медленными, чтобы быть полезными для этой роли. [3] Кинг посчитал, что фотоскопическое хранилище было естественным решением проблемы, и представил идею автоматизированной системы перевода на основе фотохранилища Военно-воздушным силам. RADC проявил интерес и предоставил исследовательский грант в мае 1956 года. В то время Военно-воздушные силы также предоставили грант исследователям из Вашингтонского университета , которые работали над проблемой создания оптимального словаря перевода для проекта.
Кинг выступал за простой подход к переводам «слово в слово». Он считал, что естественная избыточность в языке позволит понять даже плохой перевод, и что одного локального контекста достаточно, чтобы обеспечить разумные догадки при столкновении с двусмысленными терминами. Он утверждал, что «успех человека в достижении вероятности 0,50 в предвосхищении слов в предложении во многом обусловлен его опытом и реальными значениями уже обнаруженных слов». [4] Другими словами, простой перевод одних только слов позволит человеку эффективно читать документ, поскольку он сможет вычленить правильное значение из контекста, предоставленного более ранними словами.
В 1958 году Кинг перешел в исследовательский центр IBM Thomas J. Watson Research Center и продолжил разработку переводчика на основе фотохранилища. Со временем Кинг изменил подход с чистого пословного переводчика на тот, который хранил «основы и окончания», что разбивало слова на части, которые можно было объединить обратно, чтобы снова сформировать целые слова. [4]
Первая машина, «Mark I», была продемонстрирована в июле 1959 года и состояла из словаря на 65 000 слов и специального компьютера на основе трубок для выполнения поиска. [3] Тексты вручную копировались на перфокарты с использованием специальных кириллических терминалов, а затем вводились в машину для перевода. Результаты были не слишком впечатляющими, но их было достаточно, чтобы предположить, что более крупная и быстрая машина будет разумной разработкой. Тем временем, Mark I применялась для переводов советской газеты « Правда» . Результаты продолжали оставаться сомнительными, но Кинг объявил ее успешной, заявив в Scientific American , что система была «...признана правительством в ходе эксплуатационной оценки весьма полезной». [3]
4 октября 1957 года СССР запустил Спутник-1 , первый искусственный спутник. Это вызвало волну беспокойства в США, чей собственный проект «Авангард» был застигнут врасплох, а затем неоднократно проваливался в зрелищной манере. Этот неловкий поворот событий привел к огромным инвестициям в американскую науку и технику, включая формирование DARPA , NASA и различных разведывательных усилий, которые попытались бы избежать неожиданностей подобного рода снова.
После короткого периода разведывательные усилия были сосредоточены на базе ВВС Райт-Паттерсон в качестве Подразделения иностранных технологий (FTD, теперь известного как Национальный центр воздушной и космической разведки ), которым управляли ВВС при участии DIA и других организаций. FTD было поручено переводить советские и другие технические и научные журналы Варшавского блока , чтобы исследователи на «западе» могли быть в курсе событий за железным занавесом . Большинство этих документов были общедоступны, но FTD также делала ряд разовых переводов других материалов по запросу.
Предполагая, что квалифицированных переводчиков не хватает, FTD чрезвычайно заинтересовался усилиями Кинга в IBM. Финансирование для модернизированной машины вскоре появилось, и работа началась над системой «Mark II», основанной на транзисторном компьютере с более быстрым и высокопроизводительным 10-дюймовым стеклянным оптическим диском, вращающимся со скоростью 2400 об/мин. Другим дополнением стал оптический считыватель символов, предоставленный третьей стороной, который, как они надеялись, устранит трудоемкий процесс копирования русского текста на машиночитаемые карты. [3]
В 1960 году команда Вашингтона также присоединилась к IBM, принеся с собой свои усилия по созданию словаря. Словарь продолжал расширяться по мере того, как появлялось дополнительное хранилище, достигнув 170 000 слов и терминов к моменту его установки в FTD. В Mark II также было включено крупное обновление программного обеспечения, которое Кинг назвал «набивкой словаря». Набивка была попыткой решить проблемы неоднозначных слов путем «набивки» префиксов из более ранних слов в тексте. [3] Эти измененные слова совпадали с аналогичными заполненными словами в словаре, что уменьшало количество ложных срабатываний.
В 1962 году Кинг ушел из IBM в Itek , военного подрядчика, который быстро приобретал новые технологии. Разработка в IBM продолжалась, и система полностью вошла в эксплуатацию в FTD в феврале 1964 года. Система была продемонстрирована на Всемирной выставке в Нью-Йорке 1964 года . Версия на выставке включала словарь на 150 000 слов, из которых около 1/3 были фразами. Около 3500 из них хранились в оперативной памяти для повышения производительности, и была заявлена средняя скорость 20 слов в минуту. Результаты тщательно отобранного входного текста были весьма впечатляющими. [5] После возвращения в FTD она использовалась непрерывно до 1970 года, когда ее заменила машина, работающая под управлением SYSTRAN . [6]
В 1964 году Министерство обороны США поручило Национальной академии наук США (NAS) подготовить отчет о состоянии машинного перевода. NAS сформировала «Консультативный комитет по автоматической обработке языка» ( ALPAC ) и опубликовала свои выводы в 1966 году. Отчет « Язык и машины: компьютеры в переводе и лингвистике » был весьма критически настроен по отношению к существующим усилиям, демонстрируя, что системы были не быстрее, чем человеческие переводы, а также демонстрируя, что предполагаемая нехватка переводчиков на самом деле была излишком, и в результате проблем со спросом и предложением человеческий перевод был относительно недорогим — около 6 долларов за 1000 слов. Хуже того, FTD также был медленнее; тесты с использованием статей по физике в качестве входных данных показали, что переводчик был «на 10 процентов менее точным, на 21 процент медленнее и имел уровень понимания на 29 процентов ниже, чем при использовании человеческого перевода». [7]
Отчет ALPAC имел такое же влияние, как и эксперимент в Джорджтауне десятилетием ранее; сразу после его публикации правительство США приостановило почти все финансирование исследований в области машинного перевода. [8] Текущая работа в IBM и Itek завершилась к 1966 году, оставив поле деятельности европейцам, которые продолжили разработку таких систем, как SYSTRAN и Logos.