stringtranslate.com

Тандемные компьютеры

Компания Tandem Computers, Inc. была ведущим производителем отказоустойчивых компьютерных систем для сетей банкоматов , банков , фондовых бирж , телефонных коммутационных центров, систем службы экстренной помощи и других подобных приложений для обработки коммерческих транзакций , требующих максимального времени безотказной работы и нулевой потери данных. Компания была основана Джимми Трейбигом в 1974 году [1] в Купертино, Калифорния . Она оставалась независимой до 1997 года, когда стала серверным подразделением Compaq . Теперь это серверное подразделение в составе Hewlett Packard Enterprise после приобретения Hewlett-Packard компании Compaq и разделения Hewlett-Packard на HP Inc. и Hewlett Packard Enterprise.

Системы NonStop компании Tandem используют ряд независимых идентичных процессоров, а также резервных устройств хранения данных и контроллеров для обеспечения автоматического высокоскоростного переключения при сбое в случае аппаратного или программного сбоя. Чтобы сдержать количество сбоев и поврежденных данных, эти многокомпьютерные системы не имеют общих центральных компонентов, даже основной памяти. Все традиционные многокомпьютерные системы используют общую память и работают непосредственно с общими объектами данных. Вместо этого процессоры NonStop взаимодействуют, обмениваясь сообщениями через надежную структуру, а программное обеспечение периодически создает снимки для возможного отката состояния программной памяти.

Помимо хорошей обработки сбоев, эта система обмена сообщениями без общего доступа также чрезвычайно хорошо масштабируется для самых крупных коммерческих рабочих нагрузок. Каждое удвоение общего количества процессоров удваивает пропускную способность системы, вплоть до максимальной конфигурации в 4000 процессоров. Напротив, производительность обычных многопроцессорных систем ограничена скоростью некоторой общей памяти, шины или коммутатора. Добавление более 4–8 процессоров таким образом не дает дальнейшего ускорения системы. Системы NonStop чаще приобретаются для удовлетворения требований масштабирования, чем для обеспечения максимальной отказоустойчивости. Они хорошо конкурируют с крупнейшими мэйнфреймами IBM, несмотря на то, что построены на основе более простой миникомпьютерной технологии.

Основание

Компания Tandem Computers была основана в 1974 году Джеймсом Трейбигом . Трейбиг впервые увидел потребность рынка в отказоустойчивости систем OLTP (онлайн-обработка транзакций), когда руководил маркетинговой командой компьютерного подразделения Hewlett-Packard HP 3000 , но HP не была заинтересована в развитии этой ниши. Затем он присоединился к венчурной фирме Kleiner & Perkins и разработал там бизнес-план Tandem. [2] [3] [4] Трейбиг собрал основную команду инженеров, нанятую из подразделения HP 3000 : Майка Грина, Джима Кацмана, Дэйва Маки и Джека Лустауну. Их бизнес-план предусматривал создание сверхнадежных систем, в которых никогда не было бы сбоев и никогда не терялись и не повреждались данные. Они были модульными по-новому, защищенными от всех « единоточечных сбоев », но при этом были лишь незначительно дороже, чем обычные неотказоустойчивые системы. Они будут дешевле и будут поддерживать большую пропускную способность, чем некоторые существующие специальные усиленные системы, которые используют резервирование, но обычно требуют «горячего резерва».

Каждый инженер был уверен, что сможет быстро реализовать свою часть этой сложной новой конструкции, но сомневался, что другие области смогут быть проработаны. Части конструкции аппаратного и программного обеспечения, которые не должны были отличаться, в основном были основаны на постепенных улучшениях знакомой конструкции аппаратного и программного обеспечения HP 3000. Многие последующие инженеры и программисты также были выходцами из HP. Штаб-квартира Tandem в Купертино, Калифорния , находилась в четверти мили от офисов HP. Первоначальные венчурные инвестиции в Tandem Computers поступили от Тома Перкинса, который ранее был генеральным менеджером подразделения HP 3000.

Бизнес-план включал подробные идеи по созданию уникальной корпоративной культуры, отражающей ценности Трейбига.

Проектирование первоначального оборудования Tandem/16 было завершено в 1975 году, а первая система была отправлена ​​​​Citibank в мае 1976 года.

Компания демонстрировала непрерывный экспоненциальный рост вплоть до 1983 года. Журнал Inc. назвал Tandem самой быстрорастущей публичной компанией в Америке. К 1996 году Tandem представляла собой компанию с оборотом в 2,3 миллиарда долларов, в которой работало около 8000 человек по всему миру.

Тандемные штабельные машины NonStop (TNS)

За 40 лет основная линейка продуктов NonStop компании Tandem росла и развивалась, обеспечивая совместимость с исходной отказоустойчивой системой T/16, с тремя основными изменениями на сегодняшний день в ее модульной архитектуре верхнего уровня или архитектуре набора команд уровня программирования. . В каждой серии было несколько крупных повторных реализаций по мере развития технологии микросхем.

В то время как обычные системы того времени, включая большие мэйнфреймы , имели среднее время наработки на отказ (MTBF) порядка нескольких дней, система NonStop была разработана с учетом интервалов сбоев в 100 раз дольше, а время безотказной работы измерялось годами. Тем не менее, NonStop был разработан так, чтобы быть конкурентоспособным по цене по сравнению с обычными системами: цена простой двухпроцессорной системы чуть более чем в два раза выше, чем у конкурирующего однопроцессорного мейнфрейма, в отличие от других отказоустойчивых решений, в четыре или более раз превышающих цену других отказоустойчивых решений.

НонСтоп Я

Первой системой была Tandem/16 или T /16 , позже переименованная в NonStop I. [5] Машина состояла из от двух до 16 процессоров, организованных в виде отказоустойчивого компьютерного кластера , размещенного в одной стойке. Каждый ЦП имел свою собственную неразделяемую память, собственный процессор ввода-вывода , собственную частную шину ввода-вывода для подключения к контроллерам ввода-вывода и двойное соединение со всеми остальными ЦП через специальную межпроцессорную объединительную шину , называемую Dynabus . . Каждый дисковый или сетевой контроллер был дублирован и имел двойное подключение как к процессорам, так и к устройствам. Каждый диск был зеркалирован и имел отдельные подключения к двум независимым контроллерам дисков. Если диск вышел из строя, его данные по-прежнему были доступны из зеркальной копии. В случае сбоя ЦП, контроллера или шины диск по-прежнему был доступен через альтернативный ЦП, контроллер и/или шину. Каждый диск или сетевой контроллер был подключен к двум независимым процессорам. Каждый блок питания был подключен только к одной стороне некоторой пары процессоров, контроллеров или шин, так что система могла продолжать работать без потери соединений в случае сбоя одного блока питания. Тщательное сложное расположение деталей и соединений в более крупных конфигурациях клиентов было задокументировано в диаграмме Маки , названной в честь ведущего продавца Дэвида Маки, который изобрел эту систему обозначений. [6] Ни одна из этих дублированных частей не была потрачена впустую как «горячие запасные части»; все это увеличивает пропускную способность системы во время обычных операций.

Помимо хорошего восстановления после выхода из строя деталей, T/16 также был разработан для скорейшего обнаружения как можно большего количества видов периодических отказов. Такое быстрое обнаружение называется «быстрым отказом». Целью было найти и изолировать поврежденные данные до того, как они будут окончательно записаны в базы данных и другие файлы на диске. В T/16 обнаружение ошибок осуществлялось с помощью дополнительных схем, которые незначительно увеличивали стоимость всей конструкции; никакие основные части не дублировались только для обнаружения ошибок.

Плата памяти TANDEM T/16

Процессор T/16 был собственной разработкой. Большое влияние на него оказал миникомпьютер HP 3000. Обе они были микропрограммными , 16-битными , стековыми машинами с сегментированной 16-битной виртуальной адресацией. Оба были предназначены для программирования исключительно на языках высокого уровня без использования ассемблера . Оба изначально были реализованы с помощью стандартных TTL- чипов низкой плотности , каждый из которых содержал 4-битный фрагмент 16-битного ALU . Оба имели небольшое количество 16-битных регистров данных на вершине стека плюс несколько дополнительных адресных регистров для доступа к стеку памяти. Оба использовали кодирование Хаффмана смещений адресов операндов, чтобы вписать большое количество режимов адресации и размеров смещения в 16-битный формат команд с очень хорошей плотностью кода. Оба в значительной степени полагались на пулы косвенных адресов, чтобы преодолеть короткий формат инструкций. Оба поддерживали более крупные 32- и 64-битные операнды посредством нескольких циклов ALU и строковые операции между памятью. Оба использовали адресацию с обратным порядком байтов для длинных и коротких операндов памяти. Все эти функции были вдохновлены стековыми машинами мейнфреймов Burroughs B5500-B6800.

Набор инструкций T/16 изменил несколько функций конструкции HP 3000. T/16 с самого начала поддерживал страничную виртуальную память. В серии HP 3000 пейджинг не добавлялся до поколения PA-RISC, 10 лет спустя (хотя в 1978 году в MPE V была форма пейджинга через прошивку APL). Tandem добавил поддержку 32-битной адресации на своей второй машине; В HP 3000 этого не было до поколения PA-RISC. Пейджинг и длинные адреса имели решающее значение для поддержки сложного системного программного обеспечения и больших приложений. В T/16 по-новому обращались с верхними регистрами; компилятор, а не микрокод, отвечал за принятие решения о том, когда полные регистры были перенесены в стек памяти, а когда пустые регистры были повторно заполнены из стека памяти. В HP 3000 это решение потребовало дополнительных циклов микрокода в каждой инструкции. HP 3000 поддерживал COBOL с несколькими инструкциями для вычислений непосредственно в строках цифр произвольной длины BCD (двоично-десятичные числа). T/16 упростил это до отдельных инструкций для преобразования строк BCD в 64-битные двоичные целые числа.

В T/16 каждый процессор состоял из двух плат логики TTL и SRAM и работал со скоростью около 0,7 MIPS . [7] В любой момент он мог получить доступ только к четырем сегментам виртуальной памяти (системные данные, системный код, пользовательские данные, пользовательский код), каждый из которых ограничен размером 128 КБ. На момент поставки 16-битные адресные пространства уже были малы для основных приложений.

В первой версии T/16 был только один язык программирования — язык приложений транзакций (TAL). Это был эффективный машинно-зависимый язык системного программирования (для операционных систем, компиляторов и т. д.), но его также можно было использовать для непереносимых приложений. Он был создан на основе языка системного программирования (SPL) HP 3000. Оба имели семантику, аналогичную C , но синтаксис основан на АЛГОЛЕ Берроуза . В последующих выпусках была добавлена ​​поддержка Cobol74, Basic, Fortran , Java , C, C++ и MUMPS .

В серии Tandem NonStop использовалась специальная операционная система , которая значительно отличалась от Unix или MPE HP 3000. Первоначально она называлась T/TOS ( Тандемная транзакционная операционная система ), но вскоре была названа Guardian из-за ее способности защищать все данные от сбоев оборудования и программного обеспечения. В отличие от всех других коммерческих операционных систем, Guardian основывалась на передаче сообщений как на основном способе взаимодействия всех процессов без использования общей памяти, независимо от того, где процессы выполнялись. [8] [9] Этот подход легко масштабируется до кластеров из нескольких компьютеров и помогает изолировать поврежденные данные до их распространения.

Все процессы файловой системы и все процессы транзакционных приложений были структурированы как пары процессов главный/подчиненный, выполняемые на отдельных процессорах. Подчиненный процесс периодически делал снимки состояния памяти главного процесса и принимал на себя рабочую нагрузку, если и когда у главного процесса возникали проблемы. Это позволило приложению пережить сбои в любом процессоре или связанных с ним устройствах без потери данных. Кроме того, это позволяло восстанавливаться после некоторых периодических сбоев программного обеспечения. Между сбоями мониторинг со стороны подчиненного процесса добавлял некоторую нагрузку на производительность, но это было намного меньше, чем 100% дублирование в других конструкциях системы. Некоторые основные ранние приложения были напрямую закодированы в этом стиле контрольных точек, но большинство вместо этого использовали различные уровни программного обеспечения Tandem, которые скрывали детали этого полупереносимым способом.

Тандемная система NonStop II

НонСтоп II

В 1981 году все процессоры T/16 были заменены на NonStop II . Его основным отличием от T/16 была поддержка периодической 32-битной адресации через переключаемый пользователем «расширенный сегмент данных». Это способствовало развитию программного обеспечения в течение следующих десяти лет и было огромным преимуществом перед T/16 или HP 3000. К сожалению, видимые регистры оставались 16-битными, и это незапланированное дополнение к набору команд требовало выполнения большого количества инструкций на одно обращение к памяти по сравнению с большинство 32-битных миникомпьютеров. Все последующие компьютеры TNS страдали из-за неэффективности этого набора команд. Кроме того, в NonStop II не хватало более широких внутренних путей данных, поэтому требовались дополнительные шаги микрокода для 32-битных адресов. ЦП NonStop II имел три платы, использующие микросхемы и дизайн, аналогичный T/16. NonStop II также заменил основную память памятью DRAM с батарейным питанием.

Нонстоп ТХП

В 1983 году процессор NonStop TXP стал первой полностью новой реализацией архитектуры набора команд TNS. [10] [11] [12] Он был построен из стандартных микросхем TTL и микросхем программируемой логики, с четырьмя платами на каждый модуль ЦП. Здесь Tandem впервые использовала кэш-память. Он имел более прямую реализацию 32-битной адресации, но все же отправлял их через 16-битные сумматоры. Более широкое хранилище микрокода позволило значительно сократить количество циклов, выполняемых на одну инструкцию; скорость увеличена до 2,0 MIPS. В нем использовалась та же стойка, контроллеры, объединительная плата и шины, что и раньше. Шины Dynabus и ввода-вывода в T/16 были переработаны, поэтому они могли работать в течение нескольких поколений обновлений.

ЛИСА

До 14 систем TXP и NonStop II теперь можно было объединить через FOX — отказоустойчивую оптоволоконную шину дальней связи для соединения кластеров TNS в бизнес-кампусе; кластер кластеров с 224 процессорами. Это позволило обеспечить дальнейшее масштабирование для работы с крупнейшими приложениями для мэйнфреймов. [13] Как и модули ЦП в компьютерах, Guardian может переносить весь набор задач на другие машины в сети. Кластеры из 4000 процессоров по всему миру также можно создать с помощью обычных сетевых каналов дальней связи.

НонСтоп VLX

В 1986 году Tandem представила процессор третьего поколения NonStop VLX . [14] Он имел 32-битные каналы передачи данных, более широкий микрокод, время цикла 12 МГц и пиковую скорость — одну инструкцию на микроцикл. Он был построен из трёх плат микросхем вентильной матрицы ECL (с распиновкой TTL). У него был обновленный Dynabus со скоростью, увеличенной до 20 Мбайт/сек на канал, всего 40 Мбайт/сек. Позже FOX II увеличил физический диаметр кластеров TNS до 4 километров.

Первоначальная поддержка баз данных Tandem осуществлялась только для иерархических нереляционных баз данных через файловую систему ENSCRIBE . Это было расширено до реляционной базы данных под названием ENCOMPASS . [15] В 1986 году компания Tandem представила первую отказоустойчивую базу данных SQL — NonStop SQL . [16] NonStop SQL, разработанный полностью собственными силами, включает в себя ряд функций на основе Guardian, обеспечивающих достоверность данных на всех узлах. NonStop SQL известен тем, что производительность линейно масштабируется в зависимости от количества узлов, добавляемых в систему, тогда как производительность большинства баз данных довольно быстро стабилизировалась, часто уже после двух процессоров. В более поздней версии, выпущенной в 1989 году, были добавлены транзакции, которые можно было распределять по узлам, — функция, которая некоторое время оставалась уникальной. NonStop SQL продолжал развиваться, сначала как NonStop SQL/MP, а затем как NonStop SQL/MX, который перешел от Tandem к Compaq и HP. Этот код по-прежнему используется в HP NonStop SQL/MP, NonStop SQL/MX и проекте Apache Trafodion . [17]

НонСтоп CLX

В 1987 году компания Tandem представила NonStop CLX , недорогую миникомпьютерную систему с меньшими возможностями расширения. [18] [19] Его роль заключалась в развитии нижнего сегмента отказоустойчивого рынка, а также в развертывании на удаленных границах крупных тандемных сетей. Его первоначальные характеристики были примерно аналогичны TXP; более поздние версии улучшились и стали примерно на 20% медленнее, чем VLX. Его небольшой шкаф можно установить в любом офисном помещении типа «копировальная машина». ЦП CLX представлял собой одну плату, содержащую шесть «компилированных кремниевых» микросхем ASIC CMOS. Чип ядра ЦП был дублирован и синхронизирован для максимального обнаружения ошибок. Это не добавляло дополнительной отказоустойчивости, но обеспечивало целостность данных, поскольку микросхема компаратора гарантировала, что результаты обоих чипов ЦП будут одинаковыми. Другие процессоры обеспечат отказоустойчивость. Распиновка была основным ограничением этой технологии чипов. Микрокод, кэш и TLB были внешними по отношению к ядру ЦП и использовали одну шину и один банк памяти SRAM. В результате CLX требовал как минимум два машинных цикла на одну инструкцию.

Нонстоп Циклон

В 1989 году компания Tandem представила NonStop Cyclone , быструю, но дорогую систему для рынка мэйнфреймов. [20] [21] Каждый процессор с самопроверкой включал три платы, заполненные горячими чипами вентильной матрицы ECL, а также платы памяти. Несмотря на микропрограммирование, ЦП был суперскалярным и часто выполнял две инструкции за цикл кэша. Это было достигнуто за счет использования отдельной процедуры микрокода для каждой общей пары инструкций. [22] Эта объединенная пара инструкций стека обычно выполняет ту же работу, что и одна инструкция обычных 32-битных миникомпьютеров. Процессоры Cyclone были упакованы в секции по четыре процессора в каждой, и эти секции соединялись оптоволоконной версией Dynabus.

Как и предыдущие высококлассные машины Tandem, корпуса Cyclone были оформлены в угловатом черном цвете, что подчеркивает силу и мощь. Рекламные видеоролики напрямую сравнивали Cyclone с самолетом-разведчиком Lockheed SR-71 Blackbird, развивающим скорость 3 Маха. Название Cyclone должно было отражать его «непреодолимую скорость при выполнении рабочих нагрузок OLTP». Днем объявления было 17 октября 1989 года. В тот же день в регионе произошло землетрясение магнитудой 6,9 в Лома-Приета , вызвавшее обрушение автострады в Окленде и крупные пожары в Сан-Франциско . Офисы «Тандема» потрясло, но на месте никто серьезно не пострадал.

Другие линейки продуктов

Радуга

В 1980–1983 годах компания Tandem попыталась перепроектировать весь свой аппаратный и программный комплекс, чтобы поставить методы NonStop на более прочную основу, чем унаследованные черты HP 3000. Аппаратное обеспечение Rainbow представляло собой 32-битную машину с регистровыми файлами, которая должна была быть лучше, чем у Digital Equipment Corporation VAX . Для надежного программирования основным языком программирования был «TPL», подмножество Ada . В то время люди едва понимали, как скомпилировать Аду в неоптимизированный код. Для существующего системного программного обеспечения NonStop, написанного на TAL, не было пути миграции. ОС, база данных и компиляторы Cobol были полностью переработаны. Потребители будут рассматривать это как совершенно разрозненную линейку продуктов, требующую от них совершенно нового программного обеспечения. Разработка программного обеспечения этого амбициозного проекта заняла гораздо больше времени, чем планировалось. Аппаратное обеспечение уже устарело и превосходило TXP по производительности еще до того, как его программное обеспечение было готово, поэтому проект Rainbow был заброшен. Все последующие усилия подчеркивали совместимость вверх и легкие пути миграции.

Разработка усовершенствованной среды разработки клиент-серверных приложений Rainbow под названием «Crystal» продолжалась некоторое время и была выделена как продукт «Ellipse» компании Cooperative Systems Inc. [23]

Динамит ПК

В 1985 году компания Tandem попыталась захватить часть быстрорастущего рынка персональных компьютеров , представив ПК/рабочую станцию ​​Dynamite на базе MS-DOS . К сожалению, многочисленные конструктивные компромиссы (в том числе уникальная аппаратная платформа на базе 8086, несовместимая с современными картами расширения и чрезвычайно ограниченная совместимость с ПК на базе IBM ) привели к тому, что Dynamite стал служить в первую очередь интеллектуальным терминалом. Его тихо и быстро убрали с рынка.

Честность

Операционная система NonStop на основе сообщений Tandem имела преимущества в плане масштабируемости, исключительной надежности и эффективного использования дорогих «запасных» ресурсов. Но многие потенциальные клиенты хотели получить достаточно хорошую надежность в небольшой системе, использующей знакомую операционную систему Unix и программы, соответствующие отраслевым стандартам. Все различные отказоустойчивые конкуренты Tandem использовали более простую аппаратную конструкцию, ориентированную только на память, где все восстановление выполнялось путем переключения между горячими резервами. Самым успешным конкурентом была Stratus Technologies , чьи машины продавались IBM как «IBM System/88».

В таких системах запасные процессоры не способствуют увеличению пропускной способности системы между сбоями, а просто дублируют выполнение точно того же потока данных, что и активный процессор, в тот же момент, на «шаге блокировки». Неисправности обнаруживаются путем наблюдения за расхождением выходных сигналов клонированных процессоров. Для обнаружения сбоев в системе должно быть два физических процессора для каждого логического активного процессора. Чтобы также реализовать автоматическое восстановление после отказа, система должна иметь три или четыре физических процессора для каждого логического процессора. Тройная или четырехкратная стоимость такой экономии практична, когда дублированные детали представляют собой обычные однокристальные микропроцессоры.

Продукты Tandem для этого рынка начались с линейки Integrity в 1989 году, в которой использовались процессоры MIPS и вариант Unix «NonStop UX». Он был разработан в Остине, штат Техас. В 1991 году Integrity S2 использовала TMR, тройное модульное резервирование, где каждый логический процессор использовал три микропроцессора MIPS R2000 для выполнения одного и того же потока данных с голосованием для поиска и блокировки неисправной части. Их быстрые часы не могли быть синхронизированы, как при строгом пошаговом блокировании, поэтому вместо этого голосование происходило при каждом прерывании. [24] В некоторых других версиях Integrity использовалось 4-кратное резервирование «пары и запасные части». Пары процессоров работали синхронно, проверяя друг друга. Когда они не согласились, оба процессора были помечены как недоверенные, и их рабочая нагрузка была передана паре процессоров горячего резерва, состояние которых уже было текущим. В 1995 году Integrity S4000 первым использовал ServerNet (сетевую «шинную» структуру) и перешел к совместному использованию периферийных устройств с линией NonStop.

Волчья стая

В 1995–1997 годах Tandem в партнерстве с Microsoft реализовала функции высокой доступности и расширенные конфигурации SQL в кластерах обычных компьютеров с Windows NT. Этот проект назывался «Wolfpack» и впервые был представлен как Microsoft Cluster Server в 1997 году. Microsoft получила большую выгоду от этого партнерства; Тандем этого не сделал.

Непрерывный переход TNS/R на MIPS

Когда в 1974 году была основана компания Tandem, каждая компьютерная компания должна была проектировать и создавать свои процессоры на основе базовых схем [ нужна ссылка ] , используя собственный набор инструкций, собственные компиляторы и т. д. С каждым годом развития полупроводников закон Мура становился все более Основные схемы ЦП могут помещаться в отдельные чипы и в результате работать быстрее и намного дешевле. Но компьютерной компании становилось все дороже разрабатывать эти передовые специализированные чипы или строить заводы по их производству. Столкнувшись с проблемами быстро меняющегося рынка и производственной среды, компания Tandem решила стать партнером MIPS и внедрила ее чипсеты R3000 и его преемники, а также их усовершенствованный оптимизирующий компилятор. Последующие машины NonStop Guardian, использующие архитектуру MIPS , были известны программистам как машины TNS/R, но имели множество маркетинговых названий.

Циклон/Р

В 1991 году Tandem выпустила Cyclone/R, также известную как CLX/R. Это была недорогая система среднего класса, основанная на компонентах CLX, но в ней использовались микропроцессоры R3000 вместо гораздо более медленной машинной платы стека CLX. Чтобы минимизировать время вывода на рынок, эта машина изначально поставлялась без какого-либо программного обеспечения собственного режима MIPS. Все, включая операционную систему NonStop Kernel (NSK) (продолжение Guardian) и базу данных NonStop SQL, было скомпилировано в машинный код стека TNS. Затем этот объектный код был преобразован в эквивалентные частично оптимизированные последовательности инструкций MIPS во время установки ядра с помощью инструмента под названием Accelerator. [25] Менее важные программы также можно запускать напрямую, без предварительной трансляции, через интерпретатор кода TNS . Эти методы миграции оказались очень успешными и используются до сих пор. Все программы переносились без дополнительной работы, производительность была достаточно хорошей для машин среднего класса, а программисты могли игнорировать различия в инструкциях даже при отладке на уровне машинного кода. Эти машины Cyclone/R были обновлены более быстрой операционной системой NSK в собственном режиме в следующем выпуске.

Микропроцессоры R3000 и более поздние версии имели лишь типичный объем проверки внутренних ошибок, недостаточный для нужд Tandem. Таким образом, Cyclone/R запускал пары процессоров R3000 синхронно, выполняя один и тот же поток данных. Это было сделано в целях обеспечения целостности данных, а не обеспечения отказоустойчивости — отказоустойчивость обеспечивалась другими механизмами, которые все еще существовали. В нем использовался любопытный вариант шагового замка. Процессор проверки работал на 1 такт позади основного процессора. Это позволило им использовать одну копию внешнего кода и кэшей данных без чрезмерной нагрузки на системную шину и снижения тактовой частоты системы. Чтобы успешно работать микропроцессоры в синхронном режиме, микросхемы должны быть полностью детерминированными. Любое скрытое внутреннее состояние должно быть очищено механизмом сброса чипа. В противном случае согласованные чипы иногда будут рассинхронизироваться без видимой причины и без каких-либо ошибок даже спустя долгое время после перезапуска чипов. Все разработчики микросхем согласны с тем, что это хорошие принципы, поскольку они помогают им тестировать чипы во время производства. Но все новые микропроцессорные чипы, похоже, имели ошибки в этой области, и потребовались месяцы совместной работы между MIPS (сторонним производителем, используемым Tandem) и Tandem, чтобы устранить или обойти последние тонкие ошибки.

NonStop Himalaya серия K

В 1993 году Tandem выпустила серию NonStop Himalaya K с более быстрым MIPS R4400 , операционной системой NSK в собственном режиме и полностью расширяемыми системными компонентами Cyclone. Они по-прежнему были связаны между собой Dynabus, Dynabus+ и исходной шиной ввода-вывода, у которых к тому времени уже не хватало запаса производительности.

Открытые системные службы

В 1995 году ядро ​​NonStop было расширено за счет Unix-подобной среды POSIX под названием Open System Services. [26] Оригинальная оболочка Guardian и ABI остались доступными.

NonStop Himalaya Серия S

В 1997 году компания Tandem представила NonStop Himalaya S-Series с новой системной архитектурой верхнего уровня, основанной на соединениях ServerNet . ServerNet заменил устаревшие шины Dynabus, FOX и I/O. Он был намного быстрее, более универсален и мог быть расширен за счет чего-то большего, чем просто двустороннее резервирование посредством произвольной структуры двухточечных соединений. Компания Tandem разработала ServerNet для своих нужд, но затем начала продвигать ее использование другими; он превратился в отраслевой стандарт InfiniBand .

Все машины серии S использовали процессоры MIPS, включая R4400, R10000 , R12000 и R14000.

Разработка более поздних, более быстрых ядер MIPS в основном финансировалась Silicon Graphics Inc. Но Pentium Pro от Intel обогнал по производительности конструкции RISC, а графический бизнес SGI сократился. После R10000 не было инвестиций в новые конструкции ядра MIPS для высокопроизводительных серверов. Поэтому компании Tandem пришлось в конечном итоге снова перевести свою линейку продуктов NonStop на другую микропроцессорную архитектуру с конкурентоспособными быстрыми чипами.

Приобретение Compaq, попытка перехода на Alpha

Логотип использовался с 1996 по 1997 год.
Логотип использовался с 1996 по 1997 год.

Джимми Трейбиг оставался генеральным директором основанной им компании до кризиса в 1996 году. Следующим генеральным директором стал Роэл Пипер, который присоединился к компании в 1996 году в качестве президента и генерального директора. Ребрендинг с целью продвижения себя как настоящей платформы Wintel (Windows/Intel) был проведен их собственным брендом и творческой командой под руководством Рональда Мэя, который позже в 1999 году стал соучредителем Форума брендов Кремниевой долины. Концепция работал, и вскоре после этого компания была приобретена Compaq.

Подразделение серверов Compaq на базе процессоров x86 одним из первых внедрило технологию соединения Tandem ServerNet/Infiniband. В 1997 году Compaq приобрела компанию Tandem Computers и клиентскую базу NonStop, чтобы сбалансировать упор Compaq на производство недорогих ПК. В 1998 году Compaq также приобрела гораздо более крупную Digital Equipment Corporation и унаследовала ее RISC-серверы DEC Alpha с клиентскими базами OpenVMS и Tru64 Unix . В то время компания Tandem находилась на полпути к переносу своей линейки продуктов NonStop с микропроцессоров MIPS R12000 на новые микропроцессоры Intel Itanium Merced. Этот проект был возобновлен с Alpha в качестве новой цели, чтобы привести NonStop в соответствие с другими крупными линейками серверов Compaq. Но в 2001 году Compaq прекратила все инвестиции в разработку Alpha в пользу микропроцессоров Itanium, еще до того, как на Alpha были выпущены какие-либо новые продукты NonStop.

Приобретение Hewlett-Packard, переход TNS/E на Itanium

В 2001 году компания Hewlett-Packard аналогичным образом приняла решение отказаться от своей успешной линейки продуктов PA-RISC в пользу микропроцессоров Intel Itanium, в разработке которых участвовала HP. Вскоре после этого Compaq и HP объявили о своем плане объединить и консолидировать схожие линейки продуктов. Это спорное слияние стало официальным в мае 2002 года. Объединения были болезненными и разрушили инженерно-ориентированную культуру DEC и «HP Way», но объединенная компания знала, как продавать сложные системы предприятиям и получать прибыль, поэтому это было улучшением для компании. выживающее подразделение NonStop и его клиенты.

В каком-то смысле путь Tandem от стартапа, вдохновленного HP, до конкурента, вдохновленного HP, а затем до подразделения HP «возвращал Tandem к его первоначальным корням», но это определенно была не та же HP.

Портирование линейки продуктов NonStop на базе NSK с процессоров MIPS на процессоры Itanium было окончательно завершено и получило название «Серверы HP Integrity NonStop». (Этот NSK Integrity NonStop не имел отношения к оригинальной серии Tandem «Integrity» для Unix.)

Поскольку было невозможно запускать чипы Itanium McKinley с блокировкой на уровне тактовой частоты, машины Integrity NonStop вместо этого использовали сравнения между состояниями чипов в более длительных временных масштабах, в точках прерывания и в различных точках синхронизации программного обеспечения между прерываниями. Промежуточные точки синхронизации автоматически запускались при каждой n-й инструкции перехода, а также явно вставлялись в тела длинных циклов всеми компиляторами NonStop. Конструкция машины поддерживала как двойное, так и тройное резервирование: два или три физических микропроцессора на логический процессор Itanium. Тройная версия продавалась клиентам, которым требовалась максимальная надежность. Этот новый подход к проверке называется NSAA, NonStop Advanced Architecture . [27]

Как и в случае более раннего перехода со стековых машин на микропроцессоры MIPS, все клиентское программное обеспечение было перенесено без изменения исходного кода. Исходный код «собственного режима», скомпилированный непосредственно в машинный код MIPS, был просто перекомпилирован для Itanium. Некоторое старое «неродное» программное обеспечение все еще существовало в форме стека TNS. Они были автоматически перенесены на Itanium с помощью методов трансляции объектного кода.

Миграция Itanium на Intel X86

Люди, работающие в Tandem/HP, имеют долгий опыт переноса ядра на новое оборудование. Следующей попыткой стал переход с Itanium на архитектуру Intel x86. Он был завершен в 2014 году, когда первые системы поступили в продажу.

Включение отказоустойчивых коммутаторов InfiniBand двойной ширины 4X FDR (четырнадцать скоростей передачи данных) обеспечило более чем 25-кратное увеличение пропускной способности системы для реагирования на рост бизнеса. [28]

Перспективы, прочее

NSK Guardian также стала основой для ОС HP Neoview, операционной системы, используемой в системах HP Neoview , адаптированных для использования в системах бизнес-аналитики и корпоративных хранилищ данных. NonStop SQL/MX также стал отправной точкой для Neoview SQL, который был адаптирован для использования в бизнес-аналитике. Код также был портирован на Linux и послужил основой для проекта Apache Trafodion .

Корпоративная культура

Бизнес-план Treybig включал подробные идеи по созданию корпоративной культуры, отражающей ценности Treybig, такие как оплачиваемый шестинедельный творческий отпуск каждые четыре года для всех сотрудников, ежегодный подарок всем сотрудникам в размере 100 акций Tandem, еженедельная вечеринка для всех сотрудников, известная как Beer. Bust Fridays и ежемесячная закрытая телепередача по всему миру («Первая пятница») для информирования сотрудников.

Группы пользователей

Смотрите также

Рекомендации

  1. ^ «История TANDEM COMPUTERS, INC. - FundingUniverse» . www.fundinguniverse.com . Проверено 01 марта 2023 г.
  2. ^ «История тандема: Введение». Журнал «Центр» , том 6 № 1, зима 1986 г., журнал для сотрудников «Тандема».
  3. ^ «Отслеживание истории Тандема», NonStop News , том 9, номер 1, январь 1986 г., информационный бюллетень для сотрудников Тандема.
  4. ^ «Группа серверов высшего класса возвращается в HP» . CNET . Проверено 27 апреля 2023 г.
  5. ^ Кацман, Джеймс А. (1978). «Тандем 16: отказоустойчивая вычислительная система». Материалы 11-й Гавайской конференции. по системным наукам (11-й HICSS'78) . Гонолулу, Гавайи: Компьютерное общество IEEE . стр. 85–102.Воспроизведено в Севёреке, ДП; Белл, КГ; Ньюэлл, А., ред. (1982). «Глава 29: Тандем 16: отказоустойчивая вычислительная система». Компьютерные структуры: принципы и примеры (PDF) . МакГроу-Хилл. стр. 470–480.
  6. ^ «История кластера». Clusters4All.com . Чикаго: 4-й международный симпозиум IEEE/ACM по кластерным компьютерам и сетям. 19–22 апреля 2004 г. Архивировано из оригинала 21 марта 2012 г. Проверено 22 августа 2011 г.
  7. ^ Бартлетт, Джоэл Ф.; Грей, Джим ; Хорст, Боб (март 1986 г.). Отказоустойчивость в тандемных компьютерных системах (PDF) (Технический отчет). Технический отчет тандема TR-86.2.
  8. ^ Бартлетт, Джоэл Ф. (январь 1978 г.). Непрерывная операционная система . Одиннадцатая Гавайская международная конференция по системным наукам. стр. 103–117.
  9. ^ Барлетт, Джоэл Ф. (июнь 1981 г.). Ядро NonStop (PDF) (Технический отчет). Технический отчет тандема TR-81.4.
  10. ^ «Высокопроизводительный процессор NonStop TXP» (PDF) . Тандемный журнал . 2 (1): 2–5.
  11. ^ Бартлетт, Венди; Хоуи, Том; Мейер, Дон. «Процессор NonStop TXP: мощная конструкция для онлайн-обработки переводов» (PDF) . Тандемный журнал . 2 (3): 10–23.
  12. ^ Новая система управляет сотнями транзакций в секунду, журнал Electronics, апрель 1984 г., перепечатано как Роберт Хорст; Сэнди Мец. Технический обзор процессора Tandem TXP (PDF) (технический отчет). Технический отчет тандема TR-84.1.
  13. ^ Хорст, Роберт; Чоу, Тим (апрель 1985 г.). Аппаратная архитектура и линейное расширение тандемных систем NonStop (PDF) (Технический отчет). Технический отчет тандема TR-85.3.
  14. ^ «Проект оборудования NonStop VLX» (PDF) . Обзор тандемных систем . 2 (3): 8–12. Декабрь 1986 года.
  15. ^ Шустер, Стюарт А. (февраль 1981 г.). Управление реляционными базами данных для онлайн-обработки транзакций (PDF) (Технический отчет). Технический отчет тандема TR-81.5.
  16. ^ NonStop SQL, распределенная, высокопроизводительная и доступная реализация SQL (PDF) (технический отчет). Апрель 1987 г. Технический отчет тандема TR-87.4.
  17. ^ «Фонд программного обеспечения Apache объявляет Apache Trafodion проектом высшего уровня» . 10 января 2018 года . Проверено 13 мая 2020 г.
  18. ^ Леноски, Дэниел Э. (ноябрь 1987 г.). Высокоинтегрированный отказоустойчивый миникомпьютер: NonStop CLX (PDF) (технический отчет). Технический отчет тандема TR-87.5.
  19. ^ Леноски, Дэн (апрель 1989 г.). «NonStop CLX: оптимизирован для распределенной онлайн-обработки» (PDF) . Обзор тандемных систем . 5 (1): 20–27.
  20. ^ Чан, Скотт; Роберт Джардин (апрель 1991 г.). «Отказоустойчивость системы NonStop Cyclone» (PDF) . Обзор тандемных систем : 4–9.
  21. ^ Бартлетт, Джоэл Ф.; Бартлетт, Венди; Карр, Ричард; Гарсия, Дэйв; Грей, Джим; Хорст, Роберт; Жардин, Роберт; Леноски, Дэн; Макгуайр, Дикс (май 1990 г.). Отказоустойчивость в тандемных компьютерных системах (PDF) (Технический отчет). Технический отчет тандема TR-90.5.
  22. ^ Хорст, Роберт; Харрис, Ричард; Джардин, Роберт (июнь 1990 г.). Проблема с несколькими инструкциями в системе NonStop Cyclone (PDF) (технический отчет). Технический отчет тандема TR-90.6.
  23. ^ Exec подробно описывает сетевые инструменты OLTP фирмы, Network World , 16 марта 1992 г.
  24. ^ Норвуд, Питер (апрель 1991 г.). «Обзор операционной системы NonStop-UX для Integrity S2» (PDF) . Обзор тандемных систем . 7 (1): 10–23.
  25. ^ Кристи Эндрюс; Дуэйн Сэнд (октябрь 1992 г.). Миграция семейства компьютеров CISC на RISC посредством трансляции объектного кода . Пятая международная конференция по архитектурной поддержке языков программирования и операционных систем. дои : 10.1145/143365.143520 .
  26. Халпер, Марк (6 марта 1995 г.). «Tandem добавляет UNIX на серверы Himalaya». Компьютерный мир . Том. 29, нет. 10. с. 66.
  27. ^ «Усовершенствованная архитектура HP NonStop, технический документ для бизнеса» (PDF) . Архивировано из оригинала (PDF) 28 февраля 2006 г.
  28. ^ «HP Integrity NonStop X NS7 X1» . Архивировано из оригинала 27 июля 2015 года.

Внешние ссылки