PetaBox , также стилизованный как Petabox , — это устройство хранения данных от Capricorn Technologies и Internet Archive . [1] [2] Оно было разработано сотрудниками Internet Archive и CR Saikley для хранения и обработки одного петабайта (миллиона гигабайт) информации. [3]
Цели дизайна Petabox включали в себя: [3]
Первая стойка на 100 терабайт была введена в эксплуатацию в Амстердаме в европейском отделении Internet Archive, Stichting Internet Archive (SIA), в июне 2004 года. Вторая стойка на 80 терабайт была введена в эксплуатацию в главном офисе в Сан-Франциско в том же году. Затем Internet Archive передал свое производство Petabox в недавно созданную компанию Capricorn Technologies. [3]
В период с 2004 по 2007 год Capricorn повторил развертывание Petabox Интернет-архива для крупных академических учреждений , специалистов по сохранению цифровых данных, правительственных учреждений, высокопроизводительных вычислений (HPC) и крупных исследовательских сайтов, поставщиков медицинских изображений , репозиториев цифровых изображений , сайтов аутсорсинга хранения данных и других предприятий. Их крупнейший продукт использует диски на 750 гигабайт. В 2007 году центр обработки данных Интернет-архива размещал около трех петабайт технологии хранения Petabox.
В 2010 году начала работу четвертая версия Petabox. Каждый Petabox позволял хранить 480 ТБ сырой информации (240 дисков по 2 ТБ каждый, настроенных с 24 дисками на стойку высотой 4U и с 10 единицами на стойку) под управлением Linux . [4] [5]
По состоянию на декабрь 2021 года система хранения Petabox Интернет-архива состоит из четырех центров обработки данных, 745 узлов и 28 000 вращающихся дисков. Wayback Machine содержит 57 петабайт информации; коллекции книг, музыки и видео содержат дополнительно 42 петабайта информации, а «уникальные данные» составляют дополнительно 99 петабайт информации, что в общей сложности составляет 212 петабайт хранения. [3]