IBM Netezza (произносится как ne-teez-a) — дочерняя компания американской технологической компании IBM , которая разрабатывает и продает высокопроизводительные устройства для хранения данных и приложения для расширенной аналитики , в том числе для хранения корпоративных данных , бизнес-аналитики , прогнозного анализа и планирования непрерывности бизнеса .
Netezza была приобретена IBM 20 сентября 2010 г. [2] и прекращена поддержка в июне 2019 г. [3] Позже она была повторно представлена в июне 2020 г. как часть предложения IBM CloudPak for Data. [4] [5]
Netezza была основана в 1999 году Фостером Хиншоу. В 2000 году Джит Саксена присоединился к Hinshaw в качестве соучредителя. Компания была зарегистрирована в Делавэре 30 декабря 1999 года под названием Intelligent Data Engines, Inc. и сменила название на Netezza Corporation в ноябре 2000 года. В 2003 году Netezza анонсировала первое в отрасли «устройство для хранения данных» [6] , призванное удовлетворить потребности отрасли в использовать быстрорастущие возможности сбора данных о потребителях. В июле 2007 года Netezza Corporation провела первичное публичное размещение акций под тикером «NZ» на NYSE Arca . [7] [8]
Хиншоу придумал термин «устройство хранилища данных» для описания продукта с параллельными узлами без совместного использования, специально предназначенного для больших объемов данных для современной аналитики данных. [9] [10] В 2005 году он покинул Netezza и основал Dataupia . [11]
Программное обеспечение Netezza было основано на PostgreSQL 7.2, [12] , но не поддерживало совместимости .
Джим Баум был назначен генеральным директором Netezza в январе 2008 года после того, как соучредитель Джит Саксена объявил о своем уходе. Баум начал работу в Netezza в качестве главного операционного директора в 2006 году. До прихода в Netezza Баум в течение пяти лет был президентом и генеральным директором Endeca в Бостоне. [13] [14]
IBM и Netezza 20 сентября 2010 г. объявили, что заключили окончательное соглашение о приобретении IBM Netezza за наличные по цене 27 долларов за акцию или по чистой цене примерно 1,7 миллиарда долларов с поправкой на денежные средства. [2]
В 2020 году IMB Netezza и Yellowbrick объединяются в партнерство. [15]
В марте 2023 года ВМС США решили сотрудничать с Yellowbrick Data и Командованием систем снабжения ВМС США (NAVSUP) для модернизации и ускорения своей стратегии обработки данных. [16] Затем, в августе, AWS и IBM Netezza переняли у Apache Iceberg формат таблиц, который расширил возможности озер данных. [17]
TwinFin, основной продукт Netezza, предназначен для быстрого анализа объемов данных, масштабируемых до петабайт. Компания представила четвертое поколение продукта TwinFin в августе 2009 года. [1] Netezza представила уменьшенную версию этого устройства под брендом Skimmer в январе 2010 года. [18]
В феврале 2010 года Netezza объявила, что открыла свои системы для поддержки основных моделей программирования, включая модели Hadoop , MapReduce , Java , C++ и Python . Предполагается, что партнерами Netezza будут использовать поддержку этого аналитического приложения Tibco Spotfire , MicroStrategy , Pursway, DemandTec и QuantiSense.
Компания также продает специализированное оборудование для розничной торговли, пространственной аналитики, комплексной аналитики и обеспечения соответствия нормативным требованиям . Netezza продает программные продукты для перехода с Oracle Exadata и для реализации схем виртуализации и федерации данных ( абстракции данных ).
Устройство Netezza стало основой IBM Db2 Analytics Accelerator (IDAA). [19]
В 2012 году продукты были переименованы в IBM PureData for Analytics. [20]
В 2017 году IBM заменила Netezza интегрированной аналитической системой [21] с процессорным фреймом Power-8 и Db2 в качестве ядра базы данных в предложении под названием Db2 Warehouse. Он имел как строковое, так и столбчатое хранилище, а также высокоскоростные флэш-накопители. Механизм Db2 Warehouse работает как в облаке, так и локально.
В 2019 году, после приобретения Red Hat, IBM создала предложения Cloud Pak на основе OpenShift и возродила Netezza как Netezza Performance Server в рамках Cloud Pak for Data, оба из которых могут работать как локально, так и в облаке. Предложение представляет собой 64-битный NPS с флэш-накопителями и оптимизированными FPGA. Возрожденный NPS на 100 процентов идентичен по совместимости с Netezza Mako, и для перехода на эту платформу требовалось только nzmigrate или nzbackup/restore. [22]
В 2020 году первым облачным сервером Netezza Performance Server стал GA на Amazon Web Services. В этом предложении используется фактическое оборудование AMPP Netezza, а не стандартное оборудование, на котором работает программное обеспечение Netezza. Для миграции на эту платформу также требуется только nzmigrate или nzbackup/restore через корзину S3 . Это прямой конкурент базе данных Amazon Red Shift. Он также доступен в Azure и IBM Cloud. [22]
Запатентованная архитектура Netezza AMPP (асимметричная массовая параллельная обработка) представляет собой двухуровневую систему, предназначенную для быстрой обработки очень больших запросов от нескольких пользователей.
Первый уровень — это высокопроизводительный хост Linux SMP , который компилирует задачи запроса данных, полученные от приложений бизнес-аналитики, и генерирует планы выполнения запросов. Затем он делит запрос на последовательность подзадач или фрагментов, которые могут выполняться параллельно, и распределяет фрагменты на второй уровень для выполнения.
Второй уровень состоит из одного-сотни блейдов обработки фрагментов (S-Blades), на которых выполняется вся основная работа устройства по обработке. S-Blades — это интеллектуальные узлы обработки, составляющие механизм массово-параллельной обработки (MPP) устройства. Каждый S-Blade представляет собой независимый сервер, содержащий многоядерные процессоры Intel и фирменные многоядерные высокопроизводительные FPGA Netezza. S-Blade состоит из стандартного блейд-сервера в сочетании со специальной платой Netezza Database Accelerator, которая крепится рядом с блейдом. Каждый S-Blade, в свою очередь, подключен к нескольким дисководам, параллельно обрабатывающим несколько потоков данных в TwinFin или Skimmer.
AMPP использует стандартные отраслевые интерфейсы (SQL, ODBC , JDBC , OLE DB ) и обеспечивает время загрузки более 2 ТБ/час и скорость резервного копирования/восстановления данных более 4 ТБ/час.
В 2009 году компания перешла с процессоров PowerPC на процессоры Intel. [23] В августе 2009 года, с выпуском продукта TwinFin 4-го поколения, Netezza перешла с проприетарных блейд-серверов на блейды IBM.
Netezza была добавлена в магический квадрант Gartner для СУБД в январе 2009 года. [24]