stringtranslate.com

Гринплам

Greenplum — это технология больших данных , основанная на архитектуре MPP и технологии баз данных с открытым исходным кодом Postgres . Технология была создана компанией с тем же названием, головной офис которой находится в Сан-Матео , Калифорния, около 2005 года. Greenplum была приобретена корпорацией EMC в июле 2010 года. [1]

Начиная с 2012 года, ее программное обеспечение для управления базами данных стало известно как Pivotal Greenplum Database , продаваемое через Pivotal Software . Pivotal открыл исходный код ядра и продолжил его разработку сообществом разработчиков программного обеспечения с открытым исходным кодом Greenplum Database и Pivotal.

Начиная с 2020 года Pivotal была приобретена VMware [2] , и VMware продолжила спонсировать сообщество разработчиков программного обеспечения с открытым исходным кодом Greenplum Database, а также коммерциализировать технологию под торговой маркой VMware Tanzu Greenplum . В ноябре 2023 года VMware была приобретена Broadcom. [3]

В мае 2024 года Tanzu by Broadcom приняла решение закрыть исходный код проекта Greenplum Database. Все будущие выпуски Greenplum Database будут иметь закрытый исходный код и будут выпускаться как часть VMware Tanzu Data Suite.

Компания

Greenplum, компания, была основана в сентябре 2003 года Скоттом Ярой и Люком Лонерганом. Это было слияние двух более мелких компаний: Metapa (основана в августе 2000 года недалеко от Лос-Анджелеса ) [4] и Didera в Фэрфаксе, Вирджиния . [5]

Инвесторами были SoundView Ventures, Hudson Ventures и Royal Wulff Ventures. В ходе слияния было объявлено о финансировании в размере 20 миллионов долларов США . [6] Greenplum, базирующаяся в Сан-Матео, Калифорния , выпустила свое программное обеспечение для управления базами данных на основе PostgreSQL в апреле 2005 года, назвав его Bizgres. [7] Раунды венчурного капитала примерно по 15 миллионов долларов США каждый были инвестированы в марте 2006 года и феврале 2007 года. [8]

В июле 2006 года было объявлено о партнерстве с Sun Microsystems . [9] Sun, которая также приобрела MySQL AB , приняла участие в раунде инвестиций в размере 27 миллионов долларов США в январе 2009 года под руководством Meritech Capital Partners . [8] Проект Bizgres включал несколько других участников и поддерживался примерно до 2008 года, когда продукт также назывался просто «Greenplum». [10] [11] Sun Fire X4500 был эталонной архитектурой и использовался большинством клиентов до тех пор, пока примерно в то же время не был осуществлен переход на Linux . Greenplum была приобретена корпорацией EMC в июле 2010 года, став основой подразделения программного обеспечения для больших данных EMC . [1] Хотя EMC не раскрывала стоимость, она была оценена в 300 миллионов долларов США . [12] [13] На момент приобретения продуктами Greenplum были Greenplum Database, Chorus (инструмент управления) и Data Science Labs. У Greenplum были клиенты на вертикальных рынках, включая eBay . [14] В 2012 году компания стала частью Pivotal Software. [15]

Вариант, использующий Apache Hadoop для хранения данных в файловой системе Hadoop под названием Hawq, был анонсирован в 2013 году. [16] [17] В 2015 году были анонсированы проекты программного обеспечения с открытым исходным кодом GreenplumDB и Hawq . [18]

Технологии

Продукт базы данных Greenplum от Pivotal использует методы массивно-параллельной обработки (MPP). Каждый компьютерный кластер состоит из главного узла, резервного главного узла и узлов сегмента. [19] Все данные находятся на узлах сегмента, а информация каталога хранится в главных узлах. Узлы сегмента запускают один или несколько сегментов, которые являются измененными экземплярами базы данных PostgreSQL и которым назначается идентификатор содержимого. Для каждой таблицы данные распределяются между узлами сегмента на основе ключей столбцов распределения, указанных пользователем на языке определения данных . Для каждого идентификатора содержимого сегмента есть как основной сегмент, так и зеркальный сегмент, которые не работают на одном и том же физическом хосте. Когда запрос поступает на главный узел, он анализируется, планируется и отправляется всем сегментам для выполнения плана запроса и либо возвращает запрошенные данные, либо вставляет результат запроса в таблицу базы данных. Для представления запросов в системе используется язык структурированных запросов версии SQL:2003 . Семантика транзакций соответствует ограничениям, известным как ACID . [20]

Конкурентами являются другие системы управления базами данных MPP, предоставляемые крупными поставщиками, такими как Teradata , Amazon Redshift , Microsoft Azure , Alibaba AnalyticDB и, в прошлом, IBM Netezza . [19] [21] Дополнительную конкуренцию составляют другие более мелкие конкуренты, столбчато-ориентированные базы данных , такие как HP Vertica , Exasol , и поставщики хранилищ данных с архитектурой, отличной от MPP, такие как Oracle Exadata , IBM Db2 и SAP HANA .

Greenplum Версия 7

В сентябре 2023 года была выпущена версия 7 базы данных Greenplum. [22] Версия 7 основана на PostgreSQL версии 12.12.

Greenplum Версия 6

В сентябре 2019 года была выпущена версия Greenplum Database 6. Версия 6 основана на PostgreSQL версии 9.4 и отличается значительным приростом производительности [23] OLTP. Greenplum 6 была рассмотрена в СМИ несколькими источниками и упомянута за ее соответствие Postgres с открытым исходным кодом [24] и за ее производительность OLTP [25].

Greenplum Версия 5

В сентябре 2017 года была выпущена версия Greenplum Database 5. Версия 5 включает в себя первую итерацию стратегии проекта Greenplum по слиянию более поздних версий PostgreSQL обратно в Greenplum и основана на PostgreSQL версии 8.3 по сравнению с предыдущей версией 8.2. [26] Версия 5 также представляет общедоступный оптимизатор GPORCA [27] для оптимизации SQL на основе затрат, разработанный для больших данных.

Ссылки

  1. ^ ab "EMC to Acquire Greenplum". Пресс-релиз . Корпорация EMC. 6 июля 2010 г. Получено 15 марта 2017 г.
  2. ^ Харанас, Марк. «5 вещей, которые вам нужно знать о приобретении VMware компании Pivotal | CRN». www.crn.com . Получено 2024-10-02 .
  3. ^ "Производитель чипов Broadcom завершает сделку на сумму 69 млрд долларов по покупке VMware". 2023-11-23 . Получено 2024-06-05 .
  4. ^ "Форма D: Уведомление о продаже ценных бумаг" (PDF) . Комиссия по ценным бумагам и биржам США. 30 июля 2003 г. Получено 15 марта 2017 г.
  5. ^ Морин О'Гара (26 сентября 2003 г.). «Metapa Buys Didera». Linux Business News . Получено 15 марта 2017 г. .
  6. ^ "Metapa приобретает Didera и закрывает дополнительное финансирование; пионеры отрасли в области высокопроизводительных вычислений объединяются для создания прорывного решения кластеризации баз данных Linux для поддержки принятия решений". Пресс-релиз . 23 сентября 2003 г.
  7. ^ "Bizgres project started". Сайт разработчика PostgreSQL . 17 апреля 2005 г. Получено 15 марта 2017 г.
  8. ^ ab Duncan Riley (21 января 2008 г.). «Greenplum Takes $27 Million Series C». Tech Crunch . Получено 15 марта 2017 г. .
  9. ^ Колин Уайт; Ричард Хакаторн (26 июня 2007 г.). "Sun/Greenplum". Business Intelligence Best Practices . Получено 15 марта 2017 г.
  10. ^ "История". Старый веб-сайт Bizgres.org . Архивировано из оригинала 22 декабря 2008 г. Получено 15 марта 2017 г.
  11. ^ "Greenplum обновляет базу данных с открытым исходным кодом". Information Week . 22 февраля 2008 г. Получено 15 марта 2017 г.
  12. Ом Малик (6 июля 2010 г.). «Большие данные = большие деньги: EMC покупает Greenplum». GigaOm . Архивировано из оригинала 20 октября 2016 г. Получено 15 марта 2017 г.
  13. Александр Хейслип (7 июля 2010 г.). «Microsoft, Sun и SAP неожиданно стали победителями на распродаже Greenplum». Forbes . Получено 15 марта 2017 г.
  14. ^ "два огромных хранилища данных eBay". Блог DBMS2 . Monash Research. 30 апреля 2009 г. Получено 15 марта 2017 г.
  15. ^ Тимоти Прикетт Морган (20 марта 2012 г.). «EMC хочет быть Linux больших данных: открывает инструмент Chorus, боргс agile coders Pivotal Labs». The Register . Получено 15 марта 2017 г.
  16. ^ «Когда следует использовать Greenplum Database, а не HAWQ?». Веб-сайт Pivotal Guru . 31 января 2014 г. Получено 15 марта 2017 г.
  17. ^ Тимоти Прикетт Морган (25 февраля 2013 г.). "EMC превращает Hadoop elephant в SQL database Hawq". The Register . Получено 15 марта 2017 г.
  18. Cade Metz (17 февраля 2015 г.). «Pivotal удваивает ставку на Open Source в знак меняющегося мира программного обеспечения». Wired . Получено 15 марта 2017 г.
  19. ^ ab Timothy Prickett Morgan (6 апреля 2011 г.). "EMC становится толстой и яркой с техникой Greenplum: возьмите это, Teradata, Exadata, Netezza". The Register . Получено 18 марта 2017 г.
  20. ^ Сунила Голлапуди (2013). Начало работы с Greenplum для аналитики больших данных . Packt Publishing. ISBN 978-1-78217-705-0.
  21. ^ "Сравнение свойств системы Amazon Redshift против Greenplum против Microsoft Azure SQL Database против Teradata Aster". DB-engines . Получено 18 марта 2017 г. .
  22. ^ «VMware Greenplum 7.x Release Notes». 2 октября 2023 г.
  23. ^ "Greenplum 6 OLTP Benchmarks". 15 мая 2019 г.
  24. ^ «База данных Greenplum компании Pivotal наконец-то будет соответствовать проекту с открытым исходным кодом. Что это будет означать для платформы?». ZDNet .
  25. ^ «Значительная версия хранилища данных MPP с открытым исходным кодом предлагает высокую степень параллелизма, встроенную аналитику и возможности науки о данных». 7 ноября 2019 г.
  26. ^ "Pivotal Greenplum жив и здоров". ZDNet . Получено 14 сентября 2017 г. .
  27. ^ "Orca: Модульная архитектура оптимизатора запросов для больших данных" (PDF) . ZDNet . Получено 14 апреля 2016 г. .