Amazon Redshift — это продукт хранилища данных , который является частью более крупной платформы облачных вычислений Amazon Web Services . [1] Он создан на основе технологии компании ParAccel , занимающейся хранением данных с массовой параллельной обработкой (MPP) (позже приобретенной Actian ), [2] для обработки крупномасштабных наборов данных и миграции баз данных . [3] Redshift отличается от другого предложения Amazon по размещению баз данных, Amazon RDS , своей способностью обрабатывать аналитические рабочие нагрузки над большими наборами данных, хранящимися по принципу столбцово-ориентированной СУБД . Redshift позволяет хранить в кластере до 16 петабайт данных [4] по сравнению с максимальным размером Amazon RDS Aurora , равным 128 терабайтам. [5]
Amazon Redshift основан на более старой версии PostgreSQL 8.0.2 , и Redshift внес в эту версию изменения. [6] [7] Первоначальная предварительная бета-версия была выпущена в ноябре 2012 года [8] , а полная версия стала доступна 15 февраля 2013 года. Служба может обрабатывать соединения из большинства других приложений, использующих соединения ODBC и JDBC . [9] Согласно отчету Cloud Data Warehouse, опубликованному Forrester в четвертом квартале 2018 года, Amazon Redshift имеет наибольшее количество развертываний облачных хранилищ данных: более 6500 развертываний. [10]
Redshift использует параллельную обработку и сжатие для уменьшения времени выполнения команд . [11] Это позволяет Redshift выполнять операции над миллиардами строк одновременно. [12] Это также делает Redshift полезным для хранения и анализа больших объемов данных из журналов или прямых каналов через такой источник, как Amazon Kinesis Data Firehose. [12]
Amazon перечислила ряд владельцев программного обеспечения для бизнес-аналитики в качестве партнеров и протестировала инструменты в своей программе «APN Partner», [13] включая Actian , Actuate Corporation , Alteryx , Dundas Data Visualization , IBM Cognos , InetSoft , Infor , Logi Analytics , Looker , MicroStrategy , Pentaho , [14] [15] Qlik , SiSense , Tableau Software и Yellowfin. Компании-партнеры, предоставляющие инструменты интеграции данных, включают Informatica и SnapLogic . В число партнеров по системной интеграции и консультированию входят Accenture , Deloitte , Capgemini и DXC Technology .
«Красный» в названии Redshift отсылает к Oracle , конкурирующей компании в области компьютерных технологий, которую иногда неофициально называют «Big Red» из-за ее красного корпоративного цвета. Следовательно, клиенты, решившие переместить свои базы данных с Oracle на Redshift, будут «переходить» с «Red». [16]
Том кластера Aurora может вырасти до максимального размера 128 тебибайт (ТиБ).
Pentaho сертифицировала свою платформу бизнес-аналитики и интеграции данных для работы с Amazon Redshift.
затем преобразовали, усовершенствовали и сразу же внедрили в Amazon Redshift.