HBase — это нереляционная распределенная база данных с открытым исходным кодом, созданная по образцу Google Bigtable и написанная на Java . Он разработан в рамках проекта Apache Hadoop Apache Software Foundation и работает поверх HDFS (распределенная файловая система Hadoop) или Alluxio , предоставляя возможности Hadoop, подобные Bigtable. То есть он обеспечивает отказоустойчивый способ хранения больших объемов разреженных данных (небольшие объемы информации, попадающие в большую коллекцию пустых или неважных данных, например, поиск 50 крупнейших элементов в группе из 2 миллиардов записей или поиск ненулевые элементы составляют менее 0,1% огромной коллекции).
HBase поддерживает сжатие, работу в памяти и фильтры Блума для каждого столбца, как описано в оригинальной статье Bigtable. [2] Таблицы в HBase могут служить входными и выходными данными для заданий MapReduce, выполняемых в Hadoop, и к ним можно получить доступ через API Java, а также через API REST , Avro или шлюза Thrift . HBase — это хранилище с широкими столбцами , получившее широкое распространение благодаря своему родству с Hadoop и HDFS. HBase работает поверх HDFS и хорошо подходит для быстрых операций чтения и записи больших наборов данных с высокой пропускной способностью и низкой задержкой ввода-вывода.
HBase не является прямой заменой классической базы данных SQL , однако проект Apache Phoenix предоставляет уровень SQL для HBase, а также драйвер JDBC , который можно интегрировать с различными приложениями аналитики и бизнес-аналитики . Проект Apache Trafodion предоставляет механизм запросов SQL с драйверами ODBC и JDBC и распределенную защиту транзакций ACID для нескольких операторов, таблиц и строк, которые используют HBase в качестве механизма хранения.
HBase сейчас обслуживает несколько веб-сайтов, управляемых данными [3] , но платформа обмена сообщениями Facebook перешла с HBase на MyRocks в 2018 году . [4] [5] В отличие от реляционных и традиционных баз данных, HBase не поддерживает сценарии SQL; вместо этого эквивалент написан на Java, используя сходство с приложением MapReduce.
Говоря языком теоремы CAP Эрика Брюэра , HBase представляет собой систему типа CP.
Apache HBase начался как проект компании Powerset из-за необходимости обрабатывать огромные объемы данных для целей поиска на естественном языке . С 2010 года это проект Apache верхнего уровня.
Facebook решил реализовать свою новую платформу обмена сообщениями с использованием HBase в ноябре 2010 года, но отказался от HBase в 2018 году. [4]
Серия 2.4.x — это текущая стабильная линейка выпусков, она заменяет более ранние линейки выпусков.
Ниже приводится список известных предприятий, которые использовали или используют HBase:
{{cite web}}
: |first=
имеет общее имя ( справка )