Различные двоичные форматы были предложены в качестве компактных представлений для XML ( Extensible Markup Language ). Использование двоичного формата XML обычно уменьшает многословность XML-документов, тем самым также снижая стоимость анализа, [1] но затрудняет использование обычных текстовых редакторов и сторонних инструментов для просмотра и редактирования документа. Существует несколько конкурирующих форматов, но ни один из них еще не стал фактическим стандартом , хотя Консорциум Всемирной паутины принял EXI в качестве Рекомендации 10 марта 2011 года. [2]
Двоичный XML обычно используется в приложениях, где производительность стандартного XML недостаточна, но возможность конвертировать документ в и из формы (XML), которую легко просматривать и редактировать, ценится. Другие преимущества могут включать возможность произвольного доступа и индексации XML-документов.
Основная проблема для двоичного XML заключается в создании единого, широко распространенного стандарта. Международная организация по стандартизации (ISO) и Международный союз электросвязи (ITU) опубликовали стандарт Fast Infoset в 2007 и 2005 годах соответственно. Другой стандарт (ISO/IEC 23001-1), известный как двоичный формат MPEG для XML ( BiM ), был стандартизирован ISO в 2001 году. BiM используется многими стандартами ETSI для цифрового телевидения и мобильного телевидения. Открытый геопространственный консорциум предоставляет спецификацию двоичного кодирования XML (в настоящее время документ о передовой практике), оптимизированную для геоданных (GML), а также эталон для сравнения производительности Fast InfoSet, EXI, BXML и deflate для кодирования/декодирования AIXM . [3]
Альтернативы двоичному XML включают использование традиционных методов сжатия файлов в документах XML (например, gzip ); или использование существующего стандарта, такого как ASN.1 . Однако традиционные методы сжатия предлагают только преимущество в виде уменьшенного размера файла, без преимущества в виде уменьшенного времени анализа или случайного доступа. ASN.1 / PER формирует основу Fast Infoset , который является одним из двоичных стандартов XML. Существуют также гибридные подходы (например, VTD-XML ), которые прикрепляют небольшой индексный файл к документу XML для устранения накладных расходов на анализ. [4]
Проекты и форматы файлов, связанные с понятием двоичного XML, включают:
Другие проекты, имеющие функциональность, связанную с двоичными представлениями (или конкурирующую с ними), включают: