RSS ( RDF Site Summary или Really Simple Syndication ) [2] — это веб-канал [3] , который позволяет пользователям и приложениям получать доступ к обновлениям веб-сайтов в стандартизированном , машиночитаемом формате. Подписка на RSS-каналы позволяет пользователю отслеживать множество различных веб-сайтов в одном агрегаторе новостей , который постоянно отслеживает сайты на предмет нового контента, устраняя необходимость для пользователя вручную проверять их. Агрегаторы новостей (или «RSS-ридеры») могут быть встроены в браузер , установлены на настольном компьютере или установлены на мобильном устройстве . [4]
Веб-сайты обычно используют RSS-каналы для публикации часто обновляемой информации, такой как записи блогов , заголовки новостей, эпизоды аудио- и видеосериалов, или для распространения подкастов . Документ RSS (называемый «каналом», «веб-каналом» [5] или «каналом») включает полный или обобщенный текст и метаданные , такие как дата публикации и имя автора. Форматы RSS указываются с помощью универсального XML- файла. [4]
Хотя форматы RSS начали развиваться еще в марте 1999 года [6] , именно в период с 2005 по 2006 год RSS получил широкое распространение, а ("") значок был выбран несколькими основными веб-браузерами. [7] Данные RSS-канала предоставляются пользователям с помощью программного обеспечения, называемого агрегатором новостей, а передача контента называется веб-синдикацией . Пользователи подписываются на каналы, либо вводя URI канала в считыватель, либо нажимая на значок канала в браузере . Считыватель RSS регулярно проверяет каналы пользователя на наличие новой информации и может автоматически загружать ее, если эта функция включена.
Форматам RSS предшествовало несколько попыток веб-синдикации , которые не получили широкой популярности. Основная идея реструктуризации информации о веб-сайтах восходит к 1995 году, когда Раманатан В. Гуха и другие в группе передовых технологий Apple разработали Meta Content Framework . [8]
RDF Site Summary, первая версия RSS, была создана Дэном Либби, Раманатаном В. Гухой и Экартом Вальтером в Netscape . [9] Она была выпущена в марте 1999 года для использования на портале My.Netscape.Com. [10] Эта версия стала известна как RSS 0.9. [6] В июле 1999 года Дэн Либби из Netscape выпустил новую версию, RSS 0.91, [3] которая упростила формат, удалив элементы RDF и включив элементы из формата новостной синдикации Дейва Винера . [11] Либби также переименовал формат из RDF в RSS Rich Site Summary и изложил дальнейшее развитие формата в «документе о будущем». [12]
Это было последнее участие Netscape в разработке RSS за восемь лет. Поскольку RSS был принят веб-издателями, которые хотели, чтобы их каналы использовались на My.Netscape.Com и других ранних порталах RSS, Netscape прекратил поддержку RSS на My.Netscape.Com в апреле 2001 года во время реструктуризации компании новым владельцем AOL , также удалив документацию и инструменты, которые поддерживали этот формат. [13]
Для заполнения образовавшейся пустоты без помощи и одобрения Netscape появились две партии: рабочая группа RSS-DEV и Дэйв Винер, чья компания UserLand Software опубликовала некоторые из первых издательских инструментов за пределами Netscape, которые могли читать и записывать RSS.
Винер опубликовал измененную версию спецификации RSS 0.91 на веб-сайте UserLand, описав, как она используется в продуктах его компании, и заявил авторские права на документ. [14] Несколько месяцев спустя UserLand подала заявку на регистрацию товарного знака в США для RSS, но не ответила на запрос эксперта по товарным знакам USPTO , и запрос был отклонен в декабре 2001 года. [15]
Рабочая группа RSS-DEV, проект, в состав которого входили Аарон Шварц , [16] Гуха и представители O'Reilly Media и More , выпустила RSS 1.0 в декабре 2000 года. [17] Эта новая версия, которая вернула себе название RDF Site Summary из RSS 0.9, вновь ввела поддержку RDF и добавила поддержку пространств имен XML , заимствовав элементы из стандартных словарей метаданных, таких как Dublin Core .
В декабре 2000 года Винер выпустил RSS 0.92 [18] незначительный набор изменений, помимо введения элемента вложения, который позволил передавать аудиофайлы в RSS-каналах и помог зажечь подкастинг . Он также выпустил черновики RSS 0.93 и RSS 0.94, которые впоследствии были отозваны. [19]
В сентябре 2002 года Winer выпустила новую версию формата, RSS 2.0, которая переименовала свои инициалы в Really Simple Syndication. RSS 2.0 удалил атрибут type , добавленный в черновике RSS 0.94, и добавила поддержку пространств имен. Чтобы сохранить обратную совместимость с RSS 0.92, поддержка пространств имен применяется только к другому контенту, включенному в канал RSS 2.0, а не к самим элементам RSS 2.0. [20] (Хотя другие стандарты, такие как Atom, пытаются исправить это ограничение, каналы RSS не объединяются с другим контентом достаточно часто, чтобы переместить популярность от RSS к другим форматам, имеющим полную поддержку пространств имен.)
Поскольку ни Винер, ни рабочая группа RSS-DEV не имели отношения к Netscape, они не могли сделать официальное заявление о названии или формате RSS. Это вызвало продолжающиеся споры [ указать ] в сообществе разработчиков синдикации о том, какая организация была надлежащим издателем RSS.
Одним из результатов этих спорных дебатов стало создание альтернативного формата синдикации, Atom, которое началось в июне 2003 года. [21] Формат синдикации Atom, создание которого было отчасти мотивировано желанием начать все сначала, без проблем, связанных с RSS, был принят как предлагаемый стандарт IETF RFC 4287.
В июле 2003 года Винер и UserLand Software передали авторские права на спецификацию RSS 2.0 Центру Беркмана Кляйна по Интернету и обществу Гарвардского университета , где он только что начал работать в качестве приглашенного научного сотрудника. [22] В то же время Винер основал Консультативный совет по RSS с Брентом Симмонсом и Джоном Уделлом , группой, целью которой было поддерживать и публиковать спецификацию и отвечать на вопросы о формате. [23]
В сентябре 2004 года Стивен Хорландер создал ныне повсеместный значок RSS () для использования в браузере Mozilla Firefox . [24]
В декабре 2005 года команда Microsoft Internet Explorer [7] и команда Microsoft Outlook [25] объявили в своих блогах, что они принимают значок RSS Firefox. В феврале 2006 года Opera Software последовала их примеру. [26] Это фактически сделало оранжевый квадрат с белыми радиоволнами отраслевым стандартом для каналов RSS и Atom, заменив большое разнообразие значков и текста, которые использовались ранее для идентификации данных синдикации.
В январе 2006 года Роджерс Кейденхед возобновил работу Консультативного совета RSS без участия Дэйва Винера, заявив о желании продолжить разработку формата RSS и разрешить неоднозначности. В июне 2007 года совет пересмотрел свою версию спецификации, чтобы подтвердить, что пространства имен могут расширять основные элементы атрибутами пространства имен, как это сделала Microsoft в Internet Explorer 7. По их мнению, разница в интерпретации оставила издателей неуверенными в том, разрешено это или запрещено.
RSS — это XML -форматированный простой текст. Сам формат RSS относительно прост для чтения как автоматизированными процессами, так и людьми. Пример фида может иметь следующее содержимое:
<?xml version="1.0" encoding=" UTF -8" ?> <rss version= "2.0" > <channel> <title> Заголовок RSS </title> <description> Это пример RSS - канала </description> <link> http://www.example.com/main.html </link> <copyright> 2020 Example.com Все права защищены </copyright> <lastBuildDate> Пн , 6 Сен 2010 00:01:00 +0000 </lastBuildDate> <pubDate> Вс , 6 Сен 2009 16:20:00 +0000 </pubDate> <ttl> 1800 </ttl> <item> <title> Пример записи </title> <description> Вот текст , содержащий интересное описание. </description> <link> http://www.example.com/blog/post/1 </link> <guid isPermaLink = "false" > 7bd204c6-1655-4c27-aeee-53f933c5395f </guid> <pubDate> Вс , 6 сен 2009 16:20:00 +0000 </pubDate> </item> </канал> </rss>
При извлечении программное обеспечение для чтения RSS может использовать структуру XML для представления аккуратного отображения конечным пользователям. Существуют различные программные агрегаторы новостей для настольных и мобильных устройств, но RSS также может быть встроен в веб-браузеры или почтовые клиенты, такие как Mozilla Thunderbird .
Существует несколько различных версий RSS, которые делятся на две основные ветви (RDF и 2.*).
Ветка RDF (или RSS 1.*) включает следующие версии:
Ветка RSS 2.* (первоначально UserLand, теперь Harvard) включает следующие версии:
Более поздние версии в каждой ветке обратно совместимы с более ранними версиями (за исключением несоответствующего синтаксиса RDF в 0.90), и обе версии включают должным образом документированные механизмы расширения с использованием пространств имен XML, либо напрямую (в ветке 2.*), либо через RDF (в ветке 1.*). Большинство программного обеспечения для синдикации поддерживают обе ветки. "Миф о совместимости RSS", статья, написанная в 2004 году критиком RSS и сторонником Atom Марком Пилигримом , более подробно рассматривает проблемы совместимости версий RSS.
Механизмы расширения позволяют каждой ветви копировать инновации в другой. Например, ветвь RSS 2.* была первой, которая поддерживала вложения , что сделало ее текущим ведущим выбором для подкастинга, и с 2005 года [обновлять]является форматом, поддерживаемым для этого использования iTunes и другим программным обеспечением для подкастинга; однако, расширение вложения теперь доступно для ветви RSS 1.*, mod_enclosure. Аналогично, основная спецификация RSS 2.* не поддерживает предоставление полного текста в дополнение к синопсису, но разметка RSS 1.* может (и часто используется) использоваться в качестве расширения. Также доступно несколько общих внешних пакетов расширений, например, один от Microsoft для использования в Internet Explorer 7.
Самая серьезная проблема совместимости связана с разметкой HTML. RSS-ридер Userland, который обычно рассматривается как эталонная реализация, изначально не отфильтровывал HTML- разметку из каналов. В результате издатели начали размещать HTML-разметку в заголовках и описаниях элементов в своих RSS-каналах. Такое поведение стало ожидаемым от читателей, вплоть до того, что стало фактическим стандартом. [28] Хотя все еще существует некоторая непоследовательность в том, как программное обеспечение обрабатывает эту разметку, особенно в заголовках. Спецификация RSS 2.0 была позже обновлена, чтобы включить примеры HTML с кодировкой сущностей; однако все предыдущие использования простого текста остаются действительными.
По состоянию на январь 2007 года [обновлять]данные отслеживания с www.syndic8.com показывают, что три основные версии RSS, используемые в настоящее время, это 0.91, 1.0 и 2.0, составляющие 13%, 17% и 67% мирового использования RSS соответственно. [29] Однако эти цифры не включают использование конкурирующего формата веб-каналов Atom. По состоянию на август 2008 года [обновлять]веб-сайт syndic8.com индексирует 546 069 каналов, из которых 86 496 (16%) были диалектом Atom, а 438 102 — диалектом RSS. [30]
Основная цель всех модулей RSS — расширить базовую схему XML, установленную для более надежной синдикации контента. Это по своей сути позволяет проводить более разнообразные, но стандартизированные транзакции без изменения базовой спецификации RSS.
Для реализации этого расширения через пространство имен XML объявляется строго контролируемый словарь (в мире RSS — «модуль», в мире XML — «схема»), позволяющий давать имена концепциям и отношениям между этими концепциями.
Вот некоторые модули RSS 2.0 с установленными пространствами имен:
Хотя количество элементов в канале RSS теоретически не ограничено, некоторые агрегаторы новостей не поддерживают файлы RSS размером более 150 КБ. Например, приложения, которые полагаются на Common Feed List Windows, могут обрабатывать такие файлы так, как будто они повреждены, и не открывать их. Взаимодействие можно максимизировать, удерживая размер файла ниже этого предела.
Подкасты распространяются с помощью RSS. Чтобы прослушать подкаст, пользователь добавляет RSS-канал в свой клиент подкастов, а затем клиент может перечислить доступные эпизоды и загрузить или транслировать их для прослушивания или просмотра. Чтобы быть включенным в каталог подкастов, канал должен для каждого эпизода предоставить название, описание, обложку, категорию, язык и явный рейтинг. Существуют некоторые сервисы, которые специально индексируют и являются поисковой системой для подкастов. [31]
Некоторые клиенты BitTorrent поддерживают RSS. RSS-каналы, предоставляющие ссылки на файлы .torrent, позволяют пользователям подписываться и автоматически загружать контент сразу после его публикации.
Некоторые сервисы доставляют RSS на почтовый ящик, отправляя обновления по личному выбору и расписанию пользователя. Примерами таких сервисов являются IFTTT , Zapier и другие. [32] И наоборот, некоторые сервисы доставляют электронную почту читателям RSS. [33] Другие сервисы, такие как Gmane, позволяют подписываться на каналы через NNTP .
Можно отметить, что почтовые клиенты , такие как Thunderbird, изначально поддерживают RSS. [34]
RSS и Atom широко поддерживаются и совместимы со всеми основными потребительскими ридерами. RSS получил более широкое распространение из-за ранней поддержки ридеров. Технически, Atom имеет несколько преимуществ: менее ограничительное лицензирование, зарегистрированный в IANA тип MIME , пространство имен XML, поддержка URI , поддержка RELAX NG . [35]
В следующей таблице показаны элементы RSS и элементы Atom, где они эквивалентны.
Примечание: символ звездочки (*) указывает на то, что элемент должен быть предоставлен (элементы Atom «author» и «link» требуются только при определенных условиях).
Несколько крупных сайтов, таких как Facebook и Twitter, ранее предлагали RSS-каналы, но сократили или убрали поддержку. Кроме того, широко используемые ридеры, такие как Shiira , FeedDemon и особенно Google Reader , были прекращены с 2013 года из-за снижения популярности RSS. [36] Поддержка RSS была удалена в версиях Mail и Safari для OS X Mountain Lion , хотя эти функции были частично восстановлены в Safari 8. [37] [38] Mozilla удалила поддержку RSS из Mozilla Firefox версии 64.0, присоединившись к Google Chrome и Microsoft Edge , которые не включают поддержку RSS, таким образом оставив Internet Explorer последним крупным браузером, включающим поддержку RSS по умолчанию. [39] [40]
С конца 2010-х годов снова наблюдается всплеск интереса к RSS. В 2018 году Wired опубликовал статью под названием «Пришло время возрождения RSS», в которой говорилось, что RSS дает больше контроля над контентом по сравнению с алгоритмами и трекерами из социальных сетей. В то время самым популярным ридером RSS был Feedly . [41] Chrome на Android добавил возможность следить за RSS-каналами с 2021 года. [42]
сосредоточен вокруг так называемой Really Simple Syndication (RSS), технологии, широко используемой для синдицирования блогов и другого веб-контента. Спор сталкивает сотрудника Гарвардской школы права Дэйва Винера, пионера блоггинга, который является ключевым хранителем RSS, с защитниками другого формата.