Потоковые данные — это данные, которые непрерывно генерируются различными источниками. Такие данные должны обрабатываться пошагово с использованием методов потоковой обработки без доступа ко всем данным. Кроме того, следует учитывать, что в данных может произойти дрейф концепций , что означает, что свойства потока могут меняться с течением времени.
Обычно он используется в контексте больших данных , в которых они генерируются множеством различных источников с высокой скоростью. [1]
Потоковую передачу данных также можно объяснить как технологию, используемую для доставки контента на устройства через Интернет, и она позволяет пользователям получать доступ к контенту немедленно, а не ждать, пока он будет загружен. [2] Большие данные заставляют многие организации сосредоточиться на расходах на хранение, что вызывает интерес к озерам данных и потокам данных . [3] Озеро данных относится к хранению большого количества неструктурированных и полуструктурированных данных и полезно из-за увеличения больших данных, поскольку их можно хранить таким образом, что фирмы могут погрузиться в озеро данных и извлечь то, что им нужно, в тот момент, когда им это нужно, [3] тогда как поток данных может выполнять анализ потоковых данных в реальном времени, и он отличается от озер данных скоростью и непрерывным характером анализа, без необходимости предварительного сохранения данных. [3]
В теориях управления цифровыми инновациями упоминаются пять характеристик цифровых инновационных технологий: гомогенизация и разъединение, модульность, связность, цифровые следы и программируемость. Прежде чем эти характеристики будут объяснены и дополнительно проработаны с различными примерами потоковой передачи данных, важно понять разницу между цифровизацией и оцифровкой . Последняя описывает кодирование аналоговой информации в цифровой формат, такой как свет, который попадает в объектив камеры и преобразуется в цифровой формат/изображение (Yoo et al. 2012). [4] Где цифровизация относится к более социально-техническому процессу, где оцифрованные методы применяются к более широким социальным и институциональным контекстам, то есть процессу преобразования информации в цифровой формат, читаемый каким-либо компьютером. [5] В контексте потоковой передачи данных это означает, что, например, медиа (информация) были оцифрованы с начала 1990-х годов, однако оцифровка «информации/медиа» начала набирать обороты с начала этого столетия. [6]
Теперь, во-первых, гомогенизация и разъединение. «Поскольку вся цифровая информация принимает одну и ту же форму, она может, по крайней мере в принципе, обрабатываться одними и теми же технологиями. Следовательно, оцифровка имеет потенциал для устранения тесных связей между типами информации и технологиями их хранения, передачи и обработки». [7] В контексте потоковой передачи данных это означает в теории, что теперь можно передавать данные с любого цифрового устройства. Это также снижает спрос и использование музыки и фильмов на компакт-дисках, например. Одним из последствий гомогенизации и разъединения является снижение предельных издержек . [8] Предельная стоимость потоковой передачи данных заключается в том, что она использует исключительно цифровую информацию, которая может передаваться, храниться и вычисляться быстрыми и недорогими способами. [8] Примером отрасли, которая имеет низкие предельные издержки из-за потоковой передачи данных, является музыкальная индустрия . Теперь продюсеры могут оцифровывать песни и загружать их на Spotify , вместо того, чтобы платить за создание физических альбомов и их распространение. Другим следствием является конвергентный пользовательский опыт, означающий, что ранее разделенные возможности теперь объединены в одном продукте. [8]
Потоковая передача данных также является модульной, поскольку компоненты системы могут быть разделены и рекомбинированы в основном для гибкости и разнообразия. Потоковая передача данных работает в различных версиях приложений и системах, таких как IOS . Также возможно изменить скорость потоковой передачи данных. [9] Следствием модульности является создание платформ. Платформы потоковой передачи данных объединяют анализ информации, но что еще важнее, они способны интегрировать данные между различными источниками (Myers, 2016). Например, IBM streams — это аналитическая платформа, которая позволяет приложениям, разработанным пользователями, собирать, анализировать и сопоставлять информацию, которая поступает к ним из различных источников ( IBM ).
Третья характеристика, связность, описывает, что цифровая технология не только соединяет приложения, устройства и пользователей, но также соединяет клиентов и компании. Например, потоковые сервисы соединяют огромную коллекцию музыки и фильмов «продюсеров» с их потребителями, так что музыка на Spotify может легко достичь большой группы потребителей. Другим примером могут служить данные транспортных средств, которые также могут быть подключены к фирмам с потоковыми приложениями через связь транспорт-дорога. [10] UPS делает это, например, для «расчета» оптимальных маршрутов доставки путем потоковой передачи больших данных в реальном времени и тем самым сокращения времени доставки посылок.
Взаимодействие, то есть способность продукта или системы работать с другими продуктами или системами, [8] является следствием связности. Например, музыкальная индустрия взаимодействует, потому что некоторые музыкальные платформы имеют интегрированные платформы социальных сетей. [11] Другим видом связности является сетевая экстерналия. Это означает, что ценность товара для пользователя увеличивается с числом других пользователей (установленная база) того же или аналогичного товара. [8] Технология потоковой передачи данных может использовать сетевые экстерналии, потому что она объединяет спрос и предложение больших сетей создателей и потребителей. Это очень актуально для popcorn time , сервиса, где люди могут транслировать последние фильмы по запросу. Эти потоки работают лучше, когда люди использовали их контент.
Последнее связано с тем, что если кто-то транслирует контент, он/она автоматически также скачивает/загружает контент. Во время использования потокового сервиса он оставляет цифровые следы, которые просто описывают тот факт, что все цифровые технологии оставляют цифровой след от пользователя. [8] В прошлом, когда продавались медиа, продавец/поставщик имел только информацию о самой транзакции. С потоковой передачей данных стало возможным фактически отслеживать поведение пользователей, поскольку это происходит в режиме реального времени, напрямую от дистрибьютора/поставщиков. Моррис и Пауэрс [12] описывают это как открытие «черного ящика» потребления. Например, поставщики потоковых сервисов теперь могут отслеживать подробное потребительское поведение пользователя, которое, в свою очередь, они используют для влияния на процесс принятия решений пользователем, создавая алгоритмы для дальнейшего развития сервиса. Этот вид потоковой передачи изменил способ, которым люди потребляют медиа, что со временем открыло новые возможности для новых идей. [12] Их также называют следами инноваций [8] и они происходят в местах, где изначально никто не ожидал. Например, потоковая передача данных позволила разработать датчики, которые используются во многих секторах для различных целей. В производственном секторе потоковая передача данных используется для анализа в реальном времени с целью улучшения операций. В секторе здравоохранения датчики используются для подключенных медицинских устройств для создания хабов пациентов и поставщиков медицинских услуг, которые могут активировать оповещения, когда у пациента возникает чрезвычайная медицинская ситуация. [13]
Наконец, программируемость, характеристика, которая описывает, что инновационная цифровая технология может быть перепрограммирована, улучшена и/или обновлена. [8] Последствия программируемости — это появляющиеся функциональные возможности. Наиболее применимая функциональность — это незавершенность, что означает, что продукты и услуги никогда не заканчиваются, [8] что имеет место в случае потоковой передачи данных, поскольку поставщики будут продолжать обновлять свои модели. [14] Однако более влиятельным последствием программируемости, а также подключенности является сервитизация цифрового медиа-контента. Потоковая передача данных привела к сдвигу в сторону оплаты за использование вместо оплаты за владение; [8] [12] Это происходит в индустрии потоковой передачи видео и музыки, вспомните Netflix или Spotify. Вам нужно платить за использование услуги, а не за владение продуктом. Так было с покупкой альбома или DVD, тогда как теперь можно получить доступ к тысячам песен или фильмов.
Потоковая передача данных становится все более полезной и необходимой в современном мире и применяется в широком спектре отраслей, некоторые из которых уже упоминались в примерах, таких как медицинская или транспортная отрасли. Другие примеры отраслей или рынков, где применима потоковая передача данных, следующие:
Финансы : позволяет отслеживать изменения на фондовом рынке в режиме реального времени, вычисляет стоимость, подверженную риску, и автоматически ребалансирует портфели на основе движения цен на акции. [15]
Недвижимость : веб-сайты могут отслеживать подмножество данных с мобильных устройств потребителей и в режиме реального времени давать рекомендации по выбору объектов недвижимости для посещения на основе их геолокации ( Amazon ).
Игры: Компания, занимающаяся онлайн-играми, может собирать потоковые данные о взаимодействии игрока с игрой и передавать эти данные на свою игровую платформу ( Amazon ).
Электронная коммерция/маркетинг: потоковая передача данных может предоставить все записи о посещениях со своих онлайн-ресурсов, а также объединить и обогатить данные демографической информацией о пользователях, а также оптимизировать размещение контента на своем сайте, обеспечивая релевантность и лучший опыт для клиентов ( Amazon ).
Помимо этих примеров, вероятно, существует еще множество приложений для потоковой передачи данных. Однако поток данных оказал наибольшее влияние на индустрию аудио, видео и телекоммуникаций из-за создания потоковых сервисов. Потоковые сервисы оказали большое влияние на то, как люди потребляют свои медиа в настоящее время. [16] Поскольку потоковые сервисы оказали наибольшее влияние, используя технологию потоковой передачи данных, это будет основным направлением дальнейшего рассмотрения на этой странице.
Процесс технологической конвергенции , который появляется из-за того, что различные отрасли все больше полагаются на один и тот же набор технологических навыков в своих производственных процессах, [17] приводит к более тесным отношениям между рынками, которые ранее не были тесно связаны. Например, платформы социальных сетей, такие как Facebook и Twitter, предоставляют услуги потоковой трансляции в реальном времени, что позволяет издателям новостей по всему миру напрямую связываться с нужной аудиторией, а также с гораздо более широким кругом аудитории, чем они могли бы охватить в противном случае. [18] Это привело к изменению того, как и где издатели новостей взаимодействуют со своей аудиторией, и как они используют службы социальных сетей для предоставления своих услуг.
Индустрия, на которую влияет потоковая передача данных, — это индустрия потокового видео. Потребители теперь требуют, чтобы видео были доступны по немедленному запросу, а это означает, что теперь не только качество разрешения изображения выступает в качестве важных показателей производительности в медиаиндустрии, но и то, как быстро видео начинает воспроизводиться. [19]
Видеоиндустрия претерпела некоторые из тех же изменений, что и музыкальная индустрия. Видеоиндустрия получала доход, продавая DVD клиентам и продавая права кинотеатрам и телеканалам. В 1997 году появились первые онлайн-дистрибьюторы, но даже спустя десятилетие их было мало, в основном из-за более низкого качества по сравнению с печатными фильмами. Третья волна потоковых сервисов, таких как Netflix, iTunes, Hulu, Amazon и Blockbuster, изменила кинорынок. [20] Netflix начал работу в 1997 году, но начал разрушать рынок только более чем десятилетие спустя
Оцифровка, цифровизация и базовые технологии потокового вещания создали эти потоковые сервисы, которые по сути и стали причиной этого нарушения. С ростом потоковых компаний в киноиндустрии продажи физических DVD полностью исчезли. Важное различие между музыкальной и киноиндустрией заключается в том, что в киноиндустрии потоковые сервисы, такие как iTunes и Netflix, «уничтожают» доход (Салливан, 2009). Из-за этого производится меньше фильмов и, следовательно, в этой отрасли меньше рабочих мест. Напротив, кинотеатры по-прежнему важны в киноиндустрии, но доля фильмов и сериалов, которые транслируются клиентами, растет очень быстро. Он заменил DVD, изменил показатели производительности действующих лиц и, таким образом, может рассматриваться как разрушительный.
Еще одной пострадавшей отраслью является индустрия потоковой передачи музыки. В 2017 году на потоковую передачу приходилось 43% доходов в музыкальной индустрии, и это был третий год подряд роста. [21] Новые сервисы потоковой передачи музыки, такие как Spotify и Apple Music, бросают вызов традиционным лейблам , которые теперь рискуют быть вытесненными новыми бизнес-моделями. [22] До быстрой адаптации потоковой передачи, в 2000 году музыкальная индустрия переживала то, что оказалось 15-летней непрерывной стагнацией доходов, что было связано с высокими ценами на компакт-диски, необходимыми для покрытия расходов звукозаписывающих лейблов. [23] В 2015 году технология потоковой передачи обогнала рынок, позволив доходам увеличиться за счет экономии затрат на лейблах, а артистам иметь более стабильный доход, зарабатывая деньги на потоковой передаче, а не полагаясь на полноценный альбом или компакт-диск, чтобы преуспеть после публикации. [24]
Кроме того, потоковая передача данных также оказывает влияние на индустрию потоковой передачи игр. Потоковая передача игр вызвана значительным ростом облачных вычислений , которые позволяют геймерам получать доступ к большему разнообразию игр без необходимости иметь дорогостоящее оборудование. [25] Облачные вычисления действуют как средство развития потоковой передачи игр, где доступ к оборудованию и контенту осуществляется из облака, что приводит к изменению в предложении большей гибкости в распространении контента. [26] Потоковая передача игр, разрешенная облачными технологиями, приведет к изменениям в игровой индустрии, где именно аппаратная конфигурация машин в облаке будет разрабатываться разработчиками, стоимость и время будут сокращены для разработки большей возможности охвата пользователей по всему миру. [27]