Бухгалтерский термин
Оценка данных — это дисциплина в области бухгалтерского учета и информационной экономики . [1] Она занимается методами расчета стоимости данных, собираемых, хранимых, анализируемых и продаваемых организациями. Эта оценка зависит от типа, надежности и области данных.
История
В 21 веке экспоненциальный рост вычислительной мощности и возможностей хранения данных (в соответствии с законом Мура ) привел к распространению больших данных , машинного обучения и других методов анализа данных . Компании все чаще адаптируют эти методы и технологии для реализации стратегий, основанных на данных, для создания новых бизнес-моделей. [ требуется цитата ] Традиционные методы бухгалтерского учета, используемые для оценки организаций, были разработаны в эпоху, когда сбор и анализ больших объемов данных не получили широкого распространения и были сосредоточены на материальных активах (машинах, оборудовании, капитале, имуществе, материалах и т. д.), игнорируя активы данных. В результате бухгалтерские расчеты часто игнорируют данные и оставляют их стоимость за балансами организаций. [2] В частности, после атак 11 сентября на Всемирный торговый центр в 2001 году ряд предприятий потеряли значительные объемы данных. Они подали иски в свои страховые компании на возмещение стоимости информации, которая была уничтожена, но страховые компании отклонили иски, утверждая, что информация не считается собственностью и, следовательно, не покрывается их страховыми обязательствами. [3]
Ряд организаций и частных лиц начали замечать это и затем публиковать материалы на тему оценки данных. Дуг Лэйни, вице-президент и аналитик Gartner , провел исследование компаний, оцененных на Уолл-стрит , которое обнаружило, что компании, которые стали информационно-ориентированными, рассматривая данные как актив, часто имели рыночную стоимость в два-три раза выше нормы. [3] [4] По этой теме Лэйни прокомментировал: «Даже сейчас, когда мы находимся в середине информационного века , информация просто не ценится теми, кто занимается оценкой. Однако мы считаем, что в течение следующих нескольких лет те, кто занимается оценкой корпоративных инвестиций, включая аналитиков по акциям , будут вынуждены учитывать богатство информации компании при правильной оценке самой компании». [2] Во второй половине 2010-х годов в списке самых дорогих компаний мира (список, в котором традиционно доминируют нефтяные и энергетические компании) доминировали компании, работающие с данными: Microsoft , Alphabet , Apple , Amazon и Facebook. [5] [6]
Характеристики данных как актива
Исследование, проведенное в 2020 году Институтом Наффилда при Кембриджском университете (Великобритания), разделило характеристики данных на две категории: экономические характеристики и информационные характеристики. [7]
Экономические характеристики
- Данные не являются конкурентными . Несколько человек могут использовать данные без их истощения или использования.
- Данные различаются по тому, являются ли они исключаемыми. Данные могут быть общественным благом или клубным благом в зависимости от того, какой тип информации они содержат. Некоторые данные могут быть разумно предоставлены любому, кто захочет получить к ним доступ (например, данные о погоде). Другие данные ограничены определенными пользователями и контекстами (например, административные данные).
- Данные включают внешние эффекты . В экономике внешние эффекты — это издержки или выгоды, которые влияют на третью сторону, которая не выбирала нести эти издержки или выгоды. Данные могут создавать положительные внешние эффекты, поскольку при создании новых данных они объединяются с уже существующими данными для получения новых идей, увеличивая ценность и тех, и других, а также отрицательные внешние эффекты, когда данные могут быть украдены, взломаны или использованы иным образом не по назначению.
- Данные могут иметь возрастающую или убывающую отдачу. Иногда сбор большего количества данных увеличивает понимание или ценность, хотя в других случаях это может просто привести к накоплению.
- Данные имеют большую опционную стоимость . Из-за постоянного развития новых технологий и наборов данных трудно предсказать, как может измениться стоимость конкретного актива данных. Организации могут хранить данные, предвидя возможную будущую стоимость, а не фактическую текущую стоимость.
- Сбор данных часто имеет высокую первоначальную стоимость и низкую предельную стоимость . Сбор данных часто требует значительных инвестиций в технологии и оцифровку. После того, как они будут созданы, дальнейший сбор данных может стоить гораздо меньше. Высокие барьеры входа могут помешать небольшим организациям собирать данные.
- Использование данных требует дополнительных инвестиций. Организациям может потребоваться инвестировать в программное обеспечение, оборудование и персонал, чтобы получить ценность от данных.
Информационные характеристики
- Предмет исследования. Охватывает то, что описывают данные, и в чем они могут помочь.
- Общность. Некоторые данные полезны для различных видов анализа; другие данные полезны только в определенных случаях.
- Временной охват, данные могут быть прогнозируемыми, в реальном времени, историческими или ретроспективными. Они используются по-разному, для планирования, оперативного и исторического анализа.
- Качество. Данные более высокого качества, как правило, более ценны, поскольку они снижают неопределенность и риск, хотя требуемое качество варьируется от использования к использованию. Большая автоматизация сбора данных, как правило, приводит к более высокому качеству.
- Чувствительность. Конфиденциальные данные — это данные, которые могут быть использованы вредоносным образом (например, персональные данные, коммерческие данные, данные национальной безопасности). Обеспечение безопасности конфиденциальных данных сопряжено с расходами и рисками.
- Взаимодействие и связываемость. Взаимодействие относится к использованию стандартов данных при представлении данных, что означает, что данные, относящиеся к одним и тем же вещам, могут быть легко объединены. Связываемость относится к использованию стандартных идентификаторов в наборе данных, что позволяет записи в одном наборе данных быть связанными с дополнительными данными в другом наборе данных.
Драйверы ценности данных
Ряд факторов влияют на то, в какой степени будущие экономические выгоды могут быть получены из данных. Некоторые факторы связаны с качеством данных, в то время как другие могут либо сделать данные бесполезными, либо создать уникальные и ценные конкурентные преимущества для владельцев данных. [8]
- Эксклюзивность. Наличие эксклюзивного доступа к активу данных делает его более ценным, чем если бы он был доступен нескольким держателям лицензий.
- Своевременность. Для многих данных, чем точнее они отражают настоящее, тем надежнее выводы, которые можно из них сделать. Недавно полученные данные более ценны, чем исторические данные.
- Точность. Чем точнее данные описывают правду, тем они ценнее.
- Полнота. Чем больше переменных о конкретном событии или объекте описывается данными, тем ценнее эти данные.
- Согласованность. Чем больше ресурс данных соответствует другим аналогичным ресурсам данных, тем он ценнее (например, нет никаких несоответствий относительно того, где находится клиент).
- Ограничения использования. Данные, собранные без необходимых разрешений на использование (например, персональные данные в маркетинговых целях), менее ценны, поскольку их нельзя использовать законным образом.
- Взаимодействие/доступность. Чем проще и эффективнее данные можно объединить с другими организационными данными для получения информации, тем они ценнее.
- Ответственность и риск. Репутационные последствия и финансовые санкции за нарушение правил обработки данных, таких как GDPR, могут быть серьезными. Чем выше риск, связанный с использованием данных, тем ниже их ценность.
Процесс получения ценности из данных можно разделить на ряд ключевых этапов: оценка данных, где отображаются текущие состояния и способы использования данных; оценка данных, где измеряется ценность данных; инвестиции в данные, где капитал расходуется на улучшение процессов, управления и технологий, лежащих в основе данных; использование данных, где данные используются в бизнес-инициативах; и отражение данных, где пересматриваются предыдущие этапы и предлагаются новые идеи и улучшения. [9]
Методы оценки данных
Из-за широкого спектра потенциальных наборов данных и вариантов использования, а также относительной незрелости оценки данных не существует простых или универсально согласованных методов. Высокая стоимость опциона и внешние эффекты означают, что стоимость данных может непредсказуемо колебаться, и, казалось бы, бесполезные данные могут внезапно стать чрезвычайно ценными в неопределенную будущую дату. [7] Тем не менее, было предложено несколько методов для расчета или оценки стоимости данных.
Информационно-теоретическая характеристика
Теория информации предоставляет количественные механизмы для оценки данных. Например, безопасный обмен данными требует тщательной защиты личной конфиденциальности или интеллектуальной собственности организации. Информационно-теоретические подходы и запутывание данных могут применяться для очистки данных перед их распространением. [10] [11]
Информационно-теоретические меры, такие как энтропия , прирост информации и стоимость информации, полезны для обнаружения аномалий и выбросов. [12] В аналитике, управляемой данными, распространенной проблемой является количественная оценка того, действительно ли большие размеры данных и/или более сложные элементы данных улучшают, ухудшают или изменяют информационное содержание данных и полезность. Метрика ценности данных (DVM) количественно определяет полезное информационное содержание больших и неоднородных наборов данных с точки зрения компромиссов между размером, полезностью, ценностью и энергией данных. [13] Такие методы можно использовать для определения того, может ли добавление, расширение или дополнение существующего набора данных улучшить моделирование или понимание базового явления.
Модели оценки инфономики
Дуг Лэйни выделяет шесть подходов к оценке данных, разделяя их на две категории: фундаментальные модели и финансовые модели. Фундаментальные модели присваивают данным относительную, информационную ценность, тогда как финансовые модели присваивают абсолютную, экономическую ценность. [14]
Фундаментальные модели
- Внутренняя ценность информации (IVI) измеряет факторы, определяющие ценность данных, включая правильность, полноту и исключительность данных, и присваивает им соответствующее значение.
- Бизнес-ценность информации (БВИ) измеряет, насколько данные соответствуют конкретным бизнес-целям (например, инициатива X требует 80%-ной точности данных, которые обновляются еженедельно — насколько точно данные соответствуют этому требованию?).
- Показатель ценности информации (PVI) измеряет, как использование данных влияет на ключевые бизнес-факторы и ключевые показатели эффективности, часто с использованием исследования контрольной группы.
Финансовые модели
- Себестоимость информации (CVI) измеряет стоимость производства и хранения данных, стоимость их замены или влияние на денежные потоки в случае их потери.
- Рыночная стоимость информации (MVI) измеряет фактическую или оценочную стоимость, по которой данные могут быть проданы на рынке данных.
- Экономическая ценность информации (EVI) измеряет ожидаемые денежные потоки, доходы или экономию от использования данных.
Оценки института Беннета
Исследования Института Беннета разделяют подходы к оценке стоимости данных на рыночные и нерыночные оценки. [7]
Рыночные оценки
- Оценки фондового рынка измеряют преимущество, получаемое организациями, которые инвестируют в данные и возможности обработки данных.
- Оценки на основе дохода направлены на измерение текущего и будущего дохода, полученного от данных. Этот подход имеет ограничения из-за его неспособности измерить стоимость, реализованную в более широкой деловой или общественной экосистеме или за пределами финансовых транзакций с использованием данных. Когда доход от данных реализуется посредством торговли данными на рынке, существуют дополнительные ограничения, поскольку рынки не могут описать полную стоимость опциона на данные и обычно не имеют достаточного количества покупателей и продавцов, чтобы рынок мог установить цену, которая действительно отражает экономическую ценность данных.
- Оценки на основе затрат измеряют стоимость создания и поддержания данных. Это может рассматривать фактические понесенные затраты или прогнозируемые затраты, если данные необходимо заменить.
Нерыночные оценки
- Экономическая ценность открытых данных исследует, для кого открытые или бесплатные данные создают ценность: для организаций, которые размещают или управляют данными; посреднических организаций или лиц, которые повторно используют данные для создания продуктов и услуг; организаций и лиц, которые используют эти продукты и услуги.
- Ценность персональных данных можно оценить, задавая потребителям вопросы, например, сколько они готовы заплатить за доступ к сервису конфиденциальности данных или сколько они готовы взимать за доступ к своим персональным данным. Ценность также можно оценить, изучив прибыль компаний, которые полагаются на персональные данные (в 2018 году Facebook заработал 10 долларов за каждого активного пользователя), и изучив штрафы, выписанные организациям, которые нарушают конфиденциальность данных или другие правила.
Другие подходы
- Модифицированный подход к оценке стоимости предлагает усовершенствования подхода к оценке стоимости на основе стоимости. Он предлагает следующие изменения: данные, собранные избыточно, следует считать имеющими нулевую стоимость, чтобы избежать двойного счета; неиспользованные данные следует считать имеющими нулевую стоимость (это можно определить с помощью статистики использования данных); количество пользователей и количество доступов к данным следует использовать для умножения стоимости данных, что позволяет изменять историческую стоимость информации в свете ее использования на практике; стоимость должна амортизироваться на основе рассчитанного «срока хранения» информации; стоимость должна изменяться на ее точность относительно того, что считается приемлемой степенью точности. [15]
- Подход на основе потребления строится на принципах подхода с модифицированной стоимостью, назначая пользователям данных различные веса на основе относительной ценности, которую они вносят в организацию. Эти веса включаются в моделирование статистики использования данных и дополнительно изменяют измеренную ценность данных. [16]
- Оценка концентраторов данных использует подход на основе затрат, который измеряет стоимость концентраторов данных, где хранятся большие репозитории данных, а не измеряет стоимость отдельных наборов данных. Стоимость концентратора данных затем может быть изменена, как в подходах на основе потребления и модифицированной стоимости. [17] Другой подход к оценке концентраторов использует модифицированный подход рыночной стоимости, измеряя экономию для пользователей от доступа к данным через концентраторы по сравнению с индивидуальным доступом к данным от производителей, а также готовность пользователей платить за доступ к концентраторам данных. [18]
- Подход заинтересованных сторон вовлекает ключевых заинтересованных лиц в оценку данных, исследуя, как данные поддерживают деятельность, которую внешние заинтересованные лица определяют как создающую для них ценность. Он использует модель, которая объединяет общую ценность, созданную организацией, взвешенный список инициатив по созданию ценности (как определено внешними заинтересованными лицами) и инвентарь активов данных. Этот подход был разработан в сотрудничестве между Anmut, консалтинговой фирмой, и Highways England, государственным агентством, для которого оценки данных, основанные на рыночной стоимости, доходе или экономических показателях, менее значимы. Этот подход также может применяться в частном секторе. [19] [20]
Компании, выполняющие оценку данных
- Oyster Venture Partners [1] выполняет оценку данных как услугу для компаний. Они предоставляют проверенную и защищенную услугу оценки данных для определения денежной стоимости активов данных организации. Их услуги разработаны для обеспечения максимальной стоимости активов данных компаний, чтобы они могли управлять ими как денежным нематериальным активом. Они реализовали более 1,5 млрд долларов в стоимости активов данных.
Оценка данных как услуга обеспечивает:
- Отчет об оценке данных на основе 21 различной методологии оценки данных и расчетов для создания обоснованной оценки ваших данных, уникальной для вашей компании и ее данных.
- Исследование данных с помощью комплексной проверки данных и для стратегии, безопасности, управления, монетизации, обоснования, защиты, конфиденциальности и людей
- Анализ стратегий монетизации данных для каждого варианта использования с целью извлечения максимальной текущей и будущей ценности данных.
- Аналитические доказательства ценности данных, а также прогнозы моделей для драйверов данных, вариантов использования и влияния монетизации на оценку ваших данных
Ссылки
- ^ Аллен, Бет (1990). «Информация как экономический товар». The American Economic Review . 80 (2): 268–273. JSTOR 2006582.
- ^ ab «Gartner заявляет, что в течение пяти лет организации будут оцениваться по их информационным портфелям».
- ^ ab «Как вы оцениваете информацию?». 15 сентября 2016 г.
- ^ «Прикладная инфономика: зачем и как измерять ценность ваших информационных активов».
- ^ «Ценность данных». 22 сентября 2017 г.
- ^ «Самые дорогие компании мира – 2020».
- ^ abc «Сводный отчет о ценности данных» (PDF) .
- ^ «Оценка данных» (PDF) .
- ^ «Оценка данных — какова стоимость ваших данных и как вы их оцениваете?». 13 сентября 2019 г.
- ^ Аскари, М.; Сафави-Наини, Р.; Баркер, К. (2012). «Информационно-теоретическая конфиденциальность и мера полезности для механизмов очистки данных». Труды второй конференции ACM по безопасности и конфиденциальности данных и приложений . Ассоциация вычислительной техники. стр. 283–294. doi :10.1145/2133601.2133637. ISBN 9781450310918. S2CID 18338542.
- ^ Чжоу, Н; Ву, К; Ву, З; Марино, С; Динов, ИД (2022). «DataSifterText: частично синтетическая генерация текста для конфиденциальных клинических заметок». Журнал медицинских систем . 46 (96): 96. doi :10.1007/s10916-022-01880-6. PMC 10111580. PMID 36380246 .
- ^ Ли, В.; Сян, Д. (2001). «Информационно-теоретические меры для обнаружения аномалий». Труды симпозиума IEEE 2001 г. по безопасности и конфиденциальности. S&P 2001 г. IEEE. стр. 130–143. doi :10.1109/SECPRI.2001.924294. ISBN 0-7695-1046-9. S2CID 6014214.
- ^ Ношад, М.; Чой, Дж.; Сан, И.; Хиро, А.; Динов, ИД. (2021). «Информационно-теоретическая мера конфиденциальности и полезности для механизмов очистки данных». J Big Data . 8 (82). Springer: 82. doi : 10.1186/s40537-021-00446-6 . PMC 8550565. PMID 34777945 .
- ^ «Зачем и как измерять ценность ваших информационных активов».
- ^ «Измерение ценности информации: подход к оценке активов» (PDF) .
- ^ «Оценка данных как актива» (PDF) .
- ^ «Метод, основанный на потреблении». 4 декабря 2018 г.
- ^ «Метод обеспечения безопасности исследовательских данных». 4 декабря 2018 г.
- ^ «Почему следует относиться к данным как к активу». 2 марта 2020 г.
- ^ «Оценка данных — оценка величайшего актива в мире».