stringtranslate.com

Прогностическая аналитика

Предиктивная аналитика — это форма бизнес-аналитики, применяющая машинное обучение для создания предиктивной модели для определенных бизнес-приложений. Как таковая, она охватывает множество статистических методов из предиктивного моделирования и машинного обучения, которые анализируют текущие и исторические факты для прогнозирования будущих или иным образом неизвестных событий. [1] Она представляет собой основное подмножество приложений машинного обучения; в некоторых контекстах она является синонимом машинного обучения. [2]

В бизнесе предиктивные модели используют закономерности, обнаруженные в исторических и транзакционных данных, для выявления рисков и возможностей. Модели фиксируют взаимосвязи между многими факторами, позволяя оценивать риск или потенциал, связанный с определенным набором условий, направляя принятие решений для потенциальных транзакций. [3]

Определяющим функциональным эффектом этих технических подходов является то, что прогностическая аналитика обеспечивает прогностическую оценку (вероятность) для каждого отдельного лица (клиента, сотрудника, пациента здравоохранения, артикула продукта, транспортного средства, компонента, машины или другой организационной единицы) с целью определения, информирования или влияния на организационные процессы, которые касаются большого количества лиц, например, в маркетинге, оценке кредитного риска, выявлении мошенничества, производстве, здравоохранении и государственных операциях, включая правоохранительные органы.

Определение

Предиктивная аналитика — это набор технологий бизнес-аналитики (BI), которые раскрывают взаимосвязи и закономерности в больших объемах данных, которые можно использовать для прогнозирования поведения и событий. В отличие от других технологий BI, предиктивная аналитика ориентирована на будущее, используя прошлые события для прогнозирования будущего. [4] Статистические методы предиктивной аналитики включают моделирование данных , машинное обучение , ИИ , алгоритмы глубокого обучения и интеллектуальный анализ данных . Часто неизвестное событие, представляющее интерес, находится в будущем, но предиктивная аналитика может применяться к любому типу неизвестного, будь то в прошлом, настоящем или будущем. Например, идентификация подозреваемых после совершения преступления или мошенничество с кредитными картами по мере его возникновения. [5] Ядро предиктивной аналитики основано на выявлении взаимосвязей между объясняющими переменными и прогнозируемыми переменными из прошлых событий и их использовании для прогнозирования неизвестного результата. Однако важно отметить, что точность и удобство использования результатов будут во многом зависеть от уровня анализа данных и качества предположений. [1]

Предиктивная аналитика часто определяется как прогнозирование на более детальном уровне детализации, т. е. создание предиктивных оценок (вероятностей) для каждого отдельного организационного элемента. Это отличает ее от прогнозирования . Например, «Предиктивная аналитика — технология, которая учится на опыте (данных) для прогнозирования будущего поведения людей с целью принятия более обоснованных решений». [2] В будущих промышленных системах ценность предиктивной аналитики будет заключаться в прогнозировании и предотвращении потенциальных проблем для достижения практически нулевого уровня поломок и дальнейшей интеграции в предписывающую аналитику для оптимизации решений. [6]

Аналитические методы

Подходы и методы, используемые для проведения предиктивной аналитики, можно в целом разделить на методы регрессии и методы машинного обучения.

Машинное обучение

Машинное обучение можно определить как способность машины учиться и затем имитировать человеческое поведение, требующее интеллекта. Это достигается с помощью искусственного интеллекта, алгоритмов и моделей. [7]

Авторегрессионное интегрированное скользящее среднее (ARIMA)

Модели ARIMA являются распространенным примером моделей временных рядов. Эти модели используют авторегрессию, что означает, что модель может быть оснащена регрессионным программным обеспечением, которое будет использовать машинное обучение для выполнения большей части регрессионного анализа и сглаживания. Известно, что модели ARIMA не имеют общей тенденции, но вместо этого имеют вариацию вокруг среднего значения с постоянной амплитудой, что приводит к статистически схожим временным моделям. Благодаря этому переменные анализируются, а данные фильтруются для лучшего понимания и прогнозирования будущих значений. [8] [9]

Одним из примеров метода ARIMA являются модели экспоненциального сглаживания. Экспоненциальное сглаживание учитывает разницу в важности между более старыми и более новыми наборами данных, поскольку более свежие данные более точны и ценны для прогнозирования будущих значений. Для достижения этого используются экспоненты, чтобы придать более новым наборам данных больший вес в расчетах, чем более старым наборам. [10]

Модели временных рядов

Модели временных рядов — это подмножество машинного обучения, которые используют временные ряды для понимания и прогнозирования данных с использованием прошлых значений. Временной ряд — это последовательность значений переменной за равноотстоящие периоды, такие как годы или кварталы в бизнес-приложениях. [11] Для этого данные должны быть сглажены или случайная дисперсия данных должна быть удалена, чтобы выявить тенденции в данных. Существует несколько способов сделать это.

Скользящая средняя

Методы одиночного скользящего среднего используют все меньшие и меньшие по размеру наборы прошлых данных для уменьшения ошибки, связанной с получением одного среднего, что делает его более точным средним значением, чем если бы было получено среднее значение всего набора данных. [12]

Методы центрированного скользящего среднего используют данные, найденные в методах одиночного скользящего среднего, путем взятия среднего значения набора данных с медианным номером. Однако, поскольку набор данных с медианным номером трудно вычислить с помощью наборов данных с четным номером, этот метод лучше работает с наборами данных с нечетным номером, чем с четным. [13]

Прогностическое моделирование

Предиктивное моделирование — это статистический метод, используемый для прогнозирования будущего поведения. Он использует предиктивные модели для анализа взаимосвязи между определенной единицей в заданной выборке и одной или несколькими характеристиками единицы. Цель этих моделей — оценить вероятность того, что единица в другой выборке будет демонстрировать тот же шаблон. Решения предиктивной модели можно считать типом технологии интеллектуального анализа данных. Модели могут анализировать как исторические, так и текущие данные и генерировать модель для прогнозирования потенциальных будущих результатов. [14]

Независимо от используемой методологии, в целом, процесс создания прогностических моделей включает в себя одни и те же шаги. Во-первых, необходимо определить цели проекта и желаемые результаты и перевести их в прогностические аналитические цели и задачи. Затем проанализируйте исходные данные, чтобы определить наиболее подходящий подход к данным и построению модели (модели полезны лишь настолько, насколько полезны применимые данные, используемые для их построения). Выберите и преобразуйте данные для создания моделей. Создайте и протестируйте модели, чтобы оценить, являются ли они действительными и смогут ли они соответствовать целям и показателям проекта. Примените результаты модели к соответствующим бизнес-процессам (выявление закономерностей в данных не обязательно означает, что бизнес поймет, как извлечь из этого выгоду или извлечь из этого выгоду). После этого управляйте и поддерживайте модели, чтобы стандартизировать и улучшить производительность (спрос на управление моделями будет расти для соответствия новым нормативным требованиям). [4]

Регрессионный анализ

Как правило, регрессионный анализ использует структурные данные вместе с прошлыми значениями независимых переменных и взаимосвязью между ними и зависимой переменной для формирования прогнозов. [8]

Линейная регрессия

В линейной регрессии строится график с предыдущими значениями зависимой переменной, нанесенными на ось Y, и независимой переменной, которая анализируется, нанесенной на ось X. Затем статистическая программа строит линию регрессии, представляющую связь между независимыми и зависимыми переменными, которую можно использовать для прогнозирования значений зависимой переменной на основе только независимой переменной. С линией регрессии программа также показывает уравнение наклона отсекаемого значения для линии, которое включает добавление для члена ошибки регрессии, где чем выше значение члена ошибки, тем менее точна регрессионная модель. Чтобы уменьшить значение члена ошибки, в модель вводятся другие независимые переменные, и аналогичные анализы выполняются для этих независимых переменных. [8] [15] Кроме того, множественная линейная регрессия (MLP) может использоваться для рассмотрения связей, включающих несколько независимых переменных, предлагая более комплексный подход к моделированию. [16]

Приложения

Аналитический обзор и условные ожидания в аудите

Важный аспект аудита включает аналитический обзор. В аналитическом обзоре определяется обоснованность сообщаемых остатков счетов, которые исследуются. Аудиторы выполняют этот процесс посредством прогнозного моделирования для формирования прогнозов, называемых условными ожиданиями остатков, которые проверяются, с использованием методов авторегрессионного интегрированного скользящего среднего (ARIMA) и методов общего регрессионного анализа, [8] в частности, посредством методов Статистического метода аналитического обзора (STAR). [17]

Метод ARIMA для аналитического обзора использует анализ временных рядов на основе прошлых проверенных балансов для создания условных ожиданий. Эти условные ожидания затем сравниваются с фактическими балансами, указанными в проверенном счете, для определения того, насколько близки отраженные балансы к ожиданиям. Если отраженные балансы близки к ожиданиям, счета не проверяются далее. Если отраженные балансы сильно отличаются от ожиданий, существует более высокая вероятность существенной ошибки учета и проводится дополнительный аудит. [17]

Методы регрессионного анализа применяются аналогичным образом, за исключением того, что используемая регрессионная модель предполагает наличие только одной независимой переменной. Существенность независимой переменной, вносящей вклад в проверенные остатки на счетах, определяется с использованием прошлых остатков на счетах вместе с текущими структурными данными. [8] Существенность — это важность независимой переменной в ее отношении к зависимой переменной. [18] В этом случае зависимой переменной является остаток на счете. Благодаря этому наиболее важная независимая переменная используется для создания условного ожидания и, подобно методу ARIMA, условное ожидание затем сравнивается с сообщенным остатком на счете, и решение принимается на основе близости двух остатков. [8]

Методы STAR работают с использованием регрессионного анализа и делятся на два метода. Первый — это подход ежемесячного баланса STAR, и условные ожидания, сделанные и используемый регрессионный анализ, оба привязаны к одному проверяемому месяцу. Другой метод — это подход годового баланса STAR, который происходит в большем масштабе, основываясь на условных ожиданиях и регрессионном анализе одного проверяемого года. Помимо разницы во времени аудита, оба метода работают одинаково, сравнивая ожидаемые и сообщенные балансы, чтобы определить, какие счета следует дополнительно исследовать. [17]

Кроме того, включение аналитических процедур в стандарты аудита подчеркивает растущую необходимость для аудиторов модифицировать эти методологии в соответствии с конкретными наборами данных, что отражает постоянно меняющийся характер финансовой проверки. [19]

Ценность бизнеса

По мере того, как мы вступаем в мир технологических достижений, где все больше данных создается и хранится в цифровом виде, компании ищут способы воспользоваться этой возможностью и использовать эту информацию для получения прибыли. Прогнозная аналитика может быть использована и способна предоставить множество преимуществ широкому кругу предприятий, включая компании по управлению активами, страховые компании, компании связи и многие другие компании. Каждая компания, которая использует управление проектами для достижения своих целей, получает огромную выгоду от возможностей прогнозной аналитики. В исследовании, проведенном IDC Analyze the Future, Дэн Вассет и Генри Д. Моррис объясняют, как компания по управлению активами использовала прогнозную аналитику для разработки лучшей маркетинговой кампании. Они перешли от подхода массового маркетинга к подходу, ориентированному на клиента, где вместо того, чтобы отправлять одно и то же предложение каждому клиенту, они персонализировали каждое предложение на основе своего клиента. Прогнозная аналитика использовалась для прогнозирования вероятности того, что потенциальный клиент примет персонализированное предложение. Благодаря маркетинговой кампании и прогнозной аналитике скорость принятия фирмой резко возросла, и число людей, принявших их персонализированные предложения, увеличилось в три раза. [20]

Технологические достижения в области предиктивной аналитики [21] увеличили ее ценность для фирм. Одним из технологических достижений являются более мощные компьютеры, и с этим предиктивная аналитика стала способна создавать прогнозы на основе больших наборов данных гораздо быстрее. С увеличением вычислительной мощности также появляется больше данных и приложений, что означает более широкий спектр входных данных для использования с предиктивной аналитикой. Другое технологическое достижение включает более удобный интерфейс, позволяющий снизить барьер входа и сократить необходимое для сотрудников обучение для эффективного использования программного обеспечения и приложений. Благодаря этим достижениям все больше корпораций внедряют предиктивную аналитику и видят преимущества в эффективности и результативности сотрудников, а также в прибыли. [22] Процент проектов, которые терпят неудачу, довольно высок — колоссальные 70% всех проектов не выполняют обещанного клиентам. Однако, как показано, внедрение процесса управления снижает частоту неудач до 20% или ниже. [23]

Прогнозирование денежного потока

Одномерные и многомерные модели ARIMA могут использоваться для прогнозирования будущих денежных потоков компании , с их уравнениями и расчетами, основанными на прошлых значениях определенных факторов, способствующих денежным потокам. Используя анализ временных рядов, значения этих факторов могут быть проанализированы и экстраполированы для прогнозирования будущих денежных потоков компании. Для одномерных моделей прошлые значения денежных потоков являются единственным фактором, используемым в прогнозировании. Между тем многомерные модели используют несколько факторов, связанных с данными начисления, такими как операционный доход до амортизации. [24]

Другая модель, используемая для прогнозирования денежных потоков, была разработана в 1998 году и известна как модель Декау, Котари и Уоттса, или DKW (1998). DKW (1998) использует регрессионный анализ для определения связи между несколькими переменными и денежными потоками. С помощью этого метода модель обнаружила, что изменения денежных потоков и начисления отрицательно связаны, в частности, через текущую прибыль, и использование этой связи прогнозирует денежные потоки на следующий период. Модель DKW (1998) выводит эту связь через связи начислений и денежных потоков с кредиторской и дебиторской задолженностью, а также с запасами. [25]

Защита детей

Некоторые агентства по защите детей начали использовать прогностическую аналитику для выявления случаев высокого риска. [26] Например, в округе Хиллсборо, штат Флорида , использование агентством по защите детей инструмента прогностического моделирования предотвратило случаи смерти детей, связанные с жестоким обращением, в целевой группе населения. [27]

Прогнозирование результатов юридических решений

Прогнозирование результатов юридических решений может осуществляться программами ИИ. Эти программы могут использоваться в качестве вспомогательных инструментов для профессий в этой отрасли. [28] [29]

Прогнозирование на уровне портфеля, продукта или экономики

Часто анализ фокусируется не на потребителе, а на продукте, портфеле, фирме, отрасли или даже экономике. Например, розничный торговец может быть заинтересован в прогнозировании спроса на уровне магазина для целей управления запасами. Или Совет управляющих Федеральной резервной системы может быть заинтересован в прогнозировании уровня безработицы на следующий год. Эти типы проблем могут быть решены с помощью предиктивной аналитики с использованием методов временных рядов (см. ниже). Их также можно решить с помощью подходов машинного обучения, которые преобразуют исходный временной ряд в векторное пространство признаков, где алгоритм обучения находит закономерности, имеющие предсказательную силу. [30] [31]

Андеррайтинг

Многим предприятиям приходится учитывать подверженность риску из-за их различных услуг и определять расходы, необходимые для покрытия риска. Предиктивная аналитика может помочь андеррайтировать эти суммы, прогнозируя вероятность болезни, дефолта , банкротства и т. д. Предиктивная аналитика может оптимизировать процесс привлечения клиентов, прогнозируя будущее рисковое поведение клиента с использованием данных уровня приложения. Предиктивная аналитика в форме кредитных рейтингов сократила количество времени, необходимое для одобрения кредита, особенно на рынке ипотечного кредитования. Правильная предиктивная аналитика может привести к правильным ценовым решениям, которые могут помочь снизить будущий риск дефолта. Предиктивная аналитика может использоваться для снижения морального риска и предотвращения несчастных случаев. [32]

Полиция

Полицейские органы теперь используют проактивные стратегии для предотвращения преступлений. Прогнозная аналитика, которая использует статистические инструменты для прогнозирования моделей преступности, предоставляет полицейским органам новые способы мобилизации ресурсов и снижения уровня преступности. [33] С помощью этой прогнозной аналитики данных о преступлениях полиция может лучше распределять ограниченные ресурсы и рабочую силу, чтобы предотвратить совершение большего количества преступлений. Направленное патрулирование или решение проблем могут быть использованы для защиты очагов преступности, в которых плотность преступности намного выше, чем в среднем по городу. [34]

Спорт

Появилось несколько фирм, специализирующихся на предиктивной аналитике в области профессионального спорта как для команд, так и для отдельных лиц. [35] Хотя прогнозирование человеческого поведения создает большую дисперсию из-за многих факторов, которые могут измениться после того, как прогнозы сделаны, включая травмы, судейство, решения тренеров, погоду и многое другое, использование предиктивной аналитики для прогнозирования долгосрочных тенденций и результатов полезно. Большая часть этой области была начата концепцией Moneyball Билли Бина на рубеже веков, и теперь большинство профессиональных спортивных команд используют собственные аналитические отделы.

Смотрите также

Ссылки

  1. ^ ab "Предсказывать или не предсказывать". mccoy-partners.com . Получено 2022-05-05 .
  2. ^ ab Siegel, Eric (2013). Predictive Analytics: The Power to Predict Who Will Click, Buy, Lie, or Die (1-е изд.) . Wiley . ISBN 978-1-1183-5685-2.
  3. ^ Кокер, Фрэнк (2014). Пульс: понимание жизненно важных признаков вашего бизнеса (1-е изд.) . Белвью, Вашингтон: Ambient Light Publishing. стр. 30, 39, 42 и др. ISBN 978-0-9893086-0-1.
  4. ^ Экерсон, Уэйн, В. (2007). «Прогностическая аналитика. Увеличение ценности ваших инвестиций в хранилище данных» (PDF) .{{cite web}}: CS1 maint: несколько имен: список авторов ( ссылка )
  5. ^ Финлей, Стивен (2014). Прогнозная аналитика, интеллектуальный анализ данных и большие данные. Мифы, заблуждения и методы (1-е изд.) . Basingstoke: Palgrave Macmillan . стр. 237. ISBN 978-1137379276.
  6. ^ Спалек, Северин (2019). Аналитика данных в управлении проектами . Taylor & Francis Group, LLC.
  7. ^ "Машинное обучение, объяснено". MIT Sloan . Получено 2022-05-06 .
  8. ^ abcdef Кинни, Уильям Р. (1978). «ARIMA и регрессия в аналитическом обзоре: эмпирический тест». The Accounting Review . 53 (1): 48–60. ISSN  0001-4826. JSTOR  245725.
  9. ^ "Введение в модели ARIMA". people.duke.edu . Получено 2022-05-06 .
  10. ^ "6.4.3. Что такое экспоненциальное сглаживание?". www.itl.nist.gov . Получено 2022-05-06 .
  11. ^ "6.4.1. Определения, приложения и методы". www.itl.nist.gov . Получено 2022-05-06 .
  12. ^ "6.4.2.1. Единая скользящая средняя". www.itl.nist.gov . Получено 2022-05-06 .
  13. ^ "6.4.2.2. Центрированное скользящее среднее". www.itl.nist.gov . Получено 2022-05-06 .
  14. ^ Маккарти, Ричард; Маккарти, Мэри; Чеккуччи, Венди (2021). Применение предиктивной аналитики: поиск ценности в данных . Springer.
  15. ^ "Линейная регрессия". www.stat.yale.edu . Получено 2022-05-06 .
  16. ^ Ли, Мэн; Лю, Цзицян; Ян, Епин (14.10.2023). «Метод оценки качества финансовых данных на основе множественной линейной регрессии». Future Internet . 15 (10): 338. doi : 10.3390/fi15100338 . ISSN  1999-5903.
  17. ^ abc Кинни, Уильям Р.; Саламон, Джеральд Л. (1982). «Регрессионный анализ в аудите: сравнение альтернативных правил расследования». Журнал исследований бухгалтерского учета . 20 (2): 350–366. doi :10.2307/2490745. ISSN  0021-8456. JSTOR  2490745.
  18. ^ PricewaterhouseCoopers. «Существенность в аудите». PwC . Получено 2022-05-03 .
  19. ^ Уилсон, Арлетт К. (1991). «Использование моделей регрессии как аналитических процедур: эмпирическое исследование влияния дисперсии данных на решения аудиторов». Журнал учета, аудита и финансов . 6 (3): 365–381. doi :10.1177/0148558X9100600307. ISSN  0148-558X. S2CID  154468768.
  20. ^ Вессет, Дэн; Моррис, Генри Д. (июнь 2011 г.). «Ценность предиктивной аналитики для бизнеса» (PDF) . Белая книга : 1–3.
  21. ^ Клей, Хэлтон. «Прогностическая аналитика: определение, типы моделей и применение». Investopedia . Получено 8 января 2024 г.
  22. ^ Стоун, Пол (апрель 2007 г.). «Введение в прогностическую аналитику: возможности». Все дни . doi :10.2118/106865-MS.
  23. ^ Team Stage (29 мая 2021 г.). «Статистика управления проектами: тенденции и распространённые ошибки в 2023 году». TeamStage . Получено 8 января 2024 г. .
  24. ^ Лорек, Кеннет С.; Виллингер, Г. Ли (1996). «Многомерная модель прогнозирования временных рядов для данных о денежных потоках». The Accounting Review . 71 (1): 81–102. ISSN  0001-4826. JSTOR  248356.
  25. ^ Барт, Мэри Э.; Крам, Дональд П.; Нельсон, Карен К. (2001). «Начисления и прогнозирование будущих денежных потоков». The Accounting Review . 76 (1): 27–58. doi :10.2308/accr.2001.76.1.27. ISSN  0001-4826. JSTOR  3068843.
  26. ^ Реформа, воспитание (2016-02-03). «Давно назревшие новые стратегии измерения риска благополучия детей». The Imprint . Получено 2022-05-03 .
  27. ^ «В пределах нашей досягаемости: Национальная стратегия по ликвидации случаев жестокого обращения с детьми и гибели детей от пренебрежения» (PDF) . Комиссия по ликвидации случаев жестокого обращения с детьми и гибели детей от пренебрежения . 2016.
  28. ^ Алетрас, Николаос; Царапацанис, Димитриос; Преотюк-Пьетро, ​​Даниэль; Лампос, Василейос (2016). «Прогнозирование судебных решений Европейского суда по правам человека: взгляд на обработку естественного языка». PeerJ Информатика . 2 : е93. дои : 10.7717/peerj-cs.93 . S2CID  7630289.
  29. ^ UCL (2016-10-24). «ИИ предсказывает результаты судебных процессов по правам человека». Новости UCL . Получено 2022-05-03 .
  30. ^ Дхар, Васант (6 мая 2011 г.). «Прогнозирование на финансовых рынках: аргументы в пользу малых дизъюнктов». ACM Transactions on Intelligent Systems and Technology . 2 (3): 1–22. doi :10.1145/1961189.1961191. ISSN  2157-6904. S2CID  11213278.
  31. ^ Дхар, Васант; Чоу, Дашин; Провост, Фостер (2000-10-01). «Обнаружение интересных закономерностей для принятия инвестиционных решений с помощью GLOWER ◯-A Genetic Learner Overlayed with Entropy Reduction». Data Mining and Knowledge Discovery . 4 (4): 251–280. doi :10.1023/A:1009848126475. ISSN  1384-5810. S2CID  1982544.
  32. ^ Монтсеррат, Гильен; Чеволини, Альберто (ноябрь 2021 г.). «Использование аналитики рисков для предотвращения несчастных случаев до их возникновения — будущее страхования». Журнал финансовой трансформации .
  33. ^ Тауэрс, Шерри; Чен, Сыцяо; Малик, Абиш; Эберт, Дэвид (24.10.2018). Эйзенбарт, Хедвиг (ред.). «Факторы, влияющие на временные закономерности преступности в крупном американском городе: перспектива предиктивной аналитики». PLOS ONE . 13 (10): e0205151. Bibcode : 2018PLoSO..1305151T. doi : 10.1371/journal.pone.0205151 . ISSN  1932-6203. PMC 6200217. PMID 30356321  . 
  34. ^ Фицпатрик, Дилан Дж.; Горр, Вильпен Л.; Нил, Дэниел Б. (13.01.2019). «Ведение счета: предиктивная аналитика в полиции». Ежегодный обзор криминологии . 2 (1): 473–491. doi :10.1146/annurev-criminol-011518-024534. ISSN  2572-4568. S2CID  169389590.
  35. ^ "Бесплатные спортивные прогнозы и прогнозы ИИ для сегодняшних игр". LEANS.AI . Получено 2023-07-08 .

Дальнейшее чтение