SAS (ранее « Система статистического анализа ») [1] — пакет статистического программного обеспечения , разработанный Институтом SAS для управления данными , расширенной аналитики, многомерного анализа , бизнес-аналитики , уголовных расследований [2] и прогнозной аналитики .
SAS разрабатывался в Университете штата Северная Каролина с 1966 по 1976 год, когда был основан Институт SAS. SAS получила дальнейшее развитие в 1980-х и 1990-х годах с добавлением новых статистических процедур, дополнительных компонентов и внедрением JMP . Интерфейс «укажи и щелкни» был добавлен в версию 9 в 2004 году. В 2010 году был добавлен продукт для анализа социальных сетей .
SAS — это пакет программного обеспечения, который может анализировать , изменять, управлять и извлекать данные из различных источников, а также выполнять их статистический анализ. [3] SAS предоставляет графический пользовательский интерфейс «укажи и щелкни» для нетехнических пользователей и многое другое посредством языка SAS . [3]
Программы SAS имеют этапы DATA, которые извлекают данные и манипулируют ими, PROC (процедуры), которые анализируют данные, а также могут иметь функции. [4] Каждый шаг состоит из серии утверждений. [5]
Шаг DATA имеет исполняемые операторы, которые приводят к тому, что программное обеспечение выполняет действие, и декларативные операторы, которые предоставляют инструкции по чтению набора данных или изменению внешнего вида данных. [4] Шаг DATA состоит из двух этапов: компиляция и выполнение. На этапе компиляции обрабатываются декларативные операторы и выявляются синтаксические ошибки. После этого на этапе выполнения последовательно обрабатывается каждый исполняемый оператор. [6] Наборы данных организованы в таблицы со строками, называемыми «наблюдениями», и столбцами, называемыми «переменными». Кроме того, каждый фрагмент данных имеет дескриптор и значение. [4] [7]
Операторы PROC вызывают именованные процедуры. Процедуры выполняют анализ и составление отчетов по наборам данных для получения статистики, анализа и графиков. Существует более 300 названных процедур, каждая из которых выполняет значительный объем статистической работы. [4] Операторы PROC также могут отображать результаты, сортировать данные или выполнять другие операции. [5]
Макросы SAS — это фрагменты кода или переменные, которые кодируются один раз и используются для выполнения повторяющихся задач. [8]
Данные SAS можно публиковать в HTML, PDF, Excel, RTF и других форматах с использованием системы доставки вывода, которая была впервые представлена в 2007 году. [9] SAS Enterprise Guide — это интерфейс SAS «укажи и щелкни». Он генерирует код для манипулирования данными или выполнения анализа без использования языка программирования SAS. [10]
Программный пакет SAS включает более 200 дополнительных пакетов, иногда называемых компонентами [11] [12] [13] Некоторые из этих компонентов SAS, то есть дополнительных пакетов к базовому SAS, включают: [3] [14]
Разработка SAS началась в 1966 году после того, как Университет штата Северная Каролина повторно нанял Энтони Барра [15] для программирования своего программного обеспечения для анализа дисперсии и регрессии, чтобы оно могло работать на компьютерах IBM System/360 . [16] Проект финансировался Национальными институтами здравоохранения . [17] и первоначально предназначался для анализа сельскохозяйственных данных [12] [18] для повышения урожайности сельскохозяйственных культур. [19] К Барру присоединился студент Джеймс Гуднайт , который разработал статистические процедуры для программного обеспечения, и они оба стали руководителями проекта. [15] [16] [20] В 1968 году Барр и Гуднайт объединили новые процедуры множественной регрессии и дисперсионного анализа . [21] [22] В 1972 году, после выпуска первой версии SAS, проект лишился финансирования. [17] По словам Гуднайта, это произошло потому, что НИЗ хотел финансировать только проекты медицинского применения. [23] Гуднайт продолжал преподавать в университете за зарплату в 1 доллар и доступ к мэйнфреймам для использования в проекте, [17] пока в следующем году он не был профинансирован университетскими статистиками Южных экспериментальных станций . [16] [23] Джон Салл присоединился к проекту в 1973 году и внес свой вклад в эконометрику программного обеспечения, временные ряды и матричную алгебру. Другой один из первых участников, Кэролл Дж. Перкинс, внес свой вклад в раннее программирование SAS. Джолейн В. Сервис и Джейн Т. Хельвиг создали первую документацию SAS. [21]
Первые версии SAS, от SAS 71 до SAS 82, были названы в честь года их выпуска. [24] В 1971 году SAS 71 был опубликован ограниченным тиражом. [3] [25] Он использовался только на мэйнфреймах IBM и имел основные элементы программирования SAS, такие как этап DATA и наиболее распространенные процедуры, то есть PROC. [24] В следующем году была выпущена полная версия под названием SAS 72, в которой был представлен оператор MERGE и добавлены функции для обработки отсутствующих данных или объединения наборов данных. [26] Развитие SAS называют « переломным моментом » в истории искусственного интеллекта . [27] В 1976 году Барр, Гуднайт, Салл и Хельвиг удалили проект из штата Северная Каролина и зарегистрировали его как SAS Institute, Inc. [28]
SAS был переработан в SAS 76. Операторы INPUT и INFILE были улучшены, чтобы они могли читать большинство форматов данных, используемых мэйнфреймами IBM. Также было добавлено создание отчетов с помощью операторов PUT и FILE. Также была добавлена возможность анализа общих линейных моделей [29] и процедура FORMAT, которая позволяла разработчикам настраивать внешний вид данных. [24] В 1979 году в стандарт SAS 79 была добавлена поддержка операционной системы IBM VM/CMS и введена процедура DATASETS. Три года спустя SAS 82 представил ранний макроязык и процедуру APPEND. [24]
Начиная с SAS 4, выпущенного в 1984 году, выпуски SAS следовали последовательному соглашению об именах, не зависящему от года выпуска. [30] Версия 4 SAS имела ограниченные возможности, но сделала SAS более доступным. Версия 5 представила полный макроязык, индексы массивов и полноэкранный интерактивный пользовательский интерфейс под названием Display Manager. [24] В 1985 году SAS был переписан на языке программирования C. Это позволило SAS использовать многовендорную архитектуру, которая позволяет программному обеспечению работать в UNIX , MS-DOS и Windows . Ранее он был написан на PL/I , Fortran и языке ассемблера . [20] [24]
В 1980-х и 1990-х годах SAS выпустила ряд компонентов в дополнение к Base SAS. SAS/GRAPH, создающий графику, был выпущен в 1980 году, а также компонент SAS/ETS, который поддерживает эконометрический анализ и анализ временных рядов. Компонент SAS/PH-Clinical, предназначенный для фармацевтических пользователей, был выпущен в 1990-х годах. В 2002 году Управление по санитарному надзору за качеством пищевых продуктов и медикаментов стандартизировало использование SAS/PH-Clinical для применения новых лекарств. [20] Также были представлены вертикальные продукты, такие как SAS Financial Management и SAS Human Capital Management (тогда называемые CFO Vision и HR Vision соответственно). [31] JMP был разработан соучредителем SAS Джоном Саллом и командой разработчиков, чтобы воспользоваться преимуществами графического пользовательского интерфейса, представленного в Apple Macintosh 1984 года . [32] Первоначально название JMP расшифровывалось как «Проект Джона Макинтош». [33] JMP был впервые выпущен в 1989 году. Обновленные версии JMP выпускались постоянно после 2002 года, а последний выпуск состоялся в 2016 году. [34] [35] [36] [37]
SAS 6 использовался на протяжении 1990-х годов и был доступен в более широком спектре операционных систем, включая Macintosh , OS/2 , Silicon Graphics и PRIMOS . SAS представила новые функции посредством точечных релизов. С 6.06 по 6.09 был представлен пользовательский интерфейс, основанный на парадигме Windows, и добавлена поддержка SQL. [38] Версия 7 представила систему доставки вывода (ODS) и улучшенный текстовый редактор. Последующие выпуски усовершенствовали ODS. Например, в версии 8 было добавлено больше параметров вывода. Количество поддерживаемых операционных систем было сокращено до UNIX , Windows и z/OS , а также был добавлен Linux . [39] SAS 8 и SAS Enterprise Miner были выпущены в 1999 году. [20]
В 2002 году было представлено программное обеспечение Text Miner. Text Miner анализирует текстовые данные, такие как электронные письма, на наличие шаблонов в приложениях бизнес-аналитики . [40] В 2004 году была выпущена версия SAS 9.0, называемая внутри компании «Проект Меркурий», и она была разработана, чтобы сделать SAS доступным для более широкого круга бизнес-пользователей. [41] [42] В SAS 9.0 добавлены настраиваемые пользовательские интерфейсы в зависимости от роли пользователя и установлен пользовательский интерфейс SAS Enterprise Guide с функцией «укажи и щелкни» в качестве основного графического пользовательского интерфейса (GUI) программного обеспечения. [41] Функции управления взаимоотношениями с клиентами (CRM) были улучшены в 2004 году с помощью SAS Interaction Management. [43] В 2008 году SAS анонсировала Project Unity, предназначенный для интеграции качества данных, интеграции данных и управления основными данными . [44]
SAS Institute Inc против World Programming Ltd — это иск к разработчикам конкурирующей реализации World Programming System , в котором утверждалось, что они частично нарушили авторские права SAS, реализовав ту же функциональность. Дело было передано Высоким судом Соединенного Королевства в Европейский суд 11 августа 2010 года. [45] В мае 2012 года Европейский суд вынес решение в пользу World Programming, установив, что «функциональность компьютера программа и язык программирования не могут быть защищены авторским правом». [46]
Бесплатная версия SAS была представлена для студентов в 2010 году. [47] В том же году был также выпущен SAS Social Media Analytics, инструмент для мониторинга социальных сетей, анализа вовлеченности и настроений . [48] В том же году был представлен SAS Rapid Predictive Modeler (RPM), который создает базовые аналитические модели с использованием Microsoft Excel . [49] [50] В 2010 году JMP 9 включал новый интерфейс для использования языка программирования R и надстройку для MS Excel. [51] [52] В следующем году платформа высокопроизводительных вычислений была доступна в партнерстве с Teradata и EMC Greenplum . [53] [54] В 2011 году компания выпустила Enterprise Miner 7.1. [55] С октября 2013 по октябрь 2014 года компания представила 27 продуктов для управления данными и обновила еще 160. [56] На Глобальном форуме SAS 2015 компания SAS анонсировала несколько новых продуктов, специализированных для различных отраслей, а также новое программное обеспечение для обучения. [57]
С 1972 года у SAS было много выпусков. [58] Начиная с версии 9.3, SAS/STAT имеет собственную нумерацию выпусков.
По состоянию на 2011 год самым большим набором продуктов SAS была линия для анализа клиентов . Многочисленные модули SAS для веб-аналитики, социальных сетей и маркетинговой аналитики могут использоваться для составления профиля клиентов и потенциальных клиентов, прогнозирования их поведения, а также управления и оптимизации коммуникаций. [59]
SAS также предоставляет SAS Fraud Framework. Основная функция платформы — мониторинг транзакций в различных приложениях, сетях и партнерах, а также использование аналитики для выявления аномалий, свидетельствующих о мошенничестве. [60] [61] [62]
SAS Enterprise GRC (Governance, Risk and Compliance) обеспечивает моделирование рисков, анализ сценариев и другие функции [63] [64] для управления и визуализации рисков, соблюдения требований и корпоративных политик. Существует также набор продуктов SAS Enterprise Risk Management, предназначенный в первую очередь для банков и организаций, предоставляющих финансовые услуги. [65]
Продукты SAS для мониторинга и управления работой ИТ-систем вместе называются SAS IT Management Solutions. [66] SAS собирает данные о производительности и использовании различных ИТ-активов, затем создает отчеты и анализирует. [67] Продукты SAS Performance Management объединяют и предоставляют графическое отображение ключевых показателей эффективности (KPI) на уровне сотрудника, отдела и организации. [68] [69]
Пакет продуктов SAS Supply Chain Intelligence предлагается для нужд цепочки поставок, таких как прогнозирование спроса на продукцию, управление распределением и запасами, а также оптимизация цен. [70] Существует также набор программного обеспечения «SAS for Sustainability Management» для прогнозирования экологических, социальных и экономических последствий и выявления причинно-следственных связей между операциями и их воздействием на окружающую среду или экосистему. [71]
SAS предлагает продукты для конкретных отраслей, таких как правительство, розничная торговля, телекоммуникации, аэрокосмическая промышленность, оптимизация маркетинга и высокопроизводительные вычисления . [72]
Ранее SAS предлагала бесплатную университетскую версию, которую можно было загрузить для некоммерческого использования. 28 мая 2014 года компания SAS выпустила пресс-релиз, анонсирующий выпуск Free University Edition. [73] Однако в 2022 году SAS Free University Edition была заменена двумя полностью веб-версиями: SAS OnDemand для академиков и SAS Viya для учащихся. [74]
В статье 2005 года для журнала Journal of Marriage and Family, в которой сравнивались статистические пакеты SAS и ее конкурентов Stata и SPSS , Алан К. Акок написал, что программы SAS предоставляют «необычайный спектр задач анализа данных и управления данными», но их трудно освоить и использовать. [75] Между тем, SPSS и Stata были проще в освоении, но имели менее развитые аналитические способности, хотя их можно было расширить с помощью платных (в SPSS) или бесплатных (в Stata) надстроек. Акок пришел к выводу, что SAS лучше всего подходит для опытных пользователей , в то время как случайные пользователи больше всего выиграют от SPSS и Stata. [75] Сравнение, проведенное в 2014 году Калифорнийским университетом в Лос-Анджелесе , дало аналогичные результаты. [76]
Конкуренты, такие как Revolution Analytics и Alpine Data Labs, рекламируют свою продукцию как значительно более дешевую, чем у SAS. В ходе сравнения 2011 года Дуг Хеншен из InformationWeek обнаружил, что стартовые взносы для этих трех компаний одинаковы, хотя и признал, что стартовые взносы не обязательно являются лучшей основой для сравнения. [77] Бизнес-модель SAS не так сильно зависит от первоначальных взносов за свои программы, вместо этого основное внимание уделяется доходам от ежегодной абонентской платы. [78] [79]
В 2016 году была представлена SAS Viya [80] с новой архитектурой, оптимизированной для запуска программного обеспечения SAS в публичных облаках. Viya также улучшила совместимость с программным обеспечением с открытым исходным кодом, позволив создавать модели с помощью таких инструментов, как R , Python и Jupyter , а затем выполнять их на движке Cloud Analytics Services (CAS) SAS. [81] В 2020 году в ходе дальнейшей архитектурной модернизации Viya 4 программное обеспечение было контейнеризировано . [82] SAS продает Viya вместе с SAS 9.4 и не позиционирует его как замену SAS 9.4. [83]
По данным IDC, SAS является крупнейшим держателем доли рынка «расширенной аналитики» с 35,4% рынка по состоянию на 2013 год. [84] Это пятый по величине владелец доли рынка программного обеспечения для бизнес-аналитики (BI) с долей 6,9%. доля [85] и крупнейший независимый вендор. На рынке BI он конкурирует с SAP BusinessObjects , IBM Cognos , SPSS Modeler , Oracle Hyperion и Microsoft Power BI . [86] SAS была включена в Квадрант лидеров Gartner в области инструментов интеграции данных, а также платформ бизнес-аналитики и аналитики. [87] Исследование, опубликованное в 2011 году в журнале BMC Health Services Research, показало, что SAS использовался в 42,6 процентах анализов данных в исследованиях здравоохранения на основе выборки из 1139 статей, взятых из трех журналов. [88]
{{cite web}}
: CS1 maint: местоположение ( ссылка )SAS 72 и SAS 76 принадлежат Барру, Гуднайту, Сервису, Перкинсу и Хельвигу.
{{cite journal}}
: Требуется цитировать журнал |journal=
( помощь )