SPSS Статистика — пакет статистического программного обеспечения , разработанный IBM для управления данными , расширенной аналитики, многомерного анализа , бизнес-аналитики и уголовных расследований . Долгое время выпускавшееся компанией SPSS Inc. , оно было приобретено IBM в 2009 году. Версии программного обеспечения, выпущенные с 2015 года, имеют торговую марку IBM SPSS Статистика .
Название программного обеспечения первоначально расшифровывалось как Statistical Package for the Social Sciences ( SPSS ), [3] что отражало первоначальный рынок, а затем позже было изменено на Statistical Product and Service Solutions . [4] [5]
SPSS — широко используемая программа для статистического анализа в социальных науках . [6] Он также используется исследователями рынка, исследователями здравоохранения, исследовательскими компаниями, правительством, исследователями в области образования, маркетинговыми организациями, сборщиками данных [7] и другими. Оригинальное руководство SPSS (Ни, Бент и Халл, 1970) [8] было описано как одна из «самых влиятельных книг по социологии», позволяющая обычным исследователям проводить собственный статистический анализ. [9] Помимо статистического анализа, функциями базового программного обеспечения являются управление данными (выбор случаев, изменение формы файла и создание производных данных) и документирование данных (словарь метаданных хранится в файле данных ).
Многие функции SPSS Статистика доступны через раскрывающиеся меню или могут быть запрограммированы с помощью собственного языка синтаксиса команд 4GL . Программирование синтаксиса команд имеет преимущества воспроизводимого вывода, упрощения повторяющихся задач и обработки сложных манипуляций с данными и их анализа. Кроме того, некоторые сложные приложения могут быть запрограммированы только синтаксически и недоступны через структуру меню. Интерфейс раскрывающегося меню также генерирует синтаксис команд: он может отображаться в выходных данных, хотя настройки по умолчанию необходимо изменить, чтобы синтаксис был виден пользователю. Их также можно вставить в файл синтаксиса с помощью кнопки «Вставить», присутствующей в каждом меню. Программы можно запускать в интерактивном или автоматическом режиме с помощью поставляемого средства производственных заданий.
«Макро»-язык может использоваться для написания подпрограмм командного языка . Расширение программирования Python может получать доступ к информации в словаре данных и данных, а также динамически создавать программы синтаксиса команд. Это расширение, представленное в SPSS 14, заменило менее функциональные «скрипты» SAX Basic для большинства целей, хотя SaxBasic остается доступным. Кроме того , расширение Python позволяет SPSS запускать любую статистику из бесплатного программного пакета R. Начиная с версии 14, SPSS может управляться извне с помощью программы Python или VB.NET с использованием поставляемых «плагинов». (Начиная с версии 20, эти две возможности создания сценариев, а также многие сценарии включены в установочный носитель и обычно устанавливаются по умолчанию.)
SPSS Статистика накладывает ограничения на внутреннюю файловую структуру, типы данных , обработку данных и сопоставление файлов, что в совокупности значительно упрощает программирование. Наборы данных SPSS имеют двумерную табличную структуру, где строки обычно представляют случаи (например, отдельных лиц или домохозяйства), а столбцы представляют измерения (например, возраст, пол или доход домохозяйства). Определены только два типа данных: числовые и текстовые (или «строковые»). Вся обработка данных происходит последовательно в каждом конкретном случае через файл (набор данных). Файлы могут сопоставляться «один к одному» и «один ко многим» , но не « многие ко многим» . В дополнение к этой структуре и обработке случаев по переменным существует отдельный сеанс матрицы, в котором можно обрабатывать данные как матрицы, используя операции матрицы и линейной алгебры.
Графический интерфейс пользователя имеет два режима просмотра, которые можно переключать. «Просмотр данных» показывает электронную таблицу наблюдений (строки) и переменных (столбцы). В отличие от электронных таблиц, ячейки данных могут содержать только числа или текст, и в этих ячейках нельзя хранить формулы. «Просмотр переменных» отображает словарь метаданных, где каждая строка представляет переменную и показывает имя переменной, метку переменной, метку(и) значения, ширину печати, тип измерения и множество других характеристик. Ячейки в обоих представлениях можно редактировать вручную, определяя структуру файла и позволяя вводить данные без использования командного синтаксиса. Этого может быть достаточно для небольших наборов данных. Более крупные наборы данных, такие как статистические опросы , чаще создаются с помощью программного обеспечения для ввода данных или вводятся во время личного интервью с помощью компьютера , путем сканирования и использования программного обеспечения для оптического распознавания символов и оптических знаков или путем прямого сбора из онлайн-анкет. Эти наборы данных затем считываются в SPSS.
SPSS Статистика может читать и записывать данные из текстовых файлов ASCII (включая иерархические файлы), других статистических пакетов, электронных таблиц и баз данных . Он также может читать и записывать таблицы внешних реляционных баз данных через ODBC и SQL .
Статистические данные выводятся в собственный формат файла (файл *.spv, поддерживающий сводные таблицы ), для которого в дополнение к встроенному средству просмотра можно загрузить отдельное средство чтения. Собственный вывод можно экспортировать в текст или в форматы Microsoft Word , PDF , Excel и другие форматы. Альтернативно, выходные данные могут быть записаны в виде данных (с помощью команды OMS), в виде текста, текста с разделителями табуляции, PDF, XLS , HTML , XML , набора данных SPSS или различных форматов графических изображений ( JPEG , PNG , BMP и EMF ).
Существует несколько вариантов статистики SPSS. Пакеты SPSS Статистика Gradpacks — это версии со значительной скидкой, которые продаются только студентам. [10] SPSS Статистика Server — это версия программного обеспечения с архитектурой клиент/сервер . Дополнительные пакеты могут расширить базовое программное обеспечение дополнительными функциями (примеры включают сложные образцы , которые можно адаптировать для кластерных и стратифицированных образцов, и пользовательские таблицы , которые могут создавать таблицы, готовые к публикации). SPSS Статистика доступна по годовой или ежемесячной подписке .
Версия 25 SPSSStatistics выпущена 8 августа 2017 года. В нее добавлены новые и расширенные статистические данные, такие как результаты решения случайных эффектов (GENLINMIXED), надежные стандартные ошибки (GLM/UNIANOVA) и графики профилей с полосами ошибок в расширенной статистике и пользовательской. Дополнение к таблицам. V25 также включает новые возможности байесовской статистики , метод статистического вывода и готовые к публикации диаграммы, такие как новые мощные возможности построения диаграмм, включая новые шаблоны по умолчанию и возможность совместного использования с приложениями Microsoft Office. [11]
SPSS был выпущен в своей первой версии в 1968 году как Статистический пакет для социальных наук (SPSS) после его разработки Норманом Х. Ни , Дейлом Х. Бентом и К. Хадлаем Халлом. Эти компании были зарегистрированы как SPSS Inc. в 1975 году. Ранние версии SPSS Статистика были написаны на Фортране и предназначены для пакетной обработки на мэйнфреймах , включая, например, версии IBM и ICL , первоначально использовавшие перфокарты для ввода данных и программ. В ходе обработки считывается командный файл команд SPSS и либо необработанный входной файл данных фиксированного формата с одним типом записи, либо «getfile» данных, сохраненных при предыдущем запуске. Чтобы сэкономить драгоценное компьютерное время, можно выполнить «редактирование» для проверки синтаксиса команды без анализа данных. Начиная с версии 10 (SPSS-X) 1983 года, файлы данных могли содержать записи нескольких типов.
До SPSS 16.0 были доступны различные версии SPSS для Windows , Mac OS X и Unix .
SPSS Статистика версии 13.0 для Mac OS X не была совместима с компьютерами Macintosh на базе Intel из-за того, что программное обеспечение эмуляции Rosetta вызывало ошибки в расчетах. SPSS Статистика 15.0 для Windows требовала установки загружаемого исправления для обеспечения совместимости с Windows Vista .
Начиная с версии 16.0, та же версия работает под Windows, Mac и Linux. Графический интерфейс пользователя написан на Java . Версия Mac OS предоставляется в виде универсального двоичного файла , что делает ее полностью совместимой с оборудованием Mac на базе PowerPC и Intel.
SPSS Inc объявила 28 июля 2009 года о приобретении IBM за 1,2 миллиарда долларов США. [18] Из-за спора о праве собственности на название «SPSS» в период с 2009 по 2010 год продукт назывался PASW (Predictive Analytics Software). [19] С января 2010 года она стала называться «SPSS: компания IBM». Полная передача бизнеса IBM была осуществлена к 1 октября 2010 года. К этой дате SPSS: Компания IBM прекратила свое существование. IBM SPSS теперь полностью интегрирован в корпорацию IBM и является одним из брендов портфеля бизнес-аналитики IBM Software Group вместе с IBM Algorithmics , IBM Cognos и IBM OpenPages .
Сопутствующее программное обеспечение семейства IBM SPSS используется для интеллектуального анализа данных и анализа текста ( IBM SPSS Modeler ), служб кредитного скоринга в реальном времени (IBM SPSS Collaboration and Deployment Services) и моделирования структурных уравнений (IBM SPSS Amos).
SPSS Data Collection и SPSS Dimensions были проданы в 2015 году компании UNICOM Systems, Inc., подразделению UNICOM Global , и объединены в интегрированный пакет программного обеспечения UNICOM Intelligence (проектирование опросов, развертывание опросов, сбор данных, управление данными и отчетность). [20] [21] [22]
IDA (Интерактивный анализ данных) [23] представлял собой пакет программного обеспечения, созданный в бывшем Национальном центре исследования общественного мнения ( NORC ) при Чикагском университете . Первоначально предлагаемый на HP-2000 , [24] несколько позже, в собственности SPSS, он также был доступен на DECSYSTEM-20 от DEC . [25] Регрессионный анализ был одной из сильных сторон IDA . [24]
SCSS был программным продуктом, предназначенным для онлайн-использования мэйнфреймов IBM.[26]
Хотя буква «C» означала «разговорный», она также представляла собой различие в способе хранения данных: использовалась база данных, ориентированная на столбцы , а не на строки (внутренняя) база данных. [ нужна цитата ]
Это обеспечило хорошее время интерактивного ответа для диалоговой статистической системы SPSS (SCSS), сильной стороной которой, как и SPSS, было перекрестное табулирование. [27]
В октябре 2020 года IBM объявила о запуске программы раннего доступа к «Новой статистике SPSS» под кодовым названием Project NX. [28] [29] Он содержит «многие из ваших любимых возможностей SPSS, представленных в новом простом в использовании интерфейсе со встроенным руководством, множеством вкладок, улучшенными графиками и многим другим».
В декабре 2021 года IBM открыла программу раннего доступа к SPSSStatistics следующего поколения для большего числа пользователей и поделилась дополнительными визуальными эффектами. [30] [31]