Сводная таблица — это таблица значений, которые являются агрегациями групп отдельных значений из более обширной таблицы (например, из базы данных , электронной таблицы или программы бизнес-аналитики ) в пределах одной или нескольких дискретных категорий. Агрегации или сводки групп отдельных терминов могут включать суммы, средние значения, подсчеты или другие статистические данные. Сводная таблица является результатом статистической обработки табличных необработанных данных и может использоваться для принятия решений.
Хотя сводная таблица является общим термином, Microsoft владела товарным знаком на этот термин в Соединенных Штатах с 1994 по 2020 год. [1]
В своей книге Pivot Table Data Crunching [ 2] Билл Джелен и Майк Александер называют Пито Саласа «отцом сводных таблиц». Работая над концепцией новой программы, которая в конечном итоге станет Lotus Improv , Салас заметил, что электронные таблицы имеют шаблоны данных. Инструмент, который мог бы помочь пользователю распознать эти шаблоны, помог бы быстро строить расширенные модели данных. С помощью Improv пользователи могли бы определять и хранить наборы категорий, а затем изменять представления, перетаскивая названия категорий с помощью мыши. Эта основная функциональность предоставила бы модель для сводных таблиц.
Lotus Development выпустила Improv в 1991 году на платформе NeXT . Через несколько месяцев после выпуска Improv Brio Technology выпустила автономную реализацию для Macintosh под названием DataPivot (технология была запатентована в 1999 году). [3] Borland приобрела технологию DataPivot в 1992 году и реализовала ее в своем собственном приложении для работы с электронными таблицами Quattro Pro .
В 1993 году появилась версия Improv для Microsoft Windows. В начале 1994 года Microsoft Excel 5 [4] вывел на рынок новую функциональность под названием «Сводная таблица». В более поздних версиях Excel Microsoft усовершенствовала эту функцию:
В 2007 году корпорация Oracle сделала PIVOT
и UNPIVOT
операторы доступными в Oracle Database 11g. [5]
При типичном вводе и хранении данных они обычно отображаются в плоских таблицах, то есть состоят только из столбцов и строк, как в следующем фрагменте примера электронной таблицы, показывающей данные по типам рубашек:
Хотя такие таблицы могут содержать много элементов данных, может быть сложно получить из них обобщенную информацию. Сводная таблица может помочь быстро обобщить данные и выделить нужную информацию. Использование сводной таблицы чрезвычайно широко и зависит от ситуации. Первый вопрос, который следует задать: «Что я ищу?» В приведенном здесь примере давайте спросим: «Сколько единиц мы продали в каждом регионе для каждой даты отгрузки? »:
Сводная таблица обычно состоит из полей строк , столбцов и данных (или фактов ). В этом случае столбец — это дата отправки , строка — регион , а данные, которые мы хотели бы видеть, — это (сумма) единиц . Эти поля допускают несколько видов агрегации , включая: сумму, среднее значение, стандартное отклонение , количество и т. д. В этом случае общее количество отправленных единиц отображается здесь с использованием агрегации суммы .
Используя пример выше, программное обеспечение найдет все отдельные значения для Region . В этом случае это: North , South , East , West . Кроме того, оно найдет все отдельные значения для Ship date . На основе типа агрегации, sum , оно суммирует факт, количество Unit , и отображает их в многомерной диаграмме. В примере выше первым элементом данных является 66. Это число было получено путем поиска всех записей, где Region был East , а Ship Date был 2005-01-31 , и сложения Units этого набора записей ( т. е . ячеек E2–E7) вместе, чтобы получить окончательный результат.
Сводные таблицы не создаются автоматически. Например, в Microsoft Excel сначала необходимо выбрать все данные в исходной таблице, а затем перейти на вкладку Вставка и выбрать «Сводная таблица» (или «Сводная диаграмма»). Затем пользователь может либо вставить сводную таблицу в существующий лист, либо создать новый лист для размещения сводной таблицы. Пользователю предоставляется список полей сводной таблицы, в котором перечислены все заголовки столбцов, присутствующие в данных. Например, если таблица представляет данные о продажах компании, она может включать Дату продажи, Продавца, Проданный товар, Цвет товара, Проданные единицы, Цену за единицу и Общую цену. Это делает данные более доступными.
Поля, которые будут созданы, будут видны на правой стороне листа. По умолчанию макет сводной таблицы будет отображаться под этим списком.
Поля сводной таблицы являются строительными блоками сводных таблиц. Каждое из полей из списка можно перетащить на этот макет, который имеет четыре варианта:
Некоторые применения сводных таблиц связаны с анализом анкет с необязательными ответами, но некоторые реализации сводных таблиц не допускают таких вариантов использования. Например, реализация в LibreOffice Calc с 2012 года не может обрабатывать пустые ячейки. [6] [7]
Фильтр отчета используется для применения фильтра ко всей таблице. Например, если поле "Цвет элемента" перетащить в эту область, то созданная таблица будет иметь фильтр отчета, вставленный над таблицей. Этот фильтр отчета будет иметь раскрывающиеся параметры (черный, красный и белый в примере выше). Когда из этого раскрывающегося списка выбирается параметр ("черный" в этом примере), то таблица, которая будет видна, будет содержать только данные из тех строк, в которых "Цвет элемента = черный".
Заголовки столбцов используются для применения фильтра к одному или нескольким столбцам, которые должны быть показаны в сводной таблице. Например, если поле «Продавец» перетащить в эту область, то построенная таблица будет иметь значения из столбца «Продавец», т. е . будет иметь количество столбцов, равное количеству «Продавец». Также будет добавлен один столбец «Итого». В приведенном выше примере эта инструкция создаст пять столбцов в таблице — по одному для каждого продавца и Grand Total. Над данными будет фильтр — заголовки столбцов — из которого можно выбрать или отменить выбор конкретного продавца для сводной таблицы.
В этой таблице не будет числовых значений, поскольку числовое поле не выбрано, но при его выборе значения в столбце «Общий итог» будут автоматически обновлены.
Метки строк используются для применения фильтра к одной или нескольким строкам, которые должны быть показаны в сводной таблице. Например, если поле «Продавец» перетащить в эту область, то другая созданная выходная таблица будет иметь значения из столбца «Продавец», т. е . в ней будет количество строк, равное количеству «Продавец». Также будет добавлена одна строка «Общий итог». В приведенном выше примере эта инструкция создаст пять строк в таблице — по одной для каждого продавца и общий итог. Над данными будет фильтр — метки строк — из которого можно выбрать или отменить выбор конкретного продавца для сводной таблицы.
В этой таблице не будет числовых значений, поскольку числовое поле не выбрано, но при его выборе значения в строке «Общий итог» будут автоматически обновлены.
Обычно это поле имеет числовые значения, которые можно использовать для различных типов вычислений. Однако использование текстовых значений также не будет ошибкой; вместо суммы будет выдано количество. Так, в примере выше, если поле «Проданные единицы» перетащить в эту область вместе с меткой строки «Продавец», то инструкция добавит новый столбец «Сумма проданных единиц», который будет содержать значения по каждому продавцу.
Сводные таблицы или функциональные возможности сводных таблиц являются неотъемлемой частью многих приложений для работы с электронными таблицами и некоторого программного обеспечения для баз данных , а также встречаются в других инструментах визуализации данных и пакетах бизнес-аналитики .
Языки программирования и библиотеки, подходящие для работы с табличными данными, содержат функции, позволяющие создавать и обрабатывать сводные таблицы.
pivot_table
[16] и xs
метод, полезные для получения разделов сводных таблиц. [ необходима ссылка ]Сводные таблицы Excel включают функцию прямого запроса к серверу онлайн-аналитической обработки (OLAP) для извлечения данных вместо получения данных из электронной таблицы Excel. В этой конфигурации сводная таблица является простым клиентом сервера OLAP. Сводная таблица Excel позволяет подключаться не только к службе анализа Microsoft, но и к любому серверу, совместимому со стандартом XML for Analysis (XMLA) OLAP.
[...] Excel 5, выпущенный в начале 1994 г., включал первую версию VBA.
Одной из самых полезных новых функций Oracle Database 11g с точки зрения SQL является введение операторов Pivot и Unpivot.