Обработка данных

Обработка данных — это сбор и обработка цифровых данных для получения значимой информации. ^[1] Обработка данных — это форма обработки информации , которая представляет собой модификацию (обработку) информации любым способом, обнаруживаемым наблюдателем. ^{[примечание 1]}

Функции

Обработка данных может включать в себя различные процессы, в том числе:

Валидация – обеспечение правильности и актуальности предоставленных данных.
Сортировка – «расстановка предметов в некоторой последовательности и/или в разных наборах».
Суммирование (статистическое) или (автоматическое) – сведение детализированных данных к основным моментам.
Агрегация – объединение нескольких фрагментов данных.
Анализ – «сбор, организация , анализ, интерпретация и представление данных».
Отчетность – список подробных или сводных данных или расчетной информации.
Классификация – разделение данных на различные категории.

История

История Бюро переписи населения США иллюстрирует эволюцию обработки данных от ручных процедур к электронным.

Руководство

Хотя широкое распространение термина « обработка данных» началось только с 1950-х годов, ^[2] функции обработки данных выполнялись вручную на протяжении тысячелетий. Например, бухгалтерский учет включает в себя такие функции, как проводка транзакций и составление таких отчетов, как баланс и отчет о движении денежных средств . Полностью ручные методы были дополнены применением механических или электронных калькуляторов . Человека, работа которого заключалась в выполнении вычислений вручную или с помощью калькулятора, называли « компьютером ».

График переписи населения США 1890 года был первым, в котором данные собирались по отдельным лицам, а не по домохозяйствам . На ряд вопросов можно ответить, поставив галочку в соответствующем поле формы. С 1850 по 1880 год Бюро переписи населения использовало «систему подсчета, которая из-за увеличения числа требуемых комбинаций классификаций становилась все более сложной. В одном подсчете можно было зарегистрировать лишь ограниченное количество комбинаций, поэтому необходимо было обработайте графики 5 или 6 раз, чтобы получить столько же независимых результатов». ^[3] «На публикацию результатов переписи 1880 года потребовалось более 7 лет» ^[4] с использованием методов ручной обработки.

Автоматический

Термин «автоматическая обработка данных» применялся к операциям, выполняемым с помощью оборудования для записи единиц , например, к использованию перфокарточного оборудования Германом Холлеритом для переписи населения США 1890 года . «Используя оборудование Холлерита для перфокарт, Управление переписи населения смогло завершить табулирование большей части данных переписи 1890 года за 2–3 года по сравнению с 7–8 годами для переписи 1880 года. По оценкам, использование системы Холлерита сэкономило на обработке около 5 миллионов долларов. затрат» ^[4] в долларах 1890 года, хотя вопросов было вдвое больше, чем в 1880 году.

Компьютеризированный

Компьютеризированная обработка данных, или электронная обработка данных , представляет собой более позднюю разработку, в которой вместо нескольких независимых единиц оборудования используется компьютер. Бюро переписи населения впервые ограниченно использовало электронные компьютеры для переписи населения США 1950 года , используя систему UNIVAC I , ^[3] поставленную в 1952 году.

Другие разработки

Термин «обработка данных» в основном был отнесен к более общему термину «информационные технологии» (ИТ). ^[5] Старый термин «обработка данных» наводит на мысль о старых технологиях. Например, в 1996 году Ассоциация управления обработкой данных (DPMA) сменила название на Ассоциацию специалистов в области информационных технологий . Тем не менее, эти термины являются примерно синонимами.

Приложения

Коммерческая обработка данных

Коммерческая обработка данных предполагает большой объем входных данных, относительно небольшое количество вычислительных операций и большой объем выходных данных. Например, страховой компании необходимо вести учет десятков или сотен тысяч полисов, распечатывать и отправлять счета по почте, а также получать и отправлять платежи.

Анализ данных

В науке и технике термины «обработка данных» и «информационные системы» считаются слишком широкими, а термин « обработка данных» обычно используется для начального этапа, за которым следует анализ данных на втором этапе общей обработки данных.

Для анализа данных используются специализированные алгоритмы и статистические расчеты, которые реже встречаются в типичной общей бизнес-среде. Для анализа данных часто используются пакеты программного обеспечения, такие как SPSS или SAS , или их бесплатные аналоги, такие как DAP , gretl или PSPP .

Системы

Система обработки данных — это комбинация машин , людей и процессов, которая для набора входных данных производит определенный набор выходных данных . Входные и выходные данные интерпретируются как данные , факты , информация и т. д. в зависимости от отношения интерпретатора к системе.

Термин, обычно используемый как синоним системы обработки данных или хранения (кодов), представляет собой информационную систему . ^[6] Что касается, в частности, электронной обработки данных , соответствующая концепция называется системой электронной обработки данных .

Примеры

Простой пример

Очень простым примером системы обработки данных является процесс ведения контрольного реестра. Транзакции — чеки и депозиты — записываются по мере их возникновения, а транзакции суммируются для определения текущего баланса. Ежемесячно данные, записанные в реестре, сверяются с, надеюсь, идентичным списком транзакций, обрабатываемых банком.

Более сложная система учета может дополнительно идентифицировать транзакции — например, вклады по источнику или чеки по типу, например, благотворительные пожертвования. Эта информация может быть использована для получения такой информации, как общая сумма всех взносов за год.

В этом примере важно то, что это система , в которой все транзакции записываются последовательно, и каждый раз используется один и тот же метод банковской выверки.

Реальный пример

Это блок-схема системы обработки данных, сочетающая ручную и компьютеризированную обработку для обработки дебиторской задолженности , выставления счетов и главной книги.

Смотрите также

Примечания

^ Обработка данных отличается от обработки текста , которая представляет собой манипулирование конкретно текстом, а не данными в целом. "обработка данных". Вебопедия . Сентябрь 1996 года . Проверено 24 июня 2013 г.

Внешние ссылки

В Wikiquote есть цитаты, связанные с обработкой данных .

дальнейшее чтение

Бурк, Линда Б.; Кларк, Вирджиния А. (1992) Обработка данных: пример опроса . (Количественные приложения в социальных науках, № 07-085). Публикации Сейджа. ISBN 0-8039-4741-0
Леви, Джозеф (1967) Обработка данных на перфокартах . Книжная компания МакГроу-Хилл.