Обработка данных — это сбор и обработка цифровых данных для получения значимой информации. [1] Обработка данных — это форма обработки информации , которая представляет собой модификацию (обработку) информации любым способом, обнаруживаемым наблюдателем. [примечание 1]
Обработка данных может включать в себя различные процессы, в том числе:
История Бюро переписи населения США иллюстрирует эволюцию обработки данных от ручных процедур к электронным.
Хотя широкое распространение термина « обработка данных» началось только с 1950-х годов, [2] функции обработки данных выполнялись вручную на протяжении тысячелетий. Например, бухгалтерский учет включает в себя такие функции, как проводка транзакций и составление таких отчетов, как баланс и отчет о движении денежных средств . Полностью ручные методы были дополнены применением механических или электронных калькуляторов . Человека, работа которого заключалась в выполнении вычислений вручную или с помощью калькулятора, называли « компьютером ».
График переписи населения США 1890 года был первым, в котором данные собирались по отдельным лицам, а не по домохозяйствам . На ряд вопросов можно ответить, поставив галочку в соответствующем поле формы. С 1850 по 1880 год Бюро переписи населения использовало «систему подсчета, которая из-за увеличения числа требуемых комбинаций классификаций становилась все более сложной. В одном подсчете можно было зарегистрировать лишь ограниченное количество комбинаций, поэтому необходимо было обработайте графики 5 или 6 раз, чтобы получить столько же независимых результатов». [3] «На публикацию результатов переписи 1880 года потребовалось более 7 лет» [4] с использованием методов ручной обработки.
Термин «автоматическая обработка данных» применялся к операциям, выполняемым с помощью оборудования для записи единиц , например, к использованию перфокарточного оборудования Германом Холлеритом для переписи населения США 1890 года . «Используя оборудование Холлерита для перфокарт, Управление переписи населения смогло завершить табулирование большей части данных переписи 1890 года за 2–3 года по сравнению с 7–8 годами для переписи 1880 года. По оценкам, использование системы Холлерита сэкономило на обработке около 5 миллионов долларов. затрат» [4] в долларах 1890 года, хотя вопросов было вдвое больше, чем в 1880 году.
Компьютеризированная обработка данных, или электронная обработка данных , представляет собой более позднюю разработку, в которой вместо нескольких независимых единиц оборудования используется компьютер. Бюро переписи населения впервые ограниченно использовало электронные компьютеры для переписи населения США 1950 года , используя систему UNIVAC I , [3] поставленную в 1952 году.
Термин «обработка данных» в основном был отнесен к более общему термину «информационные технологии» (ИТ). [5] Старый термин «обработка данных» наводит на мысль о старых технологиях. Например, в 1996 году Ассоциация управления обработкой данных (DPMA) сменила название на Ассоциацию специалистов в области информационных технологий . Тем не менее, эти термины являются примерно синонимами.
Коммерческая обработка данных предполагает большой объем входных данных, относительно небольшое количество вычислительных операций и большой объем выходных данных. Например, страховой компании необходимо вести учет десятков или сотен тысяч полисов, распечатывать и отправлять счета по почте, а также получать и отправлять платежи.
В науке и технике термины «обработка данных» и «информационные системы» считаются слишком широкими, а термин « обработка данных» обычно используется для начального этапа, за которым следует анализ данных на втором этапе общей обработки данных.
Для анализа данных используются специализированные алгоритмы и статистические расчеты, которые реже встречаются в типичной общей бизнес-среде. Для анализа данных часто используются пакеты программного обеспечения, такие как SPSS или SAS , или их бесплатные аналоги, такие как DAP , gretl или PSPP .
Система обработки данных — это комбинация машин , людей и процессов, которая для набора входных данных производит определенный набор выходных данных . Входные и выходные данные интерпретируются как данные , факты , информация и т. д. в зависимости от отношения интерпретатора к системе.
Термин, обычно используемый как синоним системы обработки данных или хранения (кодов), представляет собой информационную систему . [6] Что касается, в частности, электронной обработки данных , соответствующая концепция называется системой электронной обработки данных .
Очень простым примером системы обработки данных является процесс ведения контрольного реестра. Транзакции — чеки и депозиты — записываются по мере их возникновения, а транзакции суммируются для определения текущего баланса. Ежемесячно данные, записанные в реестре, сверяются с, надеюсь, идентичным списком транзакций, обрабатываемых банком.
Более сложная система учета может дополнительно идентифицировать транзакции — например, вклады по источнику или чеки по типу, например, благотворительные пожертвования. Эта информация может быть использована для получения такой информации, как общая сумма всех взносов за год.
В этом примере важно то, что это система , в которой все транзакции записываются последовательно, и каждый раз используется один и тот же метод банковской выверки.
Это блок-схема системы обработки данных, сочетающая ручную и компьютеризированную обработку для обработки дебиторской задолженности , выставления счетов и главной книги.