Цифровые данные в теории информации и информационных системах — это информация, представленная в виде строки дискретных символов, каждый из которых может принимать одно из конечного числа значений из некоторого алфавита , например, букв или цифр. Примером может служить текстовый документ , состоящий из строки буквенно-цифровых символов . Наиболее распространенной формой цифровых данных в современных информационных системах являются двоичные данные , представленные строкой двоичных цифр (битов), каждый из которых может иметь одно из двух значений: 0 или 1.
Цифровые данные можно противопоставить аналоговым данным , которые представлены значением из непрерывного ряда действительных чисел . Аналоговые данные передаются аналоговым сигналом , который не только принимает непрерывные значения, но и может непрерывно меняться со временем, непрерывной действительной функцией времени. Примером является изменение давления воздуха в звуковой волне .
Слово «цифровой» происходит от того же источника, что и слова «digit» и «digitus» ( латинское слово, обозначающее палец ), поскольку пальцы часто используются для счета. Математик Джордж Стибиц из Bell Telephone Laboratories использовал слово «цифровой» в отношении быстрых электрических импульсов, испускаемых устройством, предназначенным для наведения и стрельбы из зенитных орудий в 1942 году. [1] Этот термин чаще всего используется в вычислительной технике и электронике , особенно там, где информация реального мира преобразуется в двоичную числовую форму, как в цифровом аудио и цифровой фотографии .
Устройство ввода символов обычно состоит из группы переключателей, которые опрашиваются через регулярные интервалы, чтобы увидеть, какие переключатели переключены. Данные будут потеряны, если в течение одного интервала опроса будут нажаты два переключателя или переключатель будет нажат, отпущен и нажат снова. Этот опрос может выполняться специализированным процессором в устройстве, чтобы не загружать основной ЦП . [2] Когда вводится новый символ, устройство обычно отправляет прерывание в специализированном формате, чтобы ЦП мог его прочитать.
Для устройств с несколькими переключателями (например, кнопки на джойстике ) статус каждого из них может быть закодирован в виде битов (обычно 0 для отпущенных и 1 для нажатых) в одном слове. Это полезно, когда комбинации нажатий клавиш имеют смысл, и иногда используется для передачи статуса клавиш-модификаторов на клавиатуре (например, shift и control). Но он не масштабируется для поддержки большего количества клавиш, чем количество битов в одном байте или слове.
Устройства со множеством переключателей (например, клавиатура компьютера ) обычно располагают эти переключатели в матрице сканирования, при этом отдельные переключатели находятся на пересечениях линий x и y. При нажатии переключателя он соединяет соответствующие линии x и y вместе. Опрос (часто называемый сканированием в этом случае) выполняется путем последовательной активации каждой линии x и определения того, какие линии y затем имеют сигнал , таким образом, какие клавиши нажаты. Когда процессор клавиатуры обнаруживает, что клавиша изменила состояние, он отправляет сигнал в ЦП, указывающий скан-код клавиши и ее новое состояние. Затем символ кодируется или преобразуется в число на основе состояния клавиш-модификаторов и желаемой кодировки символов .
Пользовательская кодировка может использоваться для конкретного приложения без потери данных. Однако использование стандартной кодировки, такой как ASCII , проблематично, если необходимо преобразовать такой символ, как 'ß', но его нет в стандарте.
По оценкам, в 1986 году менее 1% мировых технологических возможностей хранения информации были цифровыми, а в 2007 году их было уже 94%. [3] Предполагается, что 2002 год станет годом, когда человечество сможет хранить больше информации в цифровом формате, чем в аналоговом («начало цифровой эпохи » ). [4] [5]
Вся цифровая информация обладает общими свойствами, которые отличают ее от аналоговых данных с точки зрения коммуникаций:
Синхронизация: Поскольку цифровая информация передается последовательностью, в которой упорядочены символы, все цифровые схемы имеют некоторый метод определения начала последовательности. В письменных или устных человеческих языках синхронизация обычно обеспечивается паузами (пробелами), заглавными буквами и знаками препинания . Машинные коммуникации обычно используют специальные последовательности синхронизации .
Язык: Все цифровые коммуникации требуют формального языка , который в этом контексте состоит из всей информации, которой отправитель и получатель цифровой коммуникации должны обладать заранее, чтобы коммуникация была успешной. Языки, как правило, произвольны и определяют значение, которое должно быть присвоено определенным последовательностям символов, допустимый диапазон значений, методы, которые должны использоваться для синхронизации и т. д.
Ошибки: помехи ( шум ) в аналоговой связи неизменно вносят некоторое, как правило, небольшое отклонение или ошибку между предполагаемой и фактической связью. Помехи в цифровой связи приводят к ошибкам только тогда, когда помехи настолько велики, что приводят к тому, что символ неправильно интерпретируется как другой символ или нарушается последовательность символов. Как правило, возможно иметь почти безошибочную цифровую связь. Кроме того, такие методы, как контрольные коды, могут использоваться для обнаружения ошибок и их исправления с помощью избыточности или повторной передачи. Ошибки в цифровой связи могут принимать форму ошибок замены, при которых символ заменяется другим символом, или ошибок вставки/удаления , при которых дополнительный неправильный символ вставляется или удаляется из цифрового сообщения. Неисправленные ошибки в цифровой связи оказывают непредсказуемое и, как правило, большое влияние на информационное содержание связи.
Копирование : Из-за неизбежного присутствия шума создание множества последовательных копий аналоговой коммуникации невозможно, поскольку каждое поколение увеличивает шум. Поскольку цифровая коммуникация, как правило, безошибочна, копии копий можно делать бесконечно.
Гранулярность : Цифровое представление непрерывно изменяющегося аналогового значения обычно включает выбор количества символов, которые будут назначены этому значению. Количество символов определяет точность или разрешение результирующего элемента данных. Разница между фактическим аналоговым значением и цифровым представлением известна как ошибка квантования . Например, если фактическая температура составляет 23,234456544453 градуса, но только две цифры (23) назначены этому параметру в конкретном цифровом представлении, ошибка квантования составляет 0,234456544453. Это свойство цифровой связи известно как гранулярность .
Сжимаемость : По словам Миллера, «несжатые цифровые данные очень велики, и в своей необработанной форме они фактически произведут больший сигнал (следовательно, их будет сложнее передавать), чем аналоговые данные. Однако цифровые данные можно сжать. Сжатие уменьшает объем полосы пропускания, необходимый для отправки информации. Данные можно сжимать, отправлять, а затем распаковывать на месте потребления. Это позволяет отправлять гораздо больше информации и приводит, например, к тому, что сигналы цифрового телевидения предоставляют больше места в спектре радиоволн для большего количества телевизионных каналов». [5]
Исторические цифровые системы
Несмотря на то, что цифровые сигналы обычно ассоциируются с двоичными электронными цифровыми системами, используемыми в современной электронике и вычислительной технике, цифровые системы на самом деле являются древними и не обязательно должны быть двоичными или электронными.
Генетический код ДНК — это естественная форма хранения цифровых данных.
Письменный текст (из-за ограниченного набора символов и использования дискретных символов – в большинстве случаев алфавита)
Абак был создан где-то между 1000 и 500 годами до нашей эры, позже он стал формой частоты вычислений. В настоящее время его можно использовать как очень продвинутый, но базовый цифровой калькулятор, который использует бусины в рядах для представления чисел. Бусины имеют значение только в дискретных состояниях вверх и вниз, а не в аналоговых промежуточных состояниях.
Маяк , возможно, является самым простым неэлектронным цифровым сигналом, имеющим всего два состояния (вкл. и выкл.). В частности, дымовые сигналы являются одним из старейших примеров цифрового сигнала, где аналоговый «носитель» (дым) модулируется одеялом для генерации цифрового сигнала (клубов дыма), который передает информацию.
В азбуке Морзе используются шесть цифровых состояний: точка, тире, внутрисимвольный промежуток (между каждой точкой или тире), короткий промежуток (между каждой буквой), средний промежуток (между словами) и длинный промежуток (между предложениями) — для отправки сообщений с помощью различных потенциальных носителей, таких как электричество или свет, например, с помощью электрического телеграфа или мигающего света.
Шрифт Брайля использует шестибитный код, представленный в виде точечных узоров.
Флаговый семафор использует стержни или флаги, удерживаемые в определенных положениях, для отправки сообщений получателю, наблюдающему за ними на некотором расстоянии.
Международные морские сигнальные флаги имеют отличительную маркировку, представляющую собой буквы алфавита, позволяющие судам передавать сообщения друг другу.
Недавно изобретенный модем модулирует аналоговый "несущий" сигнал (такой как звук) для кодирования двоичной электрической цифровой информации в виде серии двоичных цифровых звуковых импульсов. Чуть более ранняя, на удивление надежная версия той же концепции заключалась в объединении последовательности аудиоцифровой информации "сигнал" и "нет сигнала" (то есть "звук" и "тишина") на магнитной кассете для использования с ранними домашними компьютерами .
^ Генрих, Лутц Дж.; Хайнцль, Армин; Ройтмайр, Фридрих (29 августа 2014 г.). Wirtschaftsinformatik-Lexikon (на немецком языке). Вальтер де Грюйтер ГмбХ & Ко КГ. ISBN978-3-486-81590-0.
^ Мартин Хильберт; Присцила Лопес (10 февраля 2011 г.). «Технологические возможности мира по хранению, передаче и вычислению информации». Science . Vol. 332, no. 6025. pp. 60–65. doi :10.1126/science.1200970. Архивировано (PDF) из оригинала 31 мая 2011 г.Также «Вспомогательные онлайн-материалы для Мирового технологического потенциала хранения, передачи и вычисления информации» (PDF) . Наука . doi :10.1126/science.1200970. Архивировано (PDF) из оригинала 31 мая 2011 г.Бесплатный доступ к статье здесь: www.martinhilbert.net/WorldInfoCapacity.html/
^ "видеоанимация о технологическом потенциале мира по хранению, передаче и вычислению информации с 1986 по 2010 год". 11 июня 2011 г. Архивировано из оригинала 21 февраля 2013 г. Получено 6 ноября 2013 г. – через YouTube.
^ ab Miller, Vincent (2011). Понимание цифровой культуры . Лондон: Sage Publications. раздел. «Конвергенция и современный медиаопыт». ISBN978-1-84787-497-9.
^ "Три состояния информации". Эдинбургский университет . Архивировано из оригинала 14 апреля 2021 г. Получено 21 февраля 2021 г.
Дальнейшее чтение
Точчи, Р. 2006. Цифровые системы: принципы и приложения (10-е издание). Prentice Hall. ISBN 0-13-172579-3