stringtranslate.com

Сбор данных

Пример сбора данных в биологических науках: пингвины Адели идентифицируются и взвешиваются каждый раз, когда они пересекают автоматизированные весы по пути к морю или обратно. [1]

Сбор данных или сбор данных — это процесс сбора и измерения информации о целевых переменных в установленной системе, что затем позволяет отвечать на соответствующие вопросы и оценивать результаты. Сбор данных является компонентом исследования во всех областях обучения, включая физические и социальные науки , гуманитарные науки , [2] и бизнес . Хотя методы различаются в зависимости от дисциплины, акцент на обеспечение точного и честного сбора остается неизменным. Целью любого сбора данных является сбор доказательств, которые позволяют анализу данных привести к формулированию достоверных ответов на поставленные вопросы.

Независимо от области или предпочтения определения данных ( количественных или качественных ), точный сбор данных имеет важное значение для поддержания целостности исследования. Выбор соответствующих инструментов сбора данных (существующих, модифицированных или недавно разработанных) и изложенные инструкции по их правильному использованию снижают вероятность ошибок .

Методология

Сбор и проверка данных состоят из четырех этапов, если речь идет о проведении переписи , и из семи этапов, если речь идет о выборке . [3]

Формальный процесс сбора данных необходим, поскольку он гарантирует, что собранные данные являются как определенными, так и точными. Таким образом, последующие решения, основанные на аргументах, воплощенных в выводах, принимаются с использованием действительных данных. [4] Процесс обеспечивает как исходную точку для измерения, так и в некоторых случаях указание на то, что следует улучшить.

Инструменты

Система сбора данных

Платформа управления данными

Платформы управления данными (DMP) представляют собой централизованные системы хранения и анализа данных, в основном используемые в маркетинге . DMP существуют для компиляции и преобразования больших объемов данных о спросе и предложении в различимую информацию. Маркетологи могут захотеть получать и использовать данные первой, второй и третьей стороны. DMP позволяют это сделать, поскольку они являются совокупной системой DSP (платформа спроса) и SSP (платформа предложения). DMP являются неотъемлемой частью оптимизации и будущих рекламных кампаний.

Проблемы с целостностью данных

Основная причина поддержания целостности данных — поддержка наблюдения за ошибками в процессе сбора данных. Эти ошибки могут быть сделаны намеренно (преднамеренная фальсификация ) или непреднамеренно ( случайные или систематические ошибки ). [5]

Существует два подхода, которые могут защитить целостность данных и обеспечить научную обоснованность результатов исследования: [6]

Обеспечение качества (ОК)

QA фокусируется на профилактике, которая в первую очередь является экономически эффективной деятельностью по защите целостности сбора данных. Стандартизация протокола с всеобъемлющими и подробными описаниями процедур сбора данных является центральной для профилактики. Риск неспособности определить проблемы и ошибки в процессе исследования часто вызван плохо написанными инструкциями. Перечислены несколько примеров таких неудач:

Проблемы конфиденциальности пользователей

Существуют серьезные опасения относительно целостности индивидуальных пользовательских данных, собранных с помощью облачных вычислений , поскольку эти данные передаются между странами, в которых действуют разные стандарты защиты индивидуальных пользовательских данных. [7] Обработка информации достигла такого уровня, что пользовательские данные теперь можно использовать для прогнозирования того, что скажет человек, еще до того, как он заговорит. [8]

Контроль качества (КК)

Поскольку действия по контролю качества происходят во время или после сбора данных, все детали могут быть тщательно задокументированы. Существует необходимость в четко определенной структуре коммуникации как предварительном условии для создания систем мониторинга. Неопределенность относительно потока информации не рекомендуется, поскольку плохо организованная структура коммуникации приводит к неэффективному мониторингу и может также ограничивать возможности обнаружения ошибок. Контроль качества также отвечает за определение действий, необходимых для исправления ошибочных практик сбора данных, а также минимизации таких случаев в будущем. Команда, скорее всего, не осознает необходимость выполнения этих действий, если ее процедуры написаны нечетко и не основаны на обратной связи или обучении.

Проблемы со сбором данных, требующие срочных действий:

Смотрите также

Ссылки

  1. ^ Lescroël, AL; Ballard, G.; Grémillet, D.; Authier, M.; Ainley, DG (2014). Descamps, Sébastien (ред.). «Изменение климата в Антарктике: экстремальные события нарушают фенотипическую реакцию на пластик у пингвинов Адели». PLOS ONE . 9 (1): e85291. Bibcode : 2014PLoSO...985291L. doi : 10.1371 /journal.pone.0085291 . PMC  3906005. PMID  24489657.
  2. ^ Выонг, Куан-Хоанг; Ла, Вьет-Фыонг; Выонг, Ту-Транг; Хо, Мань-Тоан; Нгуен, Гонконг Т.; Нгуен, Вьет-Ха; Фам, Хиеп-Хунг; Хо, Мань-Тунг (25 сентября 2018 г.). «Открытая база данных производительности социальных и гуманитарных наук Вьетнама для публичного использования». Научные данные . 5 : 180188. Бибкод : 2018NatSD...580188V. дои : 10.1038/sdata.2018.188. ПМК 6154282 . ПМИД  30251992. 
  3. ^ Зиафати Бафарасат, А. (2021) Сбор и проверка данных: простое руководство для исследователей. Advance. Препринт.. https://doi.org/10.31124/advance.13637864.v1
  4. ^ Сбор и анализ данных Д-р Роджер Сапсфорд, Виктор Джапп ISBN 0-7619-5046-X 
  5. ^ Университет Северного Иллинойса (2005). «Сбор данных». Ответственное поведение при управлении данными . Получено 8 июня 2019 г.
  6. ^ Most, Marlene M.; Craddick, Shirley; Crawford, Staci; Redican, Susan; Rhodes, Donna; Rukenbrod, Fran; Laws, Reesa (октябрь 2003 г.). «Процессы обеспечения качества диетического питания в исследовании диеты с контролируемым содержанием натрия». Журнал Американской диетической ассоциации . 103 (10): 1339–1346. doi :10.1016/s0002-8223(03)01080-0. PMID  14520254.
  7. ^ Ван, Фэй Фанфей (10 января 2014 г.). Закон об электронных коммерческих транзакциях: современные проблемы в ЕС, США и Китае. Routledge. стр. 154. ISBN 978-1-134-11522-8.
  8. ^ «Данные, а не конфиденциальность, представляют собой настоящую опасность». NBC News . 4 февраля 2019 г.

Внешние ссылки