stringtranslate.com

Сбор данных

Пример сбора данных в области биологических наук: пингвинов Адели идентифицируют и взвешивают каждый раз, когда они пересекают автоматические весы по пути к морю или обратно. [1]

Сбор данных или сбор данных — это процесс сбора и измерения информации о целевых переменных в установленной системе, который затем позволяет ответить на соответствующие вопросы и оценить результаты. Сбор данных является исследовательским компонентом во всех областях обучения, включая физические и социальные науки , гуманитарные науки [ 2] и бизнес . Хотя методы различаются в зависимости от дисциплины, акцент на обеспечении точного и честного сбора данных остается прежним. Целью любого сбора данных является сбор доказательств, которые позволят провести анализ данных и сформулировать достоверные ответы на поставленные вопросы.

Независимо от области или предпочтений в определении данных ( количественных или качественных ), точный сбор данных необходим для поддержания целостности исследования. Выбор подходящих инструментов сбора данных (существующих, модифицированных или вновь разработанных) и четкие инструкции по их правильному использованию снижают вероятность ошибок .

Методология

Сбор и проверка данных состоят из четырех этапов, когда речь идет о проведении переписи населения , и семи этапов, когда речь идет о выборке . [3]

Формальный процесс сбора данных необходим, поскольку он гарантирует, что собранные данные являются точными и точными. Таким образом, последующие решения, основанные на аргументах, воплощенных в выводах, принимаются с использованием достоверных данных. [4] Этот процесс обеспечивает как базовый уровень для измерения, так и, в некоторых случаях, указание на то, что следует улучшить.

Инструменты

Система сбора данных

Платформа управления данными

Платформы управления данными (DMP) — это централизованные системы хранения и анализа данных, используемые в основном в маркетинге . DMP существуют для сбора и преобразования больших объемов данных о спросе и предложении в различимую информацию. Маркетологи могут захотеть получать и использовать данные первых, вторых и третьих сторон. [ необходимы разъяснения ] DMP позволяют это сделать, поскольку они представляют собой совокупную систему DSP (платформы спроса) и SSP (платформы предложения). DMP являются неотъемлемой частью оптимизации будущих рекламных кампаний.

Проблемы с целостностью данных

Основной причиной поддержания целостности данных является поддержка наблюдения за ошибками в процессе сбора данных. Эти ошибки могут быть допущены намеренно (преднамеренная фальсификация ) или непреднамеренно ( случайные или систематические ошибки ). [5]

Существует два подхода, которые могут защитить целостность данных и обеспечить научную достоверность результатов исследования: [6]

Обеспечение качества (QA)

Целью QA является профилактика, которая в первую очередь является экономически эффективной деятельностью по защите целостности сбора данных. Стандартизация протокола с подробным описанием процедур сбора данных имеет решающее значение для профилактики. Риск неспособности выявить проблемы и ошибки в процессе исследования часто вызван плохо написанными руководствами. Перечислено несколько примеров таких неисправностей:

Проблемы с конфиденциальностью пользователей

Существуют серьезные опасения по поводу целостности индивидуальных пользовательских данных, собранных с помощью облачных вычислений , поскольку эти данные передаются между странами, в которых действуют разные стандарты защиты индивидуальных пользовательских данных. [7] Обработка информации достигла такого уровня, что пользовательские данные теперь можно использовать для прогнозирования того, что говорит человек, еще до того, как он заговорит. [8]

Контроль качества (КК)

Поскольку действия по контролю качества происходят во время или после сбора данных, все детали могут быть тщательно задокументированы. Существует необходимость в четко определенной структуре связи в качестве предварительного условия для создания систем мониторинга. Неопределенность в отношении потока информации не рекомендуется, поскольку плохо организованная структура связи приводит к неэффективному мониторингу, а также может ограничивать возможности обнаружения ошибок. Контроль качества также отвечает за определение действий, необходимых для исправления ошибочных методов сбора данных, а также за минимизацию таких случаев в будущем. Команда с большей вероятностью не осознает необходимости выполнения этих действий, если ее процедуры написаны расплывчато и не основаны на обратной связи или обучении .

Проблемы сбора данных, требующие оперативных действий:

Смотрите также

Рекомендации

  1. ^ Лескроэль, Алабама; Баллард, Г.; Гремийе, Д.; Отье, М.; Эйнли, генеральный директор (2014). Декамп, Себастьян (ред.). «Изменение климата в Антарктике: экстремальные явления нарушают пластическую фенотипическую реакцию у пингвинов Адели». ПЛОС ОДИН . 9 (1): e85291. Бибкод : 2014PLoSO...985291L. дои : 10.1371/journal.pone.0085291 . ПМК  3906005 . ПМИД  24489657.
  2. ^ Выонг, Куан-Хоанг; Ла, Вьет-Фыонг; Выонг, Ту-Транг; Хо, Мань-Тоан; Нгуен, Гонконг Т.; Нгуен, Вьет-Ха; Фам, Хиеп-Хунг; Хо, Мань-Тунг (25 сентября 2018 г.). «Открытая база данных производительности социальных и гуманитарных наук Вьетнама для публичного использования». Научные данные . 5 : 180188. Бибкод : 2018NatSD...580188V. doi : 10.1038/sdata.2018.188. ПМК 6154282 . ПМИД  30251992. 
  3. ^ Зиафати Бафарасат, А. (2021) Сбор и проверка данных: простое руководство для исследователей. Продвигать. Препринт.. https://doi.org/10.31124/advance.13637864.v1
  4. ^ Сбор и анализ данных доктора Роджера Сапсфорда, ISBN Виктора Джаппа 0-7619-5046-X 
  5. ^ Университет Северного Иллинойса (2005). "Сбор данных". Ответственное поведение при управлении данными . Проверено 8 июня 2019 г.
  6. ^ Мост, Марлен М.; Крэддик, Ширли; Кроуфорд, Стейси; Редикан, Сьюзен; Роудс, Донна; Рукенброд, Фрэн; Лоус, Риса (октябрь 2003 г.). «Процессы обеспечения качества диеты в исследовании диеты, контролируемой DASH-натрием». Журнал Американской диетической ассоциации . 103 (10): 1339–1346. дои : 10.1016/s0002-8223(03)01080-0. ПМИД  14520254.
  7. Ван, Фэй Фанфэй (10 января 2014 г.). Закон об электронных коммерческих сделках: современные проблемы в ЕС, США и Китае. Рутледж. п. 154. ИСБН 978-1-134-11522-8.
  8. ^ «Данные, а не конфиденциальность, представляют собой реальную опасность» . Новости Эн-Би-Си . 4 февраля 2019 г.

Внешние ссылки