Сбор данных или сбор данных — это процесс сбора и измерения информации о целевых переменных в установленной системе, который затем позволяет ответить на соответствующие вопросы и оценить результаты. Сбор данных является исследовательским компонентом во всех областях обучения, включая физические и социальные науки , гуманитарные науки [ 2] и бизнес . Хотя методы различаются в зависимости от дисциплины, акцент на обеспечении точного и честного сбора данных остается прежним. Целью любого сбора данных является сбор доказательств, которые позволят провести анализ данных и сформулировать достоверные ответы на поставленные вопросы.
Независимо от области или предпочтений в определении данных ( количественных или качественных ), точный сбор данных необходим для поддержания целостности исследования. Выбор подходящих инструментов сбора данных (существующих, модифицированных или вновь разработанных) и четкие инструкции по их правильному использованию снижают вероятность ошибок .
Сбор и проверка данных состоят из четырех этапов, когда речь идет о проведении переписи населения , и семи этапов, когда речь идет о выборке . [3]
Формальный процесс сбора данных необходим, поскольку он гарантирует, что собранные данные являются точными и точными. Таким образом, последующие решения, основанные на аргументах, воплощенных в выводах, принимаются с использованием достоверных данных. [4] Этот процесс обеспечивает как базовый уровень для измерения, так и, в некоторых случаях, указание на то, что следует улучшить.
Платформы управления данными (DMP) — это централизованные системы хранения и анализа данных, используемые в основном в маркетинге . DMP существуют для сбора и преобразования больших объемов данных о спросе и предложении в различимую информацию. Маркетологи могут захотеть получать и использовать данные первых, вторых и третьих сторон. [ необходимы разъяснения ] DMP позволяют это сделать, поскольку они представляют собой совокупную систему DSP (платформы спроса) и SSP (платформы предложения). DMP являются неотъемлемой частью оптимизации будущих рекламных кампаний.
Основной причиной поддержания целостности данных является поддержка наблюдения за ошибками в процессе сбора данных. Эти ошибки могут быть допущены намеренно (преднамеренная фальсификация ) или непреднамеренно ( случайные или систематические ошибки ). [5]
Существует два подхода, которые могут защитить целостность данных и обеспечить научную достоверность результатов исследования: [6]
Целью QA является профилактика, которая в первую очередь является экономически эффективной деятельностью по защите целостности сбора данных. Стандартизация протокола с подробным описанием процедур сбора данных имеет решающее значение для профилактики. Риск неспособности выявить проблемы и ошибки в процессе исследования часто вызван плохо написанными руководствами. Перечислено несколько примеров таких неисправностей:
Существуют серьезные опасения по поводу целостности индивидуальных пользовательских данных, собранных с помощью облачных вычислений , поскольку эти данные передаются между странами, в которых действуют разные стандарты защиты индивидуальных пользовательских данных. [7] Обработка информации достигла такого уровня, что пользовательские данные теперь можно использовать для прогнозирования того, что говорит человек, еще до того, как он заговорит. [8]
Поскольку действия по контролю качества происходят во время или после сбора данных, все детали могут быть тщательно задокументированы. Существует необходимость в четко определенной структуре связи в качестве предварительного условия для создания систем мониторинга. Неопределенность в отношении потока информации не рекомендуется, поскольку плохо организованная структура связи приводит к неэффективному мониторингу, а также может ограничивать возможности обнаружения ошибок. Контроль качества также отвечает за определение действий, необходимых для исправления ошибочных методов сбора данных, а также за минимизацию таких случаев в будущем. Команда с большей вероятностью не осознает необходимости выполнения этих действий, если ее процедуры написаны расплывчато и не основаны на обратной связи или обучении .
Проблемы сбора данных, требующие оперативных действий: