stringtranslate.com

Анализ содержания

Анализ контента — это изучение документов и артефактов коммуникации, которые могут быть текстами различных форматов, изображениями, аудио или видео. Социологи используют анализ контента для изучения закономерностей в коммуникации воспроизводимым и систематическим образом. [1] Одним из ключевых преимуществ использования анализа контента для анализа социальных явлений является его неинвазивный характер, в отличие от моделирования социального опыта или сбора ответов на опросы.

Практики и философия контент-анализа различаются в зависимости от академических дисциплин. Все они включают систематическое чтение или наблюдение за текстами или артефактами, которым присваиваются метки (иногда называемые кодами) , указывающие на наличие интересных, значимых фрагментов контента. [2] [3] Систематически маркируя контент набора текстов , исследователи могут количественно анализировать закономерности контента , используя статистические методы , или использовать качественные методы для анализа значений контента в текстах .

Компьютеры все чаще используются в контент-анализе для автоматизации маркировки (или кодирования) документов. Простые вычислительные методы могут предоставить описательные данные, такие как частоты слов и длина документов. Классификаторы машинного обучения могут значительно увеличить количество текстов, которые могут быть маркированы, но научная полезность этого является предметом споров. Кроме того, доступны многочисленные компьютерные программы компьютерного анализа текста (CATA), которые анализируют текст на предмет предопределенных лингвистических, семантических и психологических характеристик. [4]

Цели

Контент-анализ лучше всего понимать как широкое семейство методов. Эффективные исследователи выбирают методы, которые лучше всего помогают им отвечать на их существенные вопросы. Тем не менее, по словам Клауса Криппендорфа , в каждом контент-анализе необходимо рассмотреть шесть вопросов: [5]

  1. Какие данные анализируются?
  2. Как определяются данные?
  3. Из какой совокупности берутся данные?
  4. Каков соответствующий контекст?
  5. Каковы границы анализа?
  6. Что необходимо измерить?

Самая простая и объективная форма анализа контента рассматривает недвусмысленные характеристики текста, такие как частоты слов , площадь страницы, занимаемая газетной колонкой, или продолжительность радио- или телевизионной программы. Анализ простых частот слов ограничен, поскольку значение слова зависит от окружающего текста. Процедуры Key Word In Context (KWIC) решают эту проблему, помещая слова в их текстовый контекст. Это помогает разрешить неоднозначности, например, те, которые вносятся синонимами и омонимами .

Дальнейшим шагом в анализе является различие между подходами на основе словаря (количественными) и качественными подходами. Подходы на основе словаря создают список категорий, полученных из списка частотности слов, и контролируют распределение слов и их соответствующих категорий по текстам. В то время как методы количественного контент-анализа таким образом преобразуют наблюдения найденных категорий в количественные статистические данные, качественный контент-анализ больше фокусируется на преднамеренности и ее последствиях. Существуют сильные параллели между качественным контент-анализом и тематическим анализом . [6]

Качественный и количественный контент-анализ

Количественный контент-анализ выделяет подсчеты частот и статистический анализ этих кодированных частот. [7] Кроме того, количественный контент-анализ начинается с сформулированной гипотезы с кодированием, определенным до начала анализа. Эти категории кодирования строго соответствуют гипотезе исследователя. Количественный анализ также использует дедуктивный подход. [8] Примеры контент-аналитических переменных и конструкций можно найти, например, в базе данных открытого доступа DOCA. Эта база данных компилирует, систематизирует и оценивает соответствующие контент-аналитические переменные областей и тем исследований в области коммуникации и политологии.

Зигфрид Кракауэр критикует количественный анализ, утверждая, что он упрощает сложные коммуникации, чтобы быть более надежным. С другой стороны, качественный анализ имеет дело с тонкостями скрытых интерпретаций, тогда как количественный фокусируется на явных значениях. Он также признает «перекрытие» качественного и количественного контент-анализа. [7] В качественном анализе шаблоны рассматриваются более подробно, и на основе скрытых значений, которые может найти исследователь, ход исследования может быть изменен. Он индуктивный и начинается с открытых исследовательских вопросов, а не с гипотезы. [8]

Кодовые книги

Инструментом сбора данных, используемым в контент-анализе, является кодовая книга или схема кодирования. В качественном контент-анализе кодовая книга создается и улучшается во время кодирования, в то время как в количественном контент-анализе кодовая книга должна быть разработана и предварительно протестирована на надежность и валидность перед кодированием. [4] Кодовая книга включает в себя подробные инструкции для кодировщиков-людей, а также четкие определения соответствующих концепций или переменных, которые должны быть закодированы, а также присвоенные значения.

Согласно действующим стандартам надлежащей научной практики, каждое исследование контент-анализа должно предоставлять свою кодовую книгу в приложении или в качестве дополнительного материала, чтобы обеспечить воспроизводимость исследования. На сервере Open Science Framework (OSF) Центра открытой науки множество кодовых книг исследований контент-анализа свободно доступны через поиск по запросу «codebook».

Кроме того, База данных переменных для анализа контента (DOCA) предоставляет архив с открытым доступом предварительно протестированных переменных и установленных кодовых книг для анализа контента. [9] Меры из архива могут быть приняты в будущих исследованиях для обеспечения использования высококачественных и сопоставимых инструментов. DOCA охватывает, среди прочего, меры для анализа контента вымышленных медиа и развлечений (например, меры сексуализации в видеоиграх [10] ), пользовательского медиаконтента (например, меры онлайн-языка ненависти [11] ), а также новостных СМИ и журналистики (например, меры использования стоковых фотографий в сообщениях прессы о сексуальном насилии над детьми [12] и меры персонализации в освещении предвыборной кампании [13] ).

Вычислительные инструменты

С развитием таких распространенных вычислительных средств, как ПК, растет популярность компьютерных методов анализа. [14] [15] [16] Ответы на открытые вопросы, газетные статьи, манифесты политических партий, медицинские записи или систематические наблюдения в экспериментах могут быть предметом систематического анализа текстовых данных.

Благодаря тому, что содержание коммуникации доступно в форме машиночитаемых текстов, входные данные анализируются на предмет частотности и кодируются в категории для построения выводов.

Компьютерный анализ может помочь с большими электронными наборами данных, сокращая время и устраняя необходимость в нескольких людях-кодировщиках для установления межкодовой надежности. Тем не менее, люди-кодировщики все еще могут быть использованы для анализа контента, так как они часто более способны выделять нюансы и скрытые значения в тексте. Исследование показало, что люди-кодировщики способны оценивать более широкий диапазон и делать выводы на основе скрытых значений. [17]

Надежность и достоверность

Роберт Вебер отмечает: «Чтобы сделать обоснованные выводы из текста, важно, чтобы процедура классификации была надежной в смысле последовательности: разные люди должны кодировать один и тот же текст одинаково». [18] Достоверность, межкодирующая надежность и внутрикодирующая надежность являются предметом интенсивных методологических исследований в течение долгих лет. [5] Нойендорф предполагает, что при использовании человеческих кодировщиков в контент-анализе следует использовать по крайней мере двух независимых кодировщиков. Надежность человеческого кодирования часто измеряется с помощью статистической меры межкодирующей надежности или «объема согласия или соответствия между двумя или более кодировщиками». [4] Лейси и Рифф определяют измерение межкодирующей надежности как сильную сторону количественного контент-анализа, утверждая, что, если контент-аналитики не измеряют межкодирующую надежность, их данные не более надежны, чем субъективные впечатления одного читателя. [19]

Согласно сегодняшним стандартам отчетности, количественные контент-анализы должны публиковаться с полными кодовыми книгами, и для всех переменных или мер в кодовой книге должны сообщаться соответствующие коэффициенты межкодировочной или межоценочной надежности на основе эмпирических предварительных тестов. [4] [20] [21] Кроме того, должна быть обеспечена валидность всех переменных или мер в кодовой книге. Этого можно достичь с помощью установленных мер, которые доказали свою валидность в более ранних исследованиях. Кроме того, валидность содержания мер может быть проверена экспертами из области, которые тщательно изучают, а затем одобряют или корректируют инструкции по кодированию, определения и примеры в кодовой книге.

Виды текста

В контент-анализе выделяют пять типов текстов:

  1. письменный текст , такой как книги и статьи
  2. устный текст, такой как речь и театральное представление
  3. иконический текст, такой как рисунки, картины и значки
  4. аудиовизуальный текст, такой как телепрограммы, фильмы и видеоролики
  5. гипертексты , которые представляют собой тексты, найденные в Интернете

История

Контент-анализ — это исследование, использующее категоризацию и классификацию речи, письменного текста, интервью, изображений или других форм коммуникации. В самом начале, с использованием первых газет в конце 19 века, анализ проводился вручную путем измерения количества колонок, посвященных теме. Этот подход также можно проследить до студента университета, изучавшего закономерности в литературе Шекспира в 1893 году. [22]

На протяжении многих лет контент-анализ применялся в различных областях. Герменевтика и филология давно используют контент-анализ для интерпретации священных и мирских текстов и, во многих случаях, для определения авторства и подлинности текстов . [3] [5]

В последнее время, особенно с появлением массовой коммуникации , контент-анализ стал все чаще использоваться для глубокого анализа и понимания медиа-контента и медиа-логики. Политолог Гарольд Лассуэлл сформулировал основные вопросы контент-анализа в его общепринятой версии начала-середины 20-го века: «Кто что говорит, кому, почему, в какой степени и с каким эффектом?». [23] Сильный акцент на количественном подходе, начатый Лассуэллом, был в конечном итоге осуществлен другим «отцом» контент-анализа, Бернардом Берельсоном , который предложил определение контент-анализа, которое с этой точки зрения является символичным: «метод исследования для объективного, систематического и количественного описания явного содержания коммуникации». [24]

Количественный контент-анализ вновь обрел популярность в последние годы благодаря технологическим достижениям и плодотворному применению в исследованиях массовой коммуникации и личной коммуникации. Контент-анализ текстовых больших данных , созданных новыми медиа , в частности социальными сетями и мобильными устройствами, стал популярным. Эти подходы используют упрощенный взгляд на язык, который игнорирует сложность семиозиса , процесса, посредством которого смысл формируется из языка. Количественные контент-аналитики подвергались критике за ограничение сферы контент-анализа простым подсчетом и за применение методологий измерения естественных наук без критического размышления об их уместности в социальных науках. [25] И наоборот, качественные контент-аналитики подвергались критике за недостаточную систематичность и излишнюю импрессионистичность. [25] Криппендорф утверждает, что количественные и качественные подходы к контент-анализу, как правило, пересекаются, и что не может быть обобщенного вывода о том, какой подход лучше. [25]

Анализ контента можно также описать как изучение следов , которые являются документами прошлых времен, и артефактов, которые являются нелингвистическими документами. Тексты понимаются как созданные процессами коммуникации в широком смысле этой фразы — часто приобретая значение через похищение . [3] [26]

Скрытое и явное содержание

Явное содержание легко понять по его номинальной стоимости. Его значение прямое. Скрытое содержание не столь явно и требует интерпретации, чтобы раскрыть значение или подтекст. [27]

Использует

Холсти группирует пятнадцать вариантов использования контент-анализа в три основные категории : [28]

Он также помещает эти варианты использования в контекст базовой парадигмы коммуникации .

В следующей таблице показаны пятнадцать вариантов использования контент-анализа с точки зрения их общей цели, элемента парадигмы коммуникации, к которому они применяются, и общего вопроса, на который они призваны ответить.

В качестве контрапункта, существуют ограничения на область использования процедур, которые характеризуют контент-анализ. В частности, если доступ к цели анализа может быть получен прямыми средствами без материального вмешательства, то методы прямого измерения дают лучшие данные. [30] Таким образом, в то время как контент-анализ пытается количественно описать сообщения , характеристики которых в первую очередь категориальны — обычно ограничены номинальной или порядковой шкалой — через выбранные концептуальные единицы ( единица ), которым присваиваются значения ( категория ) для перечисления при мониторинге межкодовой надежности , если вместо этого целевая величина явно уже напрямую измерима — обычно по шкале интервалов или отношений — особенно непрерывная физическая величина, то такие цели обычно не включаются в число тех, которые нуждаются в «субъективных» выборах и формулировках контент-анализа. [31] [32] [33] [34] [35] [36] [20] [37] Например (из смешанных исследований и клинического применения), поскольку медицинские изображения сообщают диагностические признаки врачам, шкала объема инсульта ( инфаркта) нейровизуализации , называемая ASPECTS, унифицирована как 10 качественно очерченных (неравных) областей мозга в зоне средней мозговой артерии , которые она классифицирует как по крайней мере частично или совсем неинфарктные, чтобы перечислить последние, при этом опубликованные серии часто оценивают надежность интеркодера с помощью каппы Коэна . Вышеуказанные курсивом операции накладывают некредитованную форму анализа содержимого на оценку степени инфаркта, которая вместо этого достаточно легко и более точно измеряется как объем непосредственно на изображениях. [38] [39] («Точность... является высшей формой надежности». [40] ) Однако сопутствующая клиническая оценка по шкале инсульта Национального института здравоохранения (NIHSS) или модифицированной шкале Рэнкина (mRS) сохраняет необходимую форму контент-анализа. Признавая потенциальные ограничения контент-анализа как в отношении содержания языка, так и изображений, Клаус Криппендорф утверждает, что «понимание... может... вообще не соответствовать процессу классификации и/или подсчета, с помощью которого осуществляется большинство контент-анализов», [41] предполагая, что контент-анализ может существенно исказить сообщение.

Разработка первоначальной схемы кодирования

Процесс начальной схемы кодирования или подхода к кодированию зависит от выбранного подхода к контент-анализу. С помощью направленного контент-анализа ученые разрабатывают предварительную схему кодирования на основе уже существующей теории или предположений. В то время как при традиционном подходе к контент-анализу начальная схема кодирования разрабатывается на основе данных.

Обычный процесс кодирования

С любым из подходов выше исследователи могут погрузиться в данные, чтобы получить общую картину. Последовательная и ясная единица кодирования имеет жизненно важное значение, с выбором от одного слова до нескольких абзацев и от текстов до иконических символов. Наконец, исследователи выстраивают отношения между кодами, сортируя их по определенным категориям или темам. [42]

Смотрите также

Ссылки

  1. ^ Брайман, Алан; Белл, Эмма (2011). Методы бизнес-исследований (3-е изд.). Кембридж: Oxford University Press. ISBN 9780199583409. OCLC  746155102.
  2. ^ Hodder, I. (1994). Интерпретация документов и материальной культуры. Thousand Oaks и т. д.: Sage. стр. 155. ISBN 978-0761926870.
  3. ^ abc Типальдо, Г. (2014). Анализ контента и средств массовой информации. Болонья, IT: Иль Мулино. п. 42. ИСБН 978-88-15-24832-9.
  4. ^ abcd Кимберли А. Нойендорф (30 мая 2016 г.). Руководство по контент-анализу. SAGE. ISBN 978-1-4129-7947-4.
  5. ^ abc Криппендорф, Клаус (2004). Анализ контента: Введение в его методологию (2-е изд.). Thousand Oaks, CA: Sage. стр. 413. ISBN 9780761915454.
  6. ^ Vaismoradi, Mojtaba; Turunen, Hannele; Bondas, Terese (2013-09-01). «Анализ контента и тематический анализ: последствия для проведения качественного описательного исследования». Nursing & Health Sciences . 15 (3): 398–405. doi : 10.1111/nhs.12048 . ISSN  1442-2018. PMID  23480423. S2CID  10881485.
  7. ^ ab Kracauer, Siegfried (1952). «Проблема качественного контент-анализа». Public Opinion Quarterly . 16 (4, Специальный выпуск по международным исследованиям в области коммуникаций): 631. doi :10.1086/266427. ISSN  0033-362X.
  8. ^ ab White, Marilyn Domas; Marsh, Emily E. (2006). «Анализ контента: гибкая методология». Library Trends . 55 (1): 22–45. doi :10.1353/lib.2006.0053. hdl : 2142/3670 . ISSN  1559-0682. S2CID  6342233.
  9. ^ Омер-Педрацци, Франциска; Кесслер, Сабрина; Гумпрехт, Эдда; Соммер, Катарина; Кастро Эрреро, Лайя (2022). «DOCA — База данных категорий для контент-анализа». ISSN  2673-8597.
  10. ^ Вульф, Тим; Посслер, Даниэль; Брейер, Йоханнес (2021). «Сексуализация (видеоигры)». DOCA — База данных переменных для анализа контента . doi : 10.34778/3e . ISSN  2673-8597. S2CID  233683109.
  11. ^ Исав, Катарина (2021). «Речь вражды (Речь вражды/Невежливость)». DOCA — База данных переменных для анализа контента . doi : 10.34778/5a . ISSN  2673-8597. S2CID  235551271.
  12. ^ Дёринг, Никола; Вальтер, Роберто (2022). «Иконография сексуального насилия над детьми в новостях (репортажи о правосудии и преступлениях)». DOCA — База данных переменных для анализа контента . doi : 10.34778/2zu . ISSN  2673-8597. S2CID  248329276.
  13. ^ Лейдекер-Сандманн, Мелани (2021). «Персонализация (Освещение избирательной кампании)». DOCA — База данных переменных для анализа контента . doi : 10.34778/2g . ISSN  2673-8597. S2CID  235520184.
  14. ^ Пфайффер, Сильвия, Стефан Фишер и Вольфганг Эффельсберг. «Автоматический анализ аудиоконтента». Технические отчеты 96 (1996).
  15. ^ Гриммер, Джастин и Брэндон М. Стюарт. «Текст как данные: перспективы и подводные камни методов автоматического анализа контента для политических текстов». Политический анализ 21.3 (2013): 267-297.
  16. ^ Насукава, Тетсуя и Чонхи Йи. «Анализ настроений: получение благоприятных отзывов с помощью обработки естественного языка». Труды 2-й международной конференции по получению знаний. ACM, 2003.
  17. ^ Конвей, Майк (март 2006 г.). «Субъективная точность компьютеров: методологическое сравнение с человеческим кодированием в контент-анализе». Journalism & Mass Communication Quarterly . 83 (1): 186–200. doi :10.1177/107769900608300112. ISSN  1077-6990. S2CID  143292050.
  18. ^ Вебер, Роберт Филип (1990). Базовый контент-анализ (2-е изд.). Ньюбери-Парк, Калифорния: Sage. стр. 12. ISBN 9780803938632.
  19. ^ Лейси, Стивен Р.; Рифф, Дэниел (1993). «Грехи бездействия и участия в количественном исследовании массовой коммуникации». Journalism & Mass Communication Quarterly . 70 (1): 126–132. doi :10.1177/107769909307000114. S2CID  144076335.
  20. ^ ab Krippendorff, Klaus (2004). Анализ контента: Введение в его методологию (2-е изд.). Thousand Oaks, CA: Sage. стр. (в разных местах). ISBN 0761915451. (О количественной природе контент-анализа, унификации и категоризации, а также об использовании по типу шкалы).
  21. ^ Олейник, Антон; Попова, Ирина; Кирдина, Светлана; Шаталова, Татьяна (2014). «О выборе мер надежности и валидности в контент-анализе текстов». Качество и количество . 48 (5): 2703–2718. doi :10.1007/s11135-013-9919-0. ISSN  1573-7845. S2CID  144174429.
  22. ^ Sumpter, Randall S. (июль 2001 г.). «Новости о новостях». История журналистики . 27 (2): 64–72. doi :10.1080/00947679.2001.12062572. ISSN  0094-7679. S2CID  140499059.
  23. ^ Лассуэлл, Гарольд (1948). «Структура и функция коммуникации в обществе». В Bryson, L. (ред.). Коммуникация идей (PDF) . Нью-Йорк: Harper and Row. стр. 216.
  24. ^ Берельсон, Б. (1952). Анализ содержания в исследовании коммуникации . Glencoe: Free Press. стр. 18.
  25. ^ abc Криппендорф, Клаус (2004). Анализ контента: Введение в его методологию . Калифорния: Sage. С. 87–89. ISBN 978-0-7619-1544-7.
  26. ^ Timmermans, Stefan; Tavory, Iddo (2012). "Theory Construction in Qualitative Research" (PDF) . Sociological Theory . 30 (3): 167–186. doi :10.1177/0735275112457914. S2CID  145177394. Архивировано из оригинала (PDF) 2019-08-19 . Получено 2018-12-09 .
  27. ^ Джанг-Хван Ли; Ён-Гуль Ким; Сон-Хо Ю (2001). "Модель этапа для управления знаниями". Труды 34-й ежегодной Гавайской международной конференции по системным наукам . IEEE Comput. Soc. стр. 10. doi :10.1109/hicss.2001.927103. ISBN 0-7695-0981-9. S2CID  34182315.
  28. ^ abc Holsti, Ole R. (1969). Анализ контента для социальных и гуманитарных наук . Reading, MA: Addison-Wesley. стр. 14–93. (Таблица 2-1, стр. 26).
  29. ^ Берельсон, Бернард (1952). Анализ содержания в исследованиях коммуникации . Гленко, Иллинойс: Free Press.
  30. ^ Холсти, Оле Р. (1969). Анализ контента для социальных и гуманитарных наук . Reading, MA: Addison-Wesley. С. 15–16.
  31. ^ Холсти, Оле Р. (1969). Анализ содержания для социальных и гуманитарных наук . Reading, MA: Addison-Wesley.
  32. ^ Нойендорф, Кимберли А. (2002). Руководство по контент-анализу . Thousand Oaks, CA: Sage. стр. 52–54. ISBN 0761919783. (Об описательной роли контент-анализа).
  33. ^ Агрести, Алан (2002). Категориальный анализ данных (2-е изд.). Хобокен, Нью-Джерси: Уайли. стр. 2–4. ISBN 0471360937. (О значениях «категориальных» и других шкал измерения).
  34. ^ Дельфико, Джозеф Ф. (1996). Анализ контента: Методология структурирования и анализа письменных материалов. Вашингтон, округ Колумбия: Главное бюджетно-контрольное управление США. С. 19–21. (Ссылка на PDF).
  35. ^ Дельфико, Джозеф Ф. (1996). Анализ контента: Методология структурирования и анализа письменных материалов. Вашингтон, округ Колумбия: Главное контрольно-ревизионное управление США. (Транскрипция ASCII; Глава 3:1.1, об использовании в соответствии с типом шкалы, и Приложение III, о надежности интеркодера).
  36. ^ Карни, Т[омас] Ф[рансис] (1971). «Анализ контента: обзорное эссе». Информационный бюллетень «Исторические методы » . 4 (2): 52–61. doi :10.1080/00182494.1971.10593939. (О количественной природе анализа контента, унификации и категоризации, а также описательной роли).
  37. ^ Холл, Кэлвин С.; Ван де Касл, Роберт Л. (1966). Анализ содержания сновидений . Нью-Йорк: Appleton-Century-Crofts. стр. 1–16. (Глава 1, «Методология анализа содержания», о количественной природе и использовании анализа содержания, и цитата «субъективный» со страницы 12).
  38. ^ Suss, Richard A. (2020). «ASPECTS, неправильное измерение инсульта: метрологическое исследование». Препринты OSF . doi :10.31219/osf.io/c4tkp. S2CID  242764761. (§3, §6 и §7 о природе, рисках и альтернативах ASPECTS, а также страница 76 для сравнения с контент-анализом).
  39. ^ Сасс, Ричард А.; Пиньо, Марко К. (2020). «АСПЕКТЫ искажают измерение объема инфаркта». Американский журнал нейрорадиологии . 41 (5): Е28. doi : 10.3174/ajnr.A6485. ПМЦ 7228155 . PMID  32241774. S2CID  214767536. 
  40. ^ Вебер, Роберт Филип (1990). Базовый контент-анализ (2-е изд.). Ньюбери-Парк, Калифорния: Sage. стр. 17. ISBN 0803938632.
  41. ^ Криппендорф, Клаус (1974). «Обзор книги Томаса Ф. Карни «Анализ контента: метод систематического вывода из коммуникаций». University of Pennsylvania Scholarly Commons, Annenberg School of Communication Departmental Papers . (Цитата с 4-й страницы, без номера).
  42. ^ Фрей, Брюс Б. (2018). Анализ контента. Sage. doi :10.4135/9781506326139. ISBN 9781506326153. S2CID  4110403 . Получено 16 декабря 2019 г. .

Дальнейшее чтение