Тестирование копирования — это специализированная область маркетинговых исследований , которая определяет эффективность рекламы на основе ответов потребителей, отзывов и поведения. Также известное как предварительное тестирование, оно может охватывать все медиаканалы, включая телевидение, печать, радио, наружную рекламу, интернет и социальные сети .
Автоматизированное тестирование копирования — это специализированный тип цифрового маркетинга, специально связанный с цифровой рекламой. Это подразумевает использование программного обеспечения для развертывания копийных вариаций цифровой рекламы в реальной среде и сбора данных от реальных пользователей. Эти автоматизированные тесты копирования обычно используют Z-тест для определения статистической значимости результатов. Если конкретная вариация объявления превосходит базовый уровень в тесте копирования до желаемого уровня статистической значимости, маркетолог должен использовать эту новую вариацию копирования.
В 1982 году консорциум из 21 ведущего рекламного агентства — включая NW Ayer , D'Arcy , Grey , McCann Erickson , Needham Harper & Steers , Ogilvy & Mather , J. Walter Thompson и Young & Rubicam — выпустил публичный документ, излагающий принципы PACT (Positioning Advertising Copy Testing), которые составляют хорошую систему тестирования копирования. PACT утверждает, что хорошая система тестирования копирования должна соответствовать следующим критериям:
Преобладающая мера тестирования копирования в 1950-х и 1960-х годах, Burke's Day-After Recall (DAR) была интерпретирована как измерение способности рекламы «прорываться» в сознание потребителя и регистрировать сообщение бренда в долгосрочной памяти (Honomichl). После того, как эта мера была принята Procter and Gamble, она стала основным элементом исследований (Honomichl).
В 70-х, 80-х и 90-х годах усилия по проверке не обнаружили никакой связи между оценками отзыва и фактическими продажами (Adams & Blair; Blair; Blair & Kuse; Blair & Rabuck; Jones; Jones & Blair; MASB; Mondello; Stewart). Например, Procter and Gamble рассмотрела 10-летние тесты сплит-кабелей (всего 100) и не обнаружила никакой значимой связи между оценками отзыва и продажами (Young, стр. 3–30). Кроме того, Леонард Лодиш из Уортонского университета провел еще более обширный обзор результатов тестового рынка и также не смог найти связь между отзывом и продажами (Lodish, стр. 125–139).
В 1970-х годах также произошел пересмотр меры «прорыва». В результате было проведено важное различие между силой привлечения внимания творческого исполнения и тем, насколько хорошо «брендирована» была реклама. Таким образом, родились отдельные меры внимания и брендинга (Янг, стр. 12).
В 1970-х и 1980-х годах, после того как было установлено, что DAR является плохим предсказателем продаж, исследовательская индустрия начала зависеть от меры убеждения как точного предсказателя продаж. Этот сдвиг был частично инициирован исследователем Горацием Шверином, который указал, что «очевидная истина заключается в том, что утверждение может быть хорошо запомнено, но совершенно неважно для потенциального покупателя продукта — решение, предлагаемое маркетологом, адресовано неправильной потребности» (Honomichl). Как и в случае с DAR, принятие Procter and Gamble меры убеждения ARS (также известной как предпочтение бренда ) сделало ее отраслевым стандартом. Оценки отзыва по-прежнему предоставлялись в отчетах о тестировании копирования с пониманием того, что убеждение было мерой, которая имела значение (Honomichl).
Гарольд Росс из Mapes & Ross обнаружил, что убеждение является лучшим предиктором продаж, чем припоминание (Росс), а прогностическая валидность убеждения ARS в отношении продаж была описана в нескольких рецензируемых публикациях (Адамс и Блэр; Джонс и Блэр; MASB; Монделло).
Основная цель диагностических мер — оптимизация. Понимание диагностических мер может помочь рекламодателям выявить творческие возможности для улучшения исполнения (Янг, стр. 7).
Невербальные измерения были разработаны в ответ на убеждение, что большую часть эффектов рекламы – например, эмоциональное воздействие – респондентам может быть трудно выразить словами или масштабировать в вербальных оценочных заявлениях. Фактически, многие считают, что эффекты рекламы могут работать ниже уровня сознания (Янг, стр. 7). По словам исследователя Чака Янга, «Есть что-то в прекрасных звуках нашей любимой музыки, что мы не можем выразить словами – и это трогает нас способами, которые мы не можем выразить» (Янг, стр. 22).
В 1970-х годах исследователи пытались измерить эти невербальные показатели биологически, отслеживая активность мозговых волн, когда респонденты смотрели рекламу (Кругман). Другие экспериментировали с гальванической реакцией кожи, анализом высоты голоса и отслеживанием глаз (Янг, стр. 22). Эти усилия не были приняты общественностью, отчасти из-за ограничений технологии, а также низкой экономической эффективности того, что широко воспринималось как академическое, а не действенное исследование.
В начале 1980-х годов сдвиг в аналитической перспективе от представления о рекламе как о фундаментальной единице измерения, которая должна оцениваться в целом, к представлению о ней как о структурированном потоке опыта, привел к экспериментам с системами, измеряемыми поминутно. Наиболее популярным из них был ответ «набери-а-метр», который требовал от респондентов поворачивать счетчик в градусах к одному концу шкалы или к другому, чтобы выразить свое мнение о том, что было на экране в тот момент.
Совсем недавно исследовательские компании начали использовать психологические тесты, такие как эффект Струпа , для измерения эмоционального воздействия текста. Эти методы используют идею о том, что зрители не знают, почему они реагируют на продукт, изображение или рекламу определенным образом (или что они вообще реагируют), потому что такие реакции происходят вне осознания, через изменения в сетях мыслей, идей и образов.
Модерируемое исследователем эмпирическое тестирование и немодерируемые платформы тестирования оценивают неявную и бессознательную предвзятость в разработке вопросов опроса для маркетинговых исследований. [1]
Тестирование копирования используется в ряде областей, от коммерческого развития до президентских выборов. В 2007 году CNN использовала эту форму тестирования рынка на всех предварительных и всеобщих выборах. Рита Кирк и Дэн Шилл из Южного методистского университета работали с CNN, чтобы оценить реакцию избирателей на дебаты между претендентами на пост президента. (http://www.cnn.com/2011/POLITICS/06/14/dial.testing/index.html)