Юзабилити-тестирование — это метод, используемый при проектировании взаимодействия, ориентированного на пользователя, для оценки продукта путем его тестирования на пользователях. Это можно рассматривать как незаменимую практику юзабилити , поскольку она дает прямую информацию о том, как реальные пользователи используют систему. [1] Он больше ориентирован на интуитивно понятный дизайн продукта и тестируется на пользователях, которые ранее не сталкивались с ним. Такое тестирование имеет первостепенное значение для успеха конечного продукта, поскольку полностью функционирующее приложение, вызывающее путаницу среди пользователей, не просуществует долго. [2] Это контрастирует с методами проверки юзабилити , где эксперты используют разные методы для оценки пользовательского интерфейса без привлечения пользователей.
Юзабилити-тестирование фокусируется на измерении способности созданного человеком продукта достигать поставленных целей. Примерами продуктов, которые обычно выигрывают от юзабилити-тестирования, являются продукты питания , потребительские товары, веб-сайты или веб-приложения, компьютерные интерфейсы , документы и устройства. Юзабилити-тестирование измеряет удобство использования или простоту использования конкретного объекта или набора объектов, тогда как общие исследования взаимодействия человека и компьютера пытаются сформулировать универсальные принципы.
Простой сбор мнений об объекте или документе — это исследование рынка или качественное исследование , а не тестирование удобства использования. Юзабилити-тестирование обычно включает систематическое наблюдение в контролируемых условиях, чтобы определить, насколько хорошо люди могут использовать продукт. [3] Однако часто качественные исследования и тестирование юзабилити используются в сочетании, чтобы лучше понять мотивацию/восприятие пользователей, а также их действия.
Вместо того, чтобы показывать пользователям черновой вариант и спрашивать: «Вы это понимаете?», юзабилити-тестирование предполагает наблюдение за людьми, пытающимися использовать что-то по назначению. Например, при тестировании инструкций по сборке игрушки испытуемым следует дать инструкцию и коробку с деталями, и вместо того, чтобы просить прокомментировать детали и материалы, их следует попросить собрать игрушку вместе. Формулировка инструкций, качество иллюстраций и дизайн игрушки — все это влияет на процесс сборки.
Организация юзабилити-теста предполагает тщательное создание сценария или реалистичной ситуации, в которой человек выполняет список задач с использованием тестируемого продукта, а наблюдатели наблюдают и делают заметки ( динамическая проверка ). Некоторые другие инструменты тестирования , такие как инструкции по сценарию, бумажные прототипы и анкеты до и после тестирования, также используются для сбора отзывов о тестируемом продукте ( статическая проверка ). Например, чтобы протестировать функцию вложения в программе электронной почты , сценарий должен описывать ситуацию, когда человеку необходимо отправить вложение к электронному письму, и просить его выполнить эту задачу. Цель состоит в том, чтобы реалистично наблюдать за тем, как люди функционируют, чтобы разработчики могли выявить проблемные области и исправить их. Методы, широко используемые для сбора данных во время юзабилити-теста, включают протокол «мысль вслух» , совместное обучение и отслеживание взгляда .
Коридорное тестирование , также известное как партизанское юзабилити , — это быстрый и дешевый метод тестирования юзабилити, при котором людей (например, тех, кто проходит мимо в коридоре) просят попробовать использовать продукт или услугу. Это может помочь дизайнерам выявить «кирпичные стены» — проблемы настолько серьезные, что пользователи просто не могут продвинуться вперед на ранних стадиях нового проекта. Можно использовать кого угодно, кроме проектировщиков и инженеров (они, как правило, действуют как «эксперты-рецензенты», поскольку слишком близки к проекту).
Этот тип тестирования является примером удобной выборки , поэтому результаты потенциально необъективны.
В сценарии, когда оценщики юзабилити, разработчики и потенциальные пользователи находятся в разных странах и часовых поясах, проведение традиционной лабораторной оценки юзабилити создает проблемы как с точки зрения затрат, так и с точки зрения логистики. Эти опасения привели к исследованию удаленной оценки удобства использования, когда пользователь и оценщики разделены в пространстве и времени. Удаленное тестирование, которое облегчает проведение оценок в контексте других задач и технологий пользователя, может быть синхронным или асинхронным. Первый вариант предполагает индивидуальную связь между оценщиком и пользователем в режиме реального времени, а второй предполагает работу оценщика и пользователя раздельно. [4] Для удовлетворения потребностей обоих этих подходов доступны многочисленные инструменты.
Методологии синхронного тестирования удобства использования включают видеоконференции или инструменты удаленного совместного использования приложений, такие как WebEx. WebEx и GoToMeeting — наиболее часто используемые технологии для проведения синхронного удаленного теста удобства использования. [5] Однако синхронному удаленному тестированию может не хватать оперативности и ощущения «присутствия», необходимых для поддержки процесса совместного тестирования. Более того, управление межличностной динамикой, преодолевая культурные и языковые барьеры, может потребовать подходов, учитывающих вовлеченные культуры. Другие недостатки включают снижение контроля над средой тестирования, а также отвлекающие факторы и помехи, с которыми сталкиваются участники в своей родной среде. [6] Одним из новых методов, разработанных для проведения синхронного удаленного тестирования удобства использования, является использование виртуальных миров. [7]
Асинхронные методологии включают автоматический сбор потоков кликов пользователей, пользовательских журналов критических инцидентов, возникающих при взаимодействии с приложением, и субъективные отзывы пользователей об интерфейсе. [6] Подобно лабораторному исследованию, асинхронный удаленный тест на удобство использования основан на задачах, и платформа позволяет исследователям фиксировать клики и время выполнения задач. Следовательно, для многих крупных компаний это позволяет исследователям лучше понять намерения посетителей при посещении веб-сайта или мобильного сайта. Кроме того, этот стиль пользовательского тестирования также дает возможность сегментировать отзывы по демографическим, установочным и поведенческим типам. Тесты проводятся в собственной среде пользователя (а не в лабораториях), что позволяет дополнительно имитировать тестирование реальных сценариев. Этот подход также предоставляет возможность легко и быстро получать отзывы от пользователей в удаленных регионах с меньшими организационными накладными расходами. В последние годы асинхронное тестирование юзабилити также стало распространенным и позволяет тестировщикам предоставлять обратную связь в свободное время, не выходя из собственного дома.
Экспертная оценка — еще один общий метод тестирования юзабилити. Как следует из названия, этот метод основан на привлечении экспертов с опытом работы в этой области (возможно, из компаний, специализирующихся на тестировании юзабилити) для оценки удобства использования продукта.
Эвристическая оценка или аудит юзабилити — это оценка интерфейса одним или несколькими экспертами по человеческому фактору. Оценщики измеряют удобство использования, эффективность и результативность интерфейса на основе принципов юзабилити, таких как 10 эвристик юзабилити, первоначально определенных Якобом Нильсеном в 1994 году. [8]
Эвристика юзабилити Nielsen, которая продолжает развиваться в ответ на исследования пользователей и появление новых устройств, включает в себя:
Подобно экспертным оценкам, автоматизированные экспертные проверки обеспечивают тестирование удобства использования, но с использованием программ, заданных правилами хорошего дизайна и эвристики. Хотя автоматизированная проверка может не предоставлять столько деталей и информации, как отзывы людей, ее можно завершить быстрее и более последовательно. Идея создания суррогатных пользователей для тестирования юзабилити — амбициозное направление для сообщества искусственного интеллекта.
В веб-разработке и маркетинге A/B-тестирование или сплит-тестирование — это экспериментальный подход к веб-дизайну (особенно дизайну взаимодействия с пользователем), целью которого является выявление изменений в веб-страницах, которые увеличивают или максимизируют интересующий результат (например, рейтинг кликов). для баннерной рекламы). Как следует из названия, сравниваются две версии (A и B), которые идентичны, за исключением одного варианта, который может повлиять на поведение пользователя. Версия A может быть той, которая используется в настоящее время, а версия B в некотором отношении модифицирована. Например, на веб-сайте электронной коммерции воронка покупок обычно является хорошим кандидатом для A/B-тестирования, поскольку даже незначительное улучшение показателей отказа может привести к значительному увеличению продаж. Значительные улучшения можно увидеть при тестировании таких элементов, как текст, макеты, изображения и цвета.
Многовариантное тестирование или пакетное тестирование похоже на A/B-тестирование, но проверяет более двух версий одновременно.
В начале 1990-х годов Якоб Нильсен , в то время исследователь Sun Microsystems , популяризировал концепцию использования многочисленных небольших юзабилити-тестов — обычно всего с пятью участниками каждый — на различных этапах процесса разработки. Его аргумент заключается в том, что, как только обнаруживается, что два или три человека полностью сбиты с толку главной страницей, мало что можно получить, наблюдая, как больше людей страдают от того же ошибочного дизайна. «Тщательно продуманные юзабилити-тесты — это пустая трата ресурсов. Наилучшие результаты можно получить, тестируя не более пяти пользователей и проводя столько небольших тестов, сколько вы можете себе позволить». [9]
Утверждение «пяти пользователей достаточно» позже было описано с помощью математической модели [10] , которая определяет долю нераскрытых проблем U
где p — вероятность того, что один испытуемый идентифицирует конкретную проблему, а n — количество испытуемых (или тестовых сессий). Эта модель выглядит как асимптотический график количества реально существующих проблем (см. рисунок ниже).
В более поздних исследованиях утверждение Нильсена было подвергнуто сомнению с использованием как эмпирических данных [11], так и более продвинутых математических моделей . [12] Два ключевых аргумента против этого утверждения:
Стоит отметить, что Nielsen не призывает останавливаться после одного теста с пятью пользователями; его точка зрения заключается в том, что тестирование с пятью пользователями, исправление обнаруженных ими проблем, а затем тестирование измененного сайта с пятью разными пользователями — это лучшее использование ограниченных ресурсов, чем проведение одного теста юзабилити с 10 пользователями. На практике тесты проводятся один или два раза в неделю в течение всего цикла разработки с использованием от трех до пяти испытуемых в каждом раунде, а результаты доставляются разработчикам в течение 24 часов. Таким образом, количество пользователей, фактически протестированных в ходе проекта, может легко достигать 50–100 человек. Исследования показывают, что пользовательское тестирование, проводимое организациями, чаще всего предполагает набор 5-10 участников. [14]
На ранней стадии, когда пользователи, скорее всего, сразу же столкнутся с проблемами, которые останавливают их на пути, в качестве испытуемого можно использовать практически любого человека с нормальным интеллектом. На втором этапе тестировщики будут набирать испытуемых с широким спектром способностей. Например, в одном исследовании опытные пользователи не выявили проблем при использовании любого дизайна, от первого до последнего, в то время как как наивные пользователи, так и самопровозглашенные опытные пользователи неоднократно терпели неудачу. [15] Позже, когда конструкция станет более гладкой, пользователей следует набирать из целевой группы населения.
Когда метод применяется к достаточному количеству людей в ходе проекта, возражения, выдвинутые выше, устраняются: размер выборки перестает быть маленьким, и обнаруживаются проблемы с удобством использования, которые возникают лишь у случайных пользователей. Ценность метода заключается в том, что однажды возникшие конкретные проблемы проектирования больше никогда не встречаются, поскольку они немедленно устраняются, а детали, которые кажутся удачными, тестируются снова и снова. Хотя это правда, что первоначальные проблемы дизайна могут быть протестированы только пятью пользователями, при правильном применении метода те части дизайна, которые сработали в этом первоначальном тесте, будут протестированы от 50 до 100 человек.
Руководство Apple Computer 1982 года для разработчиков, содержащее рекомендации по тестированию удобства использования: [16]
Apple посоветовала разработчикам: «Вам следует начать тестирование как можно скорее, используя привлеченных друзей, родственников и новых сотрудников»: [16]
Наш метод тестирования заключается в следующем. Мы оборудовали комнату с пятью-шестью компьютерными системами. Мы назначаем две-три группы по пять-шесть пользователей одновременно для тестирования систем (часто они не знают, что мы тестируем именно программное обеспечение, а не систему). У нас в комнате два дизайнера. Еще меньше, и они упускают многое из того, что происходит. Еще немного — и у пользователей возникает ощущение, будто кто-то всегда дышит им в шею.
Дизайнеры должны лично наблюдать за тем, как люди используют программу, потому что [16]
Девяносто пять процентов камней преткновения обнаруживаются при наблюдении за языком тела пользователей. Следите за прищуренными глазами, сгорбленными плечами, покачиванием голов и глубокими, сердечными вздохами. Когда пользователь сталкивается с препятствием, он предполагает, что это «поскольку он не слишком умен»: он не сообщит об этом; он это скроет... Не делайте предположений о том, почему пользователь запутался. Спроси его. Вы часто будете удивлены, узнав, что, по мнению пользователя, делала программа в тот момент, когда он заблудился.
Юзабилити-тестирование было формальным предметом академического обучения по различным дисциплинам. [17] Юзабилити-тестирование важно для изучения композиции и онлайн-инструкций по письму (OWI). [18] Ученый Коллин Бьорк утверждает, что тестирование юзабилити «необходимо, но недостаточно для разработки эффективного OWI, если только оно не сочетается с теориями цифровой риторики ». [19]
Продукты опроса включают бумажные и цифровые опросы , формы и инструменты, которые могут быть заполнены или использованы респондентом опроса самостоятельно или вместе со сборщиком данных. Юзабилити-тестирование чаще всего проводится в веб-опросах и фокусируется на том, как люди взаимодействуют с опросом, например, навигация по опросу, ввод ответов на опросы и поиск справочной информации. Юзабилити-тестирование дополняет традиционные методы предварительного тестирования опросов , такие как когнитивное предварительное тестирование (то, как люди понимают продукты), пилотное тестирование (как будут работать процедуры опроса) и экспертная оценка профильным экспертом в области методологии опроса . [20]
Тестирование юзабилити переведенных продуктов опросов показало, что «культурная пригодность» должна учитываться на уровне предложений и слов, а также в дизайне ввода данных и навигации [21] , а также что представление перевода и визуальных подсказок общих функций (вкладки, гиперссылки) , раскрывающиеся меню и URL-адреса ) помогают улучшить взаимодействие с пользователем. [22]
{{cite journal}}
: Требуется цитировать журнал |journal=
( помощь )