Юзабилити-тестирование

Юзабилити-тестирование — это метод, используемый при проектировании взаимодействия, ориентированного на пользователя, для оценки продукта путем его тестирования на пользователях. Это можно рассматривать как незаменимую практику юзабилити , поскольку она дает прямую информацию о том, как реальные пользователи используют систему. ^[1] Он больше ориентирован на интуитивно понятный дизайн продукта и тестируется на пользователях, которые ранее не сталкивались с ним. Такое тестирование имеет первостепенное значение для успеха конечного продукта, поскольку полностью функционирующее приложение, вызывающее путаницу среди пользователей, не просуществует долго. ^[2] Это контрастирует с методами проверки юзабилити , где эксперты используют разные методы для оценки пользовательского интерфейса без привлечения пользователей.

Юзабилити-тестирование фокусируется на измерении способности созданного человеком продукта достигать поставленных целей. Примерами продуктов, которые обычно выигрывают от юзабилити-тестирования, являются продукты питания , потребительские товары, веб-сайты или веб-приложения, компьютерные интерфейсы , документы и устройства. Юзабилити-тестирование измеряет удобство использования или простоту использования конкретного объекта или набора объектов, тогда как общие исследования взаимодействия человека и компьютера пытаются сформулировать универсальные принципы.

Что это не так

Простой сбор мнений об объекте или документе — это исследование рынка или качественное исследование , а не тестирование удобства использования. Юзабилити-тестирование обычно включает систематическое наблюдение в контролируемых условиях, чтобы определить, насколько хорошо люди могут использовать продукт. ^[3] Однако часто качественные исследования и тестирование юзабилити используются в сочетании, чтобы лучше понять мотивацию/восприятие пользователей, а также их действия.

Вместо того, чтобы показывать пользователям черновой вариант и спрашивать: «Вы это понимаете?», юзабилити-тестирование предполагает наблюдение за людьми, пытающимися использовать что-то по назначению. Например, при тестировании инструкций по сборке игрушки испытуемым следует дать инструкцию и коробку с деталями, и вместо того, чтобы просить прокомментировать детали и материалы, их следует попросить собрать игрушку вместе. Формулировка инструкций, качество иллюстраций и дизайн игрушки — все это влияет на процесс сборки.

Методы

Организация юзабилити-теста предполагает тщательное создание сценария или реалистичной ситуации, в которой человек выполняет список задач с использованием тестируемого продукта, а наблюдатели наблюдают и делают заметки ( динамическая проверка ). Некоторые другие инструменты тестирования , такие как инструкции по сценарию, бумажные прототипы и анкеты до и после тестирования, также используются для сбора отзывов о тестируемом продукте ( статическая проверка ). Например, чтобы протестировать функцию вложения в программе электронной почты , сценарий должен описывать ситуацию, когда человеку необходимо отправить вложение к электронному письму, и просить его выполнить эту задачу. Цель состоит в том, чтобы реалистично наблюдать за тем, как люди функционируют, чтобы разработчики могли выявить проблемные области и исправить их. Методы, широко используемые для сбора данных во время юзабилити-теста, включают протокол «мысль вслух» , совместное обучение и отслеживание взгляда .

Тестирование в коридоре

Коридорное тестирование , также известное как партизанское юзабилити , — это быстрый и дешевый метод тестирования юзабилити, при котором людей (например, тех, кто проходит мимо в коридоре) просят попробовать использовать продукт или услугу. Это может помочь дизайнерам выявить «кирпичные стены» — проблемы настолько серьезные, что пользователи просто не могут продвинуться вперед на ранних стадиях нового проекта. Можно использовать кого угодно, кроме проектировщиков и инженеров (они, как правило, действуют как «эксперты-рецензенты», поскольку слишком близки к проекту).

Этот тип тестирования является примером удобной выборки , поэтому результаты потенциально необъективны.

Удаленное тестирование юзабилити

В сценарии, когда оценщики юзабилити, разработчики и потенциальные пользователи находятся в разных странах и часовых поясах, проведение традиционной лабораторной оценки юзабилити создает проблемы как с точки зрения затрат, так и с точки зрения логистики. Эти опасения привели к исследованию удаленной оценки удобства использования, когда пользователь и оценщики разделены в пространстве и времени. Удаленное тестирование, которое облегчает проведение оценок в контексте других задач и технологий пользователя, может быть синхронным или асинхронным. Первый вариант предполагает индивидуальную связь между оценщиком и пользователем в режиме реального времени, а второй предполагает работу оценщика и пользователя раздельно. ^[4] Для удовлетворения потребностей обоих этих подходов доступны многочисленные инструменты.

Методологии синхронного тестирования удобства использования включают видеоконференции или инструменты удаленного совместного использования приложений, такие как WebEx. WebEx и GoToMeeting — наиболее часто используемые технологии для проведения синхронного удаленного теста удобства использования. ^[5] Однако синхронному удаленному тестированию может не хватать оперативности и ощущения «присутствия», необходимых для поддержки процесса совместного тестирования. Более того, управление межличностной динамикой, преодолевая культурные и языковые барьеры, может потребовать подходов, учитывающих вовлеченные культуры. Другие недостатки включают снижение контроля над средой тестирования, а также отвлекающие факторы и помехи, с которыми сталкиваются участники в своей родной среде. ^[6] Одним из новых методов, разработанных для проведения синхронного удаленного тестирования удобства использования, является использование виртуальных миров. ^[7]

Асинхронные методологии включают автоматический сбор потоков кликов пользователей, пользовательских журналов критических инцидентов, возникающих при взаимодействии с приложением, и субъективные отзывы пользователей об интерфейсе. ^[6] Подобно лабораторному исследованию, асинхронный удаленный тест на удобство использования основан на задачах, и платформа позволяет исследователям фиксировать клики и время выполнения задач. Следовательно, для многих крупных компаний это позволяет исследователям лучше понять намерения посетителей при посещении веб-сайта или мобильного сайта. Кроме того, этот стиль пользовательского тестирования также дает возможность сегментировать отзывы по демографическим, установочным и поведенческим типам. Тесты проводятся в собственной среде пользователя (а не в лабораториях), что позволяет дополнительно имитировать тестирование реальных сценариев. Этот подход также предоставляет возможность легко и быстро получать отзывы от пользователей в удаленных регионах с меньшими организационными накладными расходами. В последние годы асинхронное тестирование юзабилити также стало распространенным и позволяет тестировщикам предоставлять обратную связь в свободное время, не выходя из собственного дома.

Экспертиза

Экспертная оценка — еще один общий метод тестирования юзабилити. Как следует из названия, этот метод основан на привлечении экспертов с опытом работы в этой области (возможно, из компаний, специализирующихся на тестировании юзабилити) для оценки удобства использования продукта.

Эвристическая оценка или аудит юзабилити — это оценка интерфейса одним или несколькими экспертами по человеческому фактору. Оценщики измеряют удобство использования, эффективность и результативность интерфейса на основе принципов юзабилити, таких как 10 эвристик юзабилити, первоначально определенных Якобом Нильсеном в 1994 году. ^[8]

Эвристика юзабилити Nielsen, которая продолжает развиваться в ответ на исследования пользователей и появление новых устройств, включает в себя:

Видимость состояния системы
Соответствие системы и реального мира
Пользовательский контроль и свобода
Последовательность и стандарты
Предотвращение ошибок
Узнавание, а не припоминание
Гибкость и эффективность использования
Эстетичный и минималистичный дизайн
Помогите пользователям распознавать, диагностировать ошибки и устранять их.
Помощь и документация

Автоматизированная экспертиза

Подобно экспертным оценкам, автоматизированные экспертные проверки обеспечивают тестирование удобства использования, но с использованием программ, заданных правилами хорошего дизайна и эвристики. Хотя автоматизированная проверка может не предоставлять столько деталей и информации, как отзывы людей, ее можно завершить быстрее и более последовательно. Идея создания суррогатных пользователей для тестирования юзабилити — амбициозное направление для сообщества искусственного интеллекта.

А/Б тестирование

В веб-разработке и маркетинге A/B-тестирование или сплит-тестирование — это экспериментальный подход к веб-дизайну (особенно дизайну взаимодействия с пользователем), целью которого является выявление изменений в веб-страницах, которые увеличивают или максимизируют интересующий результат (например, рейтинг кликов). для баннерной рекламы). Как следует из названия, сравниваются две версии (A и B), которые идентичны, за исключением одного варианта, который может повлиять на поведение пользователя. Версия A может быть той, которая используется в настоящее время, а версия B в некотором отношении модифицирована. Например, на веб-сайте электронной коммерции воронка покупок обычно является хорошим кандидатом для A/B-тестирования, поскольку даже незначительное улучшение показателей отказа может привести к значительному увеличению продаж. Значительные улучшения можно увидеть при тестировании таких элементов, как текст, макеты, изображения и цвета.

Многовариантное тестирование или пакетное тестирование похоже на A/B-тестирование, но проверяет более двух версий одновременно.

Число участников

В начале 1990-х годов Якоб Нильсен , в то время исследователь Sun Microsystems , популяризировал концепцию использования многочисленных небольших юзабилити-тестов — обычно всего с пятью участниками каждый — на различных этапах процесса разработки. Его аргумент заключается в том, что, как только обнаруживается, что два или три человека полностью сбиты с толку главной страницей, мало что можно получить, наблюдая, как больше людей страдают от того же ошибочного дизайна. «Тщательно продуманные юзабилити-тесты — это пустая трата ресурсов. Наилучшие результаты можно получить, тестируя не более пяти пользователей и проводя столько небольших тестов, сколько вы можете себе позволить». ^[9]

Утверждение «пяти пользователей достаточно» позже было описано с помощью математической модели ^[10] , которая определяет долю нераскрытых проблем U

$U=1-(1-p)^{n}$

где p — вероятность того, что один испытуемый идентифицирует конкретную проблему, а n — количество испытуемых (или тестовых сессий). Эта модель выглядит как асимптотический график количества реально существующих проблем (см. рисунок ниже).

В более поздних исследованиях утверждение Нильсена было подвергнуто сомнению с использованием как эмпирических данных ^[11], так и более продвинутых математических моделей . ^[12] Два ключевых аргумента против этого утверждения:

Поскольку удобство использования связано с конкретной группой пользователей, такой небольшой размер выборки вряд ли будет репрезентативным для всей совокупности, поэтому данные такой небольшой выборки с большей вероятностью будут отражать группу выборки, чем совокупность, которую они могут представлять.
Не все проблемы юзабилити одинаково легко обнаружить. Неразрешимые проблемы замедляют общий процесс. В этих условиях прогресс процесса оказывается гораздо более поверхностным, чем предсказывает формула Нильсена/Ландауэра. ^[13]

Стоит отметить, что Nielsen не призывает останавливаться после одного теста с пятью пользователями; его точка зрения заключается в том, что тестирование с пятью пользователями, исправление обнаруженных ими проблем, а затем тестирование измененного сайта с пятью разными пользователями — это лучшее использование ограниченных ресурсов, чем проведение одного теста юзабилити с 10 пользователями. На практике тесты проводятся один или два раза в неделю в течение всего цикла разработки с использованием от трех до пяти испытуемых в каждом раунде, а результаты доставляются разработчикам в течение 24 часов. Таким образом, количество пользователей, фактически протестированных в ходе проекта, может легко достигать 50–100 человек. Исследования показывают, что пользовательское тестирование, проводимое организациями, чаще всего предполагает набор 5-10 участников. ^[14]

На ранней стадии, когда пользователи, скорее всего, сразу же столкнутся с проблемами, которые останавливают их на пути, в качестве испытуемого можно использовать практически любого человека с нормальным интеллектом. На втором этапе тестировщики будут набирать испытуемых с широким спектром способностей. Например, в одном исследовании опытные пользователи не выявили проблем при использовании любого дизайна, от первого до последнего, в то время как как наивные пользователи, так и самопровозглашенные опытные пользователи неоднократно терпели неудачу. ^[15] Позже, когда конструкция станет более гладкой, пользователей следует набирать из целевой группы населения.

Когда метод применяется к достаточному количеству людей в ходе проекта, возражения, выдвинутые выше, устраняются: размер выборки перестает быть маленьким, и обнаруживаются проблемы с удобством использования, которые возникают лишь у случайных пользователей. Ценность метода заключается в том, что однажды возникшие конкретные проблемы проектирования больше никогда не встречаются, поскольку они немедленно устраняются, а детали, которые кажутся удачными, тестируются снова и снова. Хотя это правда, что первоначальные проблемы дизайна могут быть протестированы только пятью пользователями, при правильном применении метода те части дизайна, которые сработали в этом первоначальном тесте, будут протестированы от 50 до 100 человек.

Пример

Руководство Apple Computer 1982 года для разработчиков, содержащее рекомендации по тестированию удобства использования: ^[16]

«Выберите целевую аудиторию. Начните разработку пользовательского интерфейса с определения целевой аудитории. Вы пишете для бизнесменов или детей?»
Определите, насколько целевые пользователи знают о компьютерах Apple и предмете программного обеспечения.
Шаги 1 и 2 позволяют спроектировать пользовательский интерфейс в соответствии с потребностями целевой аудитории. Программное обеспечение для подготовки налогов, написанное для бухгалтеров, может предполагать, что его пользователи ничего не знают о компьютерах, но являются экспертами в налоговом кодексе, в то время как такое программное обеспечение, написанное для потребителей, может предполагать, что его пользователи ничего не знают о налогах, но знакомы с основами работы компьютеров Apple.

Apple посоветовала разработчикам: «Вам следует начать тестирование как можно скорее, используя привлеченных друзей, родственников и новых сотрудников»: ^[16]

Наш метод тестирования заключается в следующем. Мы оборудовали комнату с пятью-шестью компьютерными системами. Мы назначаем две-три группы по пять-шесть пользователей одновременно для тестирования систем (часто они не знают, что мы тестируем именно программное обеспечение, а не систему). У нас в комнате два дизайнера. Еще меньше, и они упускают многое из того, что происходит. Еще немного — и у пользователей возникает ощущение, будто кто-то всегда дышит им в шею.

Дизайнеры должны лично наблюдать за тем, как люди используют программу, потому что ^[16]

Девяносто пять процентов камней преткновения обнаруживаются при наблюдении за языком тела пользователей. Следите за прищуренными глазами, сгорбленными плечами, покачиванием голов и глубокими, сердечными вздохами. Когда пользователь сталкивается с препятствием, он предполагает, что это «поскольку он не слишком умен»: он не сообщит об этом; он это скроет... Не делайте предположений о том, почему пользователь запутался. Спроси его. Вы часто будете удивлены, узнав, что, по мнению пользователя, делала программа в тот момент, когда он заблудился.

Образование

Юзабилити-тестирование было формальным предметом академического обучения по различным дисциплинам. ^[17] Юзабилити-тестирование важно для изучения композиции и онлайн-инструкций по письму (OWI). ^[18] Ученый Коллин Бьорк утверждает, что тестирование юзабилити «необходимо, но недостаточно для разработки эффективного OWI, если только оно не сочетается с теориями цифровой риторики ». ^[19]

Исследовательский опрос

Продукты опроса включают бумажные и цифровые опросы , формы и инструменты, которые могут быть заполнены или использованы респондентом опроса самостоятельно или вместе со сборщиком данных. Юзабилити-тестирование чаще всего проводится в веб-опросах и фокусируется на том, как люди взаимодействуют с опросом, например, навигация по опросу, ввод ответов на опросы и поиск справочной информации. Юзабилити-тестирование дополняет традиционные методы предварительного тестирования опросов , такие как когнитивное предварительное тестирование (то, как люди понимают продукты), пилотное тестирование (как будут работать процедуры опроса) и экспертная оценка профильным экспертом в области методологии опроса . ^[20]

Тестирование юзабилити переведенных продуктов опросов показало, что «культурная пригодность» должна учитываться на уровне предложений и слов, а также в дизайне ввода данных и навигации ^[21] , а также что представление перевода и визуальных подсказок общих функций (вкладки, гиперссылки) , раскрывающиеся меню и URL-адреса ) помогают улучшить взаимодействие с пользователем. ^[22]

Смотрите также

Внешние ссылки

Юзабилити.gov