Тестирование удобства использования

Тестирование удобства использования — это метод, используемый в дизайне взаимодействия , ориентированном на пользователя , для оценки продукта путем его тестирования на пользователях. Это можно рассматривать как незаменимую практику удобства использования , поскольку она дает прямой ввод о том, как реальные пользователи используют систему. ^[1] Оно больше касается интуитивности дизайна продукта и тестируется на пользователях, которые ранее не имели с ним дела. Такое тестирование имеет первостепенное значение для успеха конечного продукта, поскольку полностью функционирующее приложение, которое создает путаницу среди своих пользователей, не будет существовать долго. ^[2] Это контрастирует с методами проверки удобства использования , когда эксперты используют разные методы для оценки пользовательского интерфейса без привлечения пользователей.

Тестирование удобства использования фокусируется на измерении способности продукта, созданного человеком, соответствовать его предполагаемым целям. Примерами продуктов, которые обычно выигрывают от тестирования удобства использования, являются продукты питания , потребительские товары, веб-сайты или веб-приложения, компьютерные интерфейсы , документы и устройства. Тестирование удобства использования измеряет удобство использования или простоту использования определенного объекта или набора объектов, тогда как общие исследования взаимодействия человека и компьютера пытаются сформулировать универсальные принципы.

Что это не так

Простой сбор мнений об объекте или документе — это маркетинговое исследование или качественное исследование , а не тестирование удобства использования. Тестирование удобства использования обычно включает систематическое наблюдение в контролируемых условиях для определения того, насколько хорошо люди могут использовать продукт. ^[3] Однако часто и качественное исследование, и тестирование удобства использования используются в сочетании, чтобы лучше понять мотивы/восприятия пользователей, в дополнение к их действиям.

Вместо того, чтобы показывать пользователям черновик и спрашивать: «Вы это понимаете?», тестирование удобства использования заключается в наблюдении за тем, как люди пытаются использовать что-то по назначению. Например, при тестировании инструкций по сборке игрушки испытуемым следует предоставить инструкции и коробку с деталями, и вместо того, чтобы просить их прокомментировать детали и материалы, их следует попросить собрать игрушку. Формулировка инструкций, качество иллюстраций и дизайн игрушки — все это влияет на процесс сборки.

Методы

Настройка теста удобства использования включает тщательное создание сценария или реалистичной ситуации, в которой человек выполняет список задач, используя тестируемый продукт , в то время как наблюдатели наблюдают и делают заметки ( динамическая проверка ). Несколько других инструментов тестирования , таких как инструкции по сценарию, бумажные прототипы и предварительные и последующие анкеты также используются для сбора отзывов о тестируемом продукте ( статическая проверка ). Например, для тестирования функции вложения программы электронной почты сценарий будет описывать ситуацию, в которой человеку необходимо отправить вложение по электронной почте, и просить его выполнить эту задачу. Цель состоит в том, чтобы понаблюдать за тем, как люди функционируют реалистичным образом, чтобы разработчики могли определить проблемные области и исправить их. Методы, широко используемые для сбора данных во время теста удобства использования, включают протокол «думай вслух» , совместное обучение и отслеживание глаз .

Тестирование в коридоре

Тестирование коридора , также известное как партизанское юзабилити , — это быстрый и дешевый метод тестирования удобства использования, при котором людей, например, проходящих мимо в коридоре, просят попробовать использовать продукт или услугу. Это может помочь дизайнерам выявить «кирпичные стены», проблемы настолько серьезные, что пользователи просто не могут продвинуться вперед, на ранних стадиях нового дизайна. Может быть использован кто угодно, кроме проектировщиков и инженеров (они, как правило, выступают в роли «экспертов-рецензентов», поскольку они слишком близки к проекту).

Этот тип тестирования является примером удобной выборки , поэтому результаты могут быть необъективными.

Удаленное тестирование удобства использования

В сценарии, где оценщики юзабилити, разработчики и потенциальные пользователи находятся в разных странах и часовых поясах, проведение традиционной лабораторной оценки юзабилити создает проблемы как с точки зрения затрат, так и с точки зрения логистики. Эти опасения привели к исследованию удаленной оценки юзабилити, когда пользователь и оценщики разделены в пространстве и времени. Удаленное тестирование, которое облегчает проведение оценок в контексте других задач и технологий пользователя, может быть как синхронным, так и асинхронным. Первый вариант подразумевает индивидуальное общение в реальном времени между оценщиком и пользователем, в то время как последний предполагает, что оценщик и пользователь работают отдельно. ^[4] Существует множество инструментов для удовлетворения потребностей обоих этих подходов.

Методологии синхронного тестирования удобства использования включают видеоконференции или используют инструменты удаленного обмена приложениями, такие как WebEx. WebEx и GoToMeeting являются наиболее часто используемыми технологиями для проведения синхронного удаленного тестирования удобства использования. ^[5] Однако синхронному удаленному тестированию может не хватать непосредственности и чувства «присутствия», необходимых для поддержки процесса совместного тестирования. Более того, управление межличностной динамикой через культурные и языковые барьеры может потребовать подходов, чувствительных к вовлеченным культурам. Другие недостатки включают в себя ограниченный контроль над средой тестирования и отвлекающие факторы и прерывания, с которыми сталкиваются участники в своей родной среде. ^[6] Один из новейших методов, разработанных для проведения синхронного удаленного тестирования удобства использования, заключается в использовании виртуальных миров. ^[7]

Асинхронные методологии включают автоматический сбор потоков кликов пользователя, журналы пользователей критических инцидентов, которые происходят во время взаимодействия с приложением, и субъективную обратную связь об интерфейсе от пользователей. ^[6] Подобно лабораторному исследованию, асинхронное удаленное тестирование удобства использования основано на задачах, и платформа позволяет исследователям фиксировать клики и время выполнения задач. Следовательно, для многих крупных компаний это позволяет исследователям лучше понимать намерения посетителей при посещении веб-сайта или мобильного сайта. Кроме того, этот стиль тестирования пользователей также дает возможность сегментировать обратную связь по демографическим, установочным и поведенческим типам. Тесты проводятся в собственной среде пользователя (а не в лабораториях), помогая дополнительно имитировать тестирование реальных сценариев. Этот подход также предоставляет средство для легкого получения обратной связи от пользователей в удаленных районах быстро и с меньшими организационными издержками. В последние годы также стало распространенным проведение асинхронного тестирования удобства использования, что позволяет тестировщикам предоставлять обратную связь в свободное время и не выходя из собственного дома.

Экспертная оценка

Экспертная оценка — еще один общий метод тестирования удобства использования. Как следует из названия, этот метод основан на привлечении экспертов с опытом в данной области (возможно, из компаний, которые специализируются на тестировании удобства использования) для оценки удобства использования продукта.

Эвристическая оценка или аудит удобства использования — это оценка интерфейса одним или несколькими экспертами по человеческому фактору. Оценщики измеряют удобство использования, эффективность и результативность интерфейса на основе принципов удобства использования, таких как 10 эвристик удобства использования, изначально определенных Якобом Нильсеном в 1994 году ^{. [8]}

Эвристика удобства использования Nielsen, которая продолжает развиваться в ответ на исследования пользователей и новые устройства, включает в себя:

Видимость состояния системы
Соответствие между системой и реальным миром
Контроль и свобода пользователя
Последовательность и стандарты
Предотвращение ошибок
Узнавание, а не припоминание
Гибкость и эффективность использования
Эстетичный и минималистичный дизайн
Помогите пользователям распознавать, диагностировать и устранять ошибки
Помощь и документация

Автоматизированная экспертиза

Подобно экспертным обзорам, автоматизированные экспертные обзоры обеспечивают тестирование удобства использования, но посредством использования программ, заданных правилами для хорошего дизайна и эвристики. Хотя автоматизированный обзор может не дать столько деталей и понимания, как обзоры от людей, они могут быть завершены быстрее и последовательнее. Идея создания суррогатных пользователей для тестирования удобства использования является амбициозным направлением для сообщества искусственного интеллекта.

A/B-тестирование

В веб-разработке и маркетинге A/B-тестирование или сплит-тестирование — это экспериментальный подход к веб-дизайну (особенно к дизайну пользовательского опыта), который направлен на выявление изменений на веб-страницах, которые увеличивают или максимизируют интересующий результат (например, показатель кликабельности для баннерной рекламы). Как следует из названия, сравниваются две версии (A и B), которые идентичны, за исключением одного изменения, которое может повлиять на поведение пользователя. Версия A может быть той, которая используется в настоящее время, в то время как версия B изменена в некотором отношении. Например, на веб-сайте электронной коммерции воронка продаж обычно является хорошим кандидатом для A/B-тестирования, поскольку даже незначительные улучшения в показателях отказа могут представлять собой значительный рост продаж. Значительные улучшения можно увидеть посредством тестирования таких элементов, как текст копии, макеты, изображения и цвета.

Многовариантное тестирование или тестирование сегментов похоже на A/B-тестирование, но одновременно тестирует более двух версий.

Количество участников

В начале 1990-х годов Якоб Нильсен , в то время исследователь в Sun Microsystems , популяризировал концепцию использования многочисленных небольших тестов удобства использования — обычно с пятью участниками в каждом — на разных этапах процесса разработки. Его аргумент заключается в том, что как только обнаруживается, что два или три человека полностью сбиты с толку домашней страницей, мало что выигрывает от наблюдения за тем, как больше людей страдают от того же несовершенного дизайна. «Тщательно продуманные тесты удобства использования — пустая трата ресурсов. Лучшие результаты достигаются при тестировании не более пяти пользователей и запуске столько небольших тестов, сколько вы можете себе позволить». ^[9]

Утверждение «Пяти пользователей достаточно» было позже описано математической моделью ^[10] , которая устанавливает для доли нераскрытых проблем U

$U=1-(1-p)^{n}$

где p — вероятность того, что один субъект идентифицирует конкретную проблему, а n — количество субъектов (или сеансов тестирования). Эта модель отображается в виде асимптотического графика по отношению к количеству реально существующих проблем (см. рисунок ниже).

В более поздних исследованиях утверждение Нильсена было подвергнуто сомнению с использованием как эмпирических данных ^[11], так и более продвинутых математических моделей . ^[12] Двумя ключевыми проблемами этого утверждения являются:

Поскольку удобство использования связано с определенным набором пользователей, такой небольшой размер выборки вряд ли будет репрезентативным для всей совокупности, поэтому данные из такой небольшой выборки, скорее всего, будут отражать группу выборки, а не совокупность, которую они могут представлять.
Не все проблемы юзабилити одинаково легко обнаружить. Неразрешимые проблемы замедляют весь процесс. При таких обстоятельствах прогресс процесса гораздо менее глубок, чем предсказывает формула Нильсена/Ландауэра. ^[13]

Стоит отметить, что Нильсен не призывает останавливаться после одного теста с пятью пользователями; его точка зрения заключается в том, что тестирование с пятью пользователями, исправление выявленных ими проблем, а затем тестирование измененного сайта с пятью разными пользователями — это лучшее использование ограниченных ресурсов, чем проведение одного теста удобства использования с 10 пользователями. На практике тесты проводятся один или два раза в неделю в течение всего цикла разработки, с использованием трех-пяти испытуемых на раунд, и с предоставлением результатов в течение 24 часов дизайнерам. Таким образом, количество пользователей, фактически протестированных в ходе проекта, может легко достигать 50-100 человек. Исследования показывают, что тестирование пользователей, проводимое организациями, чаще всего предполагает набор 5-10 участников. ^[14]

На ранней стадии, когда пользователи, скорее всего, сразу же столкнутся с проблемами, которые остановят их на пути, в качестве испытуемого может быть использован практически любой человек с нормальным интеллектом. На второй стадии тестировщики будут набирать испытуемых с широким спектром способностей. Например, в одном исследовании опытные пользователи не показали никаких проблем с использованием любого дизайна, от первого до последнего, в то время как наивные пользователи и самоидентифицированные продвинутые пользователи оба неоднократно терпели неудачу. ^[15] Позже, по мере сглаживания дизайна, пользователи должны набираться из целевой популяции.

Когда метод применяется к достаточному количеству людей в ходе проекта, возражения, высказанные выше, становятся решенными: размер выборки перестает быть малым, и обнаруживаются проблемы с удобством использования, которые возникают только у случайных пользователей. Ценность метода заключается в том, что определенные проблемы дизайна, однажды возникшие, больше никогда не встречаются, потому что они немедленно устраняются, в то время как части, которые кажутся успешными, тестируются снова и снова. Хотя верно, что первоначальные проблемы в дизайне могут быть протестированы всего пятью пользователями, при правильном применении метода части дизайна, которые сработали в этом первоначальном тесте, будут затем протестированы 50–100 людьми.

Пример

В руководстве для разработчиков Apple Computer 1982 года говорилось о тестировании удобства использования: ^[16]

«Выберите целевую аудиторию. Начните проектирование человеческого интерфейса с определения целевой аудитории. Вы пишете для бизнесменов или детей?»
Определите, насколько целевые пользователи осведомлены о компьютерах Apple и тематике программного обеспечения.
Шаги 1 и 2 позволяют разработать пользовательский интерфейс, который будет соответствовать потребностям целевой аудитории. Программное обеспечение для подготовки налоговой отчетности, написанное для бухгалтеров, может предполагать, что его пользователи ничего не знают о компьютерах, но являются экспертами в налоговом кодексе, в то время как такое программное обеспечение, написанное для потребителей, может предполагать, что его пользователи ничего не знают о налогах, но знакомы с основами компьютеров Apple.

Apple посоветовала разработчикам: «Вам следует начать тестирование как можно скорее, используя приглашенных друзей, родственников и новых сотрудников»: ^[16]

Наш метод тестирования заключается в следующем. Мы создаем комнату с пятью-шестью компьютерными системами. Мы планируем две-три группы по пять-шесть пользователей за раз, чтобы они опробовали системы (часто без их ведома, что мы тестируем программное обеспечение, а не систему). В комнате находятся двое дизайнеров. Если их меньше, они упускают многое из того, что происходит. Если больше, пользователи чувствуют, что кто-то постоянно дышит им в затылок.

Дизайнеры должны лично наблюдать, как люди используют программу, потому что ^[16]

Девяносто пять процентов препятствий обнаруживаются при наблюдении за языком тела пользователей. Следите за прищуренными глазами, сгорбленными плечами, качанием головы и глубокими, искренними вздохами. Когда пользователь сталкивается с препятствием, он предполагает, что это «из-за того, что он не слишком умен»: он не сообщит об этом; он скроет это... Не делайте предположений о том, почему пользователь запутался. Спросите его. Вы часто будете удивлены, узнав, что пользователь думал о том, что делает программа, когда он заблудился.

Образование

Тестирование удобства использования было формальным предметом академического обучения в различных дисциплинах. ^[17] Тестирование удобства использования важно для изучения композиции и обучения письму онлайн (OWI). ^[18] Ученый Колин Бьорк утверждает, что тестирование удобства использования «необходимо, но недостаточно для разработки эффективного OWI, если оно не сочетается с теориями цифровой риторики ». ^[19]

Исследование опроса

Продукты опроса включают бумажные и цифровые опросы , формы и инструменты, которые могут быть заполнены или использованы респондентом опроса самостоятельно или со сборщиком данных. Тестирование удобства использования чаще всего проводится в веб-опросах и фокусируется на том, как люди взаимодействуют с опросом, например, перемещаются по опросу, вводят ответы на опрос и находят справочную информацию. Тестирование удобства использования дополняет традиционные методы предварительного тестирования опроса, такие как когнитивное предварительное тестирование (как люди понимают продукты), пилотное тестирование (как будут работать процедуры опроса) и экспертная оценка экспертом по предметной области в методологии опроса . ^[20]

В переведенных продуктах для опросов тестирование удобства использования показало, что «культурная пригодность» должна учитываться на уровне предложений и слов, а также в дизайне для ввода данных и навигации ^[21], и что представление перевода и визуальных подсказок общих функций (вкладки, гиперссылки , раскрывающиеся меню и URL-адреса ) помогает улучшить пользовательский опыт. ^[22]

Смотрите также

Ссылки

^ Нильсен, Дж. (1994). Юзабилити-инжиниринг, Academic Press Inc, стр. 165
^ Mejs, Monika (2019-06-27). "Тестирование удобства использования: ключ к проверке дизайна". Mood Up team - software house . Получено 2019-09-11 .
^ Деннис Г. Йерц (19 июля 2000 г.). «Тестирование удобства использования: что это такое?». Веблог Jerz's Literacy . Получено 29 июня 2016 г.
^ Андреасен, Мортен Зикер; Нильсен, Хенрик Виллеманн; Шрёдер, Саймон Ормхольт; Стейдж, Ян (2007). «Что случилось с удаленным тестированием удобства использования?». Труды конференции SIGCHI по человеческому фактору в вычислительных системах . стр. 1405. doi :10.1145/1240624.1240838. ISBN 978-1-59593-593-9. S2CID 12388042.
^ Дэбни Гоф; Холли Филлипс (2003-06-09). "Удаленное онлайн-тестирование удобства использования: зачем, как и когда его использовать". Архивировано из оригинала 15 декабря 2005 г.
^ ab Dray, Susan; Siegel, David (март 2004 г.). «Удаленные возможности?: международное тестирование удобства использования на расстоянии». Interactions . 11 (2): 10–17. doi :10.1145/971258.971264. S2CID 682010.
^ Chalil Madathil, Kapil; Greenstein, Joel S. (2011). «Синхронное удаленное тестирование удобства использования». Труды конференции SIGCHI по человеческому фактору в вычислительных системах . стр. 2225–2234. doi :10.1145/1978942.1979267. ISBN 978-1-4503-0228-9. S2CID 14077658.
^ "Эвристическая оценка". Usability First . Получено 9 апреля 2013 г.
^ «Тестирование удобства использования с 5 пользователями (Alertbox Якоба Нильсена)». useit.com. 2000-03-13.; ссылки Нильсен, Якоб; Ландауэр, Томас К. (1993). "Математическая модель поиска проблем удобства использования". Труды конференции SIGCHI по человеческим факторам в вычислительных системах . стр. 206–213. doi :10.1145/169059.169166. ISBN 978-0-89791-575-5. S2CID 207177537.
^ Virzi, RA (1992). «Усовершенствование фазы тестирования оценки удобства использования: сколько субъектов достаточно?». Human Factors . 34 (4): 457–468. doi :10.1177/001872089203400407. S2CID 59748299.
^ Спул, Джаред; Шредер, Уилл (2001). Тестирование веб-сайтов: пять пользователей далеко не достаточно . Расширенные рефераты CHI '01 по человеческому фактору в вычислительных системах. стр. 285. doi :10.1145/634067.634236. S2CID 8038786.
^ Колтон, ДА (2001). «Ослабление предположения однородности в тестировании удобства использования». Поведение и информационные технологии . 20 (1): 1–7. doi :10.1080/01449290010020648. S2CID 62751921.
^ Шметтов, Мартин (1 сентября 2008 г.). «Гетерогенность в процессе оценки удобства использования». Электронные семинары по вычислительной технике. doi : 10.14236/ewic/HCI2008.9 . {{cite journal}}: Цитировать журнал требует |journal=( помощь )
^ "Результаты отчета по пользовательскому тестированию в отрасли за 2020 год". www.userfountain.com . Получено 04.06.2020 .
^ Брюс Тоньяццини. «Максимизация Windows».
^ abc Мейерс, Джо; Тоньяццини, Брюс (1982). Apple IIe Design Guidelines (PDF) . Apple Computer. стр. 11–13, 15.
^ Брейх, Ли-Энн М. Кастман; Захри, Марк; Спинуцци, Клэй (апрель 2001 г.). «Инструкции по удобству использования в программах технической коммуникации: новые направления в разработке учебных программ». Журнал деловой и технической коммуникации . 15 (2): 223–240. doi :10.1177/105065190101500204. S2CID 61365767.
^ Миллер-Кохран, Сьюзен К.; Родриго, Рошель Л. (январь 2006 г.). «Определение эффективных проектов дистанционного обучения с помощью тестирования удобства использования». Компьютеры и композиция . 23 (1): 91–107. doi :10.1016/j.compcom.2005.12.002.
^ Бьорк, Коллин (сентябрь 2018 г.). «Интеграция тестирования удобства использования с цифровой риторикой в OWI». Компьютеры и композиция . 49 : 4–13. doi :10.1016/j.compcom.2018.05.009. S2CID 196160668.
^ Гейзен, Эмили; Бергстром, Дженнифер Романо (2017). Тестирование удобства использования для исследований опросов . Кембридж: Elsevier MK Morgan Kaufmann Publishers. ISBN 978-0-12-803656-3.
^ Ван, Линь; Ша, Мэнди (01.06.2017). «Культурная пригодность в удобстве использования интернет-опроса переписи населения США на китайском языке». Survey Practice . 10 (3). doi : 10.29115/SP-2017-0018 .
^ Ша, Мэнди; Хси, И. Патрик; Гоерман, Патрисия Л. (2018-07-25). «Перевод и визуальные подсказки: на пути к созданию дорожной карты для ограниченного числа носителей английского языка для доступа к переведенным интернет-опросам в Соединенных Штатах». Перевод и интерпретация . 10 (2): 142–158. ISSN 1836-9324.

Внешние ссылки

Usability.gov