Образность — это мера того, насколько легко физический объект, слово или среда вызовет четкий ментальный образ в сознании любого человека, наблюдающего за ним. [1] [2] Она используется в архитектуре и городском планировании, в психолингвистике [3] и в автоматизированных исследованиях компьютерного зрения. [4] В автоматизированном распознавании изображений обучение моделей для связывания изображений с концепциями, имеющими низкую образность, может привести к предвзятым и вредным результатам. [4]
Кевин А. Линч впервые ввел термин «образность» в своей книге 1960 года « Образ города» . [1] [5] В этой книге Линч утверждает, что города содержат ключевой набор физических элементов, которые люди используют для понимания окружающей среды, ориентации в ней и придания ей значения. [6]
Линч утверждает, что пятью ключевыми элементами, влияющими на имидж города, являются пути, границы, районы, узлы и достопримечательности.
В 1914 году, за полвека до публикации «Образа города» , Пол Стерн обсуждал концепцию, похожую на образность в контексте искусства. Стерн в « Размышлениях об искусстве» Сьюзан Лангер называет атрибут, описывающий, насколько ярко и интенсивно может восприниматься художественный объект, видимостью. [7]
Автоматическое распознавание изображений было разработано с использованием машинного обучения для поиска закономерностей в больших аннотированных наборах данных фотографий, таких как ImageNet . Изображения в ImageNet помечаются с помощью концепций в WordNet . Концепции, которые легко выражаются вербально, например «ранний», рассматриваются как менее «образимые», чем существительные, относящиеся к физическим объектам, например «лист». Обучение моделей ИИ связывать концепции с низкой образностью с конкретными изображениями может привести к проблемным предубеждениям в алгоритмах распознавания изображений. Это особенно критиковалось, поскольку относится к категории «человек» WordNet и, следовательно, также ImageNet. Тревор Пэган и Кейт Кроуфорд продемонстрировали в своем эссе «Раскопки ИИ» и своем художественном проекте ImageNet Roulette, как это приводит к тому, что фотографии обычных людей маркируются системами ИИ как «террористы» или «сексуальные преступники». [8]
Изображения в наборах данных часто помечаются как имеющие определенный уровень образности. Как описывают Кайю Ян, Фей-Фей Ли и соавторы, это часто делается в соответствии с критериями из психолингвистического исследования существительных Аллана Пайвио и его коллег 1968 года. [3] Ян и др. пишут, что аннотаторы наборов данных, которым поручено маркировать образность, «видят список слов и оценивают каждое слово по шкале от 1 до 7 от «низкой образности» до «высокой образности». [4]
Чтобы избежать предвзятого или вредного распознавания и генерации изображений, Янг и др. рекомендуют не обучать модели распознавания изображений на концепциях с низкой образностью, особенно когда концепции являются оскорбительными (например, сексуальные или расовые оскорбления) или деликатными (их примеры для этой категории включают «сироту», «сепаратиста», «англосакса» и «перекрестного избирателя»). Даже «безопасные» концепции с низкой образностью, такие как «внучатая племянница» или «вегетарианец», могут привести к вводящим в заблуждение результатам и их следует избегать. [4]
{{cite book}}
: CS1 maint: несколько имен: список авторов ( ссылка ) CS1 maint: числовые имена: список авторов ( ссылка ){{cite book}}
: CS1 maint: местоположение отсутствует издатель ( ссылка ) CS1 maint: другие ( ссылка ){{cite book}}
: CS1 maint: multiple names: authors list (link) CS1 maint: numeric names: authors list (link)