Аннотация — это дополнительная информация , связанная с определенной точкой документа или другой частью информации. Это может быть примечание, содержащее комментарий или пояснение. [1] Аннотации иногда размещаются на полях страниц книги . Аннотации различных цифровых носителей см. в веб-аннотациях и текстовых аннотациях .
Практика аннотирования заключается в выделении фразы или предложения и включении комментария, обведении слова, требующего определения, постановке вопроса, когда что-то не совсем понятно, и написании краткого изложения ключевого раздела. [2] Он также предлагает учащимся «(ре)конструировать историю посредством использования материалов и захватывающих практик аннотаций DIY (Сделай сам)». [3] Доступные сегодня методы аннотирования предлагают замечательный набор инструментов, позволяющих учащимся начать работу в более тесном сотрудничестве, чем это было возможно ранее. [4]
Текстовая и киноаннотация — это метод, который предполагает использование комментариев и текста внутри фильма. Анализ видео — это занятие, которое никогда не бывает полностью свободным от предвзятых представлений, и первым шагом для исследователей является определение своего ориентира в области возможных исследовательских подходов и, таким образом, размышление над своими собственными базовыми предположениями. [5] Аннотации могут присутствовать в видео и использоваться при записи видеоданных. В текстах и фильмах он используется как инструмент для записи своих мыслей и эмоций в маркировку. [2] На любом количестве этапов анализа его также можно дополнить дополнительными аннотациями. Антропологи Клиффорд Гирц называет это «толстым описанием». Это может дать представление о том, насколько полезны аннотации, особенно если добавить описание того, как их можно реализовать в фильме. [5]
Маргиналии — это надписи или украшения на полях рукописи. Средневековые маргиналии настолько хорошо известны, что их забавные или сбивающие с толку примеры служат пищей для вирусных агрегаторов, таких как Buzzfeed и Brainpickings, а увлечение чтением других читателей проявляется на таких сайтах, как Marginalia Online Мелвилла или онлайн-выставка маргиналей шести личных книг в Гарварде. библиотеки. [4] Он также может быть частью других веб-сайтов, таких как Pinterest, или даже генераторов мемов и инструментов GIF.
Текстология — это дисциплина, которая часто использует технику аннотаций для описания или добавления дополнительного исторического контекста к текстам и физическим документам, чтобы облегчить их понимание. [6]
Студенты часто выделяют отрывки в книгах, чтобы активно взаимодействовать с текстом. Учащиеся могут использовать аннотации, чтобы легко возвращаться к ключевым фразам, или добавлять заметки на полях , чтобы облегчить изучение и поиск связей между текстом и предыдущими знаниями или проработанными темами. [7]
Аннотированные библиографии содержат комментарии об актуальности или качестве каждого источника в дополнение к обычной библиографической информации, которая просто идентифицирует источник.
Студенты используют аннотации не только в академических целях, но и для интерпретации своих мыслей, чувств и эмоций. [2] Такие сайты, как Scalar и Omeka, используются учащимися. Существует несколько жанров аннотаций, таких как математика, кино, лингвистика и теория литературы, которые учащиеся считают наиболее полезными. Большинство студентов отметили, что процесс аннотирования полезен для улучшения общих навыков письма, грамматики и академического словарного запаса.
Математические выражения (символы и формулы) могут быть аннотированы их значениями на естественном языке. Это важно для устранения неоднозначности, поскольку символы могут иметь разные значения (например, «E» может означать «энергию» или «ожидаемое значение» и т. д.). [8] [9] Процесс аннотирования можно облегчить и ускорить с помощью рекомендаций, например, используя систему «AnnoMathTeX», размещенную на Wikimedia. [10] [11] [12]
С когнитивной точки зрения аннотации играют важную роль в обучении и обучении. В рамках управляемого наблюдения оно включает в себя выделение, наименование или маркировку и комментирование аспектов визуальных представлений, чтобы помочь сосредоточить внимание учащихся на конкретных визуальных аспектах. Другими словами, это означает присвоение типологических представлений (культурно значимых категорий) топологическим представлениям (например, изображениям). [13] Это особенно важно, когда эксперты, такие как врачи, подробно интерпретируют визуализации и объясняют свои интерпретации другим, например, с помощью цифровых технологий. [14] Здесь аннотация может быть способом установить точки соприкосновения между участниками взаимодействия с разными уровнями знаний. [15] Ценность аннотаций была эмпирически подтверждена, например, в исследовании, которое показывает, что в компьютерных телеконсультациях интеграция аннотаций изображений и речи приводит к значительному улучшению обмена знаниями по сравнению с использованием изображений и речи без аннотаций. [16]
Аннотации были удалены с YouTube 15 января 2019 года примерно через десять лет. [17] Они разрешили пользователям предоставлять информацию, которая появлялась во время видео, но YouTube указал, что они плохо работают на маленьких мобильных экранах и ими злоупотребляют.
Языки разметки, такие как XML и HTML, аннотируют текст таким образом, чтобы его можно было синтаксически отличить от этого текста. Их можно использовать для добавления информации о желаемом визуальном представлении или машиночитаемой семантической информации, как в семантической сети . [18]
Сюда входят CSV и XLS . Процесс присвоения семантических аннотаций табличным данным называется семантической маркировкой. Семантическая маркировка — это процесс присвоения аннотаций из онтологий табличным данным. [19] [20] [21] [22] Этот процесс также называется семантической аннотацией. [23] [22] Семантическая маркировка часто выполняется (полу)автоматическим способом. Методы семантической маркировки работают со столбцами сущностей, [22] числовыми столбцами, [19] [21] [24] [25] координатами, [26] и многим другим. [26] [25]
Существует несколько типов семантической маркировки, в которых используются методы машинного обучения. Эти методы можно разделить на следующие категории, следуя работе Флаха [27] [28] : геометрические (с использованием линий и плоскостей, такие как машина опорных векторов , линейная регрессия ), вероятностные (например, условное случайное поле ), логические (например, обучение дереву решений ) и методы, не связанные с машинным обучением (например, балансирование охвата и специфичности [22] ). Обратите внимание, что геометрическая, вероятностная и логическая модели машинного обучения не являются взаимоисключающими. [27]
Фам и др. [29] используют индекс Жаккара и сходство TF-IDF для текстовых данных и тест Колмогорова-Смирнова для числовых данных. Алобейд и Корчо [21] используют нечеткую кластеризацию (c-средние [30] [31] ) для маркировки числовых столбцов.
Лимайе и др. [32] использует подобие TF-IDF и графические модели . Они также используют машину опорных векторов для вычисления весов. Венетис и др. [33] создают базу данных isA, состоящую из пар (экземпляр, класс), а затем вычисляют максимальное правдоподобие, используя эти пары.
Сайед и др. [34] создали Wikitology, которая представляет собой «гибридную базу знаний структурированной и неструктурированной информации, извлеченной из Википедии, дополненной данными RDF из DBpedia и других ресурсов связанных данных». [34] Для индекса Wikitology они используют PageRank для связывания сущностей , что является одной из задач, часто используемых при семантической маркировке. Поскольку они не смогли запросить у Google все статьи Википедии, чтобы получить PageRank , они использовали дерево решений для его аппроксимации. [34]
Алобейд и Корчо [22] представили подход к аннотированию столбцов сущностей. Этот метод начинается с аннотирования ячеек в столбце сущностей сущностями из графа справочных знаний (например, DBpedia ). Затем классы собираются, и каждый из них оценивается на основе нескольких представленных ими формул с учетом частоты каждого класса и их глубины в соответствии с иерархией подклассов. [35]
Есть некоторые задачи, общие для различных подходов к семантической маркировке.
Это наиболее распространенная задача при семантической маркировке. Учитывая текст ячейки и источник данных, этот подход прогнозирует сущность и связывает ее с сущностью, идентифицированной в данном источнике данных. Например, если входными данными для подхода был текст «Ричард Фейнман» и URL-адрес конечной точки SPARQL DBpedia, подход вернет «http://dbpedia.org/resource/Richard_Feynman», который является объектом из DBpedia. . Некоторые подходы используют точное соответствие. [22] , в то время как другие используют метрики сходства, такие как косинусное сходство [32]
Столбец темы таблицы — это столбец, содержащий основные темы/сущности в таблице. [19] [28] [33] [36] [37] Некоторые подходы ожидают столбец темы в качестве входных данных [22] , в то время как другие прогнозируют столбец темы, например TableMiner+. [37]
Типы столбцов делятся по-разному в зависимости от подхода. [28] Некоторые делят их на строки/текст и числа [21] [29] [38] [25] , в то время как другие разделяют их дальше [28] (например, типология числа, [19] дата, [34] [33] координаты [39] ).
Отношения между Мадридом и Испанией являются «столицей». [40] Такие отношения можно легко найти в онтологиях, таких как DBpedia . Венетис и др. [33] используют TextRunner [41] для извлечения связи между двумя столбцами. Сайед и др. В [34] используется связь между сущностями двух столбцов, и выбирается наиболее часто встречающаяся связь.
СД2 [42] является наиболее распространенным золотым стандартом семантической маркировки. Существуют две версии T2D: T2Dv1 (иногда их также называют T2D) и T2Dv2. [42] Другие известные тесты опубликованы в SemTab Challenge. [43]
Функция «аннотации» (также известная как «обвинение» или «похвала»), используемая в системах контроля версий , таких как Git , Team Foundation Server и Subversion , определяет, кто внес изменения в исходный код в репозиторий. При этом выводится копия исходного кода, где каждая строка помечена именем последнего участника, редактировавшего эту строку (и, возможно, номером версии). Это может помочь установить вину в случае, если изменение вызвало сбой, или определить автора гениального кода.
Особым случаем является язык программирования Java , где аннотации могут использоваться как особая форма синтаксических метаданных в исходном коде. [44] Классы, методы, переменные, параметры и пакеты могут быть аннотированы. Аннотации могут быть встроены в файлы классов , созданные компилятором, и могут сохраняться виртуальной машиной Java и, таким образом, влиять на поведение приложения во время выполнения . В Java можно создавать метааннотации из существующих. [45]
Автоматическая аннотация изображений используется для классификации изображений для систем поиска изображений . [46]
С 1980-х годов молекулярная биология и биоинформатика создали потребность в аннотациях ДНК . Аннотация ДНК или аннотация генома — это процесс определения местоположения генов и всех кодирующих областей в геноме и определения того, что делают эти гены. Аннотация (независимо от контекста) — это примечание, добавленное в виде пояснения или комментария. После секвенирования генома его необходимо аннотировать, чтобы понять его смысл. [47]
В сообществе цифровых изображений термин «аннотация» обычно используется для видимых метаданных, наложенных на изображение без изменения основного основного изображения, таких как стикеры , виртуальные лазерные указатели, круги, стрелки и затемнения (см. Редактирование ). [48]
В сообществе специалистов по медицинской визуализации аннотацию часто называют областью интереса и кодируют в формате DICOM .
В Соединенных Штатах юридические издательства, такие как Thomson West и Lexis Nexis, публикуют аннотированные версии законов , предоставляя информацию о судебных делах , в которых законы интерпретировались. Как федеральный Кодекс Соединенных Штатов, так и законы штатов подлежат толкованию судами , а аннотированные законы являются ценными инструментами в юридических исследованиях . [49]
Одной из целей аннотации является преобразование данных в форму, пригодную для компьютерного анализа. Перед аннотацией определяется схема аннотации, которая обычно состоит из тегов. Во время разметки транскрипционисты вручную добавляют теги в расшифровки, где необходимые лингвистические особенности идентифицируются в редакторе аннотаций. Схема аннотаций гарантирует, что теги добавляются последовательно во всем наборе данных, и позволяет проверять ранее помеченные данные. [50] Помимо тегов, более сложные формы лингвистической аннотации включают аннотацию фраз и отношений, например, в древовидных банках . Было разработано множество различных форм лингвистических аннотаций, а также различные форматы и инструменты для создания лингвистических аннотаций и управления ими, как описано, например, в Wiki Linguistic Annotation Wiki. [51]
{{cite web}}
: CS1 maint: несколько имен: список авторов ( ссылка )