Аннотация

Аннотация — это дополнительная информация , связанная с определенной точкой документа или другой частью информации. Это может быть примечание, содержащее комментарий или пояснение. ^[1] Аннотации иногда размещаются на полях страниц книги . Аннотации различных цифровых носителей см. в веб-аннотациях и текстовых аннотациях .

Литература, грамматика и образовательные цели

Практика визуально

Практика аннотирования заключается в выделении фразы или предложения и включении комментария, обведении слова, требующего определения, постановке вопроса, когда что-то не совсем понятно, и написании краткого изложения ключевого раздела. ^[2] Он также предлагает учащимся «(ре)конструировать историю посредством использования материалов и захватывающих практик аннотаций DIY (Сделай сам)». ^[3] Доступные сегодня методы аннотирования предлагают замечательный набор инструментов, позволяющих учащимся начать работу в более тесном сотрудничестве, чем это было возможно ранее. ^[4]

Текст и аннотации к фильму

Текстовая и киноаннотация — это метод, который предполагает использование комментариев и текста внутри фильма. Анализ видео — это занятие, которое никогда не бывает полностью свободным от предвзятых представлений, и первым шагом для исследователей является определение своего ориентира в области возможных исследовательских подходов и, таким образом, размышление над своими собственными базовыми предположениями. ^[5] Аннотации могут присутствовать в видео и использоваться при записи видеоданных. В текстах и фильмах он используется как инструмент для записи своих мыслей и эмоций в маркировку. ^[2] На любом количестве этапов анализа его также можно дополнить дополнительными аннотациями. Антропологи Клиффорд Гирц называет это «толстым описанием». Это может дать представление о том, насколько полезны аннотации, особенно если добавить описание того, как их можно реализовать в фильме. ^[5]

Средневековые маргиналии

Маргиналии — это надписи или украшения на полях рукописи. Средневековые маргиналии настолько хорошо известны, что их забавные или сбивающие с толку примеры служат пищей для вирусных агрегаторов, таких как Buzzfeed и Brainpickings, а увлечение чтением других читателей проявляется на таких сайтах, как Marginalia Online Мелвилла или онлайн-выставка маргиналей шести личных книг в Гарварде. библиотеки. ^[4] Он также может быть частью других веб-сайтов, таких как Pinterest, или даже генераторов мемов и инструментов GIF.

Текстовая стипендия

Текстология — это дисциплина, которая часто использует технику аннотаций для описания или добавления дополнительного исторического контекста к текстам и физическим документам, чтобы облегчить их понимание. ^[6]

Студент использует

Студенты часто выделяют отрывки в книгах, чтобы активно взаимодействовать с текстом. Учащиеся могут использовать аннотации, чтобы легко возвращаться к ключевым фразам, или добавлять заметки на полях , чтобы облегчить изучение и поиск связей между текстом и предыдущими знаниями или проработанными темами. ^[7]

Аннотированные библиографии содержат комментарии об актуальности или качестве каждого источника в дополнение к обычной библиографической информации, которая просто идентифицирует источник.

Студенты используют аннотации не только в академических целях, но и для интерпретации своих мыслей, чувств и эмоций. ^[2] Такие сайты, как Scalar и Omeka, используются учащимися. Существует несколько жанров аннотаций, таких как математика, кино, лингвистика и теория литературы, которые учащиеся считают наиболее полезными. Большинство студентов отметили, что процесс аннотирования полезен для улучшения общих навыков письма, грамматики и академического словарного запаса.

Аннотация к математическому выражению

Математические выражения (символы и формулы) могут быть аннотированы их значениями на естественном языке. Это важно для устранения неоднозначности, поскольку символы могут иметь разные значения (например, «E» может означать «энергию» или «ожидаемое значение» и т. д.). ^[8]^[9] Процесс аннотирования можно облегчить и ускорить с помощью рекомендаций, например, используя систему «AnnoMathTeX», размещенную на Wikimedia. ^[10]^[11]^[12]

Обучение и инструкция

С когнитивной точки зрения аннотации играют важную роль в обучении и обучении. В рамках управляемого наблюдения оно включает в себя выделение, наименование или маркировку и комментирование аспектов визуальных представлений, чтобы помочь сосредоточить внимание учащихся на конкретных визуальных аспектах. Другими словами, это означает присвоение типологических представлений (культурно значимых категорий) топологическим представлениям (например, изображениям). ^[13] Это особенно важно, когда эксперты, такие как врачи, подробно интерпретируют визуализации и объясняют свои интерпретации другим, например, с помощью цифровых технологий. ^[14] Здесь аннотация может быть способом установить точки соприкосновения между участниками взаимодействия с разными уровнями знаний. ^[15] Ценность аннотаций была эмпирически подтверждена, например, в исследовании, которое показывает, что в компьютерных телеконсультациях интеграция аннотаций изображений и речи приводит к значительному улучшению обмена знаниями по сравнению с использованием изображений и речи без аннотаций. ^[16]

На ютубе

Аннотации были удалены с YouTube 15 января 2019 года примерно через десять лет. ^[17] Они разрешили пользователям предоставлять информацию, которая появлялась во время видео, но YouTube указал, что они плохо работают на маленьких мобильных экранах и ими злоупотребляют.

Программное обеспечение и инженерия

Текстовые документы

Языки разметки, такие как XML и HTML, аннотируют текст таким образом, чтобы его можно было синтаксически отличить от этого текста. Их можно использовать для добавления информации о желаемом визуальном представлении или машиночитаемой семантической информации, как в семантической сети . ^[18]

Табличные данные

Сюда входят CSV и XLS . Процесс присвоения семантических аннотаций табличным данным называется семантической маркировкой. Семантическая маркировка — это процесс присвоения аннотаций из онтологий табличным данным. ^[19]^[20]^[21]^[22] Этот процесс также называется семантической аннотацией. ^[23]^[22] Семантическая маркировка часто выполняется (полу)автоматическим способом. Методы семантической маркировки работают со столбцами сущностей, ^[22] числовыми столбцами, ^[19]^[21]^[24]^[25] координатами, ^[26] и многим другим. ^[26]^[25]

Методы семантической маркировки

Существует несколько типов семантической маркировки, в которых используются методы машинного обучения. Эти методы можно разделить на следующие категории, следуя работе Флаха ^[27]^[28] : геометрические (с использованием линий и плоскостей, такие как машина опорных векторов , линейная регрессия ), вероятностные (например, условное случайное поле ), логические (например, обучение дереву решений ) и методы, не связанные с машинным обучением (например, балансирование охвата и специфичности ^[22] ). Обратите внимание, что геометрическая, вероятностная и логическая модели машинного обучения не являются взаимоисключающими. ^[27]

Геометрические методы

Фам и др. ^[29] используют индекс Жаккара и сходство TF-IDF для текстовых данных и тест Колмогорова-Смирнова для числовых данных. Алобейд и Корчо ^[21] используют нечеткую кластеризацию (c-средние ^[30]^[31] ) для маркировки числовых столбцов.

Вероятностные методы

Лимайе и др. ^[32] использует подобие TF-IDF и графические модели . Они также используют машину опорных векторов для вычисления весов. Венетис и др. ^[33] создают базу данных isA, состоящую из пар (экземпляр, класс), а затем вычисляют максимальное правдоподобие, используя эти пары.

Логические методы

Сайед и др. ^[34] создали Wikitology, которая представляет собой «гибридную базу знаний структурированной и неструктурированной информации, извлеченной из Википедии, дополненной данными RDF из DBpedia и других ресурсов связанных данных». ^[34] Для индекса Wikitology они используют PageRank для связывания сущностей , что является одной из задач, часто используемых при семантической маркировке. Поскольку они не смогли запросить у Google все статьи Википедии, чтобы получить PageRank , они использовали дерево решений для его аппроксимации. ^[34]

Методы, не связанные с МО

Алобейд и Корчо ^[22] представили подход к аннотированию столбцов сущностей. Этот метод начинается с аннотирования ячеек в столбце сущностей сущностями из графа справочных знаний (например, DBpedia ). Затем классы собираются, и каждый из них оценивается на основе нескольких представленных ими формул с учетом частоты каждого класса и их глубины в соответствии с иерархией подклассов. ^[35]

Общие задачи семантической маркировки

Есть некоторые задачи, общие для различных подходов к семантической маркировке.

Связывание сущностей и устранение неоднозначности

Это наиболее распространенная задача при семантической маркировке. Учитывая текст ячейки и источник данных, этот подход прогнозирует сущность и связывает ее с сущностью, идентифицированной в данном источнике данных. Например, если входными данными для подхода был текст «Ричард Фейнман» и URL-адрес конечной точки SPARQL DBpedia, подход вернет «http://dbpedia.org/resource/Richard_Feynman», который является объектом из DBpedia. . Некоторые подходы используют точное соответствие. ^[22] , в то время как другие используют метрики сходства, такие как косинусное сходство ^[32]

Идентификация предметного столбца

Столбец темы таблицы — это столбец, содержащий основные темы/сущности в таблице. ^[19]^[28]^[33]^[36]^[37] Некоторые подходы ожидают столбец темы в качестве входных данных ^[22] , в то время как другие прогнозируют столбец темы, например TableMiner+. ^[37]

Обнаружение типа данных столбца

Типы столбцов делятся по-разному в зависимости от подхода. ^[28] Некоторые делят их на строки/текст и числа ^[21]^[29]^[38]^[25] , в то время как другие разделяют их дальше ^[28] (например, типология числа, ^[19] дата, ^[34]^[33] координаты ^[39] ).

Прогноз отношений

Отношения между Мадридом и Испанией являются «столицей». ^[40] Такие отношения можно легко найти в онтологиях, таких как DBpedia . Венетис и др. ^[33] используют TextRunner ^[41] для извлечения связи между двумя столбцами. Сайед и др. ^{В [34]} используется связь между сущностями двух столбцов, и выбирается наиболее часто встречающаяся связь.

Золотые стандарты

СД2 ^[42] является наиболее распространенным золотым стандартом семантической маркировки. Существуют две версии T2D: T2Dv1 (иногда их также называют T2D) и T2Dv2. ^[42] Другие известные тесты опубликованы в SemTab Challenge. ^[43]

Управления источником

Функция «аннотации» (также известная как «обвинение» или «похвала»), используемая в системах контроля версий , таких как Git , Team Foundation Server и Subversion , определяет, кто внес изменения в исходный код в репозиторий. При этом выводится копия исходного кода, где каждая строка помечена именем последнего участника, редактировавшего эту строку (и, возможно, номером версии). Это может помочь установить вину в случае, если изменение вызвало сбой, или определить автора гениального кода.

Java-аннотации

Особым случаем является язык программирования Java , где аннотации могут использоваться как особая форма синтаксических метаданных в исходном коде. ^[44] Классы, методы, переменные, параметры и пакеты могут быть аннотированы. Аннотации могут быть встроены в файлы классов , созданные компилятором, и могут сохраняться виртуальной машиной Java и, таким образом, влиять на поведение приложения во время выполнения . В Java можно создавать метааннотации из существующих. ^[45]

Аннотация к изображению

Автоматическая аннотация изображений используется для классификации изображений для систем поиска изображений . ^[46]

Вычислительная биология

С 1980-х годов молекулярная биология и биоинформатика создали потребность в аннотациях ДНК . Аннотация ДНК или аннотация генома — это процесс определения местоположения генов и всех кодирующих областей в геноме и определения того, что делают эти гены. Аннотация (независимо от контекста) — это примечание, добавленное в виде пояснения или комментария. После секвенирования генома его необходимо аннотировать, чтобы понять его смысл. ^[47]

Цифровое изображение

В сообществе цифровых изображений термин «аннотация» обычно используется для видимых метаданных, наложенных на изображение без изменения основного основного изображения, таких как стикеры , виртуальные лазерные указатели, круги, стрелки и затемнения (см. Редактирование ). ^[48]

В сообществе специалистов по медицинской визуализации аннотацию часто называют областью интереса и кодируют в формате DICOM .

Другое использование

Закон

В Соединенных Штатах юридические издательства, такие как Thomson West и Lexis Nexis, публикуют аннотированные версии законов , предоставляя информацию о судебных делах , в которых законы интерпретировались. Как федеральный Кодекс Соединенных Штатов, так и законы штатов подлежат толкованию судами , а аннотированные законы являются ценными инструментами в юридических исследованиях . ^[49]

Лингвистика

Одной из целей аннотации является преобразование данных в форму, пригодную для компьютерного анализа. Перед аннотацией определяется схема аннотации, которая обычно состоит из тегов. Во время разметки транскрипционисты вручную добавляют теги в расшифровки, где необходимые лингвистические особенности идентифицируются в редакторе аннотаций. Схема аннотаций гарантирует, что теги добавляются последовательно во всем наборе данных, и позволяет проверять ранее помеченные данные. ^[50] Помимо тегов, более сложные формы лингвистической аннотации включают аннотацию фраз и отношений, например, в древовидных банках . Было разработано множество различных форм лингвистических аннотаций, а также различные форматы и инструменты для создания лингвистических аннотаций и управления ими, как описано, например, в Wiki Linguistic Annotation Wiki. ^[51]

Смотрите также

Посмотрите аннотацию в Викисловаре, бесплатном словаре.

Аннотация (резюме)
Автоматическое аннотирование изображений
Кодирование (социальные науки)
Аннотация к драме
Комментарий (разные)
Сноска
Гиперкино
Индекс (публикация)
Маргиналии
Метаданные
Нота Бене
Обелус , символ, используемый в древних рукописях для обозначения отрывков, которые предположительно были искажены или поддельны; практика добавления таких пометок на полях стала известна как обелим .
PDF-аннотация
Тематическое индексирование
Семантика
Тег (метаданные)
Текстовая аннотация
Веб-аннотации
XPS-аннотация