Аннотация — это дополнительная информация, связанная с определенным пунктом в документе или другой частью информации. Это может быть примечание, включающее комментарий или пояснение. [1] Аннотации иногда размещаются на полях страниц книг . Для аннотаций различных цифровых носителей см. веб-аннотации и текстовые аннотации .
Предоставляется пять типов аннотаций: аннотация LIDAR, аннотация изображения, текстовая аннотация, видео аннотация, аудио аннотация [2]
Методы аннотирования включают выделение фразы или предложения и включение комментария, обведение слова, требующего определения, постановку вопроса, если что-то не до конца понятно, и написание краткого резюме ключевого раздела. [3] Он также предлагает студентам «(ре)конструировать историю посредством вовлечения в материал и захватывающих методов аннотирования DIY (сделай сам)». [4] Методы аннотирования, доступные сегодня, предлагают замечательный набор инструментов, чтобы студенты могли начать работать, и в более совместной, связанной манере, чем это было возможно ранее. [5]
Текстовая и киноаннотация — это метод, который включает использование комментариев, текста в фильме. Анализ видео — это начинание, которое никогда не бывает полностью свободным от предвзятых мнений, и первым шагом для исследователей является нахождение своих ориентиров в области возможных исследовательских подходов и, таким образом, размышление над собственными основными предположениями. [6] Аннотации могут присутствовать в видео и могут использоваться при записи видеоданных. Они используются как инструмент в тексте и фильме для записи мыслей и эмоций в маркировку. [3] На любом количестве шагов анализа они также могут быть дополнены дополнительными аннотациями. Антрополог Клиффорд Гирц называет это «толстым описанием». Это может дать представление о том, насколько полезны аннотации, особенно путем добавления описания того, как они могут быть реализованы в фильме. [6]
Marginalia относится к написанию или оформлению на полях рукописи. Средневековые marginalia настолько известны, что забавные или сбивающие с толку примеры их являются пищей для вирусных агрегаторов, таких как Buzzfeed и Brainpickings, а увлечение чтением других читателей проявляется на таких сайтах, как Melville's Marginalia Online или онлайн-выставка Harvard marginalia из шести личных библиотек. [5] Они также могут быть частью других веб-сайтов, таких как Pinterest, или даже генераторов мемов и инструментов GIF.
Текстология — это дисциплина, которая часто использует технику аннотирования для описания или добавления дополнительного исторического контекста к текстам и физическим документам, чтобы сделать их более понятными. [7]
Студенты часто выделяют отрывки в книгах, чтобы активно взаимодействовать с текстом. Студенты могут использовать аннотации, чтобы легко ссылаться на ключевые фразы, или добавлять заметки на полях , чтобы помочь в изучении и поиске связей между текстом и предыдущими знаниями или текущими темами. [8]
Аннотированные библиографии содержат комментарии относительно релевантности или качества каждого источника в дополнение к обычной библиографической информации, которая просто идентифицирует источник.
Студенты используют аннотации не только в академических целях, но и для интерпретации собственных мыслей, чувств и эмоций. [3] Такие сайты, как Scalar и Omeka, являются сайтами, которые используют студенты. Существует множество жанров с аннотациями, таких как математика, кино, лингвистика и литературная теория, которые студенты считают наиболее полезными для использования. Большинство студентов отметили, что процесс аннотации полезен для улучшения общих навыков письма, грамматики и академического словарного запаса.
Математические выражения (символы и формулы) могут быть аннотированы их естественным языковым значением. Это важно для устранения неоднозначности, поскольку символы могут иметь разные значения (например, «E» может быть «энергия» или «ожидаемое значение» и т. д.). [9] [10] Процесс аннотирования может быть облегчен и ускорен с помощью рекомендаций, например, с использованием системы «AnnoMathTeX», размещенной в Wikimedia. [11] [12] [13]
С когнитивной точки зрения аннотация играет важную роль в обучении и обучении. Как часть направленного внимания она включает в себя выделение, наименование или маркировку и комментирование аспектов визуальных представлений, чтобы помочь сосредоточить внимание учащихся на определенных визуальных аспектах. Другими словами, это означает назначение типологических представлений (культурно значимых категорий) топологическим представлениям (например, изображениям). [14] Это особенно важно, когда эксперты, такие как врачи, подробно интерпретируют визуализации и объясняют свои интерпретации другим, например, с помощью цифровых технологий. [15] Здесь аннотация может быть способом установления общей основы между взаимодействующими лицами с разным уровнем знаний. [16] Ценность аннотации была подтверждена эмпирически, например, в исследовании, которое показывает, что в компьютерных телеконсультациях интеграция аннотации изображений и речи приводит к значительному улучшению обмена знаниями по сравнению с использованием изображений и речи без аннотации. [17]
Аннотации были удалены с YouTube 15 января 2019 года после примерно десятилетия обслуживания. [18] Они позволяли пользователям предоставлять информацию, которая всплывала во время видео, но YouTube указал, что они не очень хорошо работают на небольших мобильных экранах и ими злоупотребляют.
Языки разметки, такие как XML и HTML, аннотируют текст таким образом, что он синтаксически отличается от этого текста. Их можно использовать для добавления информации о желаемом визуальном представлении или машиночитаемой семантической информации, как в семантической паутине . [19]
Сюда входят CSV и XLS . Процесс назначения семантических аннотаций табличным данным называется семантической маркировкой. Семантическая маркировка — это процесс назначения аннотаций из онтологий табличным данным. [20] [21] [22] [23] Этот процесс также называется семантической аннотацией. [24] [23] Семантическая маркировка часто выполняется в (полу)автоматическом режиме. Методы семантической маркировки работают со столбцами сущностей, [23] числовыми столбцами, [20] [22] [25] [26] координатами, [27] и т. д. [27] [26]
Существует несколько типов семантической маркировки, которые используют методы машинного обучения. Эти методы можно классифицировать, следуя работе Флаха [28] [29] следующим образом: геометрические (использующие линии и плоскости, такие как машина опорных векторов , линейная регрессия ), вероятностные (например, условное случайное поле ), логические (например, обучение дерева решений ) и не-ML-методы (например, балансировка покрытия и специфичности [23] ). Обратите внимание, что геометрические, вероятностные и логические модели машинного обучения не являются взаимоисключающими. [28]
Фам и др. [30] используют индекс Жаккара и сходство TF-IDF для текстовых данных и тест Колмогорова-Смирнова для числовых. Алобаид и Корчо [22] используют нечеткую кластеризацию (c-means [31] [32] ) для маркировки числовых столбцов.
Лимай и др. [33] используют сходство TF-IDF и графические модели . Они также используют машину опорных векторов для вычисления весов. Венетис и др. [34] создают базу данных isA, которая состоит из пар (экземпляр, класс), а затем вычисляют максимальное правдоподобие с использованием этих пар. Алобейд и Корчо [35] аппроксимировали график qq для прогнозирования свойств числовых столбцов.
Сайед и др. [36] построили Wikitology, которая является «гибридной базой знаний структурированной и неструктурированной информации, извлеченной из Wikipedia, дополненной данными RDF из DBpedia и других ресурсов Linked Data». [36] Для индекса Wikitology они используют PageRank для связывания сущностей , что является одной из задач, часто используемых в семантической маркировке. Поскольку они не смогли запросить Google для всех статей Wikipedia, чтобы получить PageRank , они использовали дерево решений для его аппроксимации. [36]
Alobaid и Corcho [23] представили подход к аннотированию столбцов сущностей. Метод начинается с аннотирования ячеек в столбце сущностей сущностями из справочного графа знаний (например, DBpedia ). Затем классы собираются, и каждый из них оценивается на основе нескольких формул, которые они представили, принимая во внимание частоту каждого класса и их глубину в соответствии с иерархией подклассов. [37]
Вот некоторые из распространенных задач семантической маркировки, представленных в литературе:
Это наиболее распространенная задача в семантической маркировке. При наличии текста ячейки и источника данных подход предсказывает сущность и связывает ее с той, которая идентифицирована в данном источнике данных. Например, если входными данными для подхода были текст «Ричард Фейнман» и URL-адрес конечной точки SPARQL DBpedia, подход вернет «http://dbpedia.org/resource/Richard_Feynman», что является сущностью из DBpedia. Некоторые подходы используют точное совпадение. [23] в то время как другие используют метрики сходства, такие как сходство по косинусу [33]
Столбец «Тема» таблицы — это столбец, содержащий основные субъекты/сущности в таблице. [20] [29] [34] [38] [39] Некоторые подходы ожидают столбец «Тема» в качестве входных данных [23] , в то время как другие, например TableMiner+, предсказывают столбец «Тема». [39]
Типы столбцов делятся по-разному в зависимости от разных подходов. [29] Некоторые делят их на строки/текст и числа [22] [30] [40] [26] , в то время как другие делят их дальше [29] (например, Типология чисел, [20] Дата, [36] [34] Координаты [41] ).
Связь между Мадридом и Испанией — «capitalOf». [42] Такие связи можно легко найти в онтологиях, таких как DBpedia . Венетис и др. [34] используют TextRunner [43] для извлечения связи между двумя столбцами. Сайед и др. [36] используют связь между сущностями двух столбцов и выбирают наиболее частую связь.
T2D [44] является наиболее распространенным золотым стандартом для семантической маркировки. Существуют две версии T2D: T2Dv1 (иногда также упоминаются как T2D) и T2Dv2. [44] Другие известные бенчмарки публикуются в SemTab Challenge. [45]
Функция «annotate» (также известная как «blame» или «praise»), используемая в системах управления исходным кодом , таких как Git , Team Foundation Server и Subversion, определяет, кто зафиксировал изменения в исходном коде в репозитории. Это выводит копию исходного кода, где каждая строка аннотируется именем последнего участника, редактировавшего эту строку (и, возможно, номером ревизии). Это может помочь установить виновника в случае, если изменение вызвало сбой, или определить автора блестящего кода.
Особым случаем является язык программирования Java , где аннотации могут использоваться как особая форма синтаксических метаданных в исходном коде. [46] Классы, методы, переменные, параметры и пакеты могут быть аннотированы. Аннотации могут быть встроены в файлы классов , сгенерированные компилятором, и могут быть сохранены виртуальной машиной Java и, таким образом, влиять на поведение приложения во время выполнения . Можно создавать метааннотации из существующих в Java. [47]
Автоматическая аннотация изображений используется для классификации изображений для систем поиска изображений . [48]
С 1980-х годов молекулярная биология и биоинформатика создали потребность в аннотации ДНК . Аннотация ДНК или аннотация генома — это процесс идентификации местоположений генов и всех кодирующих областей в геноме и определения того, что делают эти гены. Аннотация (независимо от контекста) — это примечание, добавленное в качестве объяснения или комментария. После того, как геном секвенирован, его необходимо аннотировать, чтобы придать ему смысл. [49]
В сообществе специалистов по цифровым изображениям термин «аннотация» обычно используется для обозначения видимых метаданных, наложенных на изображение без изменения основного изображения, например, стикеров , виртуальных лазерных указок, кругов, стрелок и затемнений (ср. редактирование ). [50]
В сообществе специалистов по медицинской визуализации аннотация часто называется областью интереса и кодируется в формате DICOM .
В Соединенных Штатах юридические издательства, такие как Thomson West и Lexis Nexis, публикуют аннотированные версии законов , предоставляя информацию о судебных делах , которые интерпретировали законы. Как федеральный Кодекс Соединенных Штатов , так и законы штатов подлежат толкованию судами , а аннотированные законы являются ценными инструментами в юридических исследованиях . [51]
Одной из целей аннотации является преобразование данных в форму, подходящую для компьютерного анализа. Перед аннотацией определяется схема аннотации, которая обычно состоит из тегов. Во время аннотации транскрибаторы вручную добавляют теги в транскрипты, где требуемые лингвистические признаки идентифицируются в редакторе аннотаций. Схема аннотации гарантирует, что теги добавляются последовательно по всему набору данных и позволяет проверять ранее помеченные данные. [52] Помимо тегов, более сложные формы лингвистической аннотации включают аннотацию фраз и отношений, например, в древовидных банках . Было разработано много различных форм лингвистической аннотации, а также различные форматы и инструменты для создания и управления лингвистическими аннотациями, как описано, например, в Linguistic Annotation Wiki. [53]
{{cite web}}
: CS1 maint: несколько имен: список авторов ( ссылка )