stringtranslate.com

Анализ настроений

Анализ настроений (также известный как интеллектуальный анализ мнений или ИИ эмоций ) — это использование обработки естественного языка , анализа текста , компьютерной лингвистики и биометрии для систематической идентификации, извлечения, количественной оценки и изучения аффективных состояний и субъективной информации. Анализ настроений широко применяется для анализа материалов клиентов, таких как обзоры и ответы на опросы, онлайн- и социальные сети, а также материалов о здравоохранении для приложений, которые варьируются от маркетинга до обслуживания клиентов и клинической медицины. С появлением моделей глубокого языка, таких как RoBERTa, можно анализировать и более сложные области данных, например, тексты новостей, где авторы обычно выражают свое мнение/чувства менее явно. [1]

Примеры

Цель и проблемы анализа настроений можно показать на нескольких простых примерах.

Простые случаи

Более сложные примеры

Типы

Основная задача анализа настроений - классифицировать полярность данного текста на уровне документа, предложения или функции/аспекта - является ли выраженное мнение в документе, предложении или функции/аспекте объекта положительным, отрицательным или нейтральным. Расширенная классификация чувств «за пределами полярности» рассматривает, например, эмоциональные состояния, такие как удовольствие, гнев, отвращение, печаль, страх и удивление. [2]

Предшественниками сентиментального анализа являются журнал General Inquirer [3] , в котором содержались подсказки по количественному определению закономерностей в тексте, и отдельно психологические исследования, в которых изучалось психологическое состояние человека на основе анализа его вербального поведения. [4]

Впоследствии метод, описанный в патенте Вулкани и Фогеля [5] , специально рассматривал настроения и идентифицировал отдельные слова и фразы в тексте по различным эмоциональным шкалам. Современная система, основанная на их работе, под названием EffectCheck, представляет синонимы, которые можно использовать для увеличения или уменьшения уровня вызванных эмоций по каждой шкале.

Многие другие последующие попытки были менее сложными и использовали просто полярный взгляд на настроения, от позитивных к негативным, например, работа Терни [6] и Панга [7] , которые применили разные методы для обнаружения полярности обзоров продуктов и обзоров фильмов соответственно. . Эта работа ведется на уровне документа. Можно также классифицировать полярность документа по многомерной шкале, что, в частности, попытались сделать Панг [8] и Снайдер [9] : Панг и Ли [8] расширили основную задачу классификации рецензий на фильмы как на положительные, так и на отрицательные. для прогнозирования звездных рейтингов по 3- или 4-звездочной шкале, в то время как Снайдер [9] провел углубленный анализ обзоров ресторанов, прогнозируя рейтинги по различным аспектам данного ресторана, таким как еда и атмосфера (по пятизвездочная шкала).

Первые шаги по объединению различных подходов — обучения, лексики, знаний и т. д. — были сделаны на весеннем симпозиуме AAAI 2004 года , где лингвисты, компьютерщики и другие заинтересованные исследователи впервые согласовали интересы и предложили общие задачи и наборы эталонных данных для систематические вычислительные исследования аффекта, привлекательности, субъективности и настроений в тексте. [10]

Несмотря на то, что в большинстве методов статистической классификации нейтральный класс игнорируется, исходя из предположения, что нейтральные тексты лежат вблизи границы бинарного классификатора, некоторые исследователи предполагают, что, как и в каждой проблеме полярности, необходимо идентифицировать три категории. Более того, можно доказать, что конкретные классификаторы, такие как Max Entropy [11] и SVM [12], могут выиграть от введения нейтрального класса и повысить общую точность классификации. В принципе есть два способа работы с нейтральным классом. Либо алгоритм сначала идентифицирует нейтральный язык, фильтрует его, а затем оценивает остальные с точки зрения положительных и отрицательных настроений, либо строит трехстороннюю классификацию за один шаг. [13] Этот второй подход часто включает оценку распределения вероятностей по всем категориям (например, наивные классификаторы Байеса, реализованные NLTK ) . Использовать ли нейтральный класс и как его использовать, зависит от характера данных: если данные четко сгруппированы в нейтральные, негативные и позитивные выражения, имеет смысл отфильтровать нейтральные выражения и сосредоточиться на полярности между позитивными и негативными настроениями. Если, напротив, данные в основном нейтральны с небольшими отклонениями в сторону положительного и отрицательного воздействия, эта стратегия затруднит четкое различие между двумя полюсами.

Другой метод определения настроения - это использование системы шкалы, при которой словам, обычно связанным с отрицательным, нейтральным или положительным настроением, присваивается соответствующее число по шкале от -10 до +10 (от самого отрицательного до самого положительного). или просто от 0 до положительного верхнего предела, например +4. Это позволяет корректировать тональность данного термина относительно его окружения (обычно на уровне предложения). Когда фрагмент неструктурированного текста анализируется с использованием обработки естественного языка , каждому понятию в указанной среде присваивается оценка, основанная на том, как эмоциональные слова соотносятся с понятием и связанной с ним оценкой. [14] [15] [16] Это позволяет перейти к более сложному пониманию настроений, поскольку теперь можно корректировать значение настроения концепции относительно модификаций, которые могут ее окружать. Например, слова, которые усиливают, ослабляют или сводят на нет чувство, выражаемое концепцией, могут повлиять на ее оценку. В качестве альтернативы текстам можно присвоить положительную и отрицательную оценку силы настроения, если цель состоит в том, чтобы определить настроение в тексте, а не общую полярность и силу текста. [17]

Существуют различные другие типы анализа настроений, такие как анализ настроений на основе аспектов, анализ настроений по шкале (положительные, отрицательные, нейтральные), многоязычный анализ настроений и обнаружение эмоций.

Идентификация субъективности/объективности

Эту задачу обычно определяют как отнесение данного текста (обычно предложения) к одному из двух классов: объективному или субъективному. [18] Иногда эта проблема может быть более сложной, чем классификация полярностей. [19] Субъективность слов и фраз может зависеть от их контекста, а объективный документ может содержать субъективные предложения (например, новостная статья, цитирующая мнения людей). Более того, как отметил Су, [20] результаты во многом зависят от определения субъективности, используемого при аннотировании текстов. Однако Панг [21] показал, что удаление объективных предложений из документа перед классификацией его полярности помогает повысить производительность.

Субъективная и объективная идентификация, новые подзадачи анализа настроений для использования синтаксических, семантических особенностей и знаний машинного обучения для определения того, содержит ли предложение или документ факты или мнения. Осознание необходимости распознавания фактов и мнений появилось не недавно, возможно, впервые оно было представлено Карбонеллом в Йельском университете в 1979 году. [ уточнить ]

Термин «цель» относится к инциденту, несущему фактическую информацию. [22]

Термин «субъективный» описывает инцидент, содержащий нефактическую информацию в различных формах, таких как личное мнение, суждение и прогнозы, также известные как «частные состояния». [23] В приведенном ниже примере это отражает частное государство «Мы, американцы». Более того, целевой объект, комментируемый мнениями, может принимать различные формы: от материального продукта до нематериальных тем, указанных в Liu (2010). [24] Кроме того, Лю (2010) наблюдал три типа отношения: 1) положительные мнения, 2) нейтральные мнения и 3) отрицательные мнения. [24]

Этот анализ представляет собой проблему классификации. [25]

Коллекции слов или индикаторов фраз каждого класса определены для поиска желаемых шаблонов в неаннотированном тексте. Для субъективного выражения был создан другой список слов. Списки субъективных показателей в словах или фразах были разработаны многими исследователями в области лингвистики и обработки естественного языка в Riloff et al. (2003). [26] Для измерения заданных выражений необходимо создать словарь правил извлечения. С годами, в субъективном обнаружении, извлечение функций прогрессировало от ручного управления функциями до автоматического изучения функций. На данный момент методы автоматизированного обучения можно разделить на контролируемое и неконтролируемое машинное обучение . Извлечение шаблонов с помощью процесса машинного обучения, аннотированного и неаннотированного текста, широко изучалось академическими исследователями.

Тем не менее, исследователи признали несколько проблем в разработке фиксированных наборов правил для респектабельных выражений. Большая часть проблем при разработке правил связана с природой текстовой информации. Несколько исследователей признали шесть проблем: 1) метафорические выражения, 2) расхождения в написании, 3) контекстно-зависимые, 4) представленные слова с меньшим употреблением, 5) чувствительные ко времени и 6) постоянно растущий объем.

  1. Метафорические выражения. Текст содержит метафорические выражения, которые могут повлиять на результативность извлечения. [27] Кроме того, метафоры принимают разные формы, что, возможно, способствовало увеличению раскрываемости.
  2. Расхождения в сочинениях. Для текста, полученного из Интернета, расхождения в стиле написания целевых текстовых данных связаны с разными жанрами и стилями письма.
  3. Контекстно-зависимый. Классификация может варьироваться в зависимости от субъективности или объективности предыдущих и последующих предложений. [25]
  4. Атрибут, чувствительный ко времени. Задача усложняется из-за того, что некоторые текстовые данные чувствительны к времени. Если группа исследователей хочет подтвердить какой-либо факт в новостях, им потребуется больше времени для перекрестной проверки, чем новости устареют.
  5. Ключевые слова с меньшим количеством употреблений.
  6. Постоянно растущий объем. Задача также усложняется огромным объемом текстовых данных. Постоянно растущий характер текстовых данных чрезвычайно затрудняет исследователям выполнение задачи вовремя.

Ранее исследования в основном были сосредоточены на классификации на уровне документов. Однако классификация уровня документа страдает меньшей точностью, поскольку в статье могут использоваться различные типы выражений. Данные исследования показывают, что в ряде новостных статей, как ожидается, будет доминировать объективное выражение, тогда как результаты показывают, что он состоит более чем на 40% из субъективного выражения. [22]

Чтобы преодолеть эти проблемы, исследователи приходят к выводу, что эффективность классификатора зависит от точности изучаемых шаблонов. А учащиеся, получающие большие объемы аннотированных обучающих данных, превосходили тех, кто обучался менее полным субъективным характеристикам. Однако одним из основных препятствий для выполнения этого типа работы является ручное создание большого набора данных аннотированных предложений. Метод ручного аннотирования менее популярен, чем автоматическое обучение, по трем причинам:

  1. Различия в понимании. При выполнении задачи аннотации вручную среди аннотаторов могут возникнуть разногласия по поводу того, является ли один экземпляр субъективным или объективным из-за двусмысленности языков.
  2. Человеческие ошибки. Задача ручного аннотирования — это кропотливое задание, для выполнения которого требуется напряженная концентрация.
  3. Кропотливый. Задача ручного аннотирования — кропотливая работа. Рилофф (1996) показал, что на обработку 160 текстов одному аннотатору уходит 8 часов. [28]

Все эти упомянутые причины могут повлиять на эффективность и результативность субъективной и объективной классификации. Соответственно, были разработаны два метода начальной загрузки для изучения лингвистических шаблонов на основе неаннотированных текстовых данных. Оба метода начинаются с нескольких исходных слов и неаннотированных текстовых данных.

  1. Мета-бутстреппинг, предложенный Рилоффом и Джонсом в 1999 году. [29] Уровень первый: создание шаблонов извлечения на основе заранее определенных правил и извлеченных шаблонов по количеству исходных слов, которые содержит каждый шаблон. Уровень второй: 5 лучших слов будут отмечены и добавлены в словарь. Повторить.
  2. Василиск ( самонастраивающийся подход к индукции семантической лексики с использованием семантических знаний ) Телен и Рилофф . [30] Шаг первый: Создайте шаблоны извлечения. Шаг второй: переместите лучшие шаблоны из пула шаблонов в пул слов-кандидатов. Шаг третий: 10 лучших слов будут отмечены и добавлены в словарь. Повторить.

В целом, эти алгоритмы подчеркивают необходимость автоматического распознавания и извлечения образов в субъективных и объективных задачах.

Субъективный и объектный классификаторы могут улучшить некоторые приложения обработки естественного языка. Одним из основных преимуществ классификатора является то, что он популяризирует практику процессов принятия решений на основе данных в различных отраслях. По словам Лю, применение субъективной и объективной идентификации реализовано в бизнесе, рекламе, спорте и социальных науках. [31]

На основе функций/аспектов

Это относится к определению мнений или настроений, выраженных в отношении различных характеристик или аспектов объектов, например сотового телефона, цифровой камеры или банка. [35] Характеристика или аспект — это атрибут или компонент объекта, например, экрана сотового телефона, услуги ресторана или качества изображения камеры. Преимущество анализа настроений на основе признаков заключается в возможности улавливать нюансы интересующих объектов. Различные функции могут вызывать разные реакции настроения, например, отель может иметь удобное расположение, но посредственную еду. [36] Эта проблема включает в себя несколько подзадач, например, идентификация соответствующих объектов, извлечение их особенностей/аспектов и определение того, является ли мнение, выраженное по каждой функции/аспекту, положительным, отрицательным или нейтральным. [37] Автоматическое определение особенностей может выполняться с помощью синтаксических методов, с помощью тематического моделирования , [38] [39] или с помощью глубокого обучения . [40] [41] Более подробные обсуждения этого уровня анализа настроений можно найти в работе Лю. [24]

Рейтинг интенсивности

Эмоции и чувства субъективны по своей природе. Степень эмоций/чувств, выраженных в данном тексте на уровне документа, предложения или функции/аспекта — степень интенсивности, выраженная по мнению документа , предложения или объекта, различается в каждом конкретном случае. основе. [42] Однако предсказание только эмоций и настроений не всегда дает полную информацию. Степень или уровень эмоций и чувств часто играет решающую роль в понимании конкретного чувства в рамках одного класса (например, «хорошо» или «потрясающе»). Некоторые методы используют метод составного ансамбля [43] для прогнозирования интенсивности эмоций и настроений путем объединения полученных результатов и использования моделей глубокого обучения , основанных на сверточных нейронных сетях , [44] сетях долгосрочной краткосрочной памяти и закрытых рекуррентных единицах . [45]

Методы и особенности

Существующие подходы к анализу настроений можно сгруппировать в три основные категории: методы, основанные на знаниях, статистические методы и гибридные подходы. [46] Методы, основанные на знаниях, классифицируют текст по категориям аффектов на основе наличия однозначных аффектных слов, таких как счастье, грусть, страх и скука. [47] Некоторые базы знаний не только перечисляют слова с очевидным эффектом, но также приписывают произвольным словам возможную «близость» к конкретным эмоциям. [48] ​​Статистические методы используют элементы машинного обучения , такие как скрытый семантический анализ , машины опорных векторов , « мешок слов », « Поточечная взаимная информация » для семантической ориентации, [6] модели семантического пространства или модели встраивания слов , [49] и глубокое обучение . Более сложные методы пытаются обнаружить носителя настроения (т. е. человека, который поддерживает это аффективное состояние) и цель (т. е. сущность, в отношении которой ощущается аффект). [50] Чтобы изучить мнение в контексте и получить характеристику, о которой высказал мнение говорящий, используются грамматические отношения слов. Отношения грамматической зависимости получаются путем глубокого разбора текста. [51] Гибридные подходы используют как машинное обучение, так и элементы представления знаний , такие как онтологии и семантические сети, для обнаружения семантики, выраженной тонким способом, например, посредством анализа концепций, которые явно не передают соответствующую информацию, но которые неявно связаны с другими концепциями, которые делают это. [52]

Программные инструменты с открытым исходным кодом, а также ряд бесплатных и платных инструментов анализа настроений используют методы машинного обучения , статистики и обработки естественного языка для автоматизации анализа настроений в больших коллекциях текстов, включая веб-страницы, онлайн-новости, интернет-дискуссионные группы, онлайн-обзоры, веб-блоги и социальные сети. [53] Системы, основанные на знаниях, с другой стороны, используют общедоступные ресурсы для извлечения семантической и аффективной информации, связанной с концепциями естественного языка. Система может помочь в реализации аффективных рассуждений, основанных на здравом смысле . [54] Анализ настроений также можно выполнять на визуальном контенте, то есть изображениях и видео (см. Мультимодальный анализ настроений ). Одним из первых подходов в этом направлении является SentiBank [55] , использующий для представления визуального контента пару прилагательных-существительных. Кроме того, подавляющее большинство подходов к классификации настроений основано на модели «мешка слов», которая игнорирует контекст, грамматику и даже порядок слов . Подходы, которые анализируют настроения на основе того, как слова составляют значение более длинных фраз, показали лучшие результаты [56] , но они требуют дополнительных накладных расходов на аннотации.

При анализе настроений необходим компонент человеческого анализа, поскольку автоматизированные системы не способны анализировать исторические тенденции отдельного комментатора или платформы и часто неправильно классифицируются по выраженным ими настроениям. Автоматизация влияет примерно на 23% комментариев, которые правильно классифицируются людьми. [57] Однако люди часто не соглашаются, и утверждается, что соглашение между людьми обеспечивает верхнюю границу, которой в конечном итоге могут достичь автоматизированные классификаторы настроений. [58]

Оценка

Точность системы анализа настроений, в принципе, определяется тем, насколько хорошо она согласуется с человеческими суждениями. Обычно это измеряется различными показателями, основанными на точности и запоминаемости двух целевых категорий негативных и позитивных текстов. Однако, согласно исследованиям, оценщики-люди обычно соглашаются только примерно в 80% случаев [59] (см. «Надежность между оценщиками »). Таким образом, программа, которая достигает 70% точности в классификации настроений, работает почти так же хорошо, как люди, хотя такая точность может показаться не впечатляющей. Если бы программа была «правильной» в 100% случаев, люди все равно не соглашались бы с ней примерно в 20% случаев, поскольку они не согласны с любым ответом. [ нужна цитата ]

С другой стороны, компьютерные системы допускают совсем другие ошибки, чем люди-оценщики, поэтому цифры не совсем сопоставимы. Например, у компьютерной системы будут проблемы с отрицаниями, преувеличениями, шутками или сарказмом, с которыми обычно легко справиться читателю: некоторые ошибки, которые допускает компьютерная система, покажутся человеку слишком наивными. В целом полезность анализа настроений для практических коммерческих задач, как он определен в академических исследованиях, была поставлена ​​под сомнение, главным образом потому, что простая одномерная модель настроения от негативного к позитивному дает довольно мало полезной информации для клиента, беспокоящегося о влияние общественного дискурса, например, на репутацию бренда или компании. [60] [61] [62]

Чтобы лучше соответствовать потребностям рынка, оценка анализа настроений перешла к более целенаправленным измерениям, сформулированным совместно с представителями PR-агентств и специалистами по исследованию рынка. Например, в наборе оценочных данных RepLab основное внимание уделяется не содержанию рассматриваемого текста, а влиянию рассматриваемого текста на репутацию бренда . [63] [64] [65]

Поскольку оценка анализа настроений становится все более и более основанной на задачах, для каждой реализации требуется отдельная модель обучения, чтобы получить более точное представление настроений для данного набора данных.

Веб 2.0

Рост социальных сетей , таких как блоги и социальные сети, подогрел интерес к анализу настроений. С распространением обзоров, рейтингов, рекомендаций и других форм онлайн-выражения онлайн-мнение превратилось в своего рода виртуальную валюту для компаний, стремящихся продвигать свою продукцию, выявлять новые возможности и управлять своей репутацией. Поскольку компании стремятся автоматизировать процесс фильтрации шума, понимания разговоров, определения соответствующего контента и принятия соответствующих мер, многие теперь обращают внимание на область анализа настроений. [66] Ситуация еще больше усложняется ростом анонимных социальных сетей, таких как 4chan и Reddit . [67] Если веб 2.0 был направлен на демократизацию публикации, то следующий этап развития Интернета вполне может быть основан на демократизации интеллектуального анализа данных всего публикуемого контента. [68]

Один шаг к этой цели делается в исследованиях. Несколько исследовательских групп в университетах по всему миру в настоящее время сосредоточены на понимании динамики настроений в электронных сообществах посредством анализа настроений. [69]

Проблема в том, что большинство алгоритмов анализа настроений используют простые термины для выражения настроений по поводу продукта или услуги. Однако культурные факторы, лингвистические нюансы и различные контексты чрезвычайно затрудняют превращение строки письменного текста в простое высказывание «за» или «против». [66] Тот факт, что люди часто не согласны с тональностью текста, иллюстрирует, насколько велика задача компьютеров, чтобы понять это правильно. Чем короче строка текста, тем сложнее она становится.

Несмотря на то, что короткие текстовые строки могут быть проблемой, анализ настроений в микроблогах показал, что Twitter можно рассматривать как надежный онлайн-индикатор политических настроений. Политические настроения в Твиттерах демонстрируют близкое соответствие политическим позициям партий и политиков, что указывает на то, что содержание сообщений в Твиттере правдоподобно отражает офлайновый политический ландшафт. [70] Кроме того, было показано, что анализ настроений в Твиттере позволяет выявить общественные настроения, связанные с циклами репродукции человека во всем мире, [71] а также другие проблемы, имеющие значение для общественного здравоохранения, такие как побочные реакции на лекарства. [72]

Хотя анализ настроений был популярен в областях, где авторы выражают свое мнение довольно явно («фильм потрясающий»), таких как социальные сети и обзоры продуктов, только недавно были разработаны надежные методы для других областей, где настроения сильно неявны или косвенны. Например, в новостных статьях – в основном из-за ожидаемой журналистской объективности – журналисты часто описывают действия или события, а не прямо заявляют о полярности той или иной информации. Более ранние подходы с использованием словарей или поверхностных функций машинного обучения не могли уловить «смысл между строк», но недавно исследователи предложили подход, основанный на глубоком обучении, и набор данных, который способен анализировать настроения в новостных статьях. [1]

Применение в рекомендательных системах

Для рекомендательной системы анализ настроений оказался ценным методом. Цель рекомендательной системы — предсказать предпочтение элемента целевого пользователя. Основные рекомендательные системы работают с явным набором данных. Например, совместная фильтрация работает с матрицей рейтингов, а фильтрация на основе контента — с метаданными элементов.

Во многих социальных сетях или на веб -сайтах электронной коммерции пользователи могут оставлять текстовые обзоры, комментарии или отзывы о товарах. Этот генерируемый пользователем текст представляет собой богатый источник мнений пользователей о многочисленных продуктах и ​​предметах. Потенциально для элемента такой текст может раскрывать как связанную функцию/аспекты элемента, так и мнение пользователей по поводу каждой функции. [73] Характеристики/аспекты элемента, описанные в тексте, играют ту же роль, что и метаданные при контентной фильтрации , но первые более ценны для рекомендательной системы. Поскольку эти функции широко упоминаются пользователями в своих обзорах, их можно рассматривать как наиболее важные функции, которые могут существенно повлиять на взаимодействие пользователя с элементом, в то время как метаданные элемента (обычно предоставляемые производителями, а не потребителями) может игнорировать функции, которые интересуют пользователей. К различным элементам с общими характеристиками пользователь может относиться по-разному. Кроме того, функция одного и того же элемента может вызывать разные мнения у разных пользователей. Мнения пользователей по поводу функций можно рассматривать как многомерный рейтинг, отражающий их предпочтения в отношении элементов.

На основе особенностей/аспектов и настроений, извлеченных из пользовательского текста, можно построить гибридную рекомендательную систему. [74] Существует два типа мотивации рекомендовать пользователю элемент-кандидат. Первая мотивация заключается в том, что элемент-кандидат имеет множество общих характеристик с предметами, которые предпочитает пользователь, [75] , а вторая мотивация заключается в том, что элемент-кандидат получает высокую оценку своих характеристик. В случае предпочтительного предмета разумно полагать, что предметы с одинаковыми характеристиками будут иметь аналогичную функцию или полезность. Таким образом, эти элементы также, скорее всего, будут предпочтительнее пользователем. С другой стороны, что касается общей функции двух элементов-кандидатов, другие пользователи могут дать положительную оценку одному из них и отрицательную оценку другому. Очевидно, что продукт с высокой оценкой должен быть рекомендован пользователю. На основе этих двух мотивов для каждого кандидата можно построить комбинацию рейтинговых оценок сходства и рейтинга настроений. [74]

Помимо сложности самого анализа настроений, применение анализа настроений к отзывам или отзывам также сталкивается с проблемой спама и предвзятых отзывов. Одно направление работы сосредоточено на оценке полезности каждого обзора. [76] Плохо написанные обзоры или отзывы вряд ли полезны для рекомендательной системы. Кроме того, отзыв может быть составлен таким образом, чтобы препятствовать продажам целевого продукта и тем самым нанести вред рекомендательной системе, даже если он хорошо написан.

Исследователи также обнаружили, что к длинным и коротким формам пользовательского текста следует относиться по-разному. Интересный результат показывает, что краткие обзоры иногда более полезны, чем развернутые [77] , потому что в кратком тексте легче отфильтровать шум. Для длинного текста растущая длина текста не всегда приводит к пропорциональному увеличению количества особенностей или настроений в тексте.

Ламба и Мадхусудхан [78] представляют новый способ удовлетворения информационных потребностей современных пользователей библиотек путем переупаковки результатов анализа настроений социальных сетей, таких как Twitter, и предоставления их в виде консолидированного сервиса, основанного на времени, в различных форматах. Кроме того, они предлагают новый способ проведения маркетинга в библиотеках с использованием анализа социальных сетей и настроений.

Смотрите также

Рекомендации

  1. ^ аб Гамборг, Феликс; Донней, Карстен (2021). «NewsMTSC: набор данных для (много) целевой классификации настроений в статьях политических новостей». «Материалы 16-й конференции Европейского отделения Ассоциации компьютерной лингвистики: основной том»
  2. ^ Вонг Ань Хо, Дуонг Хуинь-Конг Нгуен, Дан Хоанг Нгуен, Линь Тхи-Ван Фам, Дык-Ву Нгуен, Киет Ван Нгуен, Нган Луу-Туи Нгуен. «Распознавание эмоций в текстах вьетнамских социальных сетей». В материалах Международной конференции Тихоокеанской ассоциации компьютерной лингвистики 2019 г. (PACLING 2019), Ханой, Вьетнам (2019).
  3. ^ Стоун, Филип Дж., Декстер К. Данфи и Маршалл С. Смит. «Общий исследователь: компьютерный подход к контент-анализу». MIT Press, Кембридж, Массачусетс (1966).
  4. ^ Готшальк, Луи Огюст и Голдин К. Глезер . Измерение психологических состояний посредством контент-анализа речевого поведения. Университет Калифорнии Пресс, 1969.
  5. ^ США Выпущено 7 136 877, Вулкани, Янон; И Фогель, Дэвид Б., «Система и метод определения и контроля воздействия текста», опубликовано 28 июня 2001 г. 
  6. ^ аб Терни, Питер (2002). «Большой палец вверх или большой палец вниз? Семантическая ориентация применительно к неконтролируемой классификации обзоров». Труды Ассоциации компьютерной лингвистики . стр. 417–424. arXiv : cs.LG/0212032 .
  7. ^ Панг, Бо; Ли, Лилиан ; Вайтьянатан, Шивакумар (2002). «Большой палец вверх? Классификация настроений с использованием методов машинного обучения». Материалы конференции по эмпирическим методам обработки естественного языка (EMNLP) . стр. 79–86.
  8. ^ аб Панг, Бо; Ли, Лилиан (2005). «Видеть звезды: использование классовых отношений для категоризации настроений по рейтинговым шкалам». Труды Ассоциации компьютерной лингвистики (ACL) . стр. 115–124.
  9. ^ аб Снайдер, Бенджамин; Барзилай, Регина (2007). «Многоаспектное ранжирование с использованием алгоритма хорошего горя». Труды совместной технологии человеческого языка/Североамериканского отделения конференции ACL (HLT-NAACL) . стр. 300–307. Архивировано из оригинала 6 августа 2016 года . Проверено 16 июня 2009 г.
  10. ^ Цюй, Ян, Джеймс Шанахан и Дженис Вибе . «Изучение отношения и аффекта в тексте: теории и приложения». На весеннем симпозиуме AAAI, технический отчет SS-04-07. AAAI Press, Менло-Парк, Калифорния. 2004.
  11. ^ Вриниотис, Василис (2013). Важность нейтрального класса в анализе настроений.
  12. ^ Коппель, Моше; Шлер, Джонатан (2006). «Важность нейтральных примеров для изучения настроений». Вычислительный интеллект 22 . стр. 100–109. CiteSeerX 10.1.1.84.9735 . 
  13. ^ Рибейро, Филипе Нуньес; Араужо, Матеус (2010). «Эталонное сравнение современных методов анализа настроений». Транзакции по встроенным вычислительным системам . 9 (4).
  14. ^ Табоада, Майте; Брук, Джулиан (2011). «Лексиконные методы анализа настроений». Компьютерная лингвистика . 37 (2): 272–274. CiteSeerX 10.1.1.188.5517 . дои : 10.1162/coli_a_00049. S2CID  3181362. 
  15. ^ Августыняк, Лукаш; Шиманский, Петр; Кайданович, Томаш; Тулиглович, Влодзимеж (25 декабря 2015 г.). «Комплексное исследование анализа настроений ансамблевой классификации на основе лексики». Энтропия . 18 (1): 4. Бибкод : 2015Entrp..18....4A. дои : 10.3390/e18010004 .
  16. ^ Мехмуд, Ясир; Балакришнан, Вимала (1 января 2020 г.). «Расширенный словарный подход к анализу настроений: тематическое исследование нелегальной иммиграции». Интернет-обзор информации . 44 (5): 1097–1117. doi : 10.1108/OIR-10-2018-0295. ISSN  1468-4527. S2CID  221766042.
  17. ^ Телвалл, Майк; Бакли, Киван; Палтоглу, Георгиос; Кай, Ди; Каппас, Арвид (2010). «Определение силы чувств в коротком неофициальном тексте». Журнал Американского общества информатики и технологий . 61 (12): 2544–2558. CiteSeerX 10.1.1.278.3863 . дои : 10.1002/asi.21416. 
  18. ^ Панг, Бо; Ли, Лилиан (2008). «4.1.2 Обнаружение субъективности и идентификация мнений». Анализ мнений и настроений . Теперь Паблишерс Инк.
  19. ^ Михалча, Рада; Банеа, Кармен; Вибе, Дженис (2007). «Изучение многоязычного субъективного языка с помощью межъязыковых проекций» (PDF) . Труды Ассоциации компьютерной лингвистики (ACL) . стр. 976–983. Архивировано из оригинала (PDF) 8 июля 2010 года.
  20. ^ Су, Фанчжун; Маркерт, Катя (2008). «От слов к чувствам: пример распознавания субъективности» (PDF) . Proceedings of Coling 2008, Манчестер, Великобритания .
  21. ^ Панг, Бо; Ли, Лилиан (2004). «Воспитание сентиментальности: анализ настроений с использованием обобщения субъективности на основе минимальных сокращений». Труды Ассоциации компьютерной лингвистики (ACL) . стр. 271–278.
  22. ^ аб Вибе, Дженис ; Рилофф, Эллен (2005). «Создание классификаторов субъективных и объективных предложений на основе неаннотированных текстов». В Гельбух, Александр (ред.). Компьютерная лингвистика и интеллектуальная обработка текста . Конспекты лекций по информатике. Том. 3406. Берлин, Гейдельберг: Springer. стр. 486–497. дои : 10.1007/978-3-540-30586-6_53. ISBN 978-3-540-30586-6.
  23. ^ Квирк, Рэндольф; Гринбаум, Сидней; Джеффри, Лич; Ян, Свартвик (1985). Комплексная грамматика английского языка (общая грамматика) . Лонгман . стр. 175–239. ISBN 1933108312.
  24. ^ abc Лю, Бинг (2010). «Анализ настроений и субъективность» (PDF) . В Индурхье, Н.; Дамерау, Ф.Дж. (ред.). Справочник по обработке естественного языка (второе изд.).
  25. ^ аб Панг, Бо; Ли, Лилиан (6 июля 2008 г.). «Анализ мнений и анализ настроений». Основы и тенденции в области информационного поиска . 2 (1–2): 1–135. дои : 10.1561/1500000011. ISSN  1554-0669. S2CID  207178694.
  26. ^ Рилофф, Эллен; Вибе, Дженис (11 июля 2003 г.). «Изучение шаблонов извлечения субъективных выражений». Материалы конференции 2003 года по эмпирическим методам обработки естественного языка . ЭМНЛП '03. Том. 10. США: Ассоциация компьютерной лингвистики. стр. 105–112. дои : 10.3115/1119355.1119369 . S2CID  6541910.
  27. ^ Вибе, Дженис ; Рилофф, Эллен (июль 2011 г.). «Нахождение взаимной выгоды между анализом субъективности и извлечением информации». Транзакции IEEE для аффективных вычислений . 2 (4): 175–191. дои : 10.1109/T-AFFC.2011.19. ISSN  1949-3045. S2CID  16820846.
  28. Рилофф, Эллен (1 августа 1996 г.). «Эмпирическое исследование автоматизированного построения словарей для извлечения информации в трех областях». Искусственный интеллект . 85 (1): 101–134. дои : 10.1016/0004-3702(95)00123-9 . ISSN  0004-3702.
  29. ^ Рилофф, Эллен; Джонс, Рози (июль 1999 г.). «Изучение словарей для извлечения информации путем многоуровневой загрузки» (PDF) . AAAI '99/IAAI '99: Материалы шестнадцатой национальной конференции по искусственному интеллекту и одиннадцатой конференции по инновационным применениям искусственного интеллекта. Инновационные применения искусственного интеллекта : 474–479.
  30. ^ Телен, Майкл; Рилофф, Эллен (6 июля 2002 г.). «Метод начальной загрузки для изучения семантических лексиконов с использованием контекстов шаблонов извлечения». Материалы конференции ACL-02 по эмпирическим методам обработки естественного языка - EMNLP '02 . Том. 10. США: Ассоциация компьютерной лингвистики. стр. 214–221. дои : 10.3115/1118693.1118721 . S2CID  137155. {{cite book}}: |journal=игнорируется ( помощь )
  31. Лю, Бинг (23 мая 2012 г.). «Анализ настроений и анализ мнений». Обобщающие лекции по технологиям человеческого языка . 5 (1): 1–167. doi : 10.2200/S00416ED1V01Y201204HLT016. ISSN  1947-4040. S2CID  38022159. Архивировано из оригинала 10 мая 2021 года . Проверено 9 декабря 2020 г.
  32. ^ Дэн, Шанкунь; Мицубути, Такаши; Сиода, Кей; Симада, Тацуро; Сакураи, Акито (декабрь 2011 г.). «Сочетание технического анализа с анализом настроений для прогнозирования цен на акции». 2011 Девятая международная конференция IEEE по надежным, автономным и безопасным вычислениям . IEEE. стр. 800–807. дои : 10.1109/dasc.2011.138. ISBN 978-1-4673-0006-3. S2CID  15262023.
  33. ^ Нгуен, Киет Ван; Нгуен, Ву Дык; Нгуен, Фу XV; Труонг, Там TH; Нгуен, Нган LT. (1 октября 2018 г.). «UIT-VSFC: Корпус отзывов вьетнамских студентов для анализа настроений». 2018 10-я Международная конференция по знаниям и системной инженерии (KSE) . Вьетнам: IEEE. стр. 19–24. дои : 10.1109/KSE.2018.8573337. ISBN 978-1-5386-6113-0. S2CID  56172224.
  34. ^ Ю, Хонг; Хацивасилоглу, Василейос (11 июля 2003 г.). «На пути к ответам на вопросы мнения». Материалы конференции 2003 года по эмпирическим методам обработки естественного языка . ЭМНЛП '03. Том. 10. США: Ассоциация компьютерной лингвистики. стр. 129–136. дои : 10.3115/1119355.1119372 .
  35. ^ Ху, Минцин; Лю, Бинг (2004). «Извлечение и обобщение отзывов клиентов». Труды КДД 2004 .
  36. ^ Катальди, Марио; Баллаторе, Андреа; Тидди, Илария; Офор, Мари-Од (22 июня 2013 г.). «Хорошее расположение, ужасная еда: определение настроений в отзывах пользователей». Анализ социальных сетей и майнинг . 3 (4): 1149–1163. CiteSeerX 10.1.1.396.9313 . дои : 10.1007/s13278-013-0119-7. ISSN  1869-5450. S2CID  5025282. 
  37. ^ Лю, Бинг; Ху, Минцин; Ченг, Цзюньшэн (2005). «Обозреватель общественного мнения: анализ и сравнение мнений в Интернете». Труды WWW 2005 .
  38. ^ Чжай, Чжунву; Лю, Бинг; Сюй, Хуа; Цзя, Пейфа (1 января 2011 г.). «Ограниченный LDA для группировки характеристик продукта при анализе мнений». В Хуане — Джошуа Чжэсюэ; Цао, Лунбин; Шривастава, Джайдип (ред.). Достижения в области обнаружения знаний и интеллектуального анализа данных . Конспекты лекций по информатике. Том. 6634. Шпрингер Берлин Гейдельберг. стр. 448–459. CiteSeerX 10.1.1.221.5178 . дои : 10.1007/978-3-642-20841-6_37. ISBN  978-3-642-20840-9.
  39. ^ Титов, Иван; Макдональд, Райан (1 января 2008 г.). «Моделирование онлайн-обзоров с помощью многогранных тематических моделей». Материалы 17-й международной конференции по Всемирной паутине . WWW '08. Нью-Йорк, штат Нью-Йорк, США: ACM. стр. 111–120. arXiv : 0801.1063 . дои : 10.1145/1367497.1367513. ISBN 978-1-60558-085-2. S2CID  13609860.
  40. ^ Лян, Бин; и другие. (2022). «Аспектный анализ настроений с помощью сверточных сетей графов с расширенными аффективными знаниями». Системы, основанные на знаниях . 235 : 107643. doi : 10.1016/j.knosys.2021.107643. S2CID  237258427.
  41. ^ Ма, Юкун; и другие. (2018). «Целевой аспектный анализ настроений посредством внедрения здравого смысла в внимательный LSTM». Труды АААИ . стр. 5876–5883.
  42. ^ Шарма, Ракша; сомани; Кумар; Бхаттачарья (2017). «Рейтинг интенсивности тональности среди прилагательных с использованием встраивания слов, несущих тональности» (PDF) . Ассоциация компьютерной лингвистики : 547–552.
  43. ^ М. С. Ахтар, А. Экбал и Э. Камбрия, «Насколько вы интенсивны? Прогнозирование интенсивности эмоций и чувств с использованием составного ансамбля [Заметки по применению]», в журнале IEEE Computational Intelligence Magazine , vol. 15, нет. 1, стр. 64–75, февраль 2020 г., номер doi: 10.1109/MCI.2019.2954667.
  44. ^ X. Оуян, П. Чжоу, Ч. Ли и Л. Лю, «Анализ настроений с использованием сверточной нейронной сети», Международная конференция IEEE 2015 г. по компьютерным и информационным технологиям; Повсеместные вычисления и коммуникации; Надежные, автономные и безопасные вычисления; Pervasive Intelligence and Computing, 2015, стр. 2359–2364, doi: 10.1109/CIT/IUCC/DASC/PICOM.2015.349.
  45. ^ Ю. Сантур, «Анализ настроений на основе закрытого рекуррентного блока», Международный симпозиум по искусственному интеллекту и обработке данных (IDAP), 2019 г., стр. 1–5, doi: 10.1109/IDAP.2019.8875985.
  46. ^ Камбрия, Э; Шуллер, Б; Ся, Ю; Хаваси, К. (2013). «Новые возможности в анализе мнений и настроений». Интеллектуальные системы IEEE . 28 (2): 15–21. CiteSeerX 10.1.1.688.1384 . дои : 10.1109/MIS.2013.30. S2CID  12104996. 
  47. ^ Ортони, Эндрю; Клор, Дж; Коллинз, А. (1988). Когнитивная структура эмоций (PDF) . Кембриджский университет. Нажимать. Архивировано из оригинала (PDF) 23 ноября 2015 г.
  48. ^ Стивенсон, Райан; Микелс, Джозеф; Джеймс, Томас (2007). «Характеристика аффективных норм английских слов по дискретным эмоциональным категориям». Методы исследования поведения . 39 (4): 1020–1024. дои : 10.3758/bf03192999 . PMID  18183921. S2CID  6673690.
  49. ^ Салгрен, Магнус ; Карлгрен, Юсси; Эрикссон, Гуннар (2007). «Валентная аннотация на основе семян в пространстве слов». Материалы Четвертого международного семинара по семантическим оценкам (SemEval-2007) .
  50. ^ Ким, С.М.; Хови, Э.Х. (2006). «Выявление и анализ мнений о суждениях». (PDF) . Материалы конференции «Технологии человеческого языка» / Североамериканская ассоциация компьютерной лингвистики (HLT-NAACL 2006). Нью-Йорк, штат Нью-Йорк . Архивировано из оригинала (PDF) 29 июня 2011 года.
  51. ^ Дей, Липика; Хак, СК Миражул (2008). «Анализ мнений на основе зашумленных текстовых данных». Материалы второго семинара по аналитике зашумленных неструктурированных текстовых данных, стр.83-90 .
  52. ^ Камбрия, Э; Хусейн, А. (2015). Сентические вычисления: основанная на здравом смысле концепция анализа настроений на концептуальном уровне. Спрингер. ISBN 9783319236544.
  53. ^ Аккора, Джунейт Гуркан; Баир, Мурат Али; Демирбас, Мюрат; Ферхатосманоглу, Хакан (2010). «Выявление переломных моментов в общественном мнении». SigKDD, Материалы первого семинара по аналитике социальных сетей .
  54. ^ Камбрия, Эрик; Лю, Цянь; Декерки, Серджио; Син, Фрэнк; Квок, Кеннет (2022). «SenticNet 7: основанная на здравом смысле система нейросимволического искусственного интеллекта для объяснимого анализа настроений» (PDF) . Труды ЛРЭК . стр. 3829–3839.
  55. ^ Борт, Дамиан; Цзи, Ронгронг; Чен, Тао; Брейэль, Томас; Чанг, Ши-Фу (2013). «Крупномасштабная онтология визуального настроения и детекторы, использующие пары прилагательных-существительных». Труды ACM Int. Конференция по мультимедиа . стр. 223–232. Архивировано из оригинала 15 апреля 2021 года . Проверено 2 ноября 2017 г.
  56. ^ Сочер, Ричард; Перелыгин, Алексей; Ву, Джин Ю.; Чуанг, Джейсон; Мэннинг, Кристофер Д.; Нг, Эндрю Ю.; Поттс, Кристофер (2013). «Рекурсивные глубокие модели семантической композиционности в дереве настроений». В трудах EMNLP : 1631–1642. CiteSeerX 10.1.1.593.7427 . 
  57. ^ «Пример из практики: расширенный анализ настроений». Архивировано из оригинала 29 октября 2013 года . Проверено 18 октября 2013 г.
  58. ^ Мозетич, Игорь; Грчар, Миха; Смайлович, Ясмина (5 мая 2016 г.). «Многоязычная классификация настроений в Твиттере: роль комментаторов-людей». ПЛОС ОДИН . 11 (5): e0155036. arXiv : 1602.07563 . Бибкод : 2016PLoSO..1155036M. дои : 10.1371/journal.pone.0155036 . ISSN  1932-6203. ПМЦ 4858191 . ПМИД  27149621. 
  59. ^ Огнева, М. «Как компании могут использовать анализ настроений для улучшения своего бизнеса». Машаемый . Проверено 13 декабря 2012 г.
  60. ^ Карлгрен, Юсси , Магнус Салгрен , Фредрик Олссон, Фредрик Эспиноза и Ола Хамфорс. «Полезность анализа настроений». На Европейской конференции по поиску информации, стр. 426-435. Шпрингер Берлин Гейдельберг, 2012.
  61. ^ Карлгрен, Юсси . «Связь между настроением автора и аффектом в тексте и текстовом жанре». В материалах четвертого семинара по использованию семантических аннотаций в информационном поиске, стр. 9-10. АКМ, 2011.
  62. ^ Карлгрен, Юсси . «Аффект, привлекательность и настроения как факторы, влияющие на взаимодействие с мультимедийной информацией». В материалах семинара «Тезей/ImageCLEF» по оценке поиска визуальной информации, стр. 8–11. 2009.
  63. ^ Амиго, Энрике, Адольфо Корухо, Хулио Гонсало, Эдгар Мей и Маартен де Рийке . «Обзор RepLab 2012: оценка систем управления онлайн-репутацией». В CLEF (онлайн-рабочие заметки/лабораторные работы/семинар). 2012.
  64. ^ Амиго, Энрике, Хорхе Каррильо Де Альборнос, Ирина Чугур, Адольфо Корухо, Хулио Гонсало, Тамара Мартин, Эдгар Мей, Маартен де Рийке и Дамиано Спина. «Обзор relab 2013: оценка систем мониторинга онлайн-репутации». На Международной конференции Форума межъязыковой оценки европейских языков, стр. 333-352. Шпрингер Берлин Гейдельберг, 2013.
  65. ^ Амиго, Энрике, Хорхе Каррильо-де-Альборнос, Ирина Чугур, Адольфо Корухо, Хулио Гонсало, Эдгар Мей, Маартен де Рийке и Дамиано Спина. «Обзор relab 2014: профилирование авторов и аспекты репутации для управления репутацией в Интернете». На Международной конференции Форума межъязыковой оценки европейских языков, стр. 307–322. Международное издательство Спрингер, 2014.
  66. ^ Аб Райт, Алекс. «Искать в Интернете чувства, а не факты», New York Times , 23 августа 2009 г. Проверено 1 октября 2009 г.
  67. ^ «Анализ настроений на Reddit». 30 сентября 2014 года . Проверено 10 октября 2014 г.
  68. ^ Киркпатрик, Маршалл. ", ReadWriteWeb , 15 апреля 2009 г. Проверено 1 октября 2009 г.
  69. ^ Кондлифф, Джейми. «Flaming движет социальными сетями в Интернете», New Scientist , 7 декабря 2010 г. Проверено 13 декабря 2010 г.
  70. ^ Тумасян, Андраник; О.Шпренгер, Тимм; Г.Санднер, Филипп; М.Велпе, Изабель (2010). «Прогнозирование выборов с помощью Твиттера: что 140 символов говорят о политических настроениях». Архивировано 12 декабря 2020 года в Wayback Machine . «Материалы четвертой международной конференции AAAI по блогам и социальным сетям»
  71. ^ Вуд, Ян Б.; Варела, Педро Л.; Боллен, Йохан; Роша, Луис М.; Гонсалвеш-Са, Жоана (2017). «Человеческие сексуальные циклы определяются культурой и соответствуют коллективным настроениям». Научные отчеты . 7 (1): 17973. arXiv : 1707.03959 . Бибкод : 2017NatSR...717973W. дои : 10.1038/s41598-017-18262-5. ПМК 5740080 . ПМИД  29269945. 
  72. ^ Корконцелос, Иоаннис; Никфарджам, Азаде; Шардлоу, Мэтью; Саркер, Абид; Ананиаду, София; Гонсалес, Грасиела Х. (2016). «Анализ влияния анализа настроений на извлечение побочных реакций на лекарства из твитов и сообщений на форумах». Журнал биомедицинской информатики . 62 : 148–158. дои : 10.1016/j.jbi.2016.06.007. ПМЦ 4981644 . ПМИД  27363901. 
  73. ^ Тан, Хуэйфэн; Тан, Сонгбо; Ченг, Сюэци (2009). «Опрос по выявлению настроений в обзорах» (PDF) . Экспертные системы с приложениями . 36 (7): 10760–10773. дои : 10.1016/j.eswa.2009.02.063. S2CID  2178380. Архивировано из оригинала (PDF) 24 мая 2018 г.
  74. ^ Аб Якоб, Никлас и др. «За пределами звезд: использование свободных текстовых обзоров пользователей для повышения точности рекомендаций фильмов». Материалы 1-го международного семинара CIKM «Темно-сентиментальный анализ массового мнения» . АКМ, 2009.
  75. ^ Минцин, Ху; Лю, Бинг (2004). «Мнения о горнодобывающей промышленности в отзывах клиентов» (PDF) . АААИ . 4 (4). S2CID  5724860. Архивировано из оригинала (PDF) 24 мая 2018 г.
  76. ^ Лю, Ян; Хуан, Сянцзи; Ан, Айджун; Ю, Сяохуэй (2008). «Моделирование и прогнозирование полезности онлайн-обзоров» (PDF) . ICDM'08. Восьмая международная конференция IEEE по интеллектуальному анализу данных . IEEE. стр. 443–452. дои :10.1109/ICDM.2008.94. ISBN 978-0-7695-3502-9. S2CID  18235238.
  77. ^ Бермингем, Адам; Смитон, Алан Ф. (2010). «Классификация настроений в микроблогах». Материалы 19-й международной конференции ACM по управлению информацией и знаниями (PDF) . стр. 1833–1836. дои : 10.1145/1871437.1871741. ISBN 9781450300995. S2CID  2084603.{{cite book}}: CS1 maint: дата и год ( ссылка )
  78. ^ Ламба, Маника; Мадхусудхан, Маргам (2018). «Применение анализа настроений в библиотеках для предоставления услуг временной информации: тематическое исследование различных аспектов производительности». Анализ социальных сетей и майнинг . 8 (1): 1–12. doi : 10.1007/s13278-018-0541-y. S2CID  53047128.