Программы для компьютерного анализа текста доступны во многих коммерческих и открытых источниках и компаниях.
Коммерческий
- Angoss – Angoss Text Analytics обеспечивает извлечение сущностей и тем, категоризацию тем, анализ настроений и возможности резюмирования документов с помощью встроенного
- AUTINDEX – это коммерческий программный пакет для интеллектуального анализа текста, основанный на сложной лингвистике, разработанной IAI (Институт прикладных информационных наук), Саарбрюккен.
- DigitalMR – инструмент для анализа социальных сетей и текста и изображений для исследования рынка.
- FICO Score – ведущий поставщик аналитики [ необходима ссылка ] .
- General Sentiment – Платформа социального интеллекта, которая использует обработку естественного языка для обнаружения сходств между поклонниками брендов и поклонниками традиционных телешоу в социальных сетях. Отдельная текстовая аналитика для сбора социальной базы знаний по миллиардам тем, хранящихся с 2004 года.
- IBM LanguageWare – пакет IBM для анализа текста (инструменты и среда выполнения).
- IBM SPSS – поставщик Modeler Premium (ранее называвшегося IBM SPSS Modeler и IBM SPSS Text Analytics), который содержит расширенные возможности анализа текста на основе NLP (извлечение многоязычных настроений, событий и фактов), которые можно использовать в сочетании с Predictive Modeling. Text Analytics for Surveys предоставляет возможность категоризировать ответы на опросы с использованием возможностей на основе NLP для дальнейшего анализа или составления отчетов.
- Inxight – поставщик технологий текстовой аналитики, поиска и неструктурированной визуализации. (Inxight был куплен компанией Business Objects , которую в 2008 году купила SAP AG ).
- Language Computer Corporation – инструменты для извлечения и анализа текста, доступные на нескольких языках.
- Lexalytics – поставщик текстового аналитического движка, используемого в Social Media Monitoring, Voice of Customer, Survey Analysis и других приложениях. Salience Engine. Программное обеспечение предоставляет уникальную возможность объединения вывода неструктурированного текстового анализа со структурированными данными для предоставления дополнительных прогностических переменных для улучшенных прогностических моделей и анализа ассоциаций.
- Linguamatics – поставщик корпоративного программного обеспечения для интеллектуального анализа и анализа текста на основе обработки естественного языка (NLP), I2E, для поиска ценных знаний и поддержки принятия решений.
- Mathematica – предоставляет встроенные инструменты для выравнивания текста, сопоставления с образцом, кластеризации и семантического анализа. См. Wolfram Language , язык программирования Mathematica.
- MATLAB предлагает набор инструментов Text Analytics Toolbox для импорта текстовых данных, преобразования их в числовую форму для использования в задачах машинного и глубокого обучения, анализа настроений и классификации. [1]
- Medallia – предлагает единую систему записи для опросов, социальных сетей, текстовых, письменных и онлайн-отзывов.
- NetOwl – набор многоязычных продуктов для анализа текста и сущностей, включая извлечение сущностей, ссылок и событий, анализ настроений, геотегирование, перевод имен, сопоставление имен и разрешение идентификационных данных, а также многое другое.
- PolyAnalyst — среда текстовой аналитики.
- PoolParty Semantic Suite — платформа для интеллектуального анализа текста на основе графов.
- RapidMiner с расширением Text Processing Extension — программное обеспечение для интеллектуального анализа данных и текста.
- SAS – SAS Text Miner и Teragram; коммерческое программное обеспечение для анализа текста, обработки естественного языка и таксономии, используемое для управления информацией .
- Sketch Engine – программное обеспечение для управления корпусами и анализа, которое обеспечивает создание текстовых корпусов из загруженных текстов или из Интернета, включая разметку частей речи и лемматизацию или обнаружение определенного веб-сайта. [2]
- Sysomos – поставщик программной платформы для аналитики социальных сетей, включая анализ текста и настроений в онлайн-общениях потребителей.
- WordStat – дополнительный модуль контент-анализа и интеллектуального анализа текста QDA Miner для анализа больших объемов текстовых данных.
С открытым исходным кодом
- Carrot2 – фреймворк кластеризации текста и результатов поиска.
- GATE – общая архитектура для текстовой инженерии, набор инструментов с открытым исходным кодом для обработки естественного языка и языковой инженерии.
- Gensim – масштабное тематическое моделирование и извлечение семантической информации из неструктурированного текста ( Python ).
- KH Coder – для количественного анализа контента или интеллектуального анализа текста
- Расширение обработки текста KNIME .
- Natural Language Toolkit (NLTK) — набор библиотек и программ для символьной и статистической обработки естественного языка (NLP) для языка программирования Python .
- OpenNLP – обработка естественного языка.
- Orange с дополнением для интеллектуального анализа текста.
- Коллекция интеллектуального анализа текста PLOS . [3]
- Язык программирования R предоставляет фреймворк для приложений текстового интеллектуального анализа в пакете tm . [4] Вид задачи обработки естественного языка содержит tm и другие пакеты библиотек текстового интеллектуального анализа. [5]
- spaCy – библиотека обработки естественного языка с открытым исходным кодом для Python
- Stanbol — система интеллектуального анализа текста с открытым исходным кодом, предназначенная для управления семантическим контентом.
- Voyant Tools – веб-среда анализа текста, созданная как научный проект.
Ссылки
- ^ "Text Analytics Toolbox". mathworks.com . Получено 2019-07-10 .
- ^ "Анализ текста с помощью Sketch Engine". Sketch Engine . LEXICAL COMPUTING CZ sro 14 декабря 2017 г. Получено 17 января 2018 г.
- ^ "Table of Contents: Text Mining". Коллекции PLOS . doi : 10.1371/issue.pcol.v01.i14 (неактивен 1 ноября 2024 г.). Архивировано из оригинала 2013-07-04 . Получено 2014-02-20 .
{{cite journal}}
: CS1 maint: DOI неактивен по состоянию на ноябрь 2024 г. ( ссылка ) - ^ «Введение в пакет tm: интеллектуальный анализ текста в R» (PDF) .
- ^ Wild, Fridolin (20 февраля 2020 г.). «Просмотр задач CRAN: Обработка естественного языка». Проект CRAN.R.
Внешние ссылки
- API для интеллектуального анализа текста на Mashape
- API-интерфейсы для интеллектуального анализа текста в программируемом веб-пространстве
- API для анализа текста на портале анализа текста для исследований