Это сравнение программного обеспечения для оптического распознавания символов включает в себя:
- OCR-движки, которые выполняют фактическую идентификацию символов
- Программное обеспечение для анализа макета, которое разделяет отсканированные документы на зоны, подходящие для OCR
- Графические интерфейсы для одного или нескольких OCR-модулей
- Комплекты средств разработки программного обеспечения , которые используются для добавления возможностей OCR в другое программное обеспечение (например, приложения для обработки форм, системы управления изображениями документов, системы электронного обнаружения , решения для управления записями)
Оценка
Анализ точности и надежности пакетов OCR Google Docs OCR, Tesseract, ABBYY FineReader и Transym, проведенный в 2016 году и использовавший набор данных, включающий 1227 изображений из 15 различных категорий, пришел к выводу, что Google Docs OCR и ABBYY работают лучше других. [21]
Ссылки
- ^ "ABBYY FineReader 14: Технические характеристики". Finereader.abbyy.com . Получено 2017-02-23 .
- ^ "ABBYY FineReader 11: Технические характеристики". Finereader.abbyy.com . Получено 2013-09-12 .
- ^ "Top OCR Software". Ocrworld.com. 2010-03-30. Архивировано из оригинала 2017-02-23 . Получено 2013-09-12 .
- ^ "Возможности Asprise OCR SDK". asprise.com . Получено 2014-06-21 .
- ^ "Возможности библиотеки Asprise Java OCR". asprise.com . Получено 21.06.2014 .
- ^ "Asprise Java, C#/VB.NET OCR API". asprise.com. 2015-11-19 . Получено 2015-11-19 .
- ^ Страница руководства Debian для Cuneiform для Linux версии 1.1.0
- ^ "GOCR Homepage". wasd.urz.uni-magdeburg.de . Получено 2018-10-17 .
- ^ "GOCR". Jocr.sourceforge.net . Получено 2013-09-12 .
- ^ "Поддерживаемые языки". 11 февраля 2022 г.
- ^ Ashok Popat (4 сентября 2015 г.). "IEEE SPS: Оптическое распознавание символов для большинства языков мира". YouTube . Архивировано из оригинала 20.12.2021.
- ^ Диас, Антонио (2024-01-20). "GNU Ocrad 0.29 выпущен" (список рассылки). info-gnu.
- ^ OCRopus включает в себя инструмент ocropus-hocr, который создает hOCR из результатов распознавания.
- ^ В сочетании с hocr-tools
- ^ "OmniPage CSDK - OCR Document Capture Toolkit | Document Imaging & OCR". Nuance. Архивировано из оригинала 2010-08-24 . Получено 2013-09-12 .
- ^ "OmniPage Standard Document Conversion". Nuance. Архивировано из оригинала 2014-03-13 . Получено 2014-02-25 .
- ^ На основе количества файлов обучения языку для версии 3.04. Доступно на странице загрузки.
- ^ Использование объяснено в файле Readme и FAQ Tesseract.
- ^ Например, ODF с OCRFeeder
- ^ "GitHub - tesseract-ocr/tesseract: Tesseract Open Source OCR Engine (основной репозиторий)". GitHub . Получено 2018-11-05 .
- ^ Ассефи, Мехди (2016-12-01). "OCR как услуга: экспериментальная оценка Google Docs OCR, Tesseract, ABBYY FineReader и Transym". ResearchGate . Получено 2019-01-31 .