Каждый день мы раздаем лицензионные программы БЕСПЛАТНО!
PDF Text OCR Xtractor 2.6.6 был доступен бесплатно 31 декабря 2021 г.
PDF Text OCR Xtractor идеально подходит для извлечения текста из PDF-файлов и всех видов популярных графических форматов, таких как PNG, JPG, BMP и TIFF.
PDF Text OCR Xtractor использует технологию Tesseract OCR. Tesseract - это, пожалуй, самое мощное и продвинутое средство распознавания текста. Прежде всего, немного истории. Он был разработан HP в 1994 году, но вскоре компания выпустила продукт под лицензией Apache для разработки с открытым исходным кодом. В 2006 году проект взял на себя Google и спонсировал разработчиков для работы над Tesseract. Перенесемся вперед, и Tesseract стал самым мощным движком OCR, который использует глубокое обучение для извлечения текстов из изображений (BMP, PNG, JPEG, TIFF и т. д.) и файлов PDF.
PDF Text OCR Xtractor поддерживает более 20 различных языков и позволяет задавать пользовательские параметры обработки исходных файлов / изображений, такие как сглаживание и регулировка DPI, увеличение контрастности и другие полезные приемы, перед их анализом.
PDF Text OCR Xtractor имеет высокую точность и преобразует любое изображение или PDF-файл в редактируемый текст с возможностью поиска. Преобразование изображения в текст происходит быстро.
Основные особенности:
1. Использование лучшей доступной технологии OCR.
2. Поддержка 20+ разных языков.
3. Полезные преобразования изображений для повышения точности сложных документов.
Дополнительные функции:
1. Самый дешевый графический пользовательский интерфейс движка Tesseract, который вы только можете найти!
2. Поддержка PDF и всех распространенных форматов изображений, таких как PNG, JPG, BMP.
Windows 7/ 8.1/ 10 (x32/x64)
131 MB
пожизненная
$29.90
> Tesseract is perhaps the most powerful and advanced OCR software out there
By no means. It's far behind many cloud-based OCR services.
> Cheapest Tesseract engine graphical user interface you can possibly find!
There are many free ones available:
https://tesseract-ocr.github.io/tessdoc/User-Projects-–-3rdParty
It loads over (and replaces) any old installations and is pre registered.
This software works as is advertised, however, the text extracted from pictures is all messed up and all over the page. I have to spend hours to put the words in the right place and therefore defeats the purpose of the conversion, like the punctuation marks in the picture, commas, dots, question marks and so on are not in the right place especially the spaces between the words are all messed up. I'll keep it for OCR on a regular text, it does a fabulous job.
новая Русская версия с поддержкой OCR распознавание на Русском языке
https://ruslangxp.ucoz.org/news/pcwinsoft_pdf_text_ocr_xtractor_2_8_8_80_retail_rus/2022-05-06-368
Save | Cancel