Каждый день мы раздаем лицензионные программы БЕСПЛАТНО!
PDF Text OCR Xtractor 3.2.2.20 был доступен бесплатно 12 октября 2025 г.
PDF Text OCR Xtractor идеально подходит для извлечения текста из PDF-файлов и всех видов популярных графических форматов, таких как PNG, JPG, BMP и TIFF.
PDF Text OCR Xtractor использует технологию Tesseract OCR. Tesseract - это, пожалуй, самое мощное и продвинутое средство распознавания текста. Прежде всего, немного истории. Он был разработан HP в 1994 году, но вскоре компания выпустила продукт под лицензией Apache для разработки с открытым исходным кодом. В 2006 году проект взял на себя Google и спонсировал разработчиков для работы над Tesseract. Перенесемся вперед, и Tesseract стал самым мощным движком OCR, который использует глубокое обучение для извлечения текстов из изображений (BMP, PNG, JPEG, TIFF и т. д.) и файлов PDF.
PDF Text OCR Xtractor поддерживает более 20 различных языков и позволяет задавать пользовательские параметры обработки исходных файлов / изображений, такие как сглаживание и регулировка DPI, увеличение контрастности и другие полезные приемы, перед их анализом.
PDF Text OCR Xtractor имеет высокую точность и преобразует любое изображение или PDF-файл в редактируемый текст с возможностью поиска. Преобразование изображения в текст происходит быстро.
Основные особенности:
1. Использование лучшей доступной технологии OCR.
2. Поддержка 20+ разных языков.
3. Полезные преобразования изображений для повышения точности сложных документов.
Дополнительные функции:
1. Самый дешевый графический пользовательский интерфейс движка Tesseract, который вы только можете найти!
2. Поддержка PDF и всех распространенных форматов изображений, таких как PNG, JPG, BMP.
Windows 7/ 8.1/ 10/ 11 (x32/x64)
103 MB
бессрочная
$29.90
Комментарии
Понравилась программа? Оставьте комментарий!
This program does not extract PDF's in full English, needs improving, but thank you again. Maybe I'm just not doing this right somehow. I have the language on English, but I still get a different language in the extraction in different paragraphs.
Save | Cancel
Terry Z.,
Well that is weird. An OCR program does not read or translate it just converts the image of letters to actual text. It may be that some paragraphs have fonts that are hard to convert or a background that blends with the text and it outputs gibberish that looks like another language
Save | Cancel