Каждый день мы раздаем лицензионные программы БЕСПЛАТНО!
PDF Text OCR Xtractor 2.8.8.80 был доступен бесплатно 24 июля 2022 г.
PDF Text OCR Xtractor идеально подходит для извлечения текста из PDF-файлов и всех видов популярных графических форматов, таких как PNG, JPG, BMP и TIFF.
PDF Text OCR Xtractor использует технологию Tesseract OCR. Tesseract - это, пожалуй, самое мощное и продвинутое средство распознавания текста. Прежде всего, немного истории. Он был разработан HP в 1994 году, но вскоре компания выпустила продукт под лицензией Apache для разработки с открытым исходным кодом. В 2006 году проект взял на себя Google и спонсировал разработчиков для работы над Tesseract. Перенесемся вперед, и Tesseract стал самым мощным движком OCR, который использует глубокое обучение для извлечения текстов из изображений (BMP, PNG, JPEG, TIFF и т. д.) и файлов PDF.
PDF Text OCR Xtractor поддерживает более 20 различных языков и позволяет задавать пользовательские параметры обработки исходных файлов / изображений, такие как сглаживание и регулировка DPI, увеличение контрастности и другие полезные приемы, перед их анализом.
PDF Text OCR Xtractor имеет высокую точность и преобразует любое изображение или PDF-файл в редактируемый текст с возможностью поиска. Преобразование изображения в текст происходит быстро.
Основные особенности:
1. Использование лучшей доступной технологии OCR.
2. Поддержка 20+ разных языков.
3. Полезные преобразования изображений для повышения точности сложных документов.
Дополнительные функции:
1. Самый дешевый графический пользовательский интерфейс движка Tesseract, который вы только можете найти!
2. Поддержка PDF и всех распространенных форматов изображений, таких как PNG, JPG, BMP.
Windows 7/ 8.1/ 10/ 11 (x32/x64)
131 MB
lifetime
$29.90
Installed per instructions: no issues.
1st use: Have a project (stack of pages knocked out on a manual typewriter ages ago) that I had shelved. Scanned 2 pages using my consumer-grade scanner/copier/printer, then opened tool. Simple, uncluttered interface. "Convert To Text" put extracted text up side-by-side with original on a split screen, where I could copy to Notepad or other word processor and easily edit. Didn't convert every character exactly, but I didn't expect it to. Will eventually save me a lot of time getting the original into a digital format. Was impressed. Thanks
Ii is worth to mention that exists the freeware,opensource Capture2Text (available at sourceforge) . It is an interactive tool to do OCR on the marked area of the screen. It is also based on the tesseract engine. It is the resident tool allowing to use hotkey win-Q for the marking. It is possible to use it directly with the google translator to have the quick translation of the OCR-ed text.
Installation was easy. Added a pdf statement from my bank and the program failed to convert most of the text and gave gibberish data. Adobe export to Excel of the same file gave me 95% correct data and in an Excel format too! Thanks but uninstalled the software.
With the Win-PRTSCN key combination, the screen print is immediately stored as a PNG file in the image images\screen recordings. Even when a PDF file is shown.
Ray Spiker, With the combination of Win-PrtScn key you can also display a complete picture of the screen as a kind of security, because no icon works on the screen when you click on it. You can also use + and - to increase or reduce the image.
Only the escape key works. Then everything is normal again.
The image recordings of images\screen recordings.
It is just very weak GUI for the powerful freeware tools .
1) Русский язык надо подгружать. 2) С формата jpeg конвертация с англ и русс без проблем 3) а вот с pdf какая-то хрень. Медленно грузит сам файл, затем конвертирует Очень медленно, при этом поленились включить картинку хода конвертации. И гадай - что там делается. С русского только часть текста без таблиц. С англ тоже самое. В общем, конвертация на 3, а интерфейс на 2. Придется применять только для картинок - тоже сойдет. Тем более для конвертации pdf пригодится Word, если файл читабелен и сделан по уму исходно
Save | Cancel
Анатолий, для распознание pdf есть проги и по лучше ASCOMP Text-R Pro 2.000 + Portable
Save | Cancel