Онлайн сервисы для распознавания текста

Я думаю, что тем кто часто работает за компьютером (не играет, а именно работает), приходилось сталкиваться с распознаванием текста. Ну например, отсканировали вы отрывок из книги и теперь вам необходимо эту часть вставить в свой документ. Но сканированный документ представляет собой картинку, а нам нужен текст — для этого то и нужны специальные программы и онлайн сервисы для распознавания текста с картинок.

Про программы для распознавания я уже писал в предыдущих постах:

— сканирование текста и распознавания в FineReader (платная программа);

— работа в аналоге FineReader — CuneiForm (бесплатная программа).

В этой же статье хотелось бы остановиться на онлайн сервисах для распознавания текста. Ведь, если нужно по быстрому получить текст с 1-2 картинок — нет смысла заморачиваться с установкой различных программ…

Важно! Качество распознавания (количество ошибок, читаемость и пр.) зависит очень сильно от исходного качества картинки. Поэтому, при сканировании (фотографировании и пр.) выбирайте качество как можно выше. В большинстве случаев качества 300-400 dpi будет достаточно (dpi — параметр характеризующий качество картинки. В настройках почти всех сканеров, обычно, указан данный параметр).

Онлайн сервисы

Для того, чтобы показать работу сервисов, я сделал скриншот одной из своих статей. Этот скриншот и будет загружаться на все сервисы, описание которых представлено ниже.

1) http://www.ocrconvert.com/

Мне этот сервис очень нравиться своей простотой. Сайт хоть и английский, но хорошо работает и с русским языком. Регистрироваться не нужно. Для начала распознавания нужно сделать 3 действия:

— загрузить свое изображение;

— выбрать язык текста, который на картинке;

— нажать кнопку начала распознавания.

Поддержка форматов: PDF, GIF, BMP, JPEG.

Результат представлен ниже на картинке. Надо сказать, текст достаточно хорошо распознался. К тому же очень быстро — я ждал буквально 5-10 сек.

2) http://www.i2ocr.com/

Этот сервис работает аналогично вышеприведенному. Здесь так же нужно загрузить файл, выбрать язык распознавания и нажать кнопку извлечь текст. Работает сервис очень быстро: 5-6 сек. на одну страницу.

Поддерживает форматы: TIF, JPEG, PNG, BMP, GIF, PBM, PGM, PPM.

Результат этот онлайн сервис представляет намного удобнее: вы сразу видите два окна — в первом результат распознавания, во втором — исходное изображение. Поэтому достаточно легко внести правки по ходу редактирования. Регистрироваться на сервисе, кстати, тоже не нужно.

3) http://www.newocr.com/

Этот сервис уникальный сразу по нескольким параметрам. Во-первых, он поддерживает «новомодный» формат DJVU (кстати, полный список форматов: JPEG, PNG, GIF, BMP, TIFF, PDF, DjVu). Во-вторых, поддерживает выделение областей текста на картинке. Это очень полезно, когда у вас на картинке есть не только текстовые области, но и графические, которые распознавать не нужно.

Качество распознавание выше среднего, регистрироваться не нужно.

4) http://www.free-ocr.com/

Очень простой сервис для распознавания: загружаете изображение, указываете язык, вводите капчу (кстати, единственный сервис в этой статье, где это нужно делать), и жмете кнопку перевести картинку в текст. Собственно все!

Поддерживаемые форматы: PDF, JPG, GIF, TIFF, BMP.

Результат распознавания — средний. Есть ошибки, но их не много. Впрочем, если качество исходного скриншота было бы повыше — ошибок было бы на порядок меньше.

На этом сегодня все. Если знаете еще интересные сервисы для распознавания текста — поделитесь в комментариях, буду благодарен. Одно условие: желательно чтобы не нужно было регистрироваться и сервис был бесплатен.