Онлайн сервисы для распознавания текста
- Информация о материале
- Категория: MS Office
- Опубликовано: 07.06.2020, 17:14
- Автор: HelpDesk
- Просмотров: 781
Я думаю, что тем кто часто работает за компьютером (не играет, а именно работает), приходилось сталкиваться с распознаванием текста. Ну например, отсканировали вы отрывок из книги и теперь вам необходимо эту часть вставить в свой документ. Но сканированный документ представляет собой картинку, а нам нужен текст — для этого то и нужны специальные программы и онлайн сервисы для распознавания текста с картинок.
Про программы для распознавания я уже писал в предыдущих постах:
— сканирование текста и распознавания в FineReader (платная программа);
— работа в аналоге FineReader — CuneiForm (бесплатная программа).
В этой же статье хотелось бы остановиться на онлайн сервисах для распознавания текста. Ведь, если нужно по быстрому получить текст с 1-2 картинок — нет смысла заморачиваться с установкой различных программ…
Важно! Качество распознавания (количество ошибок, читаемость и пр.) зависит очень сильно от исходного качества картинки. Поэтому, при сканировании (фотографировании и пр.) выбирайте качество как можно выше. В большинстве случаев качества 300-400 dpi будет достаточно (dpi — параметр характеризующий качество картинки. В настройках почти всех сканеров, обычно, указан данный параметр).
Онлайн сервисы
Для того, чтобы показать работу сервисов, я сделал скриншот одной из своих статей. Этот скриншот и будет загружаться на все сервисы, описание которых представлено ниже.
1) http://www.ocrconvert.com/
Мне этот сервис очень нравиться своей простотой. Сайт хоть и английский, но хорошо работает и с русским языком. Регистрироваться не нужно. Для начала распознавания нужно сделать 3 действия:
— загрузить свое изображение;
— выбрать язык текста, который на картинке;
— нажать кнопку начала распознавания.
Поддержка форматов: PDF, GIF, BMP, JPEG.
Результат представлен ниже на картинке. Надо сказать, текст достаточно хорошо распознался. К тому же очень быстро — я ждал буквально 5-10 сек.
2) http://www.i2ocr.com/
Этот сервис работает аналогично вышеприведенному. Здесь так же нужно загрузить файл, выбрать язык распознавания и нажать кнопку извлечь текст. Работает сервис очень быстро: 5-6 сек. на одну страницу.
Поддерживает форматы: TIF, JPEG, PNG, BMP, GIF, PBM, PGM, PPM.
Результат этот онлайн сервис представляет намного удобнее: вы сразу видите два окна — в первом результат распознавания, во втором — исходное изображение. Поэтому достаточно легко внести правки по ходу редактирования. Регистрироваться на сервисе, кстати, тоже не нужно.
3) http://www.newocr.com/
Этот сервис уникальный сразу по нескольким параметрам. Во-первых, он поддерживает «новомодный» формат DJVU (кстати, полный список форматов: JPEG, PNG, GIF, BMP, TIFF, PDF, DjVu). Во-вторых, поддерживает выделение областей текста на картинке. Это очень полезно, когда у вас на картинке есть не только текстовые области, но и графические, которые распознавать не нужно.
Качество распознавание выше среднего, регистрироваться не нужно.
4) http://www.free-ocr.com/
Очень простой сервис для распознавания: загружаете изображение, указываете язык, вводите капчу (кстати, единственный сервис в этой статье, где это нужно делать), и жмете кнопку перевести картинку в текст. Собственно все!
Поддерживаемые форматы: PDF, JPG, GIF, TIFF, BMP.
Результат распознавания — средний. Есть ошибки, но их не много. Впрочем, если качество исходного скриншота было бы повыше — ошибок было бы на порядок меньше.
На этом сегодня все. Если знаете еще интересные сервисы для распознавания текста — поделитесь в комментариях, буду благодарен. Одно условие: желательно чтобы не нужно было регистрироваться и сервис был бесплатен.