Google встроил распознавалку в онлайн-документы

Все блоги / Про интернет 23 июня 2010 0   
Google встроил появившуюся (
как один из API
) прошлой осенью технологию распознавания текста в свой онлайн-редактор Google Docs.
Загружаемые изображения и pdf-файлы
теперь могут быть преобразованы в редактируемый текст (пока только на 5-и западноевропейских языках, без русского).

Для преобразования применяется OCR
Google Books
, однако, несмотря на говорящее название родителя, результат распознавания, даже идеально отсканированной книжной страницы, от собственно книги — далёк. Дело в том, что вёрстка листа фактически не принимается во внимание и на выходе получается простой текст.

http://clip2net.com/clip/m5451/1277296968-primer-dlya-gd-en-755kb.jpg

Исходная книжная страница


http://docs.google.com/Doc?docid=0AeCtMyBNLYOmZDR3cW43a18xMzhkZDJ6MmJ0bg&hl=ru

Пример распознавания


Преобразование сканов быстрое, ошибок не содержит, но на десктопе укомплектованном сканером (а значит, как правило, и программой OCR) есть привычные, глубоко проработанные (и заведомо сохраняющие форматирование) альтернативы онлайновому преобразованию.

Интереснее ситуация в нише переносных приложений. Учитывая, что программ распознавания для смартфонов на рынке практически нет, а камеры телефонов вплотную подбираются к разрешениям достаточным для чёткого отображения листов A4, достаточно очевидно, что не загружающее процессор распознавание в первую очередь может пригодиться на мобильных устройствах без клавиатуры. На небольших экранах даже сохранение форматирования может оказаться избыточным.

Примечательно, что у той же
Abbyy
распознавание текста с фотографий, а не сканов, появилось, как прописанная возможность ещё в 2008-м году. К 2010-му году перестали быть редкостью и загружаемые в сеть телефонные снимки большого разрешения. Существует даже
онлайновый FineReader
. Но, как вещь в себе, и "где-то там" в тени.

Между тем просматривается выгода портальной интеграции онлайнового распознавания: пользователь мог бы использовать стандартный софт для загрузки изображений на фотохостинг, указывать необходимость распознавания текста на нем и получать результат на e-mail.



!Alter Ego
"Советский спорт" выкладывает нарезки голов с ЧМ под предлогом цитирования

internet_gign
Инсайд: "Яндекс" раздал сотрудникам iPhone/Андроиды

internet_gign
Инсайд: "Яндекс" раздал сотрудникам iPhone/Андроиды

!Alter Ego
Инсайд: "Яндекс" раздал сотрудникам iPhone/Андроиды

!неяндексоид
Инсайд: "Яндекс" раздал сотрудникам iPhone/Андроиды



Источник:Roem.ru

Похожие публикации

@
  • bowtiesmilelaughingblushsmileyrelaxedsmirk
    heart_eyeskissing_heartkissing_closed_eyesflushedrelievedsatisfiedgrin
    winkstuck_out_tongue_winking_eyestuck_out_tongue_closed_eyesgrinningkissingstuck_out_tonguesleeping
    worriedfrowninganguishedopen_mouthgrimacingconfusedhushed
    expressionlessunamusedsweat_smilesweatdisappointed_relievedwearypensive
    disappointedconfoundedfearfulcold_sweatperseverecrysob
    joyastonishedscreamtired_faceangryragetriumph
    sleepyyummasksunglassesdizzy_faceimpsmiling_imp
    neutral_faceno_mouthinnocent

Архив публикаций