Яндекс.Диск научился читать текст на изображениях
Яндекс.Диск теперь умеет распознавать текст на изображениях форматов JPEG, GIF и PNG, об этом компания объявила в своём блоге. Таким образом система позволит искать среди сохранённых фотографий на диске нужную — например, найти скан договора или визитку.
Для распознавания текста используется технология оптического распознавания символов, разработанная в стенах Яндекса.
Для разных видов изображений она разная. Например, для отсканированных документов точность распознавания текстов на русском языке составляет около 80%, для фотографий с надписями — 63,2%, а для скриншотов приближается к 100%. Помимо русского языка, система также распознаёт английский, украинский и турецкий. Точность распознавания текстов всего потока изображений более 70%. Это неплохой результат, но мы будем работать над его улучшением.
2 комментария | Подписаться на комментарии | Комментировать
Источник: Roem.ru
Похожие новости
- Будущее архитектуры безопасности: Проблемы, связанные с существующими системами безопасности
- Фишинг живее всех живых, кейс из личной почты
- Сбор ПДн через Яндекс.Формы: как соблюсти 152-ФЗ
- Обход Cloudflare. Часть I
- DHCP: настройка серверов, Relay и анализ трафика в Wireshark
- Безопасная аутентификация с Indeed AM
- bit kogan: Одна из наиболее обсуждаемых тем сегодня — по какому пути пойдет дальнейшее развитие интернета в России
- Как работает машина Enigma M3 (для флота)
- Из туризма в стеганографию: история создания ChameleonLab и наш новый взгляд на контент
- Невидимые чернила в цифровом мире: технология сокрытия данных в DOCX/XLSX