ВКонтакте поддержала часовые голосовые сообщения и научилась их расшифровывать
В ВК теперь можно записать голосовое сообщение длиной до часа. Соцсеть научила свои нейросети расшифровывать длинные "войсы", разбивая их на части с одновременной расшифровкой всех частей, а потом собирая обратно. Войсы оказались самым популярным типом вложений в мессенджере, обогнав фотографии и файлы. Впрочем, 99% всех аудио -- длиной менее двух минут, такие теперь расшифровываются за секунду.
Сергей Ларионенко, старший разработчик команды Core Infrastructure ВКонтакте:
«Технология распознавания аудио помогает любителям и ненавистникам голосовых сообщений общаться друг с другом в удобном формате, а ещё экономит время — прочитать расшифровку можно быстрее, чем прослушать аудио. Наше решение состоит из нескольких нейросетей, выдерживает высокую нагрузку, понимает русскоязычный сленг и показывает хорошие результаты даже при сложных условиях записи — например, посторонних шумах или скомканной речи. Мы продолжим развивать технологию, увеличивать скорость её работы и улучшать качество распознавания».
Распознавание голосовых сообщений полностью автоматизировано. Для обучения нейросетей используются аудио, которые специально для этой задачи записывают участники программы VK Testers.
Тестировать расшифровку голосовых сообщений ВК начала в марте этого года, причем использовалась сторонняя технология. Сейчас -- собственная. В апреле Mail.ru Group выпустила обновленный мессенджер ICQ, где уже работала расшифровка войсов.
| Подписаться на комментарии | Комментировать
Источник: Roem.ru
Похожие новости
- Реальные атаки, виртуальный полигон: Standoff Defend — новый продукт для blue team
- AI-креативы в мобайле 2025: персонализация и «живой» контент
- Триллионы RWA ликвидности TradFi заходят в Solana. Как это изменит рынок DeFi?
- Compass Мессенджер: Взлет и падение Zoom: как стать лучшим сервисом видеоконференций, а спустя 3 года растерять все преимущество
- Особенности подачи входных данных при фаззинге в режиме Persistent Mode на примере Libfuzzer + CURL
- Безопасность: на каких инструментах нельзя экономить?
- eBPF глазами хакера
- Spark_news: Яндекс Еда запустила платформу краудсорсинга: рестораны предложат новые функции, а сервис их реализует
- Мир на пороге новой эры: как нейросети меняют жизнь и работу
- Дайджест мероприятий: В Москве пройдет Х Неделя устойчивого развития