Воисковик
Hugo Barra, директор подразделения мобильных продуктов Google, рассказывал больше всех, вещи были достаточно общие и относились к демонстрации достоинств Android-телефонов. В силу невладения русским, показывал он распознавание на английском языке (слово Pushkin иноземному сервису так и не покорилось - вечно вылезал то Bush, Push can, остальные слова во фразе определялись правильно. Показывал и навигацию по Лондону (в России навигация на Android, в целом, не работает). Наиболее впечатляющий момент был, когда Hugo попросил проложить маршрут в какой-то музей, где лежит Rosetta stone. Google послушно проложил маршрут в британский музей. Уж на что я ушлый журналист, так и то был впечатлен.

Позже Андрей Дороничев (на фото), менеджер по мобильным продуктам Google на словах рассказал о возможных сферах применения голосового поиска, а еще позже, уже в конце мероприятия, пообещал, что платные приложения в русском Market будут работать так скоро, как это возможно. Google перед включением данной функции должен решить какие-то "нетехнические проблемы". Похоже, что поскольку Google, в отличие от Apple, ведет деятельность в России, перед запуском локализованного "Маркета" должен решить какие-то весьма серьезные юридические вопросы. В Google задачи такого плана не всегда решаются быстро.
Про технику голосового поиска рассказывал Юджин Вайнштейн (в десятилетнем возрасте переехавший в англоязычную среду), разработчик ПО. Он продемонстрировал работу русскоязычного голосового поиска на достаточно длинных словах. Позже я ему задал вопрос о том, насколько хорошо работает голосовой поиск с короткими словами (именно с ними возникают наибольшие трудности при распознавании речи), Юджин ответил, что с короткими словами тоже все хорошо, а Андрей Дороничев посоветовал отложить узкоспециализированные вопросы на потом. Также Юджин рассказал, в чем проблемы голосового поиска вообще:
Первая: никакой индивидуальной подстройки нет, записи анализируются на серверах Google.
Второе: система может распознавать около миллиона слов, в первую очередь основываются на самых популярных запросах.
Третье: объем сэмпла составляет приблизительно 100кб. На каком-нибудь плохом GPRS запрос будет идти на сервер несколько десятков секунд и обойдется запрашиваемому в несколько десятков копеек (если исходить из цены в 3 рубля за мегабайт трафика).
При этом, естественно, Google приходится учитывать вероятное сочетание слов (не расслышит, так догадается), надо разрабатывать модель произношения (што, а не что) и обрабатывать звуки с учетом окружающей акустической обстановки.
Потом я потестировал голосовой поиск и пользовался им неоднократно в течение дня. Больше всего мне это напомнило время, когда я учился водить на механике: вроде бы все действия весьма простые, но чтобы научиться вовремя выжимать сцепление, приходится вырабатывать в себе какой-то новый навык времени и ощущения работы автомобиля. Точно также и с голосовым поиском: произносить слова надо в одном темпе, но желательно равномерно, а не по слогам. При этом жаль, что куча сервисов для автомобилистов, вроде той же навигации, на данный момент недоступна в России, а качество сотовый связи увеличивает время реакции системы до крайне некомфортных значений.
В общем, презентация Hugo Barra несколько расходится с окружающей реальностью. Поэтому прекрасное далеко придется подождать еще.
Юрий Синодов, sinodov@roem.ru
Источник:Roem.ru