Уроки Кремниевой Долины
«Главная цель — не продукт, а совершенствование технологии, что бы наши решения могли послужить основой новым стартапам. Проделав колоссальную работу по лицензированию технологии в России и США мы открываем свой API».
Уже по всей России программисты-энтузиасты интегрируют системы распознавания речи в привычное и специализированное ПО. Недавняя новость о голосовом вводе данных в систему 1С становится лишним тому подтверждением.
Стоит отметить, что ведущий российский инноватор в области распознавания речи RealSpeaker Lab принял Политику открытых возможностей и равных прав, открывшую API разработчикам для создания своих новых продуктов, в том числе и коммерческих. Основатель лаборатории Виктор Осетров убежден в том, что выбранная им freemiun бизнес-модель принесет успех.
«После двух недель в кремниевой долине в рамках программы DeepDive в голове многое складывается воедино. Решения, которые принимались интуитивно подтверждаются опытом коллег. Эта стажировка действительно стала глубоким погружением, так как наша программа распознавания речи уже доступна для скачивания бесплатно для пользователей Windows 7 и 8. Скорый выход бета-версии RealSpeaker для Android будет проведен с учетом новых знаний. Мы планируем подарить дюжину лицензий тем, кто следит за новостями в наших сообществах на Facebook и ВКонтакте.»
Сейчас, после акклиматизации, Виктор готовит подробный отчет о поездке, в котором поделится некоторыми секретами о визите в офис Evernote. Не секрет, что широкий успех этой компании принесла не продажа своего ПО, а открытие API для разработчиков сторонних приложений, в том числе коммерческих.Мультиплатформенность, как обязательное условие успеха, приходит и в Россию. По словам Виктора, голосовой ввод текста актуален не только для профессий связанных с производством контента (журналистов, переводчиков, копирайтеров). Производители смартфонов уделяют большое внимание голосовому управлению устройством. Верификация пользователя с помощью аудио-видеоанализатора может быть использована не только в системах безопасности, но и для повышения точности распознавания. «Ваш смартфон будет слушать только Вас, не обращая внимания, на посторонние шумы и человеческую речь вокруг. Это возможно благодаря сравнению аудио потока с данными о движении губ диктора. Наиболее востребовано это может быть в автомобилестроении, где от решения инженеров могут зависеть человеческие жизни».
Интересно, что разработчики из Казани не боятся менять сложившуюся привычку пользователей вводить текст с помощью клавиатуры. На странице Лаборатории в соцсетях размещена цитата:
(за 2 месяца до презентации первого iPhone)
Марк Андриссен: «Слушай, Стив, а ты не думаешь, что набор текста непосредственно на экране может стать проблемой для людей?»
Стив Джобс: «Они привыкнут к этому».
PS: Начиная с 2007 года Apple продала более 250 миллионов iPhone.