14.07.2023

Разработка приложений для голосовых помощников: как заработать на новом тренде

Информационные технологии показывают уверенный рост на протяжении всего существования, но в последнее время особенно актуальными становятся тренды, связанные с их «очеловечиванием». Цифровизация и автоматизация становится привычной частью жизни людей, далеких от IT-сферы, но готовых приобретать современные гаджеты — это стало возможным благодаря тому, что пользователи наконец-то смогли обращаться к своим устройствам на привычном им языке.

Рост популярности использования голосовых помощников

Управление программным обеспечением с использованием обычного человеческого языка — давняя мечта, много раз озвученная фантастами прошлого столетия. Тем не менее свое коммерческое развитие она получила не так давно: например, привычный многим Google Assistant появился всего 7 лет назад, а Siri — чуть более 10 лет.

С тех пор было запущено огромное количество проектов голосовых ассистентов. По сути свой помощник появился практически у каждой крупной IT-компании, включая российские:

  • Алиса — голосовой ассистент от «Яндекс»;
  • Маруся — проект бывшей Mail.ru Group, а ныне VK;
  • Олег — голосовой помощник от «Тинькофф»;
  • Салют — семейство виртуальных ассистентов от «Сбер».

В этом списке представлены лишь самые популярные отечественные разработки, на самом деле их гораздо больше.

Несмотря на то что возможности ассистентов довольно широки и могут использоваться, в том числе и для управления финансами, — 2 из 4 приведенных выше примеров разработаны банками, — основной «деятельностью» виртуальных помощников можно считать управление различными мультимедийными устройствами.

По заявлению Сергея Сухорукова, представляющего группу «М.Видео-Эльдорадо», в 2022 году в России продали порядка 3 млн. умных колонок — в 2,3 больше, чем в предыдущем. Голосовые помощники используются в навигаторах, системах умного дома, телефонных разговорах — боты способны полностью заменить первую линию технической поддержки.

Самые распространенные гаджеты, — смартфоны, — тоже предлагают пользователям своих голосовых помощников, которые, благодаря глубокой интеграции с системой, способны упростить управление функционалом устройства. Задать вопрос и получить ответ голосом, в некоторых случаях будет быстрее и удобнее, чем набирать его на сенсорной клавиатуре в поисковике и читать.

Особенности разработки голосовых приложений

Суть голосовых приложений в упрощении взаимодействия с услугой, которая стоит за ними. К примеру, человек со слабым зрением или пожилой человек, не умеющий самостоятельно искать в сети сайты доставки еды и оформлять там заказы, легко сможет это сделать с помощью умной колонки, если процедура будет похожа на телефонный разговор.

Это значит, что приложение нужно спроектировать так, чтобы им не нужно было учиться пользоваться: запоминать точные команды и навигацию, как это приходится делать с Interactive Voice Response (это программы, предлагающие, например, нажимать соответствующие вопросу цифры).

Этапы разработки обычно выглядят так:

  • дизайн — проработка возможных диалогов;
  • разработка — создание системы распознавания речи и реализация логики;
  • тесты и публикация — эти 2 этапа актуальны для любых приложений.

Проектирование, как правило, делится на этапы: разрабатываются варианты диалогов, отрисовываются блок-схемы, составляется prompt lists — списки различных ответов, возможных в определенном контексте.

Варианты диалогов — разыгрываемая по ролям ситуация, которую обязательно нужно отыграть, как в театре. Такой подход помогает сразу выявлять очевидные недочеты, так как голосовой интерфейс радикально отличается от классического, что делает невозможным простую конвертацию обычного приложения в голосовое. В качестве наглядного образца можно привести процедуру регистрации, которая есть почти в любом мобильном приложении, но которую будет сложно реализовать в голосовом.

Блок-схемы — карты, позволяющие моделировать нелинейные диалоги. Размеры подобных блок-схем могут быть огромными, поскольку даже в простом разговоре есть масса вариантов ответов, и для каждого их них нужно продумать дальнейшее развитие диалога. Так как невозможно избежать разрастания блок-схемы, опытные разработчики советуют разбивать ее на логические части, чтобы получить несколько понятных схем с ясными связями.

Prompt lists — список всех фраз, доступных приложению в виде ответа. Рекомендуется делать по 5 - 6 разных фраз для каждого случая, чтобы добавить схожести с человеком: ведь люди редко отвечают одинаковыми фразами. Признаком качества считается проработанный образ, который будет прослеживаться за фразами, например, веселая озорная девушка или любящий читать нравоучения дедушка. Как минимум, весь диалог должен проходить в одном стиле: неформальный, поучительный, шутливый и так далее.

Тестирование — это максимально важный момент. Дело в том, что в графических приложениях пользователь ограничен предоставленными ему элементами взаимодействия, а в разговоре — нет. Поэтому результат может быть совершенно непредсказуемым, просто потому, что все люди разные и по-разному могут взаимодействовать с приложением. На ранних этапах тестирования его можно выполнять «вручную», с использованием интерактивного прототипа, самостоятельно выбирая варианты ответа.

Советы:

  • используйте SSML — с его помощью можно точнее выразить эмоции, проставить паузы, прописать ударения;
  • учитывайте обстановку — если пользователь в шумном месте, можно изменить алгоритм, например, не озвучивать определенную информацию, а показать на экране;
  • учитывайте разные платформы — есть ли экран, можно ли с ним взаимодействовать и так далее.

Главное — помнить, что коммуницировать с разговорным приложением должно быть проще, чем с графическим, иначе в нем пропадает весь смысл.

Возможности интеграции с голосовыми помощниками

Голосовые приложения не нуждаются в установке на смартфон, все их компоненты, — бизнес-логика, распознавание речи, — размещены в облаке. Для активации приложения достаточно произнести его название, после чего ассистент выполнит запуск. Под разные голосовые помощники есть свои «приложения», но они имеют конкретные названия:

  • Алиса — «навыки»;
  • Alexa — «skills»;
  • Google Assistant — «actions».

На примере Алисы, созданные приложения можно размещать в специальном каталоге — после проверки модератором они будут доступны для использования.

Способы заработка на разработке голосовых приложений

Голосовое управление — перспективная ниша. Вполне вероятно, что уже скоро умные колонки станут неотъемлемым атрибутом дома как телевизор. С помощью мобильных приложений с голосовым помощником можно проводить опросы, продвигать рекламные кампании, обеспечивать доступ к самым разным данным в наиболее удобной форме.


Оперативно и совершенно бесплатно ответим на Ваши вопросы!
0