4.9
Поможем грамотно и бесплатно

Проконсультируем быстро по любым вопросам

Разработка приложений для голосовых помощников: как заработать на новом тренде

55236811_2.jpg

Информационные технологии показывают уверенный рост на протяжении всего существования, но в последнее время особенно актуальными становятся тренды, связанные с их «очеловечиванием». Цифровизация и автоматизация становится привычной частью жизни людей, далеких от IT-сферы, но готовых приобретать современные гаджеты — это стало возможным благодаря тому, что пользователи наконец-то смогли обращаться к своим устройствам на привычном им языке.

Рост популярности использования голосовых помощников

Управление программным обеспечением с использованием обычного человеческого языка — давняя мечта, много раз озвученная фантастами прошлого столетия. Тем не менее свое коммерческое развитие она получила не так давно: например, привычный многим Google Assistant появился всего 7 лет назад, а Siri — чуть более 10 лет.

С тех пор было запущено огромное количество проектов голосовых ассистентов. По сути свой помощник появился практически у каждой крупной IT-компании, включая российские:

  • Алиса — голосовой ассистент от «Яндекс»;
  • Маруся — проект бывшей Mail.ru Group, а ныне VK;
  • Олег — голосовой помощник от «Тинькофф»;
  • Салют — семейство виртуальных ассистентов от «Сбер».

В этом списке представлены лишь самые популярные отечественные разработки, на самом деле их гораздо больше.

Несмотря на то что возможности ассистентов довольно широки и могут использоваться, в том числе и для управления финансами, — 2 из 4 приведенных выше примеров разработаны банками, — основной «деятельностью» виртуальных помощников можно считать управление различными мультимедийными устройствами.

По заявлению Сергея Сухорукова, представляющего группу «М.Видео-Эльдорадо», в 2022 году в России продали порядка 3 млн. умных колонок — в 2,3 больше, чем в предыдущем. Голосовые помощники используются в навигаторах, системах умного дома, телефонных разговорах — боты способны полностью заменить первую линию технической поддержки.

Самые распространенные гаджеты, — смартфоны, — тоже предлагают пользователям своих голосовых помощников, которые, благодаря глубокой интеграции с системой, способны упростить управление функционалом устройства. Задать вопрос и получить ответ голосом, в некоторых случаях будет быстрее и удобнее, чем набирать его на сенсорной клавиатуре в поисковике и читать.

Особенности разработки голосовых приложений

Суть голосовых приложений в упрощении взаимодействия с услугой, которая стоит за ними. К примеру, человек со слабым зрением или пожилой человек, не умеющий самостоятельно искать в сети сайты доставки еды и оформлять там заказы, легко сможет это сделать с помощью умной колонки, если процедура будет похожа на телефонный разговор.

Это значит, что приложение нужно спроектировать так, чтобы им не нужно было учиться пользоваться: запоминать точные команды и навигацию, как это приходится делать с Interactive Voice Response (это программы, предлагающие, например, нажимать соответствующие вопросу цифры).

Этапы разработки обычно выглядят так:

  • дизайн — проработка возможных диалогов;
  • разработка — создание системы распознавания речи и реализация логики;
  • тесты и публикация — эти 2 этапа актуальны для любых приложений.

Проектирование, как правило, делится на этапы: разрабатываются варианты диалогов, отрисовываются блок-схемы, составляется prompt lists — списки различных ответов, возможных в определенном контексте.

Варианты диалогов — разыгрываемая по ролям ситуация, которую обязательно нужно отыграть, как в театре. Такой подход помогает сразу выявлять очевидные недочеты, так как голосовой интерфейс радикально отличается от классического, что делает невозможным простую конвертацию обычного приложения в голосовое. В качестве наглядного образца можно привести процедуру регистрации, которая есть почти в любом мобильном приложении, но которую будет сложно реализовать в голосовом.

Блок-схемы — карты, позволяющие моделировать нелинейные диалоги. Размеры подобных блок-схем могут быть огромными, поскольку даже в простом разговоре есть масса вариантов ответов, и для каждого их них нужно продумать дальнейшее развитие диалога. Так как невозможно избежать разрастания блок-схемы, опытные разработчики советуют разбивать ее на логические части, чтобы получить несколько понятных схем с ясными связями.

Prompt lists — список всех фраз, доступных приложению в виде ответа. Рекомендуется делать по 5 - 6 разных фраз для каждого случая, чтобы добавить схожести с человеком: ведь люди редко отвечают одинаковыми фразами. Признаком качества считается проработанный образ, который будет прослеживаться за фразами, например, веселая озорная девушка или любящий читать нравоучения дедушка. Как минимум, весь диалог должен проходить в одном стиле: неформальный, поучительный, шутливый и так далее.

Тестирование — это максимально важный момент. Дело в том, что в графических приложениях пользователь ограничен предоставленными ему элементами взаимодействия, а в разговоре — нет. Поэтому результат может быть совершенно непредсказуемым, просто потому, что все люди разные и по-разному могут взаимодействовать с приложением. На ранних этапах тестирования его можно выполнять «вручную», с использованием интерактивного прототипа, самостоятельно выбирая варианты ответа.

Советы:

  • используйте SSML — с его помощью можно точнее выразить эмоции, проставить паузы, прописать ударения;
  • учитывайте обстановку — если пользователь в шумном месте, можно изменить алгоритм, например, не озвучивать определенную информацию, а показать на экране;
  • учитывайте разные платформы — есть ли экран, можно ли с ним взаимодействовать и так далее.

Главное — помнить, что коммуницировать с разговорным приложением должно быть проще, чем с графическим, иначе в нем пропадает весь смысл.

Возможности интеграции с голосовыми помощниками

Голосовые приложения не нуждаются в установке на смартфон, все их компоненты, — бизнес-логика, распознавание речи, — размещены в облаке. Для активации приложения достаточно произнести его название, после чего ассистент выполнит запуск. Под разные голосовые помощники есть свои «приложения», но они имеют конкретные названия:

  • Алиса — «навыки»;
  • Alexa — «skills»;
  • Google Assistant — «actions».

На примере Алисы, созданные приложения можно размещать в специальном каталоге — после проверки модератором они будут доступны для использования.

Способы заработка на разработке голосовых приложений

Голосовое управление — перспективная ниша. Вполне вероятно, что уже скоро умные колонки станут неотъемлемым атрибутом дома как телевизор. С помощью мобильных приложений с голосовым помощником можно проводить опросы, продвигать рекламные кампании, обеспечивать доступ к самым разным данным в наиболее удобной форме.


У вас остались какие-то вопросы?

Задайте их в форме ниже и мы обязательно с вами свяжемся!

Другие материалы по теме:

  • 24.01.2024

    Обновление сервиса миграции из Облака в Коробку Битрикс24

    С осени 2023 года у клиентов Битрикс24 пропала возможность штатного переноса облачного портала в кор...

    Подробнее
  • 16.11.2023

    Битрикс24 Вега - единые настройки портала

    Обзор функционала новой версии Битрикс24 - Вега. В новой версии Битрикс24 появилась возможность созд...

    Подробнее
  • 23.09.2023

    Сравнение Битрикс24 и SberCRM

    CRM — это важная часть работы компании, и в особенности отдела продаж. В ней хранятся все важные дан...

    Подробнее
Оперативно и совершенно бесплатно ответим на Ваши вопросы!

Нажимая кнопку "Заказать", я даю свое согласие на обработку моих персональных данных, в соответствии с Федеральным законом от 27.07.2006 года №152-Ф3 "О персональных данных", на условиях и для целей, определенных в Согласии на обработку персональных данных.