Умные голосовые помощники становятся все популярнее. Google предлагает купить Google Home, Amazon — Echo, а «Яндекс» — «Яндекс.Станцию». Они стоят от 3 290 до 15 тысяч рублей и умеют включать музыку или кино, искать нужную информацию в интернете и сообщать погоду. Зарубежные гаджеты также могут управлять умным домом, но в России эта функция ограничена — нужные комплектующие трудно купить. The Village спросил у москвичей, зачем и о чем они разговаривают со своими голосовыми ассистентами.

Александр Плющев

журналист, владелец «Яндекс.Станции»


Выбор станции

Я давно хотел голосовой помощник, но меня сдерживало использование английского языка. Мне кажется неестественным говорить на английском языке с роботом, потому что, когда ты говоришь на иностранном языке, ты делаешь что-то специальное, а все должно быть естественно.

Плюс в России функционал иностранных голосовых помощников усечен. Например, Amazon очень ограниченный ряд товаров присылает к нам. В Штатах же это магазин номер один, поэтому «Алексу» и голосовой помощник надо там испытывать. У Google есть помощник на русском языке, но я даже забыл о его существовании, потому что он живет в телефоне. Кажется, с телефоном разговаривать несколько неестественно. Даже когда «Алиса» появилась, мы с ней поиграли немножко, и все.

Короче, психологический эффект играет большую роль. «Станция» — только для «Алисы». Ты отдаешь ей команды, она их выполняет. Еще «Станция» очень красивая, из тех вау-продуктов, какие в свое время были у Apple. Мне важно, что Станция — российский продукт. Пусть она и сделана в Китае, но разработана-то у нас. Это круто.

Мне важно, что Станция — российский продукт. Пусть она и сделана в Китае, но разработана-то у нас

Три станции

Я решил купить «Станцию» сразу, как только ее представили. К сожалению, в день начала продаж меня не было в Москве — я оставил предзаказ на сайте, ждал исправно около трех месяцев, пока ее привезут.

Странно, но у «Яндекса» было мало «Станций» для журналистов — одна или две. Потом вдруг мне дали на тестирование целых две колонки. В результате у меня появились три «Станции». Я их распределил следующим образом. Ту, которую купил за деньги, оставил себе, две, которые дали на тесты, отдал в Deutsche Welle и в «Эхо Москвы». Она стоит сейчас у нас в студии, мы ее иногда используем на утренних эфирах. Это элемент шоу, конечно, но, если ты при включенном микрофоне будешь руками что-то искать в интернете, возникнет пауза. А со «Станцией» ты ее спрашиваешь — она отвечает. Не важно, что она ответит, все равно интересно. Правильно ответит — здорово, неправильно ответит — окей, отшутится — вообще круто.

Ребята из Deutsche Welle пошли дальше. Они рассматривают «Станцию» как возможное средство доставки своих новостей, колонок и статей в аудиоформате с помощью навыков «Алисы» (режим, который вызывается определенным активационным именем. — Прим. ред.).

У «Эха Москвы» тоже есть навык. Я о нем случайно узнал, и, если честно, он мне не очень нравится. Это очень техническая вещь. Ты должен сказать: «Запусти навык „Эхо Москвы“» — и станция зачитывает наши новости. После прочтения одной «Станция» спрашивает: «Читать дальше или нет?» Меня заколебывает такое внимание. Я хочу, чтобы она целиком сводку зачитала, пока я чем-то занимаюсь, а вынужден постоянно говорить: «Читай дальше». Короче, впереди еще долгий путь. Хотелось бы, чтобы «Алиса» читала новости и блоги эхомосковским голосом, а еще могла включить прямой эфир. В «Яндексе» говорят, что это трудно, и не очень горят этой идеей. Для этого надо записать огромные массивы слов и фраз.

Я не исключаю, что в будущем можно будет сказать: «Алиса, что мне прокомментировали в фейсбуке за последние 12 часов?» Станция начнет читать комментарии к твоим постам, а ты сможешь на них голосом ответить.

Не важно, что она ответит, все равно интересно. Правильно ответит — здорово, неправильно ответит — окей, отшутится — вообще круто

Домашняя колонка

Домашняя «Станция» сейчас стоит у нас на кухне. Раньше была у меня в комнате, но я не смог ее подружить с телевизором. Основной сценарий использования — семья слушает музыку. «Станция» пока нас не различает по голосу. Из-за этого, кто бы что ни попросил включить, «Станция» все равно потом собьется на мои предпочтения. Мне недавно по итогам года отчет прислали, где один из самых проигрываемых исполнителей – ABBA. Подозреваю, что это слушал не я.

Забавно, что у всех в семье разные паттерны: жене просто приходит в голову исполнитель, она просит поставить. Дочь использует «Станцию» как Bluetooth-колонку. Я слушаю музыку и пробую разные новые штуки: запусти навык такой-то, прочитай сказку. Иногда спрашиваю трафик, погоду, но часто забываю. Я привык, что несколько раз ткну — и откроется погода на айфоне, а теперь можно просто спросить у «Станции». Пытаюсь перестроиться.

Странно, что «Станция» не интегрируется с другими сервисами «Яндекса»: еду и такси, например, нельзя заказывать. Идеальный сценарий — говоришь: «Заказать пиццу как всегда» — алгоритм переводит тебя к оплате: «Вас устраивает, что пицца будет доставлена не через 15, а через 35 минут, потому что много заказов?» Ты говоришь: «Окей!», и это сигнал для того, чтобы списали деньги. «Алиса» тебе повторяет сумму, говорит: «Я хочу списать столько-то на вашу пиццу. Согласны?» Ты говоришь: «Да, все окей». Бам-бам, все списалось.

Все равно «Станция» превзошла ожидания. Во-первых, время от времени она все-таки работает, иногда понимает нативный язык. Если она сильно на эфире разговорится, я ей говорю: «Заткнись», а слушатели вступаются за нее: «Нельзя так грубо говорить с женщинами».

То есть они воспринимают «Станцию» как живого человека. Люди уверены, что у нее есть характер, что она стервозная. Я в этом плане фанат «Станции» и «Яндекса», потому что они открывают дверь в будущее.

«Яндекс.Станция»

9 990 рублей

Александр Малышев

владелец «Яндекс.Станции x Покрас Лампас»


Первый в очереди

Я пользовался «Алексой» и Google Home — они неудобны в России. «Яндекс.Станция» же локализована, у нее были хвалебные обзоры у блогеров. В какой-то момент увидел объявление о выходе лимитированной версии и решил взять.

Я один приехал к семи утра. Сначала стоял около магазина, но быстро замерз. Арендовал «Яндекс.Драйв», припарковал его у входа и грелся в нем за два рубля в минуту. В десять открыли магазин. Появились другие покупатели, человек десять. Написали список, кто когда пришел, и создали чат. Договорился с продавцами в магазине, чтобы всех покупателей отправляли ко мне, и вписывал их в чат. Где-то в 12:30 нас выгнали из магазина. Я организовал очередь по списку. В какой-то момент ребята из «Яндекс.Еды» угостили нас едой — было мило.

В итоге купил первые две колонки. Одну продал, второй пользуюсь сам. «Станция» стоит на рабочем столе, в основном у меня к ней только два запроса: послушать музыку и узнать погоду. Поскольку я сам разработчик, то хочу что-то свое написать для «Станции», но пока руки не доходят.

Я один приехал к семи утра. Сначала стоял около магазина, но быстро замерз

Проблемы в общении

Вообще, «Яндекс» не очень популяризирует «Станцию» среди разработчиков. Это грустно, потому что кажется, что за голосовыми интерфейсами будущее. Уже сейчас, если ты не программист или дизайнер, тебе не очень нужен компьютер — все действия можно совершать в телефоне или с помощью «Станции».

Основная проблема «Яндекс.Станции» и всех голосовых помощников — с ними неудобно общаться голосом. Намного удобнее делать это короткими звуковыми посланиями: щелчками, отдельными буквами. Не говорить постоянно «следующая песня», а свистнуть. Это эффективнее.

Google Home

10 500 рублей

Сергей Кузнецов

техножурналист, владелец Google Home


Колонка в умный дом

Я интересуюсь технологиями и стараюсь пробовать новые гаджеты. Долгое время занимался носимой электроникой, купил много умных часов. Потом мне захотелось сделать аналог умного дома. К сожалению, полностью умный дом создать сложно без ремонта, смены розеток и прочего. Мне хотелось получить упрощенный вариант, чтобы лампочку можно было голосом выключить, телевизор включить, спросить погоду.

Встал вопрос: «Яндекс.Станция» или Google Home. Но меня смутило, что «Станция» должна постоянно стоять возле телевизора, подключенная проводом, ее сложно связать с умным домом. И я хотел несколько колонок в комнате и на кухне, а у «Яндекса» тогда не было маленьких версий. Плюс у меня куплена подписка на Google Play и Android как основной телефон. Понял, что нативнее будет использовать Google.

Купил Google Home, Google Home Mini и Chromecast для телевизора. Покупал все серое в каком-то магазине на «Горбушке», потому что у нас официально Google не продает. Все серые колонки — из США или из Китая, у меня из США. Google Home Mini стоила 4 тысячи рублей, большая — 10 500, Сhromecast вроде 2 500, лампочки и набор датчиков всяких — примерно 4 500. Всего потратил около 22 тысяч.

Покупал все серое в каком-то магазине на «Горбушке», потому что у нас официально Google не продает

Google, включи свет

Я живу не один, у меня есть девушка, колонки Google поддерживают два аккаунта и различают людей по голосам. У «Яндекса» этого нет. Очень удобно, что колонки связаны друг с другом. Можно передавать сообщения с одной на другую, как по рации. То есть, если я в комнате, а девушка на кухне, не нужно кричать. Можно просто сказать «Hey Google, broadcast», зачитать любое сообщение длиной до одной минуты и передать на другую колонку. Можно включать на всю квартиру музыку, а колонки будут ее играть, причем с поправкой на задержку. Я иногда так убираюсь. Везде играет музыка и на нужной мне громкости. Кайф.

Я также использую колонки для включения музыки, когда прихожу домой. «Hey Google, I’m home» — включается музыка и на всех колонках в доме выводится сообщение «Sergey is home».

Основных сценариев использования два. Первый — Routines. Google Home по команде рассказывает про пробки и погоду, советует, что надеть, зачитывает планы на день и важные напоминания. Это очень удобно: если раньше я просыпался и должен был смотреть в телефон, сейчас могу спокойно завтракать, спросить Google, какой у меня сегодня план на день. То же самое перед сном. Говоришь: «Hey Google, good night», он в ответ: «Ok, у тебя на завтра пять дел, завтра будет солнечная погода, еще в восемь утра тебе нужно съездить в больницу», и включает успокаивающую музыку.

Еще у меня в рутине настроены лампы и розетка. «Доброе утро» — и включается свет, «Доброй ночи» — выключается свет. Можно просто сказать: «выключи лампочку в комнате» или «включи лампочку на кухне». Можно менять цвет, яркость. Посмотрел вечером фильм, и не нужно вставать, чтобы выключать свет, или тянуться за пультом телевизора — просто сказал: «Good night», и у тебя все сразу потухло. Разумеется, все можно сделать и через телефон, если вдруг неохота говорить.

«Доброе утро» — и включается свет, «Доброй ночи» — выключается свет

Трудности перевода

Очень круто, что у каждого члена семьи свой Google Home, свой ассистент, который учится в зависимости от того, как часто с ним взаимодействовать. Например, мой пока не всегда знает, что мне музыку нужно проигрывать на колонке, а не на телевизоре. Он постоянно переспрашивает. А ассистент девушки уже приучился к тому, что музыка — на колонке, а Netflix — на телевизоре. Пришлось купить подписку на Netflix, потому что есть нативное приложение для Chromecast. Соответственно, если мы хотим посмотреть какой-то сериал или фильм, просто говорим «Hey Google, play — название фильма или сериала — on Netflix on TV», он играет это через Netflix в телике.

Всего Google Home поддерживает больше сотни приложений, но для России важнее всего Netflix, YouTube и Plex для фильмов, которых нет в Netflix. Приятно то, что в Netflix тоже есть разделение аккаунтов. Например, мы смотрим один и тот же сериал, но я смотрю еще первый сезон, а девушка второй. Если она говорит: «Hey Google, play Good Place on Netflix on TV», то ей он показывает из ее аккаунта в Netflix с того места, где она остановилась. Если я говорю, то показывает с того места, где я остановился.

У Google уже появился перевод на русский язык, его можно активировать, но мы решили этого не делать. Во-первых, это классный способ подтягивать английский, каждый день общаясь хотя бы с колонкой. Плюс русский пока довольно корявый: какие-то слова он не знает, как произносить правильно, проблема с ударением, проблема со склонениями. Мне приятнее слышать нормальную английскую речь, чем корявую русскую.

Правда, болтать с ним толком не получается: как только начинаются отклонения от скрипта, он говорит: «Я не понимаю» или «Окей, я сейчас поищу в Google и выдам информацию».

Я могу просто сказать что-то в любой точке квартиры, меня услышит одна из колонок и даст ответ

Домашний киберпанк

Бывают забавные ответы, например на вопрос «What does the fox say?» она поет ответ из песенки: «Динь-динь-динь, рон-дон-дон». Если из «Гарри Поттера» сказать какое-то заклинание, она отвечает магическим звуком. Еще из полезных функций: есть бросок монетки. Говоришь: «Кинь монетку», Google Home кидает и говорит, орел или решка. Или можно бросить кубик, например.

Часто использую «Google, where is my phone?». Google Home просто звонит на телефон, принудительно включая звук. Это один из плюсов нативности платформы. То же самое работает в обратную сторону. Я могу с телефона, находясь на работе, отправить сообщение домой. Если девушка заснула, а мне очень нужно до нее дозвониться, я могу сказать в телефон: «Broadcast», указать, на какую колонку послать сообщение — это, вероятно, ее разбудит.

Очень не хватает русскоязычных сериалов. Вообще, это в целом проблема рынка: я вынужден платить за Netflix и «Амедиатеку». Но некоторых сериалов нет ни там ни там. Получается, мне надо купить еще Amazon Prime, сервис NBC, «Кинопоиск» и YouTube, тогда у меня будет полное покрытие. Но платить за все эти сервисы 5–10 тысяч в месяц не очень хочется. Эта раздробленность раздражает. Бесит то, что в ютьюбе Google Home ищет на английском, я не могу смотреть там русскоязычные видео, он физически их не может найти. То же самое с музыкой.

Зато мне дома не нужен телефон. Если раньше я постоянно бегал с ним: «Господи, куда я его положил, надо взять», то сейчас мне, даже чтобы что-то погуглить, он не нужен. Я могу просто сказать что-то в любой точке квартиры, меня услышит одна из колонок и даст ответ. Это очень клево и удобно. Киберпанк прям.

Григорий Бакунов

директор по распространению технологий «Яндекса», владелец трех колонок и одного собственного голосового помощника


Как говорить с роботами

У меня дома есть «Алекса», Google Home, «Яндекс.Станция» и собственный голосовой ассистент. Во всем этом многообразии я живу последние четыре года. Это довольно увлекательная жизнь, потому что «Алекса» не понимает ничего, кроме английского, Google Home лучше всего понимает английский, а «Яндекс.Станция» и мой собственный ассистент работают только по-русски. Поэтому у меня наблюдается некоторая проблема в голове — к кому и с чем обратиться.

Сейчас все распределено так: свет, включение телевизора и весь умный дом подключен к «Алексе». Бóльшую часть времени я общаюсь с «Алексой». Она самая низкоинтеллектуальная из всех ассистентов — в том смысле, что у нее умение понимать контекст, понимать диалог хуже, чем у всех остальных, поэтому она предсказуема. «Алису» ты воспринимаешь как личность, а «Алексу» ты как личность не воспринимаешь вообще. Она тупая как пробка, но максимально исполнительная. Она похожа на прототип робота первого поколения: ему сказали — он сделал.

Остальные высокоинтеллектуальные ассистенты больше для удовольствия. Я легко могу проболтать с любым из ассистентов всю дорогу из дома на работу. Кстати, есть штука, про которую не говорят, а мне кажется, что это важно. Я обнаружил, что все современные ассистенты работают значительно лучше, когда ты не повышаешь голос. Большинство людей, общаясь с любым ассистентом, почему-то начинают рефлекторно повышать голос и стараться раздельно говорить. Это неправильно.

Главная проблема современных голосовых ассистентов — в людях

Посмотрите, как Железный человек общается с Джарвисом — он почти не повышает голос. Если и повышает, то только для того, чтобы к Джарвису обратиться. Дальше он с ним разговаривает как с живым человеком. Точно так же и здесь: чтобы обратить на себя внимание, как и с живым человеком, нужно крикнуть: «Окей, Google». Все, он определил источник звука, а дальше ты можешь говорить естественным голосом.

Системы распознавания голоса уже достаточно хорошо работают, чтобы не переживать по этому поводу. Спокойно говоришь — и получаешь нормальные результаты. Спокойный тон дает ощущение того, что ты общаешься с условно разумным объектом, а не с непонятным черным ящиком. Плюс это просто добавляет ощущение футуристичности происходящего, как в кино.Главная проблема современных голосовых ассистентов — в людях. Мы просто не привыкли к ним и не знаем, что с ними делать. Они слегка туповаты и отвечают зачастую не на те вопросы, которые мы задаем, но они существенно разумнее, чем то, как мы к ним обращаемся.

«Алису» ты воспринимаешь как личность, а «Алексу» ты как личность не воспринимаешь вообще. Она тупая как пробка, но максимально исполнительная

К кому обратиться

У меня довольно часто заняты руки, а еще у меня маленький ребенок, поэтому все, что касается управления видео, тоже лежит на голосовом ассистенте. Всякую справочную информацию я уже просто привык искать голосом, даже когда сижу за компьютером и пишу текст. Например, вчера писал небольшой аналитический текст про состояние криптовалют. Спросил у «Алисы»: «Какой сегодня курс биткоина?» Потом попросил пересчитать в доллары. Ты реально общаешься с живым ассистентом, который тебе подсказывает.

Я интуитивно понимаю, к какому ассистенту обратиться. У меня рядом с рабочим местом стоит одна из «Алекс», поэтому проще спросить у нее. Практически не общаюсь с Google: он может делать то же, что и «Алекса». «Алиса» очень хорошо поселилась в навигаторе. Кстати, есть небольшая разница между «Алисой», которая живет в колонке, и «Алисой», которая живет в яндексовском приложении: в приложении она периодически просто находит ответы в интернете, а колонка пока так не умеет, но скоро научится. Еще у меня есть несколько устройств, у которых единственный способ голосового управления, — Google Home.

«Русский кондиционер» и другие разработки

Мой же ассистент — просто эксперимент. Попытка сделать голосового помощника, о каком я бы мечтал. С поправкой на то, что я его делаю в одно лицо. Это автоматически приводит к тому, что он совершенно неотделим от меня. У разработки собственного ассистента есть несколько забавных проблем. Например, когда ты пользуешься чужим ассистентом, там запрограммировано несколько десятков ответов на один и тот же вопрос. Они тебя удивляют, потому что ты не все их еще слышал, но потом начинают повторяться.

В случае с разработкой собственного голосового помощника приходится придумывать способы формирования ответа, которые предполагают, что ты не знаешь этого ответа. Например, спрашиваю у него: «Что там с погодой на завтра?» Последний раз, когда я проверял, в базе было две с половиной тысячи ответов на этот вопрос. Это огромная база формулировок, как разные люди отвечают на вопрос про погоду. Ответы из чатов, имиджбордов, соцсетей, форумов…

Мой голосовой ассистент устроен так, что в любой непредвиденной ситуации пробует отшутиться

Прикол тут в том, что ассистент отвечает непредсказуемо для меня. Это было прямо суперважно, потому что именно это создает ощущение естественности разговора. Мой голосовой ассистент устроен так, что в любой непредвиденной ситуации пробует отшутиться.

Я искренне считаю, что только чувство юмора показывает наличие или отсутствие интеллекта. Мне пришлось создать огромную базу шуток из интернета. Это прикольная работа, совершенно неотделимая от меня, потому что не каждому они покажутся смешными. Я же их не читаю, они каждый раз новые.

Моя голосовая система живет преимущественно в машине. Я могу в дороге спросить: «Кто у меня сейчас дома находится»? У меня почти везде висят камеры, и система, глядя в них, распознает лица и говорит, что дома находится вот этот человек, которого она знает, вот этот человек, которого она знает, и еще два человека, которых она не знает.

Еще я придумал гениальную конструкцию — «Русский кондиционер». Это очень простой моторчик, от него подходит прямая штанга, которая приоткрывает и закрывает окно в зависимости от температуры в комнате. Просто в одной из комнат не было кондиционера, и пришлось колхозить. Оно у меня сейчас управляется «Алисой». Я прошу: открой окно, закрой окно. То есть с практической точки зрения никаких ограничений по умному дому у «Алисы» нет. Нужно просто понимать, почему этого не происходит сейчас — потому что у нас в стране не особо популярна тема умных домов. Думаю, через пару лет и до нас все докатится. Например, IKEA привезет в Россию первые умные лампочки, выключатели, и, я думаю, это подорвет рынок в хорошем смысле.

Мне не хватает во всех коммерческих голосовых помощниках спонтанности и непредсказуемости

Помощник без инициативы

Вообще, задача всех голосовых ассистентов — развиваться примерно в два раза быстрее, чем живой человек. Чтобы за 2019 год это был не четырехлетний ребенок, как сейчас, а шестилетний. А в 2020-м будет восьмилетний ребенок и уже совершенно другой набор функций.

Мне не хватает во всех коммерческих голосовых помощниках спонтанности и непредсказуемости. В моем голосовом ассистенте есть эта важная часть, но других людей это, скорее, раздражает. Еще страшно не хватает инициативы со стороны голосовых помощников. Сейчас все привыкли к тому, что мы говорим ключевое слово: «Слушай, „Яндекс“». Я хочу наоборот: когда сажусь в свою машину и завожу ее, мне голосовой ассистент сам говорит: «Слушай, судя по времени, ты сейчас собираешься на работу. Поехали на работу?» Я отвечаю «Да, поехали». Точно так же голосовой ассистент у меня дома прекрасно знает, когда я проснулся и встал с кровати. Нет ничего сложного в том, чтобы в этот момент зачитать мне последние новости, рассказать мне про изменения в моем календаре и еще что-то такое.

Здесь не технологическая проблема, а человеческая. Надо изменить отношение человека к происходящему. Я думаю, в 2019–2020 годах это произойдет. Мы наконец-то дадим слово нашим компьютерам.


Обложка: «Яндекс»