Как нейросети помогают нам покупать, знакомиться и слушать музыку Плейлист для дождя, удаление непрошеных дикпиков и объявлений о продаже брата

Истории о нейросетях, которые научились делать что-то забавное или необычное, часто попадают в новости. Так, инженер из Amazon с помощью технологии не пускал в дом кота, если он приходил с добычей — пойманными птицами и грызунами. А приложение DeepNude, которое убирает одежду с фотографий женщин, дорисовывая обнаженные части тела, стало известным на весь мир за один день, не выдержало наплыва желающих им воспользоваться и в итоге закрылось. Но нейросети без особого шума применяют и крупные компании. Мы узнали, как технологии помогают нам ходить на свидания, собирать плейлист для дождливого вечера и покупать товары.
Фейк не пройдет
Ситуация, когда после нескольких дней романтической переписки на реальное свидание приходит вовсе не человек с фотографии, может надолго отбить желание сидеть на сайтах и в приложениях для знакомств. Пользователей Badoo от такого защищают как раз нейросети. Руководитель отдела локализации и работы с сообществом сервиса Дмитрий По рассказывает, что обычно создатели фейковых аккаунтов не любят сильно напрягаться — они просто ищут изображения по запросам «мужчина» или «женщина» и пытаются поставить себе в профиль первую понравившуюся фотографию. Благодаря большой базе изображений с помощью нейросети можно с точностью до 95 % распознать фейк, отказать в загрузке фото и предупредить создателя аккаунта, что такое поведение недопустимо.


Именно нейросеть скрывает в сообщениях непрошеные дикпики
Еще один способ оградиться от ненастоящих аккаунтов — фотоверификация. Пользователям при регистрации показывают картинку и просят сфотографироваться, повторив жест с изображения. Если нейросеть понимает, что это тот же самый человек, что и на других фото в профиле, и он показывает правильный жест, то аккаунт подтвержден. На главной фотографии должно быть хорошо видно лицо человека, чтобы все сразу понимали, с кем знакомятся, поэтому нейросети обрезают рамки и центрируют фото.
Другая нейросеть помогает выявлять на этапе регистрации людей до 18 лет, которым пока нельзя заходить в приложение для знакомств. Для ее обучения использовали много вручную отобранных фотографий людей с известным возрастом. Проанализировав нескольких фото в анкете, нейросеть только предполагает, что потенциальный пользователь не достиг 18 лет, но помешать регистрации она не может. Сейчас разработчики проверяют решения, которые принимает нейросеть. На основе количества допущенных ошибок они понимают, нужно ли дорабатывать или переобучать систему.
Политика Badoo позволяет удалять нежелательный эротический контент, если он находится за пределами закрытого альбома «Личные фото». Эту важную задачу доверили нейросети, именно она скрывает из сообщений непрошеные дикпики и другие подобные изображения. Если есть риск, что на фотографии в личном сообщении окажется неожиданная обнаженная часть тела, пользователю покажут изображение заблюренным, и он должен подтвердить, что хочет увидеть его.


Поплакать и потанцевать
Плейлист для летнего дня, утренней зарядки или поездки на автомобиле — в «Яндекс.Музыке» такие подборки на все случаи жизни редакторам помогает собирать нейросеть. Она умеет определять жанр и настроение трека, узнает тембр, бит, тип вокала и использованные инструменты. Например, она знает, что саксофон обычно звучит в печальных композициях, подходящих для дождливой погоды. А вот слова в песнях нейросеть пока еще не распознает, потому запросто может отправить в плейлист с веселой музыкой ритмичную танцевальную композицию о неразделенной любви или экзистенциальном кризисе.
Обучили модель на большом количестве музыкальных фрагментов, про которые заранее было известно, для какого настроения они подойдут. Руководитель группы машинного обучения «Яндекс.Музыки» Андрей Михеев объясняет, что нужны примеры с разным настроением. Если показать нейросети только печальные песни, она никогда не научится отличать их от веселых. «Надо в нее загрузить музыку и показать: это грустная, это для зарядки, это весенняя, а под эту хорошо засыпать», — говорит Михеев.
Слова в песнях нейросеть не распознает и может отправить в плейлист с веселой музыкой ритмичную композицию о неразделенной любви
Прежде чем музыкальные фрагменты попали в нейросеть, их дали послушать и оценить людям — исполнителям на сервисе «Яндекс.Толока», где можно зарабатывать, выполняя несложные задания. На основе своих ощущений они отмечали, какие из треков кажутся им бодрыми, летними, подходящими для сна и других занятий. Люди не всегда сходятся во мнениях, потому из результатов выбирают только те случаи, где оценки максимально совпадают. Затем размеченные фрагменты использовали в качестве примеров для обучения нейросети.
Чтобы составить персонализированный плейлист дня для каждого из 20 миллионов слушателей, в «Яндекс.Музыке» задействуют другие алгоритмы машинного обучения. Здесь не достаточно знать только настроение или жанр трека, потому алгоритмы учитывают предпочтения пользователя: что он слушал, лайкал, перематывал, ставил на повтор, добавлял в плейлисты, чем делился. Алгоритм учитывает и то, на каком устройстве пользователь собирается слушать музыку. Если это «Яндекс.Станция», то детские песни отделяются от взрослых: во время семейного ужина после саундтрека к мультфильму неожиданно не заиграет «Сектор газа».


Честные объявления
В сервисе «Юла» рассказывают, что ежедневно модерацию на сайте проходит 1,7 миллиона объявлений. Согласно правилам, здесь нельзя продавать запрещенные законом товары, писать оскорбления и использовать чужой контент. Но даже такие несложные требования пользователи выполняют не всегда, причем нарушают правила не обязательно со злым умыслом. Например, во время школьных каникул на сервис обрушивается волна специфических детских предложений вроде попыток продать брата или сестру. Для обработки всех новых объявлений понадобилось бы нанять тысячи модераторов, которым пришлось бы круглые сутки смотреть фотографии и читать описания товаров, но от этого нелегкого труда людей избавила нейросеть.
Нейросеть блокирует объявления с запрещенными товарами и услугами, ей известны практически все слова, которыми нарушители пытаются описывать, к примеру, наркотические вещества — от официальных названий, используемых химиками, до «веселья» и «скорости». Такие предложения блокируются автоматически. Проблемы у нейросети могут возникнуть, только если нарушитель при составлении описания проявляет незаурядную фантазию — например, как в случае с объявлением, предлагающим сдать на час приставку для игры в Super Mario Brazzers. Нейросеть не сможет понять подобных тонких намеков, ее не смутит даже то, что на фото не Xbox, а полуголая девушка. Такое объявление может оказаться на сервисе, но только до тех пор, пока его не заметит модератор или на него не пожалуются бдительные пользователи.
Во время школьных каникул на сервис обрушивается волна попыток продать брата или сестру
Помимо известных и уже попавших под запрет вещей, на «Юле» постоянно появляются новые, о которых пока ничего не знают ни люди, ни нейросети. Первым с ними взаимодействует модератор. Он должен понять, что это за товар, нарушает ли он какие-либо правила, можно ли продавать его на сайте. Сотрудник сервиса смотрит тысячи фотографий и читает столько же описаний, выделяет из них плохие и хорошие примеры, на базе которых потом обучает нейросеть. Спустя какое-то время она разовьется до такого уровня, что сможет определить недопустимое объявление, даже если его автор заменит запрещенные слова синонимами. К примеру, так произошло с вейпами, торговля которыми на сервисе запрещена. Продавцы называли их аппартами для парения или даже паровыми машинами, но такие объявления модерацию не прошли.
Руководитель отдела модерации «Юлы» Андрей Марейчев рассказывает, что для работы модераторами нужны люди с широким кругозором и тягой к знаниям: сегодня ты изучаешь мишек из роз, а завтра отличаешь шоколадные пистолеты от настоящих. Кстати, этот товар действительно приносит немало головной боли: кондитеры стараются сделать сувенирное оружие максимально похожим на настоящее, нейросеть видит на фотографиях запрещенный предмет и блокирует объявления, а возмущенные продавцы потом пишут в службу поддержки.
Нейросеть нужна также для защиты сервиса от нечестных продавцов, которые пытаются разместить множество одинаковых объявлений об одном товаре с разными номерами телефонов. Она поймет, что это тот же предмет, даже если его сфотографировать под разными углами. Из сотни таких предложений 99 будут забанены, так как из-за них добросовестным продавцам труднее продвигать свои товары, а покупателям не из чего выбрать. Не пропустит нейросеть и объявление с фото и описанием из интернета. В сервисе считают, что если человек не может сам сфотографировать вещь или составить небольшой текст о ней, то, скорее всего, это злоумышленник и товара у него нет.