Что сегодня умеют нейросети? Все больше технологий под контролем искусственного интеллекта
Подзаголовок этого текста написала нейросеть «Яндекса», которую запустили полгода назад. Она обучена на части страниц «Википедии», новостных статей и книги, открытых записях в социальных сетях и других текстовых материалах и продолжает уже написанный текст в разных стилях: пацанские цитаты, рекламные слоганы, короткие истории, подписи в Instagram, «короче, „Википедия“», синопсисы фильмов, гороскоп, народные мудрости, тосты, теории заговора, ТВ-репортажи и народные мудрости.
Компьютерную модель нейронной сети придумали еще в 1943 году американский нейрофизиолог, один из основоположников кибернетики Уоррен МакКаллок и нейролингвист, логик и математик Уолтер Питтс. Но активно внедрять в нашу жизнь технологию стали только в последние годы, потому что появились компьютеры с достаточно большими вычислительными мощностями. Нейросеть обладает свойством накапливать знания и применять их на практике, но задачи, которые она решает, должны быть хорошо понятны самим людям.
The Village Екатеринбург пообщался с руководителем Центра искусственного интеллекта в «Контуре» Никитой Тарасовым и data-scientist в «Точке» Семеном Стихиным о том, как на самом деле устроены нейросети (нет, не как человеческий мозг), как они обучаются и смогут ли делать вообще все за человека. А еще — есть ссылка на нейросеть, которая генерирует фотографии несуществующих котов, можно залипнуть на весь день!
Что такое нейросеть и по какому принципу работает
Семен Стихин
data-scientist в «Точке»
Нейросеть устроена, как большой калькулятор. Мы даем ей объект — картинку, аудиодорожку, видео и прочее, но в компьютере это оцифровано, поэтому, представляет из себя набор чисел (например, каждый пиксель — это три числа — Прим. ред.). Нейросеть принимает этот набор чисел, а дальше производит большое количество операций над ними: сложение, умножение и т.д. А на выходе мы получаем другой набор чисел, который также интерпретируется в виде картинки, аудио, видео и прочего.
Например, при разблокировке телефона с помощью FaceID — устройство получает изображение, нейросеть проводит операцию по его сравнению с заданным, а на выходе дает ответ — совпадают ли они. А в «Точке» мы используем нейросети для перевода фотографий клиента в вектор параметров, чтобы потом быстро проверить, нет ли его в базе мошенников. Самое важное — это архитектура нейросети и ее внутренние параметры. Они определяют порядок манипуляций с информацией.
Никита Тарасов
руководитель Центра искусственного интеллекта в «Контуре»
Нейросети хорошо зарекомендовали себя для решения задач на основе плотных данных, как текст, изображения, аудио. Уникальных текстов на конкретную заданную тему можно написать очень много. И внутри каждого будут скрытые связи между словами. Но анализируя слово «добрый», алгоритмы с большей вероятностью предложат вам продолжить фразу словом «день», а не словом «поле». Такая вариативность делает сложной задачу для классических моделей машинного обучения, но не для нейросетей.
Как обучают нейросети
Никита Тарасов
руководитель Центра искусственного интеллекта в «Контуре»
К открытию выставки Федора Конюхова в Екатеринбурге весной прошлого года «Контур» решил обучить нейросеть художественному стилю этого художника-путешественника. Мы отобрали несколько фотографий его картин, которые и стали источником стиля. А перенести его стало возможным на любое другое базовое изображение, например, на фото Федора Конюхова — так нейросеть сделала их в стиле, которым он писал свои картины.
Нейросеть изучает каждое из изображений, разбивая их на «слои»: линии, окружности или иные объекты. Разные слои отражают разные аспекты изображения. Такая разбивка в дальнейшем помогает нейросети заменить стиль базового изображения на тот, которому ее обучили. В итоге мы получаем произведение, нарисованное искуственным интеллектом в заданном художественном стиле.
Семен Стихин
data-scientist в «Точке»
Один из методов обучения нейросетей — метод градиентного спуска. Для его описания есть аналогия. Представьте, что вы управляете марсоходом с земли, и вам нужно найти на этой планете самую глубокую яму. Вы двигаете его в стороны и смотрите, как изменились координаты высоты. Скорее всего вы пойдете в ту сторону, где это изменение больше, и постепенно спуститесь в какую-то яму. Она может быть и не самой глубокой на планете — чтобы это проверить, вы отправите еще несколько марсоходов, и тогда точно найдете самую низкую точку на поверхности. По такому же принципу ищут минимальное значение функции, чтобы подобрать параметры для нейросети. Именно параметры нейросети определяют, будет ли она давать корректный ответ на нашу задачу.
В конце 1990-х нейросети научились решать задачи, которые были не под силу компьютеру, но только с условием большого количества исходных данных, на которых можно обучаться. В 2010 году нейросеть могла распознать объекты на картинке с правильностью до 70%, а к 2015 году научилась идентифицировать объекты со 96%-результатом. Причем качество решения такой же задачи человеком — хуже на 1%. Это стало возможным за счет того, что увеличились доступные человеку вычислительные мощности, и теперь нейросеть может обрабатывать достаточное ей количество информации для такой задачи.
Сегодня нейросети ускоряют рутинную работу человека: классифицируют изображений, генерируют и классифицируют тексты, генерируют музыку. Но вычислительных мощностей до сих пор не хватает, чтобы качественно решать отдельные задачи. Даже если взять генерацию текста в нейросети «Яндекса» — прочитав большинство полученных результатов, сразу становится понятно, что текст писал не человек, а компьютер.
Где и как сейчас используют нейросети
Никита Тарасов
руководитель Центра искусственного интеллекта в «Контуре»
Сегодня нейросети используют для решения задач, где требуется обработать текстовые данные, видео, аудио, картинки, 3D-снимки, и другие неструктурированные данные. А «фановые штуки» помогают нейросетям становиться популярнее в широких кругах. Это могут быть как задачи дискриминативные, например, когда нужно определить, кто изображен на картинке — котик или собачка, так и и генеративные, например, когда хочется создать изображения несуществующих котиков.
Нейронные сети внедрены в продукты для жизни, такие как трекеры сна, которые мониторят активность и рисуют график того, как мы спим. Также, каждый сталкивается с нейросетями, когда ищет информацию в интернете. За поиском в Google, «Яндексе» и любом другом сервисе скрывается очень большое количество алгоритмов, многие из них основаны на нейросетях.
Бизнес также использует нейросети. В электронном документообороте внутри компании или с контрагентами нейросети отвечают за распознавание изображений. Документы как правило или дублируются на бумаге, или изначально созданы на бумаге. Автоматически переводить большие объемы документов из физического состояния в электронное помогают алгоритмы, которые основаны на нейросетях. Также, в «Контуре» при заполнении заявки на электронную подпись мы подсказываем пользователям, что набор документов не соответствует требованиям, чего-то не хватает. И нейросеть помогает это выяснить сразу же при загрузке документов. Тем самым уменьшается время на коммуникации с оператором для получения подписи. Во многих крупных корпорациях, где есть техподдержка клиентов, сегодня внедрены чат-боты, за некоторые задачи в которых отвечают нейросети. Например, отдельная нейронная сеть распознают проблемы пользователя, а когда класс проблемы распознан, задача переходит другому алгоритму и далее по цепочке.
Нейросеть обладает свойством накапливать знания и применять их на практике. Первое существенное ограничение для ее обучения заключается в том, что нейронная сеть обучается только на тех данных, которыми мы ее учим. А второе — задача должна быть понятна и хорошо решаема людьми, чтобы они могли автоматизировать ее с помощью нейросетей от и до.
Семен Стихин
data-scientist в «Точке»
Нейросеть используется не в вакууме, а совместно с другими алгоритмами, и в качестве инструментов, которые помогают оптимизировать процессы в разных сферах. Например, с помощью нейронной сети реставрируют старые фильмы или фотографии, а еще навигатор строит кратчайший путь до нужной точки вашему курьеру.
В банке «Точка» мы используем нейросети для анализа запросов в техподдержку: классифицируем проблемы пользователей и выясняем, на какие стоит обратить внимание в первую очередь. Также, с помощью нейросетей построили умный поиск по базе знаний, чтобы сотрудники могли оперативно отвечать на вопросы клиентов. Еще мы формируем подсказки пользователям, когда он задает вопрос в чате: отдаем нейросети на вход фразу, которую клиент начал вводить, а на выходе получаем несколько вариантов дополнения до вопроса, который уже когда-то обрабатывали. Так мы пытаемся предугадать проблему, чтобы оперативно ее решить.
Один из любимых примеров использования нейросетей — беспилотные автомобили «Яндекса». Камеры на машинах собирают информацию о внешнем пространстве, нейросети ее обрабатывают и задают направление, скорость движения. В скором будущем с увеличением вычислительных мощностей это поможет внедрить беспилотников повсеместно — уже сейчас в «Сколково» можно проехаться в машине без управления человека.
Чтобы прочитать целиком, купите подписку. Она открывает сразу три издания
месяц
год
Подписка предоставлена Redefine.media. Её можно оплатить российской или иностранной картой. Продлевается автоматически. Вы сможете отписаться в любой момент.
На связи The Village, это платный журнал. Чтобы читать нас, нужна подписка. Купите её, чтобы мы продолжали рассказывать вам эксклюзивные истории. Это не дороже, чем сходить в барбершоп.
The Village — это журнал о городах и жизни вопреки: про искусство, уличную политику, преодоление, травмы, протесты, панк и смелость оставаться собой. Получайте регулярные дайджесты The Village по событиям в Москве, Петербурге, Тбилиси, Ереване, Белграде, Стамбуле и других городах. Читайте наши репортажи, расследования и эксклюзивные свидетельства. Мир — есть все, что имеет место. Мы остаемся в нем с вами.