Об искусственном интеллекте последнее время вспоминают всё чаще. Если раньше ИИ занимались исключительно исследовательские институты и крупные компании, то теперь в этой области появляется всё больше небольших стартапов. Правда, их зачастую очень быстро покупают те же самые компании-гиганты. Среди заметных событий последнего года, важных для развития отрасли, — и покупка Google стартапа DeepMind за баснословные $500 млн, и инвестирование Цукербергом, Маском (и Эштоном Катчером) $40 млн в компанию Vicarious, научившую компьютер понимать CAPTCHA, и открытие специального подразделения с 2 000 человек в штате для работы с ИИ-приложениями в IBM.

На стэнфордский онлайн-курс, посвящённый искусственному интеллекту, в прошлом году записалось более 150 000 человек, TED объявил конкурс на создание первого ИИ, который сможет выступить с достойной речью на их конференции. Различные команды работают над алгоритмами распознавания речи, компьютерного зрения, обработки естественного языка, активно используя так называемое «глубокое обучение» — вид машинного обучения, основанного на нейросетях. Этот алгоритм позволяет компьютеру учиться самостоятельно, не прибегая к прямому человеческому вмешательству. Причём компьютер в данном случае учится понимать абстрактные концепции, связи и «смыслы».  

 

IBM: безработный суперкомпьютер

Представьте, что вы создали невероятно умный искусственный интеллект, а он оказался никому не нужен. В подобной ситуации оказался суперкомпьютер Watson компании IBM. Его разработка стоила компании порядка $20 млн и заняла три года. Цель его создания изначально заключалась в том, чтобы выиграть у людей в игре-викторине Jeopardy! (зарубежный аналог «Своей игры»). Корпорация любит участвовать в подобных показательных проектах, и когда-то «дедушка» Ватсона — шахматный суперкомпьютер Deep Blue — выиграл матч у чемпиона мира по шахматам Гарри Каспарова. Тогда задача компьютера была в том, чтобы действовать на основе правил игры, Watson было труднее.

Он не только должен находить в своей базе данных ответы на поставленные вопросы, но также понимать естественный язык, на котором они задаются. К тому же вопросы задаются не прямые (где нужно просто подобрать слово к определению) — это хитроумные задания, для решения которых нужно понимать переносные значения понятий, использовать ассоциации и фантазию. В IBM считают, что настоящий ИИ должен уметь находить неочевидные решения, создавать и изобретать новое, а не только анализировать старое. Среди всего прочего компания развивала креативные способности Watson, обучая его кулинарному искусству, в результате чего тот научился придумывать новые рецепты самостоятельно.

После того, как Watson победил в викторине, его создатели надеялись, что его таланты пригодятся для решения практических задач, предполагая, что он будет приносить компании более $10 млрд в год. Однако время шло, а доход Watson составлял не более $100 000 в год. Услуги суперкомпьютера для одних стоили слишком дорого, другие просто не понимали, для чего его можно использовать. Одним из немногих успешных проектов Watson стала работа над диагностированием рака у пациентов и подбором возможных вариантов лечения. Чтобы как-то стимулировать спрос на услуги суперкомпьютера, в январе 2014 года компания создала специальный отдел IBM Watson Group, в котором будет работать порядка 2 000 человек. Они займутся разработкой практических приложений Watson для таких отраслей, как фармацевтика, биотехнологии, аналитика больших данных, понимание естественного языка. Создание этого подразделения стоило IBM $1 млрд. А пока что с Watson можно один на один поиграть в «Свою игру» на сайте NYTimes. 

 

Microsoft: внимательный личный ассистент

В начале апреля Microsoft наконец объявила о том, что создание продвинутого аналога Siri и Google Now — голосового помощника для Windows Phone 8.1 — подошло к концу. Виртуальная помощница получила имя Cortana в честь ИИ из игры Halo. Microsoft пришли к созданию Cortana постепенно: сначала потренировались на говорящем лифте и виртуальном администраторе на ресепшен в главном офисе.

Лифт в здании Microsoft может «узнавать» людей, которые им уже пользовались, запоминать их передвижения и предсказывать их желания. То есть он может понять, что этот конкретный сотрудник, вероятно, хочет сейчас отправиться в столовую, потому что он уже много раз ходил на обед примерно в это время. «Девушка-администратор», встречающая гостей при входе в офис, впечатляет ещё больше. Она может считывать разнообразную информацию, основываясь на внешнем виде человека. Например, понимать, одет ли он буднично или официально, в каком он сейчас настроении и так далее. Главное, что она обладает способностью самостоятельного обучения — собирать информацию и анализировать всё, что она видит перед собой.

Основное преимущество Cortana перед Siri как раз заключается в том, что она обладает адаптивностью, способностью к самообучению и даже некоторой формой интуиции. С одной стороны, она, как и Siri, может выдавать справочную информацию, собранную из внешних источников, но также способна к саморазвитию, пониманию ваших персональных предпочтений, нормальной человеческой речи, а также умеет шутить. Ей можно поручить управление вашей почтой и календарём, и можно рассчитывать на то, что она сама догадается напомнить вам о чём-то, что вы забыли. В целом, Cortana невероятно напоминает Саманту из фильма Спайка Джонса «Она».

 

Facebook: подслушивающий и подсматривающий

В прошлом году Марк Цукерберг на собрании инвесторов Facebook объявил, что считает ИИ основным направлением развития компании на данный момент, в связи с чем он создал специальный отдел, который будет работать над алгоритмами «глубокого обучения», и нанял на работу специалиста в области машинного обучения и нейрокомпьютерных интерфейсов Яна ЛеКуина. Прессе Цукерберг сообщил, что хочет превратить соцсеть в огромную базу знаний: «Наша главная цель — использовать новые подходы в изучении искусственного интеллекта, чтобы придать смысл всему контенту, которым обмениваются люди. Таким образом мы можем генерировать новые идеи о мире, чтобы ответить на вопросы людей». Первым результатом работы ИИ-отдела стал проект DeepFace, усовершенствованный алгоритм распознавания лиц на фотографиях. Его точность составляет 97%, независимо от качества фото, степени освещённости, расположения человека на снимке (анфас, в профиль).

Работа системы искусственного интеллекта DeepFace основана на симуляции работы нейронной сети. Разработчики обучали свой алгоритм, используя 4 000 фотографий из альбомов 4 млн человек. Они смогли достичь такой точности благодаря созданию способа формирования трёхмерной модели лица на фотографии. Сначала система виртуально вращает эту модель, чтобы получить её «анфас-версию». Затем она создает математическое описание лица с использованием ряда параметров и сравнивает его с имеющимися в своей базе данных. На основании степени совпадения этого описания система делает вывод о том, являются ли люди на фотографиях одним и тем же лицом. Facebook не собирается останавливаться на фотографиях. Компания уже работает с текстами сообщений, которыми обмениваются их пользователи, так что скоро алгоритм «научится» понимать то, о чём именно говорят люди, с какой интонацией, что им нравится, а что нет, и главное — что они хотели бы купить.

 

Google: гении, кошки и роботы

Вероятно, наиболее заинтересованная в ИИ компания — это Google. Брин и Пейдж не только создали на своей базе несколько исследовательских лабораторий, посвящённых ИИ (среди которых есть Quantum Artificial Intelligence Lab, занимающаяся вопросами применения квантовых компьютеров для машинного обучения), наняли на работу главные «умы» в этой области — Рэя Курцвейла, Джеффри Хинтона и Эндрю Нг, но и постоянно скупают стартапы, специализирующиеся на ИИ. Считается, что одна из главных целей Google в данном случае заключается в том, чтобы создать максимально подробную модель окружающего мира, на основе которой они смогут с большой точностью предсказывать будущее и улучшать качество выдачи поисковой системы. Среди их главных последних приобретений стартапы DeepMind, специализирующегося на понимании естественного языка, Boston Dynamics (на видео), занимающийся созданием умных роботов, Flutter, проект распознавания жестов, Nest, производящий умную бытовую технику для «интернета вещей». 

Самым известным и масштабным на данный момент экспериментом с работой ИИ для Google стал опыт распознавания кошек на видео YouTube. Изначально самообучаемая нейросеть не знала о существовании кошек, но после просмотра 10 миллионов случайных кадров с YouTube в нейросети сформировались нейроны, селективно реагирующие на присутствие их мордочек на изображениях. В процессе самообучения нейросеть Google работала примерно так же, как работают нейроны в зрительной коре головного мозга млекопитающих. Тот же самый принцип использовался для улучшения точности распознавания речи и в проекте Google Street View для обработки маленьких фрагментов фотографий, где нужно было определить, является число на фрагменте номером дома или нет.

 

 

Фотография на обложке: Shutterstock