В какой-то момент команда Google ads взяла на вооружение нейронные сети и использовала их в таргетированной рекламе, но команда самого движка внедрять технологию не спешила. Сейчас же Google включил глубинное обучение в свой поисковый движок, работу возглавил глава отдела искусственного интеллекта.

Вчера 46-летний ветеран компании Google, отвечающий за его поисковый движок, Амит Сингхал, объявил о своем уходе. Вскоре Google объявили, что важное место Сингхала займет Джон Джианнадреа. Если особо не задумываться, то это — просто два парня, которые привносят в жизнь что-то новое. Но можно также рассматривать эту пару как совершенную метафору мгновенного переключения в работе Google — и, вместе с ним, технического мира в целом. 

Дело в том, что Джианнандреа отвечает в Google за работу над искусственным интеллектом, что включает в себя глубокие нейронные сети — сети, построенные за счет технического и программного обеспечения, близкие к тем, что находятся в человеческом мозге. Анализируя огромные массивы цифровых данных, эти нейронные сети способны обучаться различным полезным навыкам, таким как: установление личности по фотографии, распознавание голосовых команд для смартфона, и, как оказалось, отклик на поисковые запросы в Интернете. В некоторых случаях они так хорошо осваивают задачу, что превосходят в ее выполнении человека. Они могут делать это лучше. Они могут делать это быстрее. И они могут делать это в гораздо больших масштабах. 

Этот подход, названный «глубинное обучение», стремительно перестраивает множество самых популярных интернет-сервисов — от Facebook и Twitter до Skype. За последний год он также переосмыслил и Google поиск, который приносит компании большую часть дохода. Ранее в 2015 году, как недавно сообщил Bloomberg, Google внедрил систему глубинного обучения RankBrain, которая помогает генерировать ответы на поисковые запросы. В октябре RankBrain сыграла важную роль в подборе результатов поиска на «значительную долю» из миллионов запросов, которые проходят через поисковый движок каждую секунду. 

Bloomberg также утверждает, что Сингхал был тем, кто разрешил внедрение RankBrain, а до этого он и его команда исследовали другие, более простые формы машинного обучения. Но, как говорят, он одно время был решительно против применения машинного обучения в Google поиске. Раньше Google обходился в основном алгоритмами, следовавшими набору строгих правил, установленному людьми. Беспокойство — как это описывают некоторые бывшие работники компании — было вызвано тем, что становилось все сложнее понимать, почему нейронные сети вели себя именно так, а не иначе, и все труднее было их настраивать. 

Эти проблемы все еще актуальны для мира машинного обучения. Правда в том, что даже эксперты не до конца понимают, как работают нейронные сети. Но они работают. Если «скормить» нейронной сети достаточное количество фотографий утконоса, она научится его различать. Если показать достаточно образцов кода компьютерных вирусов, она сможет их определять. Если дать ей достаточно примеров неформальной речи — слова или фразы, которые люди могут набрать в поисковой строке — сеть сможет понимать поисковые запросы и поможет отвечать на них. В некоторых случаях она может справится с запросами даже лучше, чем алгоритмы, написанные инженерами вручную. Искусственный интеллект — это будущее Google поиска, а значит, будущее многих других вещей.

Соблюдение правил 

Этой осенью я общался с бывшим сотрудником Google, который попросил не указывать его имя, так как ему нельзя говорить о процессах внутри компании, и мы обсудили роль нейронных сетей в поисковом движке Google. В какой-то момент, как он рассказал, команда Google ads взяла на вооружение нейронные сети и использовала их в таргетированной рекламе, но команда самого движка внедрять эту технологию не спешила. Действительно, на протяжении многих лет дискуссии о таком развитии то и дело возникали на Quora, популярном веб-сайте формата «вопрос-ответ». 

Эдмонд Лау, состоявший в команде Google поиска, автор книги «Справочник эффективного инженера» («The Effective Engineer»), написал на Quora пост, в котором говорилось о том, что у Сингхала были философские основания не доверять машинному обучению. Проблема машинного обучения, писал Лау, состояла в том, что «было сложно определить и объяснить, почему определенный результат поиска занимает позицию выше другого в отдельной выдаче». Он добавил: «Сложно напрямую подстроить систему, основанную на машинном обучении таким образом, чтобы она существенно повысила приоритет определенных сигналов перед другими». Другие бывшие сотрудники Google согласились с его описанием. 

Да, поисковый движок Google всегда работал на алгоритмах, которые автоматически отвечали на каждый запрос. Но эти алгоритмы привязаны к целому перечню определенных правил. Инженеры Google могли бы легко изменить эти правила и сделать их удобнее. И в отличие от нейронных сетей, эти алгоритмы не были бы самообучаемыми. «Хотя оценочная метрика, основанная на правилах, довольно сложна, она предоставляет инженерам больше возможностей для прямой настройки приоритетов в конкретной ситуации», — пояснил Лау. 

Тем не менее сейчас Google включил глубинное обучение в свой поисковый движок. И поставив главу отдела ИИ заниматься поиском, компания уверена, что это большой шаг вперед.

Потеря контроля 

Действительно, при использовании нейронных сетей, человек теряет некоторый контроль. Но не весь, как убежден Крис Николсон, основатель Skymind, стартапа по глубинному обучению. Нейронные сети — это просто математика, линейная алгебра, а инженеры уж точно могут увидеть, как числа ведут себя внутри этих многослойных созданий. Проблема в том, что сложно понять, почему нейронная сеть определяет фото, сказанное слово, или фрагмент естественного языка именно так, а не иначе. 

Крис Николсон: «Люди считают, что за глубинным обучением стоит линейная алгебра. Однако то, что получается в итоге, не предназначено для человека. Эта информация для машины. Они могут прийти к очень точным результатам, но мы не всегда можем объяснить, как и почему это произошло»


Все это говорит о том, что для настройки нейронных сетей нужно корректировать математические вычисления с помощью интуиции, путем проб и ошибок. Нужно настроить сети на новые данные, а для этого нужно еще больше пробовать и ошибаться. Это выполнимо, но сложно. И как только поисковая система Google станет работать по модели ИИ, будет непонятно, как справедливо выдавать результаты поиска или как менять выдачу, если на результаты поступили жалобы. 

Это очень важная проблема. В настоящее время в отношении Google заведено дело в европейском антимонопольном комитете из-за того, что поисковик компании нечестно занижает рейтинг страниц конкурентов. Что произойдет, когда машины будут принимать такие решения и их логику нельзя будет расшифровать? Люди все еще будут контролировать машины, но уже не так как раньше. 

В любом случае, глубинное обучение уже проникло в поиск Google. И скорее всего компания уже использовала и другие формы машинного обучения за последние несколько лет. Хотя из-за этих технологий придется пожертвовать контролем, в Google уверены: игра стоит свеч.

Глубинное обучение 

Нужно помнить, что глубинное обучение — это всего лишь один из методов работы поиска Google. Согласно данным Bloomberg, RankBrain обслуживает около 15% запросов Google в день — это запросы, с которыми система еще не сталкивалась. В общих чертах, движок, основанный на машинном обучении, мастерски анализирует слова и фразы, которые содержатся в поисковом запросе, и решает, какие другие слова и фразы имеют схожее значение. В результате обрабатывать незнакомые запросы у него получается намного лучше, чем у старой алгоритмической системы. 

Однако со временем подобные системы будут играть все большую роль в интернет-сервисах вроде Google поиска. Как-то раз Google провел тест, в котором его поисковые инженеры состязались с RankBrain. Обеим командам надо было взглянуть на несколько различных страниц и спрогнозировать, какая будет занимать более высокую позицию в результатах поиска Google. RankBrain был прав в 80% случаев, а инженеры — только в 70%. 

Но это не умаляет заслуг Сингхала. Он присоединился к Google в 2000 году и уже год спустя был назван Google Fellow — самым почетным званием для инженера. Большую часть существования Google он возглавлял работу над поисковым движком, и этот движок был самым лучшим. 

Несмотря на это, машинное обучение существенно меняет ситуацию. «Если мы построим систему обучения, нам больше не придется писать эти правила, — объявил Джон Джианнадреа этой осенью на пресс-конференции. Более того, мы приходим к выводу, что если мы будем обучать машины, а не писать код, мы будем справляться намного лучше». 

Кейд Мец

Оригинал/Источник

Читайте и смотрите также:

ПОЧЕМУ ЭЛЕКТРИЧЕСКИМ ОВЦАМ СНЯТСЯ ГЛАЗА И СОБАКИ

 

ПИТЕР УОТТС: КОЛЛЕКТИВНОЕ СОЗНАНИЕ

 

СТЕНТРОДЫ ДЛЯ УПРАВЛЕНИЯ ТЕХНИКОЙ СИЛОЙ МЫСЛИ