Сергей Шумский: Воспитание машин

Специалист в области машинного обучения и искусственного интеллекта Сергей Александрович Шумский выпустил книгу ‘Воспитание машин: Новая история разума‘. Книга небольшая, легко читается и в то же время она дает прекрасное представление о стиле мышления людей, занимающихся искусственным интеллектом.

Шумский позиционирует книгу таким образом:

‘Главное отличие этой книги от многих других — попытка рассмотреть искусственный интеллект в глубоком историческом контексте, не ограничиваясь историей последних десятилетий.’

Это означает следующее: история человечества от времен охотников-собирателей до примерно половины двадцатого века охвачена в первой главе. Вторая глава посвящена времени от появления первых компьютеров до Интернета. Третья глава рассматривает время цифровых платформ, то есть, по сути дела последние двадцать лет. Вторая половина книги (еще три главы) посвящены будущему.

Глубокий исторический контекст на поверку оказался связанным с оценками возможной численности населения в рамках определенного технологического уклада. По оценкам Шумского технологический уклад охотников-собирателей мог прокормить до 10 млн людей на Земле. Когда этот предел был достиг человечество перешло к аграрному технологическому укладу — наступило время неолита. Логику Шумского прекрасно передает следующая цитата:

‘Поскольку людям нужно сбалансированное по жирам, белкам и углеводам питание, специализация разных регионов на «своих» сельскохозяйственных культурах сделала торговлю необходимым элементом неолитического технологического пакета, что, в свою очередь, привело к развитию письменности, мореплавания и связанных с ними ремесел, включая металлургию.’

Предел населения при аграрном технологическом укладе по оценкам Шумского составляет 1 млрд людей и он был достигнут в 18 веке. Поэтому наступила время промышленных революций. Отмечу только, что аграрный технологический уклад от начала неотлита до 18 века характеризуется Шумским как мальтузианская ловушка. Это по сути дела все, что сказано в книге про историю человечества за 11 тыс. лет.

Индустриальный технологический уклад привел к взрывному росту благосостояния и поднял границу численности населения. Тем не менее, по оценкам к концу 20-века он достиг пределов своего развития. В качестве одного из критериев Шумский приводит замедление роста населения Земли:

‘Замедление роста населения Земли, наблюдающееся со второй трети XX века, является важным индикатором современного глобального кризиса.’

С количеством населения Шумский связывает количество знаний (грубо говоря, количество мозгов). Если уровень населения остается на одном уровне, то прирост знаний в мозгах становится невозможным:

‘Рано или поздно все знания человечества уже не смогут помещаться в наших головах! Возможно, мы уже вплотную приблизились к этому пределу сложности человеческой цивилизации …’

Выход — переход на цифровой технологический уклад и в близком будущем приход сильного искусственного интеллекта.

Я не буду пересказывать про историю последных 70 лет, поскольку дело известное. Отмечу только, что в книге все построено на оценке числа арифметических операций в секунду (FLOPS). Сделана оценка для мозга человека и далее она сравнивается с мощностью компьютеров. Самое интересное, пожалуй, как оценивается современный уровень перехода к цифровому технологическому укладу:

‘По мнению автора, появление искусственного интеллекта в его современном виде слабого ИИ соответствует созданию первых, еще очень несовершенных паровых двигателей.’

‘Современное глубокое обучение можно уподобить первым громоздким паровым двигателям Ньюкомена с их чудовищно низким КПД.’

В целом будущее связано исключительно с переходом к сильному искусственному интеллекту, при этом стратегия связанна с машинным обучением и машинным воспитанием. Начну с цитат, которые показывают ограниченность имеющихся в настоящее время технологий глубокого обучения. Они несколько длинные, но их полезно просмотреть, поскольку со всех сторон в настоящее время можно услышать про самообучающийся ИИ. Утверждения Шумского ниже хорошо показывают, что это всего лишь преувеличение. Успехи действительно имеются, но они в то же время достаточно ограничены:

‘У всех на слуху недавние победы машин во всевозможных стратегических играх, от культовой древней игры го до новомодных StarCraft 2 и Dota 2, где требуется реагировать на действия соперников в реальном времени и строить гипотезы о том, что происходит в ненаблюдаемых областях игрового поля. Эти достижения демонстрируют способность глубоких нейросетей формировать полезные поведенческие навыки и строить выигрышные стратегии в виртуальных мирах. Но современные алгоритмы пока что не позволяют машинному интеллекту вырваться из этих виртуальных миров в реальный. Обучение нейросетей происходит сегодня слишком медленно, и соответствующий «жизненный опыт» за приемлемое время удается набрать лишь в виртуальном мире за счет существенного ускорения темпа игры. Эти алгоритмы невозможно перенести на обучение роботов в реальном мире, где у них не будет столько времени на обучение и стольких виртуальных жизней, которыми заплачено за неудачные решения.’

‘К тому же, если вернуться к разговорному интеллекту, у нас пока нет виртуальных миров для оттачивания разговорных навыков. Ассистентам надо учиться рассуждать и вести диалоги, а для этого — пробовать самим генерировать варианты ответов в различных сценариях. Привычное обучение на больших корпусах готовых диалогов здесь не подходит. Надо, чтобы кто-то оценивал качество каждой реплики в бесчисленных ветвящихся вариантах развития диалогов, из которых лишь очень немногие могут присутствовать в обучающей выборке. А на это пока что способны только живые люди и лишь в реальном времени.’

‘Существующие глубокие нейросети можно рассматривать как подсистемы искусственной психики, которые можно обучить решению множества самых разных задач, но только по одной, а не всех сразу. Если обученную нейросеть начать обучать новой задаче, она будет забывать старые навыки, поскольку разные задачи решаются разными наборами одних и тех же настроечных параметров нейросети.’

Предлагаемое решение связано с созданием машинной психики, которая будет напоминать человеческую. При этом:

‘Ничто в науках о разуме не имеет смысла, кроме как в свете машинного обучения.’

‘Физика, в которой отсутствует понятие обучения, не способна объяснить появление таких сложных систем, как, скажем, жизнь или разум. Для этого нам приходится обращаться к машинному обучению.’

Для преодоления имеющихся проблем Шумский выдвигает широкий спектр идей, включая бизнес-планы. Я выделю только одну — разделение между интеллектом и разумом. Интеллект связывается с индивидуальным агентом (индивидуальное мышление), разум же с культурой, то есть с обществом. На жаргоне ИИ это выглядит таким образом:

  • ‘интеллект — это алгоритм обучения целенаправленному поведению агента;
  • разум — это алгоритм обучения целесообразному коллективному поведению агентов.’

Отсюда следует переход от обучения к воспитанию. Агент обучается сам по себе, но при этом его воспитывает коллектив. Таким образом для появления сильного искусственного интеллекта необходимы люди, которые должны путем воспитания сделать из робота «настоящего человека». Научная задача по Шумскому выражается следующим образом:

‘Соответственно, если мы действительно хотим понять человеческий разум и создать роботов, способных на равных вписаться в человеческую цивилизацию, наша исследовательская программа должна развить теорию машинного обучения до теории машинного воспитания, а именно ответить на вопрос: каким образом приобщить роботов к человеческим знаниям, ценностям и культуре?’

В целом книга является хорошим способом вырваться из каждодневной рутины и вдохнуть полной грудью пьянящий аромат сильного искусственного интеллекта. Я не удержусь и приведу еще одну цитату, которая описывает цифровую демократию будущего для решения всех социальные проблем:

‘На платформах цифровой демократии интеллектуальные агенты смогут «дирижировать» процессами принятия коллективных решений, взвешивая мнения экспертов с учетом уровня их компетентности и знакомя граждан с наиболее весомыми аргументами за и против по любому вопросу подобно тому, как Google сегодня отбирает из сети наиболее релевантную информацию, а Amazon рейтингует и рекомендует товары на своих электронных витринах. Технологии сильного ИИ помогут людям формировать их личные мнения по любому вопросу в процессе диалога, в котором искусственный интеллект сможет суммировать разные точки зрения, находить в них скрытые противоречия и формулировать аргументированные советы исходя из понимания индивидуальных предпочтений и ценностей каждого гражданина.’

В заключение картиночка из книги Роберта Лафлина Другая Вселенная. По-моему она является лучшей характеристикой книги. Перевод подписи: ‘Нет ничего более трогательного, чем наставления компьютерных боссов ‘.

Информация

Сергей Шумский, Воспитание машин: Новая история разума, 2021.

Картиночка из книги Robert B. Laughlin, A Different Universe: Reinventing Physics From the Bottom Down, 2005.

Подпись к рисунку по-английски: ‘There is nothing more heartwarming than pontifications from computer executives.’

Обсуждение

https://evgeniirudnyi.livejournal.com/261963.html

https://www.facebook.com/evgenii.rudnyi/posts/2340078299459909


Comments are closed.