Ли Седол против компьютера

Обновлено: 09.07.2026

19 марта 2016 года Ли Седол, сильнейший игрок в го в мире, сыграет с программой искусственного интеллекта AlphaGo от Google DeepMind. Они в отеле Four Seasons в сеульском районе Кванхвамун, и это большое дело: большинство крупных южнокорейских телеканалов транслируют игру. В Китае его смотрят 60 миллионов человек. Для англоязычного мира Американская ассоциация го и DeepMind проводят прямую трансляцию на YouTube на английском языке, и ее смотрят 100 000 человек. Несколько сотен представителей прессы находятся в соседних комнатах, наблюдая за игрой вместе с опытными комментаторами.

Сегодня вечером Ли Седоля поддерживают мозг одного 33-летнего человека и примерно 12 унций кофе.

Большинство людей делают ставку на победу Ли.

По своей сути игра Го, зародившаяся в Китае более 2500 лет назад, представляет собой абстрактный симулятор войны. Игроки начинают с совершенно пустой доски и размещают черные и белые камни по одному, чтобы окружить территорию. После размещения камни не двигаются и удаляются только в том случае, если они «убиты», то есть полностью окружены камнями противника. И так игра продолжается — черный камень, белый камень, черный камень, белый камень — пока игровое поле не покроется замысловатым черно-белым гобеленом.

Правила го просты, и их изучение занимает всего несколько минут, но возможности кажутся безграничными. Количество потенциальных должностей в юридическом совете:

<р> 208.168.199.381.979.984.699.478.633.344.862.770.286.522, <р> 453.884.530.548.425.639.456.820.927.419.612.738.015.378, <р> 525.648.451.698.519.643.907.259.916.015.628.128.546.089, <р> 888314427, 129.715.319.317.557.736.620.397.247.064.840, <р> 935.

Это число, которое больше, чем количество атомов во Вселенной, было определено только в начале 2016 года. Поскольку существует множество направлений, в которых может двигаться любая игра, общеизвестно, что го — сложная игра для компьютеров. Его часто называют «Святым Граалем» искусственного интеллекта.

В феврале 2016 года исследователи DeepMind опубликовали в журнале Nature статью, в которой объявили о том, что им удалось сделать нечто замечательное: их ИИ не только смог превзойти любую другую программу для игры в го в мире, но и победил профессионала по имени Фан Хуэй, действующего чемпиона Европы. AlphaGo не просто обыграл Фань Хуэя — он уверенно обыграл его в каждом матче серии из пяти игр.

Эта новость пронеслась по всему миру Го. Было широко распространено мнение, что ИИ, достаточно сильный, чтобы победить профессионального игрока, появится еще как минимум через десять лет, и эта веха была незаметно преодолена. Следующим логическим шагом было выяснить, каким может быть верхний предел AlphaGo, и Ли был логичным выбором для чемпиона человечества.

Любопытно, что когда кто-то действительно хорош в чем-то, мы называем его "машиной". Ли Седоль – это машина для игры в го, призванная побеждать, ну, машину для игры в го.

Ли, конечно, не машина. Он особенно молодо выглядящий 33-летний мужчина. Это человек, который встает и завтракает, дремлет, смущается, нервничает. Однако в мире го нет никого страшнее Ли, который играет с пугающей уверенностью. Он создает ситуации, которые должны закончиться катастрофой, а затем — без особых усилий для наблюдателя — переворачивает их с ног на голову, словно магический трюк, сбивая своих противников с толку.

За несколько недель до первой игры команда DeepMind выразила скромный оптимизм в отношении шансов AlphaGo на победу. Ли более наглый; на пресс-конференции с Демисом Хассабисом, основателем DeepMind, он заявил, что для него проблема не в том, победит ли он AlphaGo, а в том, победит ли он со счетом 5:0 или 4:1.

Ли не ведет себя высокомерно. Он делает объективную оценку, основываясь на игре AlphaGo против Fan Hui, которую он видел. А Фан Хуэй и Ли Седол не совсем сопоставимы по силе. В мире го Ли — это Майкл Джордан, Тайгер Вудс, Роджер Федерер. Он один из тех редких виртуозов, которые определяют свою эпоху, задают тон всему остальному миру. Он на порядки более талантлив, чем Фан Хуэй, который не дурак. И Fan Hui на самом деле обыграл AlphaGo за пределами официального матча из пяти игр, о котором сообщил DeepMind. При гораздо более жестких настройках времени он выиграл два матча из пяти, что усложнило жизнь AlphaGo.

Другие корейские профессионалы шутят, что завидуют Ли, считая, что DeepMind Challenge Match — это самый легкий миллион долларов, который может когда-либо заработать игрок высшего уровня.

Через несколько минут после первой игры все ожидания меняются. Сразу становится ясно, что Ли Седоль играет не в ту AlphaGo, в которую играл Фан Хуэй в Лондоне. Та версия AlphaGo играла стабильно, но также пассивно, мирно. AlphaGo, играющая в Сеуле, рада вступить в агрессивную борьбу с Ли. Ли сыграл нестандартный дебют, пытаясь сбить AlphaGo с толку, но это не сработало.

У AlphaGo было почти пять месяцев, чтобы улучшиться, и она постоянно совершенствуется, играя сама с собой миллионы раз, постепенно пересматривая свои алгоритмы в зависимости от того, какие последовательности игр приводят к более высокому проценту выигрышей. Пока вы читаете это, AlphaGo совершенствуется. Он не делает перерывов. У него нет дней, когда ему просто не хочется заниматься, дней, когда он не может сфокусировать свой электронный мозг. День за днем AlphaGo стремилась к превосходству, и результаты ошеломляют.

Ли проигрывает первую партию и сдается после 186 ходов. Поворотный момент в ментальной игре, кажется, наступил на 102-м ходу белых. Это резкое, неожиданное вторжение, агрессивный ход, влекущий за собой усложнение боевых позиций. По правде говоря, это именно тот ход, которым известен Ли. В этот момент на Ли накатывает весь спектр реакций: шок, удивление, принятие и, наконец, мрачная решимость. У него отвисает челюсть, и через несколько секунд он снова откидывается на спинку стула и улыбается, возможно, удивленный, но определенно ошеломленный. Затем выражение его лица становится серьезным, а рука потирает затылок — тик, который он проявляет, когда напряженно думает или нервничает.

В тот момент, когда он бросает полотенце, он начинает пересматривать ходы, толкая камни по доске, чтобы разыграть альтернативные варианты, экспериментируя с неизведанными дорогами. Мы видим, как он работает над этим, пытаясь точно определить, как именно он проиграл.

Он измерил машину. Переходя к игре 2, он понимает масштабы того, с чем ему предстоит столкнуться. На следующий вечер будет настоящее первое испытание. Но на пресс-конференции после первой игры он понизил предполагаемые шансы на победу до 50 %.

В игре 2 Ли демонстрирует другой стиль, пытаясь играть более осторожно. Он ждет любой возможности, которую он может использовать, но AlphaGo продолжает удивлять. На 37-м ходу AlphaGo делает неожиданный ход, так называемый «удар плечом» в правом верхнем углу доски. Этот ход в этой позиции невидан в профессиональных партиях, но остроумие его сразу бросается в глаза. Позже Фань Хуэй сказал: «Я никогда не видел, чтобы человек играл этот ход. Так красиво».

А Ли? Он встает и выходит из комнаты. Какое-то мгновение непонятно, что происходит, но затем он снова входит в игровую комнату, уже сочиненный, садится и воспроизводит свой ответ. Далее следует гораздо более близкая игра, чем игра 1, но результат остается прежним. Ли Седоль уходит в отставку после 211 ходов.

Той ночью Ли и группа его коллег не спали до 6:00, обдумывая возможные стратегии. Они ищут серебряную пулю, ахиллесову пяту, любой способ добиться победы. Теперь ему потребуется три победы подряд, чтобы выиграть серию.

Игра 3 заканчивается еще одним поражением — после четырех часов изнурительной игры Седол уходит в отставку. Он играет в один из лучших го в своей карьере, но он просто не может сломать броню ИИ. Понятно, что сила AlphaGo превосходит даже то, что демонстрировалось в играх 1 и 2. Позже американский комментатор Дэвид Ормерод напишет, что, наблюдая за победой AlphaGo в игре 3, он почувствовал себя «физически плохо».

На послематчевой конференции Ли выглядит на 10 лет старше. Среди шквала фотовспышек он сразу извиняется перед всем миром. «Я прошу прощения за то, что не смог удовлетворить ожидания многих людей», — говорит он. «Я чувствовал себя бессильным». Даже исследователи DeepMind, глубоко восхищающиеся Ли, кажутся скорее угрюмыми, чем ликующими по поводу собственной победы. Есть ощущение, что что-то изменилось. Гу Ли, один из давних друзей и соперников Ли, комментирует по китайскому телевидению, что Ли ведет «очень одинокую битву с невидимым противником».

Ли уже проиграл серию, но перед игрой 4 его новая цель – выиграть хотя бы один раз.

Ли, играя белыми против черных AlphaGo, пробует еще один новый стиль — более рискованную стратегию под названием амаси. На этот раз давление спадает, и мы видим, как некоторые волшебные пузырьки Ли Седоля всплывают на поверхность. До сих пор AlphaGo побеждала, позволяя Ли получать небольшую прибыль в обмен на свои дополнительные преимущества, а ее превосходные вычислительные способности каждый раз позволяли ей выходить на первое место. Теперь Ли вынуждает AlphaGo вступить в битву по принципу «все или ничего». Он крупно проиграет или крупно выиграет.

Затем следует 78-й ход Ли, который впоследствии будет называться его ходом «Рука Бога». Это блестящая тактическая игра, которую AlphaGo не учитывает. В течение следующих нескольких ходов последовательность становится катастрофической для AlphaGo, которая, по-видимому, «осознает» — настолько, насколько это вообще возможно, — что ее перехитрили. Его стратегия начинает рушиться.

В конце концов, не найдя ходов, повышающих его шансы на победу, он начинает делать бессмысленные ходы, ходы, которые на самом деле уменьшают его собственные очки. Наконец, он уходит в отставку.

После матча сотни людей скандируют имя Седоля, когда он подходит к сцене.Ликующий гроссмейстер благодарит всех причастных, говоря, что теплота, которую он чувствует в этот момент, стоит того, чтобы проиграть три предыдущих матча.

Однако вечером нас ждет еще один сюрприз. На пресс-конференции Ли отмечает, что и в этой партии, и в игре 2 (ближайшей из его проигрышей) AlphaGo играл черными. Ли просит сам сыграть черными в финальной игре, лишая его единственного преимущества. Такое ощущение, что Ли, поднявшись на Эверест после трех неудачных попыток, попросил еще раз попробовать, только с завязанными глазами.

В игре 5 Ли использует стратегию, аналогичную игре 4. Какое-то время игра близка, но AlphaGo еще раз доказывает, что она находит маленькие способы закрепить любые свои преимущества, и как только она выходит вперед, она очень хорошо защищает свое лидерство. Ли вынужден уйти в отставку в последний раз, закончив серию с четырьмя поражениями и одной победой. На этот раз Руки Бога нет.

Что это значит? Не так много, само по себе. Если бы AlphaGo проиграла Ли в марте, это было бы только вопросом времени, когда он улучшится настолько, чтобы превзойти его. Go постоянно развивается. То, что считается оптимальной игрой, быстро меняется. Люди оттачивали свои коллективные знания об игре более 2 500 лет. Разница лишь в том, что AlphaGo может делать то же самое гораздо быстрее.

Важная вещь, которую следует усвоить из этой серии, заключается не в том, что ИИ DeepMind может научиться побеждать в го, а в том, что в более широком смысле он может научиться побеждать все, что проще, чем го, то есть много вещей. Способы применения этих революционных достижений в области машинного обучения — способности машин имитировать человеческое творчество и интуицию — практически безграничны.

Но машины создаются человеческими руками, по крайней мере, на данный момент. В обсуждении на Reddit ученый-компьютерщик Энди Салерно хорошо выразился: «AlphaGo — это не таинственный зверь с какой-то далекой неизвестной планеты. AlphaGo — это мы», — написал он. «AlphaGo — это наше непрекращающееся любопытство. AlphaGo — это наше стремление выйти за рамки того, что мы считали возможным».

«Ли не должен стыдиться своих поражений», — продолжил Салерно. «Потому что AlphaGo никогда не смогла бы продемонстрировать свои способности — наши способности, — если бы Ли не был рядом, чтобы бросить ей вызов».

Программа AlphaGo от Google DeepMind одержала победу в финальной игре против гроссмейстера го из Южной Кореи Ли Седоля и выиграла серию со счетом 4:1, что еще раз свидетельствует о выдающемся достижении для программы искусственного интеллекта.

Ли уверенно начал игру во вторник, воспользовавшись ранней ошибкой AlphaGo. Но в итоге Ли не смог сдержать камбэк соперника, который одержал узкую победу.

После того, как были подведены результаты, соучредитель Google DeepMind Демис Хассабис назвал сегодняшний конкурс «одной из самых невероятных игр за всю историю», заявив, что AlphaGo добилась «умопомрачительного» возвращения после ранней ошибки.

Это была пятая игра за семь дней, изматывающая и эмоциональная битва Ли. AlphaGo выиграла первые три игры, но Ли выиграл четвертую игру в воскресенье.

Во время объявления результатов игры он оставался на своем месте, его глаза наполнились слезами. На послематчевой пресс-конференции он выразил сожаление по поводу своего поражения. «Я потерпел неудачу, — сказал он. «Мне жаль, что матч закончился и закончился вот так. Я хотел, чтобы все закончилось хорошо».

На протяжении всего матча наблюдатели хвалили Ли за решительный и творческий подход к AlphaGo, сопернику, неуязвимому для стресса и усталости. На пресс-конференции во вторник Крис Гарлок, один из комментаторов в прямом эфире, сказал, что матч состоит из «пяти прекрасных и исторических партий», добавив: «Я думаю, что мы будем изучать их в течение многих лет».

Из-за сложности го и важности реакции и интуиции компьютеру оказалось труднее освоить его, чем более простые игры, такие как шашки или шахматы. В го слишком много ходов, чтобы машина могла выиграть с помощью вычислений методом грубой силы, как, например, Deep Blue от IBM обыграла бывшего чемпиона мира по шахматам Гарри Каспарова в 1997 году.

Победа AlphaGo над Ли имеет большое значение, поскольку это первый случай, когда программа искусственного интеллекта обыграла высокопоставленного профессионала в го. По прогнозам экспертов, до победы оставалось еще несколько лет. В октябре AlphaGo обыграла чемпиона Европы по го Фан Хуэя, но ожидалось, что Ли будет более сложной задачей.

Этот матч привлек необычайно высокий уровень внимания к игре Го, популярной в Восточной Азии, но мало распространенной на Западе. Инсайдеры Go говорят, что не привыкли быть в центре внимания.«Я никогда не видел такого внимания к го, — сказал Ли Ха Джин, генеральный секретарь Международной федерации го и приглашенный комментатор прямой трансляции во вторник.

Google DeepMind рассказал о применении глубоких нейронных сетей и методов машинного обучения, которые AlphaGo использовала для освоения Go, в более актуальных областях, таких как здравоохранение и робототехника. Но с победой AlphaGo в книгах Хассабис был молчалив, говоря, что его команде нужно будет вернуться в Великобританию и потратить «недели или месяцы», анализируя результаты матча, прежде чем объявить о своих следующих шагах.

Южнокорейский чемпион по го Ли Седол ушел из профессиональной карьеры, заявив информационному агентству Yonhap, что его решение было мотивировано господством искусственного интеллекта.

«С дебютом искусственного интеллекта в играх Го я понял, что я не на вершине, даже если я стану номером один благодаря отчаянным усилиям», — сказал Ли Yonhap. «Даже если я стану номером один, есть сущность, которую невозможно победить».

В течение многих лет Go считалось недоступным даже для самых сложных компьютерных программ. Древняя настольная игра известна своей сложностью, в ней больше возможных конфигураций фигур, чем атомов в наблюдаемой вселенной.

Эта репутация пострадала в 2016 году, когда принадлежащая Google компания DeepMind, занимающаяся искусственным интеллектом, шокировала мир, выиграв у Седола четыре матча против одного с помощью системы искусственного интеллекта AlphaGo. Игры оказали глобальное влияние, предупредив мир о новом поколении программ машинного обучения, которые обещали быть умнее и креативнее, чем ИИ прошлого.

Почему победа Google в Go так важна

Как мы справимся с поражением машин?

Основатель DeepMind Демис Хассабис о том, как ИИ будет формировать будущее

Ли, который в конце 2000-х годов занимал первое место в мире по игре в го, сначала предсказал, что победит AlphaGo с большим отрывом, и был шокирован своими поражениями, зайдя так далеко, что извинился перед южнокорейской общественностью. «Я потерпел неудачу, — сказал он после турнира. «Мне жаль, что матч закончился и закончился вот так. Я хотел, чтобы все закончилось хорошо».

Несмотря на результат, эксперты по го сошлись во мнении, что турнир показал выдающуюся игру. AlphaGo удивила мир своим так называемым «ходом 37», который эксперты-люди сначала сочли ошибкой, но который оказался решающим во второй игре. Ли оказал влияние своей игрой «Рука Бога» (ход 78), которая сбила с толку программу ИИ и позволила Ли выиграть одну партию. Он остается единственным человеком, когда-либо побеждавшим AlphaGo в турнирных условиях. (Во время тренировки AlphaGo проиграла две игры с ограниченным временем игроку в го Фань Хуэю.)

Однако после турнира DeepMind только улучшила свои системы AI Go. В 2017 году она создала AlphaGo Zero, версию программы, которая превзошла даже AlphaGo.

В то время как первоначальный ИИ научился играть в го, изучив набор данных о более чем 100 000 человеческих игр, AlphaGo Zero развивал свои навыки, просто играя сам с собой снова и снова. После трех дней самостоятельной игры с использованием чрезвычайно мощных компьютерных систем, которые позволяли ему играть в игры со сверхчеловеческой скоростью, AlphaGo Zero смогла победить своего предшественника в 100 играх до нуля. В то время DeepMind заявила, что AlphaGo Zero, вероятно, является сильнейшим игроком в го в истории.

В заявлении, переданном The Verge, генеральный директор DeepMind Демис Хассабис сказал, что Ли продемонстрировал «настоящий воинственный дух» в своих играх с AlphaGo. Хассабис сказал: «От имени всей команды AlphaGo в DeepMind я хотел бы поздравить Ли Се Дола с его легендарным десятилетием на вершине игры и пожелать ему всего наилучшего в будущем. Я знаю, что Ли запомнят как одного из величайших игроков в го своего поколения».

По словам Yonhap, Ли не совсем отказывается от игры с ИИ. Он планирует отметить свой уход на пенсию в декабре, сыграв матч против южнокорейской программы искусственного интеллекта под названием HanDol, которая уже обыграла пятерку лучших игроков страны. Ли получит преимущество в два камня.

«Даже с преимуществом в два камня я чувствую, что проиграю первую игру HanDol», — сказал Ли Yonhap. «Сейчас я не слежу за новостями Go. Я хотел комфортно играть против HanDol, так как я уже завершил карьеру, хотя я сделаю все возможное».

Обновление: к истории добавлен комментарий генерального директора DeepMind Демиса Хассабиса, а также уточнение об игроках, которые обыграли AlphaGo в различных условиях.

Хотя машины теперь способны создавать гениальные моменты, люди почти не утратили способность генерировать свои собственные.

Чтобы повторно просмотреть эту статью, перейдите в раздел "Мой профиль" и выберите "Просмотреть сохраненные истории".

СЕУЛ, ЮЖНАЯ КОРЕЯ --- Во второй игре машина Google сделала ход, который не сделал бы ни один человек. И это было красиво. На глазах у всего мира этот шаг прекрасно продемонстрировал чрезвычайно мощные и довольно загадочные таланты современного искусственного интеллекта.

Но в четвертой игре человек сделал ход, которого никакая машина не ожидала. И это тоже было красиво. В самом деле, это было так же красиво, как переезд с машины Google --- не меньше и не больше. Он показал, что, хотя машины теперь способны создавать гениальные моменты, люди почти не утратили способность создавать свои собственные трансцендентные моменты. И кажется, что в ближайшие годы, пока мы, люди, будем работать с этими машинами, наша гениальность будет только расти вместе с нашими творениями.

На этой неделе завершился исторический матч между Ли Седолем, одним из лучших в мире игроков в го, и AlphaGo, системой искусственного интеллекта, разработанной группой исследователей DeepMind, лондонской лаборатории искусственного интеллекта, которая теперь принадлежит Google. Машина одержала победу в серии best-of-five, выиграв четыре игры и проиграв только одну. Это был первый раз, когда машина обыграла лучших в этой древней и чрезвычайно сложной игре — подвиг, который до недавнего времени эксперты не ожидали, что произойдет еще десять лет.

Победа примечательна тем, что за технологиями, лежащими в основе AlphaGo, будущее. Они уже меняют Google, Facebook, Microsoft и Twitter и готовы заново изобретать все, от робототехники до научных исследований. Это пугает некоторых. Беспокоит то, что машины с искусственным интеллектом отберут наши рабочие места и, возможно, даже вырвутся из-под нашего контроля — и на каком-то уровне эти опасения вполне здравы. Нас не застанут врасплох.

Но есть и другой способ думать обо всем этом — способ, который выводит нас за пределы тропа противостояния человека и машины, руководствуясь уроками этих двух великолепных ходов.

С 37-м ходом во второй партии матча AlphaGo преподнесла сюрприз в правой части доски 19 на 19, который сбил с толку даже лучших в мире игроков в го, включая Ли Седоля. «Это очень странный ход», — сказал один комментатор, сам игрок в го с девятью данами, самый высокий ранг. "Я думал, что это была ошибка," сказал другой. Ли Седолю, покинувшему игровую комнату, потребовалось почти пятнадцать минут, чтобы сформулировать ответ. Фан Гуй, трехкратный чемпион Европы по го, который играл в AlphaGo во время закрытого матча в октябре, проиграв пять игр ни разу, отреагировал скептически. Но затем, опираясь на свой опыт работы с AlphaGo — он снова и снова играл в машину в течение пяти месяцев с октября — Фан Хуэй увидел красоту этого довольно необычного хода.

Действительно, этот ход изменил ход игры. AlphaGo выиграла вторую игру, и на послематчевой пресс-конференции Ли Седол был в шоке. «Вчера я был удивлен», — сказал он через переводчика, имея в виду свое поражение в первой игре. «Но сегодня я потерял дар речи. Если вы посмотрите на то, как была сыграна партия, я признаю, что это был очень явный проигрыш с моей стороны. С самого начала игры не было момента, когда я чувствовал, что Я был ведущим."

Это был душераздирающий момент. Но в то же время те из нас, кто смотрел матч в сеульском отеле Four Seasons, могли ощутить красоту этого движения, особенно после разговора с заразительно философским Фан Хуэем. «Так красиво», — продолжал он говорить. "Так красиво." Затем, на следующее утро, Дэвид Сильвер, ведущий исследователь проекта AlphaGo, рассказал мне, как машина восприняла перемещение. И это тоже было красиво.

Изначально Сильвер и его команда научили AlphaGo играть в древнюю игру с использованием глубокой нейронной сети — сети аппаратного и программного обеспечения, которая имитирует паутину нейронов в человеческом мозгу. Эта технология уже лежит в основе онлайн-сервисов в таких местах, как Google, Facebook и Twitter, помогая идентифицировать лица на фотографиях, распознавать команды, произнесенные в смартфоны, управлять поисковыми системами и т. д. Если вы загрузите достаточное количество фотографий омара в нейронную сеть, она научится распознавать лобстера. Если вы кормите его достаточным количеством человеческого диалога, он может научиться поддерживать приличный разговор. А если дать ему 30 миллионов ходов от опытных игроков, он научится играть в го.

Но затем команда пошла дальше. Используя вторую технологию искусственного интеллекта, называемую обучением с подкреплением, они организовали бесчисленное количество матчей, в которых (немного) разные версии AlphaGo играли друг с другом. И пока AlphaGo играла сама, система отслеживала, какие ходы приносили больше всего территории на доске.«AlphaGo научилась открывать для себя новые стратегии, играя в миллионы игр между своими нейронными сетями, против самих себя и постепенно совершенствуясь», — сказал Сильвер, когда Google представил AlphaGo в начале этого года.

Пятая игра превратилась в самую захватывающую игру серии, балансирующую на острие ножа. Эта победа ставит восклицательный знак на важном для ИИ моменте.

СЕУЛ, ЮЖНАЯ КОРЕЯ --- В финальной игре своего исторического матча компьютерная система Google с искусственным интеллектом для игры в го победила корейского гроссмейстера Ли Седоля, завершив серию до лучших из пяти с четырьмя победами и одним поражением.< /p>

Эта победа ставит восклицательный знак на важном для искусственного интеллекта моменте. За последние двадцать пять лет машины обыграли лучших людей в шашки, шахматы, Отелло и даже в Jeopardy! 2500-летней игре, которая экспоненциально сложнее шахмат и требует, по крайней мере от людей, дополнительной интуиции.

Пятая игра превратилась в самую захватывающую игру серии, балансирующую на острие ножа.

Победа примечательна сама по себе. Но события этой недели еще более значимы, если учесть, что технологии машинного обучения, лежащие в основе машины Google, известной как AlphaGo, уже внедряются в реальные приложения. Некоторые помогают управлять сервисами внутри Google и других интернет-гигантов, помогая идентифицировать лица на фотографиях, распознавать команды, произнесенные на смартфонах, и многое другое. Другие методы, лежащие в основе искусственного интеллекта Google, способны изменить все, от научных исследований до робототехники.

Ли Седоль не смог подняться и финишировать в пределах одной победы над своим соперником с искусственным интеллектом. Но он действительно лидировал в пятой игре в самом начале, после серьезной ошибки AlphaGo — ошибки, которая выглядела дилетантской для человеческого глаза. По мере того, как машина Google выкапывалась из своей ямы во второй половине конкурса, пятая игра превратилась в самую захватывающую в серии, игру, балансирующую на острие ножа, превосходящую даже драматизм победы Ли Седоля в четвертой игре.

Кореец продемонстрировал — в лихой манере — что люди по-прежнему обладают талантами, которые не может воспроизвести ни одна машина. Да, в начале серии из пяти игр он изо всех сил пытался справиться с давлением — очень человеческая ошибка. Но по мере того, как матч продолжался, он адаптировался к тому, что видел у своего соперника в предыдущих играх, чего AlphaGo пока не может.

Возбуждение, охватившее пятую игру, было еще более сильным, чем в преддверии первой игры — примечательно, если учесть, что исход матча был решен тремя днями ранее, когда AlphaGo выиграла первые три игры и выиграла домой приз матча в размере 1 миллиона долларов. Но это был только один из способов решить этот исторический матч. Ли Седоль сильно изменил ситуацию в воскресенье вечером, когда он выиграл волнующую четвертую игру, и небольшая толпа корейской прессы приветствовала его, когда он пришел на послематчевую пресс-конференцию.

«Поскольку я проиграл три матча, а затем смог одержать одну победу, эта победа настолько ценна, что я не променяю ее ни на что в мире», — сказал он через переводчика после победы в игре. Четыре. "Это из-за аплодисментов и поддержки, которую вы все мне оказали".

В восторге не только корейская пресса. Здесь, в Сеуле, матч был на первых полосах новостей всю неделю — в буквальном смысле. Если вы включите телевизор в своем гостиничном номере или сядете в такси с включенным радио, оно неизбежно всплывет. За несколько часов до пятой игры Демис Хассабис, курирующий лабораторию искусственного интеллекта Google, которая построила AlphaGo, прошел по главному бульвару в Седжонг Даэро, недалеко от отеля Four Seasons, в котором всю неделю проходил матч. Снова и снова Хассабиса узнавали прохожие. Одна кореянка вытянула обе руки и театрально отвисла от изумления. Это было похоже на то, как будто она только что увидела Бейонсе, идущую по Sejong Daero — рука об руку с Леди Гагой.

Но корейской публике не нравятся Демис Хассабис и AlphaGo. Они тянут за Ли Седоля. Приблизительно 8 миллионов корейцев играют в го, и даже среди тех, кто не играет, он фигура общенациональная. Это его мальчишеское лицо обычно появляется на первых страницах. В результате в течение первых трех геймов матча он очень сильно почувствовал вес нации. Об этом он сказал во время пресс-конференции после решающего поражения в третьей игре. Он также извинился перед всеми, кто ожидал от него большего. «Я не знаю, что сказать сегодня, но я думаю, что сначала мне придется принести свои извинения», — сказал он."Я должен был показать лучший результат, лучший результат, лучшую конкуренцию с точки зрения сыгранных игр."

В ходе матча автомат не может изменить свою стратегию в зависимости от того, как его противник играл в предыдущих играх.

Кажется, это давление уменьшилось в четвертой игре. Ли Седоль провел свой сильнейший матч. И он выиграл отчасти, сказал он, потому что AlphaGo играла черными камнями, а он играл белыми. AlphaGo также играла черными во второй игре, и в обеих этих играх, по словам Ли Седола, он чувствовал, что машина не так сильна. «Он боролся больше, когда был черным», — сказал он на пресс-конференции после победы в четвертой игре.

И все же он попросил сыграть черными камнями в пятой игре, выбрав более сложный сценарий. Он хотел победить так, как еще не побеждал. «Я действительно надеюсь, что смогу выиграть черным, — сказал он, — потому что выигрыш черным гораздо ценнее».

Когда началась пятая игра, вопрос заключался в том, пойдет ли Ли Седол в атаку черными камнями или будет вести более уклончивую игру. Он атаковал в четвертой игре и победил. Но это было с белыми камнями. Примерно через девять ходов в пятой игре кореец атаковал, претендуя на территорию с правой стороны доски, вместо того, чтобы вести более экспансивную игру по всей доске в целом. Обычно Ли Седоль предпочитает агрессивный стиль. Он использовал свои сильные стороны.

Но судя по тому немногому, что мы знаем об AlphaGo — мы видели, как это воплощение машины играло всего в четыре игры — оно тоже играло на набор текста. Кажется, он предпочитает более экспансивный стиль. «Оба игрока в некотором смысле играют предсказуемо», — сказал англоязычный комментатор Майкл Редмонд.

По сравнению с предыдущими тремя играми, Ли Седол играл быстрее. Во второй, третьей и четвертой играх у него рано возникли проблемы с часами, поскольку он потратил огромное количество времени на обдумывание первых ходов. На сороковой минуте этой игры у него было столько же времени на часах, сколько и у AlphaGo.

В таком матче у машины есть определенные преимущества. Он не чувствует давления. Оно не устает. Но в случае с AlphaGo есть один заметный недостаток. По ходу матча креация Google не может изменить свою стратегию, основываясь на том, как его соперник играл в предыдущих играх. Поскольку Хассабису и его команде требуется несколько недель на переобучение AlphaGo, они не могут изменить систему до окончания матча. Но Ли Седоль может изменить стратегию. Он может адаптировать свою игру в соответствии с тем, что было раньше. И по ходу пятой игры казалось, что он приспосабливается, опираясь не только на победу в четвертой игре, но и на поражения в первых трех играх.

По прошествии часа Ли Седоль продолжал играть агрессивно. По словам Редмонда, стратегия заключалась в том, чтобы «захватить территорию, захватить территорию». Это сработало в четвертой игре. Но, как отметил Редмонд, это сработало только после одного блестящего решающего хода корейского гроссмейстера.

Это был ход 78, игра "клином" в центре доски, которая внезапно и неожиданно изменила направление состязания. До переезда, по словам комментаторов и поклонников го — и, по словам самой AlphaGo, как мы позже узнали — машина Google имела заметное преимущество в игре. Затем Ли Седоль провел добрых полчаса, обдумывая, что делать дальше, прежде чем выгрузить 78-й ход. Как вскоре написал в Твиттере Демис Хассабис, это был не тот ход, который AlphaGo ожидала от человека, и уже на следующем ходу машина совершила роковую ошибку. . Через несколько минут, проанализировав состояние игры, AlphaGo решила, что ее шансы на победу резко упали. По ходу игры машина начала делать особенно странную и неэффективную серию ходов. И в конце концов он ушел в отставку.

Казалось, второго момента гениальности нельзя было ожидать от Ли Седоля.

Казалось, что AlphaGo плохо приспособлена для того, чтобы справиться с таким внезапным моментом человеческого гения — ходом, который, вероятно, не сделает ни один другой человек. Но по мере того, как шла пятая игра, казалось, что второго момента гениальности нельзя было ожидать от Ли Седоля.

На отметке «час и двадцать минут» AlphaGo сделала то, что комментаторы сочли довольно слабым ходом, и это вызвало разговоры об очередном внезапном крахе. «Мы наблюдаем еще одно короткое замыкание?» — спросил другой англоязычный комментатор Крис Гарлок. Но у AlphaGo есть общая склонность к подобным вещам. Машина делает ходы, предназначенные для максимизации своих шансов на победу, а не для максимизации перевеса в победе. Иногда это приводит к кажущимся слабым или «вялым» движениям, на которые лучшие игроки смотрят свысока.

Теперь и AlphaGo, и Ли Седол играли на скорости. «Я едва успеваю за игрой, — сказал Редмонд. Кореец использовал больше своих игровых часов, но совсем немного. Часы AlphaGo показывали один час и двадцать четыре минуты. Ли Седоль был в час двенадцать. Как только их часы закончатся, игрок должен сделать каждый ход менее чем за 60 секунд.

Благодаря своей агрессивной игре Ли Седол стал доминировать в нижней части доски. И казалось, что AlphaGo совершила большую ошибку в этой области — ошибку, которую никогда не совершит даже человек средней квалификации. «Это территория черных», — сказал Редмонд, имея в виду человека. AlphaGo, добавил он, может в конечном итоге понести «ужасные потери» в этой области — потери, которые могут сильно склонить игру в пользу Ли Седоля. «Когда вы даете ему такие дополнительные очки, он очень счастлив», — сказал Редмонд. "Он считает, что даже с двумя или тремя дополнительными очками он сможет забрать это домой и выиграть игру".

Но до игры оставалось еще много. Шло время, и Гарлок и Редмонд почувствовали, что игра разворачивается где-то между тем, что произошло в третьей игре Ли Седола, и тем, что произошло во время поражения AlphaGo в четвертой игре. Там было больше открытого пространства, но возможности по-прежнему казались ограниченными. «Я не вижу другого места для черных, кроме как прямо в объятия белых», — сказал Гарлок.

После двух с половиной часов матча Редмонд почувствовал, что игра вступила в «опасный период». Ли Седоль, по его словам, столкнулся с дракой в самом центре доски. Но он все еще чувствовал, что кореец был впереди. По его словам, был один сценарий, в котором Ли Седол брался за самую важную область игры. Но был и другой случай, когда AlphaGo захватила эту область. «Разница между этими двумя вариантами будущего игры действительно огромна», — сказал Редмонд.

Сорок пять минут спустя драка все еще продолжалась. «Это очень сложная игра, — сказал Редмонд. «Столько всего зависит от центральной территории». А когда игра преодолела отметку в три с половиной часа, Ли Седол столкнулся с цейтнотом. Его часы сократились до 5 минут, в то время как у AlphaGo оставалось около 30. Проблема заключалась в том, что в верхней правой части доски оставалось слишком много невостребованного места. Бороться за это место будет непросто.

Действительно, его часы скоро закончились. И тут ему не удалось сделать ход за отведенные шестьдесят секунд. Еще две неудачи, и он проиграет матч. Во время своей победы в четвертой игре кореец поддерживал драму, постоянно выжидая до последней миллисекунды, чтобы сделать ход, который означал бы поражение, если бы он не сделал его достаточно быстро.

AlphaGo опирается на глубокие нейронные сети — сети аппаратного и программного обеспечения, которые имитируют паутину нейронов в человеческом мозгу. С помощью этих нейронных сетей он может изучать задачи, анализируя огромные объемы цифровых данных. Если вы загрузите достаточное количество фотографий коровы в нейронную сеть, она может научиться распознавать корову. И если вы накормите его достаточным количеством ходов в го от игроков-людей, он сможет научиться игре в го. Но Хассабис и его команда также использовали эти методы, чтобы научить AlphaGo управлять временем. И машина явно справилась с этим лучше, чем корейский гроссмейстер. Его часы по-прежнему показывали шестнадцать минут.

Машина Google неоднократно делала довольно нестандартные ходы, которые комментаторы вполне могли понять. Но это тоже ожидаемо. После обучения реальным человеческим движениям AlphaGo продолжает свое обучение, играя игру за игрой за игрой против себя. Он учится на огромном количестве ходов, которые генерирует сам, а не только на движениях человека. Это означает, что иногда он делает ходы, которые не сделал бы человек. Это то, что позволяет ему побеждать такого человека, как Ли Седол. Но в ходе отдельной игры это также может заставить людей почесать затылок.

Игра показала, что AlphaGo далеко не безошибочен.

Затем часы AlphaGo закончились. У обоих игроков оставалось 60 секунд на каждый ход, а Ли Седоль дважды превышал свои 60 секунд. Еще один, и он лишится игры. Вскоре игра перешагнула отметку в четыре с половиной часа, и впервые в матче казалось, что два игрока доиграют игру до самого конца, и ни один из них не сдастся. Это было так близко.

Глядя на доску, Редмонд начал подсчитывать очки, доступные каждому игроку, и оказалось, что у одного из них есть преимущество. «К сожалению для Ли Седоля, — сказал он, — я думаю, что белые могут иметь здесь небольшое преимущество». А когда игра растянулась до пяти часов, Редмонд начал уступать победу AlphaGo. Но трудно сказать, сказал он, где Ли Седол ошибся. Через несколько секунд кореец подал в отставку.

Игра показала, что AlphaGo далеко не безошибочен. В начале состязания он совершил ошибку, которую не допустил бы даже приличный игрок-человек. В его образовании есть дыры. Но, способный использовать месяцы игры сам с собой — на наборе ходов, которые даже не видел ни один человек, — он также способен выбраться из такой глубокой ямы, даже против одного из лучших игроков в мире. . ИИ неисправен. Но это здесь.

Читайте также: