"Невозможно сказать, что такое го — игра, спорт, философия, медитация или боевой симулятор. Порой кажется, что это игра отбирает людей, а не они ее выбирают."
Напомнило присказку — Linux — дружелюбная система, только друзей она выбирает себе сама :)
- в отличие от шахматной победы Deep Blue, это совсем другая история. Deep Blue был основан на очень глубоком дереве ветвлений и на крутой оценочной функции (оценка позиций), которая создавалась по советам Каспарова. Программа выигравшая Го — нейронная сеть. Разница? Нейронная сеть — чёрный ящик. Она даёт ответ, но не даёт объяснений. Если Deep Blue мог подробно расписать почему и зачем он делает каждый ход — с прогнозом игры и точной оценкой почему новая позиция по его мнению (по мнению оценочной фунцкии) лучше старой. Это может дать новые идеи шахматной науке и теории. Нейронная сеть играющая в Го — это просто набор коэффициентов связей нейронов. Понять, почему она поступает так а не иначе — практически невозможно.
- Нейронная сеть играющая в Го на первом этапе обучалась игре по архиву игр людей. На втором этапе она была продублирована и играла сама с собой. Очень и очень много игр. Нейронные сети пока учатся очень медленно. Если человек может выйти на неплохой уровень игры сыграв пару тысяч игр, нейронной сети нужны миллиарды игр. Миллиардов игр в архивах нет, поэтому хитрость была в том, чтобы заставить её играть саму с собой и чтобы железо могло работать настолько быстро, чтобы эти игры не заняли десятилетия.
- Это победа над человеком, но не победа над игрой — т.е. с точки зрения математиков и теоретиков игры никаких прорывов сделано не было. Игра как была плохо понимаемой и плохо описываемой математически — так и осталась.
- Единственное, что доказали этой победой — что у нас есть технология, способная натренировать не очень большую (по сравнению с мозгом) сеть на выполнение конкретной задачи лучше человека. Интересно, сколько нейронов участвует в игре в Го у лучших мастеров? И сколько содержалось в этой игре? Важно ещё понимать, что мастер Го сыграл за свою жизнь от силы 10^5 игр, а эта сеть — на 4 порядка больше.
- Ещё один важный момент — вполне вероятно, что за счёт способности к более быстрому обучению, человек эксперт в Го сможет начать переигрывать эту сеть после 100-150 проигрышей. Да, потом сеть можно будет опять дотренировать и она опять начнёт выигрывать, но всё же...
ну почему же не он не знаком? Вот он голубчик, хамло известное
А всем дебилоидам,которые рьяно орут о том,что там бобра спасти,дерево или ещё какой сверхтупой аргумент пишут,- обчитайтесь своей электроникой,но не суйте нос,куда не просят.
Это победа, которой раньше не было. Но это свершившийся факт. И это был лишь вопрос времени. И как то странно выдумывать отмазки. И победа компьютера в Го, не значит, что он умнее. Это значит, что он (компьютер) обыграл человека. И не более. А то, так можно сказать и об автомобилях. Что они не ездят быстрее, чем бегает человек, потому что созданы человеком и под капотом у них сотни лошадей. Но факт остается фактом. Машина ездит быстрее.
Если в программу заложены какие-то сложные паттерны, которые уже ранее использовались другими людьми, то это паттерны именно этих людей. А нейронные сети так и тренируют, насколько я знаю.
Интересно было бы, если бы был единой алгоритм, основанный на формальных правилах игры и n число приемом равное число приемов, которые знает реальный игрок.
А то это получается равносильно соревнованию человека со словарем в знании иностранных слов...
Т.е. победа ценности не представляет, только для самого широкого круга общественности.
Отчего же не уместно? Есть КОНКРЕТНАЯ задача. Есть соревнование. Есть условия этого соревнования, которые НЕ НАРУШАЛИСЬ. Есть победитель. Все честно.
Реальный игрок, тоже обучается на примерах и книжках. Если он, конечно, серьезный игрок. Это не статья о том, каким должен быть идеальный ИИ, а о том, что компьютер ВПЕРВЫЕ обыграл чемпиона в го. Сам Fan Hui, никаких отговорок для себя не находит. Он просто признает поражение. Из интервью с ним:
Какова была ваша реакция, когда вы проиграли?
Я был очень удивлен. Люди Deepmind сказал мне: "Вы знаете, это исторический момент?". Я первый профессиональный игрок в мире, который проиграл машине. Я чувствуюудивление и стыд: ребята будут смеяться надо мной, когда они узнают об этом! Она очень хорошо играет. Она раздавила меня. Я был удивлен ее уровнем.
Как играет AlphaGo ?
Я не чувствую, что я играл с компьютером вообще. Она играет, как человек. Обычно вы можете сказать вы играете против компьютера, потому что программа делает странные ходы. С AlphaGo, не было таких ходов, только нормальные ходы. Это невероятно. Она оказывала сильное давления на меня. Мы, люди, у нас много опыта, но и много недостатков тоже: мы не всегда стабильна. Программа не имеет этого психологичесого изъяна. В конце концов, я потерял уверенность в игре против нее. Это привело к катастрофическим последствиям. Она не имеет этой проблемы.
А я вам пишу, что это был не конкурс на лучшую программу ИИ. На приближение ИИ к разуму человека. Это был вполне унитарный турнир, в котором РАНЬШЕ всегда побеждал игрок-профессионал. Компьютер — человек. Но случилось то, что случилось. Причем, играй они по интернету, возможно Fan Hui и не понял бы, что играет с компьютером. А это, согласитесь, достижение программистов.
Программа для игры в Го и не должна обладать интеллектом человека. Желательно, конечно, но не обязательно. Во всяком случаи сегодня. Как и простой калькулятор не должен уметь чистить картошку, а автомобиль ловить рыбу. Но может быть когда то... в далеком будущем... Можно, конечно и помечтать и побрюзжать... Однако, сегодня, имеем то, что имеем. Узкие задачи, с которыми, порою, компьютер справляется лучше человека. И это тоже достижение. Хотя бы по тому, что раньше компьютеру это было не по силам. В любом виде. Хоть в сетях Хопфилда, хоть методами Монте-Карло или еще какими. Можно только поздравить программистов.
Комментарии
Напомнило присказку — Linux — дружелюбная система, только друзей она выбирает себе сама :)
- в отличие от шахматной победы Deep Blue, это совсем другая история. Deep Blue был основан на очень глубоком дереве ветвлений и на крутой оценочной функции (оценка позиций), которая создавалась по советам Каспарова. Программа выигравшая Го — нейронная сеть. Разница? Нейронная сеть — чёрный ящик. Она даёт ответ, но не даёт объяснений. Если Deep Blue мог подробно расписать почему и зачем он делает каждый ход — с прогнозом игры и точной оценкой почему новая позиция по его мнению (по мнению оценочной фунцкии) лучше старой. Это может дать новые идеи шахматной науке и теории. Нейронная сеть играющая в Го — это просто набор коэффициентов связей нейронов. Понять, почему она поступает так а не иначе — практически невозможно.
- Нейронная сеть играющая в Го на первом этапе обучалась игре по архиву игр людей. На втором этапе она была продублирована и играла сама с собой. Очень и очень много игр. Нейронные сети пока учатся очень медленно. Если человек может выйти на неплохой уровень игры сыграв пару тысяч игр, нейронной сети нужны миллиарды игр. Миллиардов игр в архивах нет, поэтому хитрость была в том, чтобы заставить её играть саму с собой и чтобы железо могло работать настолько быстро, чтобы эти игры не заняли десятилетия.
- Это победа над человеком, но не победа над игрой — т.е. с точки зрения математиков и теоретиков игры никаких прорывов сделано не было. Игра как была плохо понимаемой и плохо описываемой математически — так и осталась.
- Единственное, что доказали этой победой — что у нас есть технология, способная натренировать не очень большую (по сравнению с мозгом) сеть на выполнение конкретной задачи лучше человека. Интересно, сколько нейронов участвует в игре в Го у лучших мастеров? И сколько содержалось в этой игре? Важно ещё понимать, что мастер Го сыграл за свою жизнь от силы 10^5 игр, а эта сеть — на 4 порядка больше.
- Ещё один важный момент — вполне вероятно, что за счёт способности к более быстрому обучению, человек эксперт в Го сможет начать переигрывать эту сеть после 100-150 проигрышей. Да, потом сеть можно будет опять дотренировать и она опять начнёт выигрывать, но всё же...
Компьютер самостоятельно выучил английский язык и поговорил с человеком — на уровне четырехлетнего ребенка.
nnm.me
А всем дебилоидам,которые рьяно орут о том,что там бобра спасти,дерево или ещё какой сверхтупой аргумент пишут,- обчитайтесь своей электроникой,но не суйте нос,куда не просят.
"алгоритм го"
до того как ты запостил статью, а не после того, как ты это вычитал из комментов к своему посту
еще интересная тема к размышлению
golang.org
Так что, это не победа.
Если в программу заложены какие-то сложные паттерны, которые уже ранее использовались другими людьми, то это паттерны именно этих людей. А нейронные сети так и тренируют, насколько я знаю.
Интересно было бы, если бы был единой алгоритм, основанный на формальных правилах игры и n число приемом равное число приемов, которые знает реальный игрок.
А то это получается равносильно соревнованию человека со словарем в знании иностранных слов...
Т.е. победа ценности не представляет, только для самого широкого круга общественности.
Реальный игрок, тоже обучается на примерах и книжках. Если он, конечно, серьезный игрок. Это не статья о том, каким должен быть идеальный ИИ, а о том, что компьютер ВПЕРВЫЕ обыграл чемпиона в го. Сам Fan Hui, никаких отговорок для себя не находит. Он просто признает поражение. Из интервью с ним:
Какова была ваша реакция, когда вы проиграли?
Я был очень удивлен. Люди Deepmind сказал мне: "Вы знаете, это исторический момент?". Я первый профессиональный игрок в мире, который проиграл машине. Я чувствуюудивление и стыд: ребята будут смеяться надо мной, когда они узнают об этом! Она очень хорошо играет. Она раздавила меня. Я был удивлен ее уровнем.
Как играет AlphaGo ?
Я не чувствую, что я играл с компьютером вообще. Она играет, как человек. Обычно вы можете сказать вы играете против компьютера, потому что программа делает странные ходы. С AlphaGo, не было таких ходов, только нормальные ходы. Это невероятно. Она оказывала сильное давления на меня. Мы, люди, у нас много опыта, но и много недостатков тоже: мы не всегда стабильна. Программа не имеет этого психологичесого изъяна. В конце концов, я потерял уверенность в игре против нее. Это привело к катастрофическим последствиям. Она не имеет этой проблемы.
reddit.com
Программа, накаченная миллионами моделей и игрок, который знает правила, знает ряд техник, которые измеряются максимум сотнями.
Смысла нет не только в победе, его особенно нет даже в игре. Вдобавок программ пользуется образцами других игроков, сотен игроков.
Что имеем?
Фактически один живой индивид играет против сотен тысяч неживых.
Если вообще ничего не знать о нейронных сетях, то это будет казаться невероятным.
Но если немного вникнуть, хотя бы в ту же сеть Хопфилда, для примера, то все немного встанет на свои места... и магия торжества этой победы рассеется.
Программа для игры в Го и не должна обладать интеллектом человека. Желательно, конечно, но не обязательно. Во всяком случаи сегодня. Как и простой калькулятор не должен уметь чистить картошку, а автомобиль ловить рыбу. Но может быть когда то... в далеком будущем... Можно, конечно и помечтать и побрюзжать... Однако, сегодня, имеем то, что имеем. Узкие задачи, с которыми, порою, компьютер справляется лучше человека. И это тоже достижение. Хотя бы по тому, что раньше компьютеру это было не по силам. В любом виде. Хоть в сетях Хопфилда, хоть методами Монте-Карло или еще какими. Можно только поздравить программистов.