AlphaZero vs. Stockfish

29.10.2007 | 19:10:30

Страницы: [1] [2] [3] [4] [5]

92	Vizvezdenec Ниже нуля Севастополь 10.12.2017 \| 20:17:03 все его сообщения: за день, за месяц, за все время

ram63k: Все это конечно чертовски увлекательное зрелище, но у меня как любителя вопрос: А сможет ли АльфаЗеро со Стоком вытворять такое в равных условиях? Ведь насколько я понял, то у Стокфиша ни "железа" ни "памяти" для обычного его состояния не было. Интересно было бы посмотреть на АЗ в чемпионате "машин", где ко всем участникам одинаковые требования, или этот "инопланетный разум" и там всех вынесет? А так конечно... после ролика Apollo, какое то необьяснимое глубокое потрясение испытываешь... прикосновение к Вечности что ли... Спасибо, Apollo!

уже оценивали - ноль шансов на текущем уровне игры.
При такой разницы по массе параметров должно быть 150 эло как минимум, чтобы быть соизмеримым по уровню движком на бытовом железе. Это без учёта плохого масштабирования нейронносетевых движков на него.

номер сообщения: 54-69-6259

93	ram63k любитель Челябинская обл. 10.12.2017 \| 20:21:11 все его сообщения: за день, за месяц, за все время

То есть, если Стокфиш выйдет на бой в полной "амуниции", он таки поставит на место выскочку?
Или наоборот?

номер сообщения: 54-69-6260

94	Vizvezdenec Ниже нуля Севастополь 10.12.2017 \| 20:29:09 все его сообщения: за день, за месяц, за все время

ram63k: То есть, если Стокфиш выйдет на бой в полной "амуниции", он таки поставит на место выскочку?
Или наоборот?

Смотря что такое "полная амуниция".
Т.к. стокфиш не умеет работать с суперкомпьютерами и вычислительными комплексами, а альфазеро работает только с ними и не умеет запускаться на обычном железе, между ними в принципе сложно провести равный по расчётным мощностям матч.
Если последний таки портировать на обычные железяки, хотя бы и серверного типа - он будет гораздо слабее не то что стокфиша, но и любого движка приличного вплоть до какого-нибудь Laser.

номер сообщения: 54-69-6261

95	ram63k любитель Челябинская обл. 10.12.2017 \| 20:44:50 все его сообщения: за день, за месяц, за все время

Спасибо, Vizvezdenec! Мне кажется для шахмат, все равно событие эпохальное, может доживем еще до следующего "переворота", и будет длиться это по этапам бесконечно... может быть когда то и разгадают все до последнего варианта, но люди махнут на это все рукой, и будут продолжать свои партии с нехитрыми комбинациями на широких лавках летнего парка.)

номер сообщения: 54-69-6262

96	Vizvezdenec Ниже нуля Севастополь 10.12.2017 \| 20:51:20 все его сообщения: за день, за месяц, за все время

ram63k: Спасибо, Vizvezdenec! Мне кажется для шахмат, все равно событие эпохальное, может доживем еще до следующего "переворота", и будет длиться это по этапам бесконечно... может быть когда то и разгадают все до последнего варианта, но люди махнут на это все рукой, и будут продолжать свои партии с нехитрыми комбинациями на широких лавках летнего парка.)

как я уже писал, пока не придумают воспроизводимый людьми алгоритм, который будет выдавать лучший ход в каждой позиции - толку от всего этого мало.
А что касается эпохальности... Эпохальным будет момент, когда нейронки спустятся со специализированных программно-аппаратных комплексов на обычное железо. Но как раз в этом направлении прогресса немного.

номер сообщения: 54-69-6263

97	xajik 11.12.2017 \| 14:53:56 все его сообщения: за день, за месяц, за все время

На Джипситим хорошая обобщающая статья Михаила Савинова, для всех кого заинтересовало, но захотелось понять детальнее. http://site.gipsyteam.ru/news/5773-neyroset-plenyaet-shahmatistov
С хорошими ссылками (на Харахабр, например).

номер сообщения: 54-69-6264

98	Vizvezdenec Ниже нуля Севастополь 11.12.2017 \| 15:21:07 все его сообщения: за день, за месяц, за все время

xajik: На Джипситим хорошая обобщающая статья Михаила Савинова, для всех кого заинтересовало, но захотелось понять детальнее. http://site.gipsyteam.ru/news/5773-neyroset-plenyaet-shahmatistov
С хорошими ссылками (на Харахабр, например).

Ну, собственно, ничего нового особо там нет - практически всё написанное тут уже было :)
Выводы достаточно спорные в итоге. Конечно, это будущее, только вот сколько лет до него?
Да и кто сказал, что Стокфиш не сможет перевести фиштест на нейросети, когда (если) они станут перевариваемыми на бытовом железе? В конце концов разработка шахматных движков - очень неприбыльное дело и 400 машин на фиштесте - уже в 4 раза примерно больше того, что есть у Комодо и Гудини (по инфе автора Гудини у него в сумме около 120 ядер, ну они, конечно, посильнее среднего на фиштесте, так что может быть не в 4, а в 2,5-3 раза. У Комодо мощности +/- те же самые), а тем оно позволяет толком только оплачивать счета и особой прибыли не приносит это занятие (таким образом, увеличить их они не могут особо). Т.е. если кто и сможет из разработчиков движков это сделать, то стокфиш. У него самые большие мощности для этого (хотя, конечно, на данный момент совершенно не достаточные для применения нейросетей).
В итоге тут возникает вопрос - смогут ли брутфорс движки стать "почти" идеальными за срок, который понадобится для того, чтобы спустить нейросети со специализированных программно-аппаратных комплексов на обычные железки? Мне кажется, что скорее да, чем нет.

номер сообщения: 54-69-6265

99	ram63k любитель Челябинская обл. 11.12.2017 \| 16:06:13 все его сообщения: за день, за месяц, за все время

Гата Камский говорит что одолеет этого монстра, если в помощь себе возьмет Стокфиша. Интересно было бы посмотреть такой матч.

номер сообщения: 54-69-6266

100	Vizvezdenec Ниже нуля Севастополь 11.12.2017 \| 16:26:38 все его сообщения: за день, за месяц, за все время

ram63k: Гата Камский говорит что одолеет этого монстра, если в помощь себе возьмет Стокфиша. Интересно было бы посмотреть такой матч.

Не исключено, кстати. Т.к. Dragon mist (чемпион 2016 по переписке) говорит, что он набирает против стокфиша до 65% очков на временном контроле, стандартном для переписки, против просто стокфиша.

номер сообщения: 54-69-6267

101	ram63k любитель Челябинская обл. 11.12.2017 \| 20:25:36 все его сообщения: за день, за месяц, за все время

Думается, что если Стоку по больше дать времени, да "книгу" по тяжелее... то вряд ли его этот монстр будет бить так нещадно. Ведь по сути этого матча между ними, складывается впечатление, что сошлись два калькулятора, у которых принцип работы разный, а в итоге победил тот, кто считает глубже и дальше. Может быть оно и так, но по правде, смущают меня эти хладнокровные жертвы, местами даже безрассудство, беспечные тихие ходы - и в результате всего этого получаются потрясающие, мой любительский разум, картины.
Нет мне покоя, от этого АльфаЗиро, надо еще один матч! И чтобы одновременно, против всех компов Мира! Вот тогда посмотрим.

номер сообщения: 54-69-6268

102	Roger 11.12.2017 \| 21:30:19 все его сообщения: за день, за месяц, за все время

Не исключено, что если Стоку дать нормальное железо и установки, то AZ и его победит, просто кривая обучения выйдет на плато немного выше.

Не исключено, правда, и то, что тестеры AZ пробовали такую конфигурацию, но не захотели показать нам результат. Например, он им не понравился.

номер сообщения: 54-69-6269

103	Vizvezdenec Ниже нуля Севастополь 11.12.2017 \| 21:38:20 все его сообщения: за день, за месяц, за все время

Roger: Не исключено, что если Стоку дать нормальное железо и установки, то AZ и его победит, просто кривая обучения выйдет на плато немного выше.

Не исключено, правда, и то, что тестеры AZ пробовали такую конфигурацию, но не захотели показать нам результат. Например, он им не понравился.

Так он не тренируется против стока, т.е. плато кривой обучения не зависит от того, против кого он играет. И то, что оно всего на 70-100 эло выше стокфиша, говорит о том, что вряд ли оно выше стокфиша на "максимальном разгоне", т.е. 512 потоках, нормальном хэше, книге, таблицах эндшпильных, новой версии и т.д.
Да хватит и 512 потоков, по идее. Как говорит автор Гудини, эффективность современного распараллеливания альфа-беты можно примерно оценить как (число потоков)^0.8, т.е. 512 потоков играется как будто бы их 147 и распараллеливание идеальное, а 64 - как будто их 27.
147/27=около 5,5, т.е. тут нужно брать что-то вроде дважды удвоение и ещё процентов 30, это на таком времени и таком железе что-то около дважды по 30 эло и ещё 10, т.е. те самые 70 уже есть. Добавить сюда нормальный хэш и возможность использовать время, как больше понравится - уже выходит больше эло, чем у альфазеро.

номер сообщения: 54-69-6270

104	Roger 11.12.2017 \| 22:38:06 все его сообщения: за день, за месяц, за все время

Тогда я, наверное, что-то пропустил - откуда тогда вообще эти кривые прогресса берутся? Там написано, что игрались партии по секунде на ход с тем же Стоком, и чтобы построить такой гладкий график нужно затратить не меньше тех же 4 часов по порядку величины. А в процессе тестовых игр движку не разрешают прогрессировать?

номер сообщения: 54-69-6271

105	Vizvezdenec Ниже нуля Севастополь 11.12.2017 \| 22:48:02 все его сообщения: за день, за месяц, за все время

Roger: Тогда я, наверное, что-то пропустил - откуда тогда вообще эти кривые прогресса берутся? Там написано, что игрались партии по секунде на ход с тем же Стоком, и чтобы построить такой гладкий график нужно затратить не меньше тех же 4 часов по порядку величины. А в процессе тестовых игр движку не разрешают прогрессировать?

Там используется разное железо для тренировки нейронки и для её игры. Тренируют её 5000 TPU, играют 4. Т.е. примерно так - сначала потренировали, потом поиграли, потом ещё потренировали и т.д. Тренируется она в игре сама с собой.

номер сообщения: 54-69-6272

106	shcherb 11.12.2017 \| 23:33:50 все его сообщения: за день, за месяц, за все время

В свое время так говорили про людей, мол если им дать открытую книгу больше времени и.т.д., то результат будет другой

__________________________
не надо шутить с войной

номер сообщения: 54-69-6273

107	Vizvezdenec Ниже нуля Севастополь 11.12.2017 \| 23:47:04 все его сообщения: за день, за месяц, за все время

shcherb: В свое время так говорили про людей, мол если им дать открытую книгу больше времени и.т.д., то результат будет другой

Ну пока что это не светит, т.к. если сложить абсолютно все мощности в мире, затрачиваемые на разработку шахматных движков, то они вряд ли достигнут и тысячной части того, что тут имел гугл, и то тот не смог в общем-то создать движка, который был бы радикально сильнее, и вряд ли планирует дальнейшие разработки в этой области. Так что пока нейросети не станут (если вообще станут) менее железо-едящими, никуда "классические" шахматные движки не исчезнут. Опять-таки тут ещё какое дело - прогресс у шахматных движков отнюдь не стоит на месте, так что и с людьми вряд ли тоже может быть аналогия прямая - те-то умнее от поколения к поколению не становятся

Я думаю, что нейросети можно приспособить (возможно, уже сейчас?) для разрешения традиционных слабостей движков - крепостей и блокадных позиций, отличать реальные крепости от "пробиваемых", ну и реально блокадные позиции от прорываемых. Также с цугцвангами разобраться. Но это, конечно, пока теория всё, на практике это весьма тяжело.

номер сообщения: 54-69-6274

108	Обережний герой кмс Харьков 11.12.2017 \| 23:54:19 Сайт все его сообщения: за день, за месяц, за все время

Nvidia при желании наверно могла бы портировать Alphazero на свой настольный супер ИИ компьютер dgx.ai,
который и по размеру как обычная персоналка, и стоит всего 50 000 USD (дешевле карсленовского компьютера), ну и по возможностям зверь.

__________________________
pr.ai PRAI Portal of Robotics and Artificial Intelligence

номер сообщения: 54-69-6275

109	miрtus 12.12.2017 \| 00:08:11 все его сообщения: за день, за месяц, за все время

Vizvezdenec:
Если последний таки портировать на обычные железяки, хотя бы и серверного типа - он будет гораздо слабее не то что стокфиша, но и любого движка приличного вплоть до какого-нибудь Laser.

Это из чего следует? Откуда известно, что его ELO масштабируется так же, как у Стокфиша?
Вполне возможно, что сила игры Альфазеро вообще мало поменяется, иначе бы они могли играть на 100, а не 4 TPU, если бы хотели показать суперсилу.

номер сообщения: 54-69-6276

110	Vizvezdenec Ниже нуля Севастополь 12.12.2017 \| 00:24:31 все его сообщения: за день, за месяц, за все время

miрtus:

Потому что у них есть график зависимости эло от времени в статье (страница 7) и он уходит ОЧЕНЬ сильно вниз на малых временах. Да и обычное или серверное железо очень плохо подходит под нужды нейросети.
Т.е. там график стокфиша надо приподнять эло на 100 из-за неравенства железок, ещё на столько же из-за того, что нейросети будет плохо на обычных процессорах, потом вспомнить, что это делалось всё для железа, которое вроде 400-8000 ядер и поэтому если ядра хотя бы до 40 скинуть - фактически мы "ужмём" время в 10^0.8 раз минимум, т.е. в 6 раз, т.е. разница в 150 эло или около того будет на 10 секундах/ход, и чем меньше времени за ход - тем хуже.
Конечно, это всё приблизительно весьма, я не слишком хорошо знаю, как вообще оно там скейлится на большее количество TPU и всего остального. Рискну предположить, что, раз не взяли большее количество TPU, то, видимо, для тренировки нейронки под них нужно во столько же раз больше базовых TPU. Но тут нужен специалист, да.
Я краем уха слышал, что нейронные сети куда лучше масштабируются априори, чем альфабета, т.к. альфабета представляет из себя крайне тяжёлый алгоритм для распараллеливания и то, что он сейчас очень неплохо скейлится с весьма простой концепцией lazySMP - чудеса, да и только

Кстати, ещё тут подумалось, что в принципе могли не взять больше TPU из-за стоимости - ведь вроде бы да, там всего 4 TPU играет, но по минуте на ход... В партии условно 70-80 ходов, т.е. 2,5 часа на партию, а партий они, похоже, изрядно наиграли, всё тестирование, возможно, встало в ту же стоимость, что и тренировка нейросети, ну а чем больше TPU - тем больше оно стоить будет.

номер сообщения: 54-69-6277

111	Ukrfan Киев 12.12.2017 \| 03:13:09 все его сообщения: за день, за месяц, за все время

Обсуждаете вы, господа, тут какую-то ахинею. Можно подумать, что так важно, как именно Альфазеро сыграет против Стокфиша в шахматы. Суть-то в том, что Альфазеро - это гигантский скачок в сторону собственно АИ, и именно так это воспринял Ананд и прочие, кто понял, что именно произошло. А вы гадаете, что будет, если убавить ядер там, да добавить хэша здесь. Разве Гугл ради этого делал эту гигантскую работу - чтобы выиграть у Стокфиша? Это просто демонстрация возможностей, понятная даже дилетантам (но, похоже, не всем). Он ведь параллельно, той же методикой, научился непобедимо играть во все игры этого типа сразу. Как суперодарённый ребёнок. А вскоре займется задачами для взрослых. В шахматы же будет изредка поигрывать на пикничке с друзьями...

номер сообщения: 54-69-6278

112	Roger 12.12.2017 \| 05:47:48 все его сообщения: за день, за месяц, за все время

Ukrfan: Альфазеро - это гигантский скачок в сторону собственно АИ

А мне показалось, что Альфазеро - это гигантский автомат из спичечных коробков для игры в крестики-нолики.

номер сообщения: 54-69-6279

113	Ukrfan Киев 12.12.2017 \| 05:56:11 все его сообщения: за день, за месяц, за все время

Roger:

Ukrfan: Альфазеро - это гигантский скачок в сторону собственно АИ

А мне показалось, что Альфазеро - это гигантский автомат из спичечных коробков для игры в крестики-нолики.

Значит, вы значительно умнее Ананда.

номер сообщения: 54-69-6280

114	miрtus 12.12.2017 \| 07:21:47 все его сообщения: за день, за месяц, за все время

Ukrfan: Он ведь параллельно, той же методикой, научился непобедимо играть во все игры этого типа сразу.

+1. Это главное. У гугла вообще не было задачи сделать чемпиона мира по шахматам. Основное их достижение - это именно алгоритм, который без какой-либо настройки и адаптации к конкретным играм, играет в них на уровне лучших программ, созданных специально для этих игр. Им просто надо было как-то измерить перфоманс, поэтому они взяли для сравнения топовый движок в каждой игре и не парились особо с настройками. Понятно, что можно было потратить годик и заточить конкретно под шахматы, но это как раз было противоположно их цели. Плюс в науке (и в программировании и много где еще) всегда лучше быстро опубликовать интересный результат и собрать обратную связь, чем годами страдать перфекционизмом. Разработчики Стокфиша нашли бы к чему придраться независимо от условий матча. Команда Гугла хочет работать над гораздо более важными проектами, чем настольные игры, но чтобы получать дальнейшие деньги на разработку, надо давать какие-то промежуточные результаты. Это один из таких результатов, просто он очень возбудил шахматных программеров.

номер сообщения: 54-69-6281

115	Roger 12.12.2017 \| 07:53:32 все его сообщения: за день, за месяц, за все время

Ukrfan: Значит, вы значительно умнее Ананда.

У нас с Анандом договор: он не программирует, а я не играю в шахматы.

номер сообщения: 54-69-6282

116	Roger 12.12.2017 \| 07:55:29 все его сообщения: за день, за месяц, за все время

miрtus: Разработчики Стокфиша нашли бы к чему придраться независимо от условий матча.

Всё же немного странно, что плато нашлось на уровне Стока с этими настройками.

номер сообщения: 54-69-6283

117	shcherb 12.12.2017 \| 09:23:45 все его сообщения: за день, за месяц, за все время

"собственно АИ" фактически представляет из себя систему, которую предварительно настраивают люди (годами)

8 часов, 4 часа...

Критика тут совсем другая; такой АИ решает дискретные задачи,

which means that there are a small number of specific moves you can make, all with certain, known consequences; and a small number of specific places the pieces can be. Ordinary life is NOTHING like that.

__________________________
не надо шутить с войной

номер сообщения: 54-69-6285

118	Vizvezdenec Ниже нуля Севастополь 12.12.2017 \| 09:49:09 все его сообщения: за день, за месяц, за все время

Ukrfan: Обсуждаете вы, господа, тут какую-то ахинею. Можно подумать, что так важно, как именно Альфазеро сыграет против Стокфиша в шахматы. Суть-то в том, что Альфазеро - это гигантский скачок в сторону собственно АИ, и именно так это воспринял Ананд и прочие, кто понял, что именно произошло. А вы гадаете, что будет, если убавить ядер там, да добавить хэша здесь. Разве Гугл ради этого делал эту гигантскую работу - чтобы выиграть у Стокфиша? Это просто демонстрация возможностей, понятная даже дилетантам (но, похоже, не всем). Он ведь параллельно, той же методикой, научился непобедимо играть во все игры этого типа сразу. Как суперодарённый ребёнок. А вскоре займется задачами для взрослых. В шахматы же будет изредка поигрывать на пикничке с друзьями...

Мы на шахматном форуме обсуждаем, как эта работа повлияет на шахматы в целом и на шахматные программы в частности. Где нам это ещё обсуждать? Это первое.
Как сами нейросети, так и нейросети конкретно от гугла, которые играют в пошаговые игры - вещь, собственно, не новая. И их перспектива видна была уже по АльфаГо, поэтому ещё раз показывать их перспективу для игры в пошаговые игры - именно, что пиар и не более того, а не какие-то научные результаты. Они была замахнулись, кстати, на непошаговые игры (конкретно Старкрафт), но там результатов как-то не особо вышло, видимо, связано это с тем, что слишком большое поле и игра в реальном времени. Это второе.
Для демонстрации того, что нейросети перспективны, есть много вещей, например, я где-то краем уха слышал, что они научились лучше людей выявлять по снимкам рак на ранней стадии (это ли не круто?!) или ловить читеров в Контр-страйке (

). Как и любой новый инструмент, его сейчас пихают куда угодно (вроде бы гугл транслейт теперь тоже что-то такое пользует, как и всякие голосовые помощники), где-то он хорошо применим, где-то хуже, где-то вообще никак, и выяснение ограничений применения - очень неплохо, но что они умеют в игрушки играть, мы уже и без этой работы на примере го прекрасно видели.
В итоге если рассматривать эту работу как пиар нейросетей - мне он не особо такой нравится, т.к. они и без того распиарены очень неплохо (круче этого сейчас разве что блокчейн распиарен), как пиар конкретной лаборатории - я от неё ничего, кроме умения делать нейросети для игрушек, не видел, поэтому было бы неплохо, чтобы они наконец-то занялись уже реальными задачами какими-то, т.к. пока они 3 год только "на кошках тренируются" и помимо этого как-то ничего от них не видно.
Если же рассматривать работу как то, что перевернёт концепцию создания шахматных движков - тут есть серьёзные сомнения.

shcherb:

"собственно АИ" фактически представляет из себя систему, которую предварительно настраивают люди (годами)

8 часов, 4 часа...

Так для того, чтобы нейросеть могла обучиться на такой уровень, её и настраивали годами. Потом да, 4 часа, только предварительная работа занимает совсем не 4 часа.

номер сообщения: 54-69-6286

119	Michael_S 12.12.2017 \| 13:12:48 все его сообщения: за день, за месяц, за все время

Я в детали не особо влезал (до вчерашнего дня вообще не слышал про эту Альфузиру), но по-моему вы не туда восхищаетесь.
Даже если допустить, что Альфазеро действительно сильнее нормально настроенного Стокфиша, бегущего на подходящем для Стокфиша железе*.
Дело в том, что Альфазеро это отнюдь не то АИ о котором нам жужжат в уши последние 60 лет (ну, в смысле, не нам, а вам, тем, кому за 60. Мне лично жужжат не настолько долго). Это более-менее нормальная шахматная программа, в которой изменили только две вещи - функцию оценки и метод обхода дерева. И если по-поводу функции оценки еще можно утверждать, что она изменена в направлении "универсального" АИ, то про метод перебора (псевдо-случайный, кажется) я бы этого не сказал.

Чего я не понял по-поводу Альфазеро, это есть ли у нее то, что на жаргоне шах-программистов зовется "хэш", т.е. запоминает ли она оценки позиций, чтоб не вычислять заново, когда дерево перебора приходит к той же позиции через другие промежуточные ходы. То, что "хэш" дико полезен, это характеристика именно шахматной игры. В других переборных задачах он вовсе не обязательно полезен.

---
Оптимальное для Стока железо [в моем понимании] это отнюдь не Xeon Phi. А в точности наоборот. Не очень много очень быстрых ядер и большой unified LLC. Из сравнительно бюджетных вариантов я бы взял этот)

номер сообщения: 54-69-6289

120	арт. created 2004.06.10 20.00.00 12.12.2017 \| 16:42:32 Сайт все его сообщения: за день, за месяц, за все время

забацал баннер на стартовую)

номер сообщения: 54-69-6290

121	Vizvezdenec Ниже нуля Севастополь 26.12.2017 \| 01:40:32 все его сообщения: за день, за месяц, за все время

На временном контроле день/ход помощь человека даёт очень неслабую прибавку в силе обычно.
Правда, на классическом времени она не даёт практически ничего.

номер сообщения: 54-69-6303

Страницы: [1] [2] [3] [4] [5]