|
|
|
|
|
|
|
|
|
|
ram63k: Все это конечно чертовски увлекательное зрелище, но у меня как любителя вопрос: А сможет ли АльфаЗеро со Стоком вытворять такое в равных условиях? Ведь насколько я понял, то у Стокфиша ни "железа" ни "памяти" для обычного его состояния не было. Интересно было бы посмотреть на АЗ в чемпионате "машин", где ко всем участникам одинаковые требования, или этот "инопланетный разум" и там всех вынесет? А так конечно... после ролика Apollo, какое то необьяснимое глубокое потрясение испытываешь... прикосновение к Вечности что ли... Спасибо, Apollo! | уже оценивали - ноль шансов на текущем уровне игры.
При такой разницы по массе параметров должно быть 150 эло как минимум, чтобы быть соизмеримым по уровню движком на бытовом железе. Это без учёта плохого масштабирования нейронносетевых движков на него. |
|
|
номер сообщения: 54-69-6259 |
|
|
|
То есть, если Стокфиш выйдет на бой в полной "амуниции", он таки поставит на место выскочку?
Или наоборот? |
|
|
номер сообщения: 54-69-6260 |
|
|
|
ram63k: То есть, если Стокфиш выйдет на бой в полной "амуниции", он таки поставит на место выскочку?
Или наоборот? | Смотря что такое "полная амуниция".
Т.к. стокфиш не умеет работать с суперкомпьютерами и вычислительными комплексами, а альфазеро работает только с ними и не умеет запускаться на обычном железе, между ними в принципе сложно провести равный по расчётным мощностям матч.
Если последний таки портировать на обычные железяки, хотя бы и серверного типа - он будет гораздо слабее не то что стокфиша, но и любого движка приличного вплоть до какого-нибудь Laser. |
|
|
номер сообщения: 54-69-6261 |
|
|
|
Спасибо, Vizvezdenec! Мне кажется для шахмат, все равно событие эпохальное, может доживем еще до следующего "переворота", и будет длиться это по этапам бесконечно... может быть когда то и разгадают все до последнего варианта, но люди махнут на это все рукой, и будут продолжать свои партии с нехитрыми комбинациями на широких лавках летнего парка.) |
|
|
номер сообщения: 54-69-6262 |
|
|
|
ram63k: Спасибо, Vizvezdenec! Мне кажется для шахмат, все равно событие эпохальное, может доживем еще до следующего "переворота", и будет длиться это по этапам бесконечно... может быть когда то и разгадают все до последнего варианта, но люди махнут на это все рукой, и будут продолжать свои партии с нехитрыми комбинациями на широких лавках летнего парка.) | как я уже писал, пока не придумают воспроизводимый людьми алгоритм, который будет выдавать лучший ход в каждой позиции - толку от всего этого мало.
А что касается эпохальности... Эпохальным будет момент, когда нейронки спустятся со специализированных программно-аппаратных комплексов на обычное железо. Но как раз в этом направлении прогресса немного. |
|
|
номер сообщения: 54-69-6263 |
|
|
|
номер сообщения: 54-69-6264 |
|
|
|
Ну, собственно, ничего нового особо там нет - практически всё написанное тут уже было :)
Выводы достаточно спорные в итоге. Конечно, это будущее, только вот сколько лет до него?
Да и кто сказал, что Стокфиш не сможет перевести фиштест на нейросети, когда (если) они станут перевариваемыми на бытовом железе? В конце концов разработка шахматных движков - очень неприбыльное дело и 400 машин на фиштесте - уже в 4 раза примерно больше того, что есть у Комодо и Гудини (по инфе автора Гудини у него в сумме около 120 ядер, ну они, конечно, посильнее среднего на фиштесте, так что может быть не в 4, а в 2,5-3 раза. У Комодо мощности +/- те же самые), а тем оно позволяет толком только оплачивать счета и особой прибыли не приносит это занятие (таким образом, увеличить их они не могут особо). Т.е. если кто и сможет из разработчиков движков это сделать, то стокфиш. У него самые большие мощности для этого (хотя, конечно, на данный момент совершенно не достаточные для применения нейросетей).
В итоге тут возникает вопрос - смогут ли брутфорс движки стать "почти" идеальными за срок, который понадобится для того, чтобы спустить нейросети со специализированных программно-аппаратных комплексов на обычные железки? Мне кажется, что скорее да, чем нет. |
|
|
номер сообщения: 54-69-6265 |
|
|
|
Гата Камский говорит что одолеет этого монстра, если в помощь себе возьмет Стокфиша. Интересно было бы посмотреть такой матч. |
|
|
номер сообщения: 54-69-6266 |
|
|
|
ram63k: Гата Камский говорит что одолеет этого монстра, если в помощь себе возьмет Стокфиша. Интересно было бы посмотреть такой матч. |
Не исключено, кстати. Т.к. Dragon mist (чемпион 2016 по переписке) говорит, что он набирает против стокфиша до 65% очков на временном контроле, стандартном для переписки, против просто стокфиша. |
|
|
номер сообщения: 54-69-6267 |
|
|
|
Думается, что если Стоку по больше дать времени, да "книгу" по тяжелее... то вряд ли его этот монстр будет бить так нещадно. Ведь по сути этого матча между ними, складывается впечатление, что сошлись два калькулятора, у которых принцип работы разный, а в итоге победил тот, кто считает глубже и дальше. Может быть оно и так, но по правде, смущают меня эти хладнокровные жертвы, местами даже безрассудство, беспечные тихие ходы - и в результате всего этого получаются потрясающие, мой любительский разум, картины.
Нет мне покоя, от этого АльфаЗиро, надо еще один матч! И чтобы одновременно, против всех компов Мира! Вот тогда посмотрим. |
|
|
номер сообщения: 54-69-6268 |
|
|
|
Не исключено, что если Стоку дать нормальное железо и установки, то AZ и его победит, просто кривая обучения выйдет на плато немного выше.
Не исключено, правда, и то, что тестеры AZ пробовали такую конфигурацию, но не захотели показать нам результат. Например, он им не понравился. |
|
|
номер сообщения: 54-69-6269 |
|
|
|
Roger: Не исключено, что если Стоку дать нормальное железо и установки, то AZ и его победит, просто кривая обучения выйдет на плато немного выше.
Не исключено, правда, и то, что тестеры AZ пробовали такую конфигурацию, но не захотели показать нам результат. Например, он им не понравился. | Так он не тренируется против стока, т.е. плато кривой обучения не зависит от того, против кого он играет. И то, что оно всего на 70-100 эло выше стокфиша, говорит о том, что вряд ли оно выше стокфиша на "максимальном разгоне", т.е. 512 потоках, нормальном хэше, книге, таблицах эндшпильных, новой версии и т.д.
Да хватит и 512 потоков, по идее. Как говорит автор Гудини, эффективность современного распараллеливания альфа-беты можно примерно оценить как (число потоков)^0.8, т.е. 512 потоков играется как будто бы их 147 и распараллеливание идеальное, а 64 - как будто их 27.
147/27=около 5,5, т.е. тут нужно брать что-то вроде дважды удвоение и ещё процентов 30, это на таком времени и таком железе что-то около дважды по 30 эло и ещё 10, т.е. те самые 70 уже есть. Добавить сюда нормальный хэш и возможность использовать время, как больше понравится - уже выходит больше эло, чем у альфазеро. |
|
|
номер сообщения: 54-69-6270 |
|
|
|
Тогда я, наверное, что-то пропустил - откуда тогда вообще эти кривые прогресса берутся? Там написано, что игрались партии по секунде на ход с тем же Стоком, и чтобы построить такой гладкий график нужно затратить не меньше тех же 4 часов по порядку величины. А в процессе тестовых игр движку не разрешают прогрессировать? |
|
|
номер сообщения: 54-69-6271 |
|
|
|
Roger: Тогда я, наверное, что-то пропустил - откуда тогда вообще эти кривые прогресса берутся? Там написано, что игрались партии по секунде на ход с тем же Стоком, и чтобы построить такой гладкий график нужно затратить не меньше тех же 4 часов по порядку величины. А в процессе тестовых игр движку не разрешают прогрессировать? | Там используется разное железо для тренировки нейронки и для её игры. Тренируют её 5000 TPU, играют 4. Т.е. примерно так - сначала потренировали, потом поиграли, потом ещё потренировали и т.д. Тренируется она в игре сама с собой. |
|
|
номер сообщения: 54-69-6272 |
|
|
|
В свое время так говорили про людей, мол если им дать открытую книгу больше времени и.т.д., то результат будет другой
__________________________
не надо шутить с войной |
|
|
номер сообщения: 54-69-6273 |
|
|
|
shcherb: В свое время так говорили про людей, мол если им дать открытую книгу больше времени и.т.д., то результат будет другой | Ну пока что это не светит, т.к. если сложить абсолютно все мощности в мире, затрачиваемые на разработку шахматных движков, то они вряд ли достигнут и тысячной части того, что тут имел гугл, и то тот не смог в общем-то создать движка, который был бы радикально сильнее, и вряд ли планирует дальнейшие разработки в этой области. Так что пока нейросети не станут (если вообще станут) менее железо-едящими, никуда "классические" шахматные движки не исчезнут. Опять-таки тут ещё какое дело - прогресс у шахматных движков отнюдь не стоит на месте, так что и с людьми вряд ли тоже может быть аналогия прямая - те-то умнее от поколения к поколению не становятся
Я думаю, что нейросети можно приспособить (возможно, уже сейчас?) для разрешения традиционных слабостей движков - крепостей и блокадных позиций, отличать реальные крепости от "пробиваемых", ну и реально блокадные позиции от прорываемых. Также с цугцвангами разобраться. Но это, конечно, пока теория всё, на практике это весьма тяжело. |
|
|
номер сообщения: 54-69-6274 |
|
|
|
Nvidia при желании наверно могла бы портировать Alphazero на свой настольный супер ИИ компьютер dgx.ai,
который и по размеру как обычная персоналка, и стоит всего 50 000 USD (дешевле карсленовского компьютера), ну и по возможностям зверь.
__________________________
pr.ai PRAI Portal of Robotics and Artificial Intelligence |
|
|
номер сообщения: 54-69-6275 |
|
|
|
Vizvezdenec:
Если последний таки портировать на обычные железяки, хотя бы и серверного типа - он будет гораздо слабее не то что стокфиша, но и любого движка приличного вплоть до какого-нибудь Laser. |
Это из чего следует? Откуда известно, что его ELO масштабируется так же, как у Стокфиша?
Вполне возможно, что сила игры Альфазеро вообще мало поменяется, иначе бы они могли играть на 100, а не 4 TPU, если бы хотели показать суперсилу. |
|
|
номер сообщения: 54-69-6276 |
|
|
|
miрtus: Vizvezdenec:
Если последний таки портировать на обычные железяки, хотя бы и серверного типа - он будет гораздо слабее не то что стокфиша, но и любого движка приличного вплоть до какого-нибудь Laser. |
Это из чего следует? Откуда известно, что его ELO масштабируется так же, как у Стокфиша?
Вполне возможно, что сила игры Альфазеро вообще мало поменяется, иначе бы они могли играть на 100, а не 4 TPU, если бы хотели показать суперсилу. | Потому что у них есть график зависимости эло от времени в статье (страница 7) и он уходит ОЧЕНЬ сильно вниз на малых временах. Да и обычное или серверное железо очень плохо подходит под нужды нейросети.
Т.е. там график стокфиша надо приподнять эло на 100 из-за неравенства железок, ещё на столько же из-за того, что нейросети будет плохо на обычных процессорах, потом вспомнить, что это делалось всё для железа, которое вроде 400-8000 ядер и поэтому если ядра хотя бы до 40 скинуть - фактически мы "ужмём" время в 10^0.8 раз минимум, т.е. в 6 раз, т.е. разница в 150 эло или около того будет на 10 секундах/ход, и чем меньше времени за ход - тем хуже.
Конечно, это всё приблизительно весьма, я не слишком хорошо знаю, как вообще оно там скейлится на большее количество TPU и всего остального. Рискну предположить, что, раз не взяли большее количество TPU, то, видимо, для тренировки нейронки под них нужно во столько же раз больше базовых TPU. Но тут нужен специалист, да.
Я краем уха слышал, что нейронные сети куда лучше масштабируются априори, чем альфабета, т.к. альфабета представляет из себя крайне тяжёлый алгоритм для распараллеливания и то, что он сейчас очень неплохо скейлится с весьма простой концепцией lazySMP - чудеса, да и только
Кстати, ещё тут подумалось, что в принципе могли не взять больше TPU из-за стоимости - ведь вроде бы да, там всего 4 TPU играет, но по минуте на ход... В партии условно 70-80 ходов, т.е. 2,5 часа на партию, а партий они, похоже, изрядно наиграли, всё тестирование, возможно, встало в ту же стоимость, что и тренировка нейросети, ну а чем больше TPU - тем больше оно стоить будет. |
|
|
номер сообщения: 54-69-6277 |
|
|
|
Обсуждаете вы, господа, тут какую-то ахинею. Можно подумать, что так важно, как именно Альфазеро сыграет против Стокфиша в шахматы. Суть-то в том, что Альфазеро - это гигантский скачок в сторону собственно АИ, и именно так это воспринял Ананд и прочие, кто понял, что именно произошло. А вы гадаете, что будет, если убавить ядер там, да добавить хэша здесь. Разве Гугл ради этого делал эту гигантскую работу - чтобы выиграть у Стокфиша? Это просто демонстрация возможностей, понятная даже дилетантам (но, похоже, не всем). Он ведь параллельно, той же методикой, научился непобедимо играть во все игры этого типа сразу. Как суперодарённый ребёнок. А вскоре займется задачами для взрослых. В шахматы же будет изредка поигрывать на пикничке с друзьями... |
|
|
номер сообщения: 54-69-6278 |
|
|
|
Ukrfan: Альфазеро - это гигантский скачок в сторону собственно АИ |
А мне показалось, что Альфазеро - это гигантский автомат из спичечных коробков для игры в крестики-нолики. |
|
|
номер сообщения: 54-69-6279 |
|
|
|
Roger: Ukrfan: Альфазеро - это гигантский скачок в сторону собственно АИ |
А мне показалось, что Альфазеро - это гигантский автомат из спичечных коробков для игры в крестики-нолики. |
Значит, вы значительно умнее Ананда. |
|
|
номер сообщения: 54-69-6280 |
|
|
|
Ukrfan: Он ведь параллельно, той же методикой, научился непобедимо играть во все игры этого типа сразу. |
+1. Это главное. У гугла вообще не было задачи сделать чемпиона мира по шахматам. Основное их достижение - это именно алгоритм, который без какой-либо настройки и адаптации к конкретным играм, играет в них на уровне лучших программ, созданных специально для этих игр. Им просто надо было как-то измерить перфоманс, поэтому они взяли для сравнения топовый движок в каждой игре и не парились особо с настройками. Понятно, что можно было потратить годик и заточить конкретно под шахматы, но это как раз было противоположно их цели. Плюс в науке (и в программировании и много где еще) всегда лучше быстро опубликовать интересный результат и собрать обратную связь, чем годами страдать перфекционизмом. Разработчики Стокфиша нашли бы к чему придраться независимо от условий матча. Команда Гугла хочет работать над гораздо более важными проектами, чем настольные игры, но чтобы получать дальнейшие деньги на разработку, надо давать какие-то промежуточные результаты. Это один из таких результатов, просто он очень возбудил шахматных программеров. |
|
|
номер сообщения: 54-69-6281 |
|
|
|
Ukrfan: Значит, вы значительно умнее Ананда. |
У нас с Анандом договор: он не программирует, а я не играю в шахматы. |
|
|
номер сообщения: 54-69-6282 |
|
|
|
miрtus: Разработчики Стокфиша нашли бы к чему придраться независимо от условий матча. |
Всё же немного странно, что плато нашлось на уровне Стока с этими настройками. |
|
|
номер сообщения: 54-69-6283 |
|
|
|
"собственно АИ" фактически представляет из себя систему, которую предварительно настраивают люди (годами) |
8 часов, 4 часа...
Критика тут совсем другая; такой АИ решает дискретные задачи, which means that there are a small number of specific moves you can make, all with certain, known consequences; and a small number of specific places the pieces can be. Ordinary life is NOTHING like that. |
__________________________
не надо шутить с войной |
|
|
номер сообщения: 54-69-6285 |
|
|
|
Ukrfan: Обсуждаете вы, господа, тут какую-то ахинею. Можно подумать, что так важно, как именно Альфазеро сыграет против Стокфиша в шахматы. Суть-то в том, что Альфазеро - это гигантский скачок в сторону собственно АИ, и именно так это воспринял Ананд и прочие, кто понял, что именно произошло. А вы гадаете, что будет, если убавить ядер там, да добавить хэша здесь. Разве Гугл ради этого делал эту гигантскую работу - чтобы выиграть у Стокфиша? Это просто демонстрация возможностей, понятная даже дилетантам (но, похоже, не всем). Он ведь параллельно, той же методикой, научился непобедимо играть во все игры этого типа сразу. Как суперодарённый ребёнок. А вскоре займется задачами для взрослых. В шахматы же будет изредка поигрывать на пикничке с друзьями... |
Мы на шахматном форуме обсуждаем, как эта работа повлияет на шахматы в целом и на шахматные программы в частности. Где нам это ещё обсуждать? Это первое.
Как сами нейросети, так и нейросети конкретно от гугла, которые играют в пошаговые игры - вещь, собственно, не новая. И их перспектива видна была уже по АльфаГо, поэтому ещё раз показывать их перспективу для игры в пошаговые игры - именно, что пиар и не более того, а не какие-то научные результаты. Они была замахнулись, кстати, на непошаговые игры (конкретно Старкрафт), но там результатов как-то не особо вышло, видимо, связано это с тем, что слишком большое поле и игра в реальном времени. Это второе.
Для демонстрации того, что нейросети перспективны, есть много вещей, например, я где-то краем уха слышал, что они научились лучше людей выявлять по снимкам рак на ранней стадии (это ли не круто?!) или ловить читеров в Контр-страйке ( ). Как и любой новый инструмент, его сейчас пихают куда угодно (вроде бы гугл транслейт теперь тоже что-то такое пользует, как и всякие голосовые помощники), где-то он хорошо применим, где-то хуже, где-то вообще никак, и выяснение ограничений применения - очень неплохо, но что они умеют в игрушки играть, мы уже и без этой работы на примере го прекрасно видели.
В итоге если рассматривать эту работу как пиар нейросетей - мне он не особо такой нравится, т.к. они и без того распиарены очень неплохо (круче этого сейчас разве что блокчейн распиарен), как пиар конкретной лаборатории - я от неё ничего, кроме умения делать нейросети для игрушек, не видел, поэтому было бы неплохо, чтобы они наконец-то занялись уже реальными задачами какими-то, т.к. пока они 3 год только "на кошках тренируются" и помимо этого как-то ничего от них не видно.
Если же рассматривать работу как то, что перевернёт концепцию создания шахматных движков - тут есть серьёзные сомнения.
shcherb: "собственно АИ" фактически представляет из себя систему, которую предварительно настраивают люди (годами) |
8 часов, 4 часа...
|
Так для того, чтобы нейросеть могла обучиться на такой уровень, её и настраивали годами. Потом да, 4 часа, только предварительная работа занимает совсем не 4 часа. |
|
|
номер сообщения: 54-69-6286 |
|
|
|
Ukrfan: Обсуждаете вы, господа, тут какую-то ахинею. Можно подумать, что так важно, как именно Альфазеро сыграет против Стокфиша в шахматы. Суть-то в том, что Альфазеро - это гигантский скачок в сторону собственно АИ, и именно так это воспринял Ананд и прочие, кто понял, что именно произошло. А вы гадаете, что будет, если убавить ядер там, да добавить хэша здесь. Разве Гугл ради этого делал эту гигантскую работу - чтобы выиграть у Стокфиша? Это просто демонстрация возможностей, понятная даже дилетантам (но, похоже, не всем). Он ведь параллельно, той же методикой, научился непобедимо играть во все игры этого типа сразу. Как суперодарённый ребёнок. А вскоре займется задачами для взрослых. В шахматы же будет изредка поигрывать на пикничке с друзьями... |
Я в детали не особо влезал (до вчерашнего дня вообще не слышал про эту Альфузиру), но по-моему вы не туда восхищаетесь.
Даже если допустить, что Альфазеро действительно сильнее нормально настроенного Стокфиша, бегущего на подходящем для Стокфиша железе*.
Дело в том, что Альфазеро это отнюдь не то АИ о котором нам жужжат в уши последние 60 лет (ну, в смысле, не нам, а вам, тем, кому за 60. Мне лично жужжат не настолько долго). Это более-менее нормальная шахматная программа, в которой изменили только две вещи - функцию оценки и метод обхода дерева. И если по-поводу функции оценки еще можно утверждать, что она изменена в направлении "универсального" АИ, то про метод перебора (псевдо-случайный, кажется) я бы этого не сказал.
Чего я не понял по-поводу Альфазеро, это есть ли у нее то, что на жаргоне шах-программистов зовется "хэш", т.е. запоминает ли она оценки позиций, чтоб не вычислять заново, когда дерево перебора приходит к той же позиции через другие промежуточные ходы. То, что "хэш" дико полезен, это характеристика именно шахматной игры. В других переборных задачах он вовсе не обязательно полезен.
---
Оптимальное для Стока железо [в моем понимании] это отнюдь не Xeon Phi. А в точности наоборот. Не очень много очень быстрых ядер и большой unified LLC. Из сравнительно бюджетных вариантов я бы взял этот) |
|
|
номер сообщения: 54-69-6289 |
|
|
|
забацал баннер на стартовую) |
|
|
номер сообщения: 54-69-6290 |
|
|
|
На временном контроле день/ход помощь человека даёт очень неслабую прибавку в силе обычно.
Правда, на классическом времени она не даёт практически ничего. |
|
|
номер сообщения: 54-69-6303 |
|
|
|
|
|
|
|
|
Copyright chesspro.ru 2004-2024 гг. |
|
|
|