Рейтинги. Проблемы, суждения, мнения

17.10.2012 | 12:36:57

Страницы: [1] ... [12] [13] [14] [15] [16]

452	mickey 07.05.2019 \| 19:29:13 все его сообщения: за день, за месяц, за все время

Над Индией пронесся ураган, в половине страны нет электричества, Интернета не будет минимум 15 дней

.
Это к вопросу о всемирном обсчете лайв-рейтингов

номер сообщения: 150-4-24077

453	AGUSA96 Class B 07.05.2019 \| 20:11:43 все его сообщения: за день, за месяц, за все время

mickey: Над Индией пронесся ураган, в половине страны нет электричества, Интернета не будет минимум 15 дней

.
Это к вопросу о всемирном обсчете лайв-рейтингов

Вот, именно! Гладко было на бумаге, да забыли про овраги!...

номер сообщения: 150-4-24078

454	dimarko 12.07.2019 \| 12:36:53 все его сообщения: за день, за месяц, за все время

Интересный сайт для оценки собственного рейтинга накопал
76 задачек, тактика+стратегия

номер сообщения: 150-4-24245

455	FIBM 06.10.2019 \| 18:37:34 все его сообщения: за день, за месяц, за все время

dimarko: Интересный сайт для оценки собственного рейтинга накопал
76 задачек, тактика+стратегия

Да выглядит симпатично. И статистический ликбез со средним и дисперсией показан.

номер сообщения: 150-4-25282

456	leshkastar 22.10.2019 \| 01:12:16 все его сообщения: за день, за месяц, за все время

остров Мэн: корреляция между порядковым номером участника и итоговым местов - 0,67.
Интересно, рейтинг объясняет чуть меньше половины итоговых результатов

номер сообщения: 150-4-25360

457	RoxyS 22.10.2019 \| 09:29:47 все его сообщения: за день, за месяц, за все время

Интересно, рейтинг объясняет чуть меньше половины итоговых результатов

Ну так не рейтингами же меряются, а конкретной игрой. Живые люди играют все-таки

__________________________
особое мнение

номер сообщения: 150-4-25361

458	fso кмс 22.10.2019 \| 10:23:20 Сайт все его сообщения: за день, за месяц, за все время

Золотые слова! Как же это теперь рейтинголюбителям обяснить?

__________________________
Шахматная партия не лотерея. Проблему мотивации решает НОКАУТ

номер сообщения: 150-4-25362

459	Ukrfan Киев 22.10.2019 \| 12:17:32 все его сообщения: за день, за месяц, за все время

leshkastar: остров Мэн: корреляция между порядковым номером участника и итоговым местов - 0,67.
Интересно, рейтинг объясняет чуть меньше половины итоговых результатов

Сто раз говорили: рейтинг не может ничего объяснять. Игроки крайне редко (можно считать, никогда) не выстраиваются строго по рейтингу. Но именно рейтинг в значительно большей степени соответствует их практической силе, чем результат оттдельно взятого турнира.

Спросим себя: что, Ван Хао сильнее Карлсена? или Алексеенко сильнее Грищука? а, может, Паравян сильнее Карякина? Видит сильнее Ананда? Рахманов сильнее Со? Ни на один из этих вопросов (кроме, может быть, второго) ни один относительно нормальный человек не ответит утвердительно.

А, может быть, это утверждение справедливо прямо сейчас? не вообще, а на данный момент. Ну давайте сейчас проведем матч между Карлсеном и Ваном, или между Со и Рахмановым. На кого поставите? то-то же.

Проведено прекрасное, динамичное, интересное соревнование. Его результаты, безусловно, достойны анализа, могут быть сделаны опрелеоенные выводы - но только не такие, какие я перечислил выше. И в качестве отбора оно пригодно с большими оговорками.

номер сообщения: 150-4-25363

460	Почитатель 22.10.2019 \| 12:36:21 все его сообщения: за день, за месяц, за все время

Приволок пустую железную бочку и давай стучать по ней дубиной. Получается громко, но никого эта "музыка" почему-то не впечатляет.
Короткое замечание RoxyS звучит гораздо осмысленнее:

Живые люди играют все-таки

В этой связи любопытно узнать у специалистов: много ли встречается расхождений между итоговым турнирным положением и исходными рейтингами в соревнованиях компьютерных программ?

(Ну, там могут быть специфические оговорки типа "не одинаковое железо" и т.п., но все-таки?)

номер сообщения: 150-4-25364

461	LateSpring 2017 22.10.2019 \| 13:31:20 все его сообщения: за день, за месяц, за все время

Почитатель: ...никого эта "музыка" почему-то не впечатляет.

А по-моему - всё по полочкам.

номер сообщения: 150-4-25365

462	Ukrfan Киев 22.10.2019 \| 13:37:06 все его сообщения: за день, за месяц, за все время

Почитатель:
В этой связи любопытно узнать у специалистов: много ли встречается расхождений между итоговым турнирным положением и исходными рейтингами в соревнованиях компьютерных программ?

Безусловно, случаются, поскольку иное означало бы, что их создатели после предыдущего турнира сидели сложа руки.

Я вам даже больше скажу: в соревнованиях компьютерных программ случается, что приходит некто с рейтингом 2000 (назовем его Альфазеро) и надирает задницу всем. В соревнованиях людей (несмотря на постоянные ламентации fso и иже с ним - мол, "а что, если...") такого не бывает, и быть не может. Поэтому пресловутый негандикапный отбор не имеет смысла.

номер сообщения: 150-4-25366

463	Почитатель 22.10.2019 \| 13:45:21 все его сообщения: за день, за месяц, за все время

Вопрос к специалистам: много ли встречается расхождений?
Ответ: безусловно, случаются.

Сразу видно "специалиста".

номер сообщения: 150-4-25368

464	leshkastar 22.10.2019 \| 15:04:45 все его сообщения: за день, за месяц, за все время

Ukrfan
Я согласен, что рейтинг хорошо отражает практическую силу. Однако рейтинг предсказывает результаты турнира с определенной погрешностью. Если бы рейтинг коррелировал с результатом турнира на 0.1-0.2, то можно было бы задаваться вопросом – это рейтинг фуфло или турнир не по шахматам.
Жаль, что фактор «все люди» нельзя разделить на факторы «сила игры в этом турнире была непривычно высокой/низкой», «у шахматиста Х в этом турнире была высокая/низкая мотивация», «тот то использовал турнирную стратегию», «случайный шум», "неправильные допы".
Слово «объясняет» я использовал в следующем смысле. Я часто видел, что если параметры А и В коррелируют и В было позже А, то авторы пишут о том, что А объясняет столько-то процентов дисперсии B. Это неправильно?

номер сообщения: 150-4-25372

465	RoxyS 22.10.2019 \| 15:36:09 все его сообщения: за день, за месяц, за все время

leshkastar,
Как можно измерить уровень мотивации? Где тот прибор?

Люди иногда ошибаются. Как вы предскажете вероятность ошибки в той или иной партии?

Небольшое эссе.

__________________________
особое мнение

номер сообщения: 150-4-25373

466	leshkastar 22.10.2019 \| 16:27:48 все его сообщения: за день, за месяц, за все время

RoxyS
Точного измерителя уровня мотивации нету. Но иногда можно посмотреть, насколько этот фактор вмешивается в "объективную действительность". Например, деньги - наиболее универсальная мотивация. Соответственно, можно посмотреть, насколько различается корряляция между рейтинговым номером и итоговым результатов в зависимости от денежного вознаграждения. Понятно, что денежное вознаграждение влияет и на средний рейтинг участников, и это тоже придется учитывать, но тем не менее.
Мне кажется, что ошибки имеют разную природу. Проигрыш Карслена Топалову из-за флага , ход 4...Кре7? или 18...Cd5? от Howell - это очень разные ошибки, которые понимать и интерпретировать тоже лучше постараться по-разному.

номер сообщения: 150-4-25374

467	Ukrfan Киев 22.10.2019 \| 17:36:48 все его сообщения: за день, за месяц, за все время

leshkastar: Ukrfan
Я согласен, что рейтинг хорошо отражает практическую силу. Однако рейтинг предсказывает результаты турнира с определенной погрешностью. Если бы рейтинг коррелировал с результатом турнира на 0.1-0.2, то можно было бы задаваться вопросом – это рейтинг фуфло или турнир не по шахматам.
Жаль, что фактор «все люди» нельзя разделить на факторы «сила игры в этом турнире была непривычно высокой/низкой», «у шахматиста Х в этом турнире была высокая/низкая мотивация», «тот то использовал турнирную стратегию», «случайный шум», "неправильные допы".
Слово «объясняет» я использовал в следующем смысле. Я часто видел, что если параметры А и В коррелируют и В было позже А, то авторы пишут о том, что А объясняет столько-то процентов дисперсии B. Это неправильно?

Я понимаю, что "жаль", иначе вы могли бы предсказывать результаты турниров с уровнем "бог". Я уже неоднократно объяснял, что практическая сила спортсмена - как измеряемая (в случае легкоатлетов, пловцов, штангистов), так и вычисляемая (в тех видах спорта, где учитываются результаты партий, матчей, турниров) - только один из многих факторов, влияющих на результат конкретной партии, забега, матча. Все их учесть невозможно, но если мы знаем спортсмена очень хорошо и обладаем инсайдерской информацией - у нас, конечно, больше шансов.
Спортсмен плохо спал этой ночью (причины могут быть опять же, разными); спортсмен отравился несвежей рыбой; у спортсмена болит голова; у спортсменки "те" дни; спортсмен узнал, что его девушка залетела; спортсмен разругался с тренером - все это влияющие факторы. На результат отдельной партии могут влиять также факторы взаимоотношений с конкретным соперником. Например: спортсмен боится этого соперника, как огня, или, напротив, он с ним в прекрасных отношениях и обычно играет вничью. Все эти факторы надо а) знать (что малореально, если вы не отец и не тренер спортсмена); б) оценить их влияние в данном конкретном случае. Это очень сложная работа, которая поддаётся (в некоторой степени) экспертной оценке, но математически не формализуется.

Теперь взглянем на проблему с другой стороны: что нам даёт результат конкретной партии (или даже турнира), если на них, кроме практической силы, влияет столько разных факторов? да почти ничего. Нам нужны усредненные данные, в которых влияние всех этих (и других) факторов учтено в меньшей степени, которые больше соответствуют действительной силе игрока. А это:
- либо рейтинг(где учтены все результаты, но, возможно, им не придан адекватный вес);
- либо цикл соревнований за значимый период, где учтены, во-первых, прежде всего важные турниры, во-вторых, успехи в них ранжированы по значимости.

Отдельно же взятый турнир, как бы увлекателен он ни был, и как бы болелам ни хотелось, чтобы все решалось "здесь и сейчас", для важных целей, вроде отбора, не годится (о всяческих нокаутах и говорить нечего).

номер сообщения: 150-4-25375

468	leshkastar 22.10.2019 \| 18:37:57 все его сообщения: за день, за месяц, за все время

Спасибо, Ukrfan, было интересно услышать ваше мнение.
Из ваших примеров я понял, что вы считаете "уровень игры" постоянной величиной, если бы удалось исключить все "нешахматные" факторы. Грубо говоря, что не может быть такого: шахматист А играет на уровне 2000 в 90% процентах случаях, и на уровне 2200 в 10% случаях, если исключить посторонние факторы. Это интересно в контексте проблемы измерений вообще (которые постоянно варьируются, даже при измерении чувствительности к сенсорным сигналам).
Об оптимальном формате я ничего не говорил, идея проводить для отбора серию турниров мне кажется хорошей.

номер сообщения: 150-4-25377

469	Ukrfan Киев 22.10.2019 \| 19:25:53 все его сообщения: за день, за месяц, за все время

leshkastar: Спасибо, Ukrfan, было интересно услышать ваше мнение.
Из ваших примеров я понял, что вы считаете "уровень игры" постоянной величиной, если бы удалось исключить все "нешахматные" факторы.

Нет, почему же. Величина эта переменная, но график ее (в идеальном мире) не менялся бы случайным образом. Он бы сначала рос, причем не обязательно гладко: вот, например, человек научился инрать в шахматы, ему показали ходы, правила увзятия фигур, простейшую стратегию. Скачок? Скачок. Потом папа подарил книгу Майзелиса - снова скачок. Потом пошел в шахматную секцию. Потом папа напрягся, и отдал сына Чучелову или к Карту. Потом купил компьютер. Это шахматные факторы, или нешахматные?

Грубо говоря, что не может быть такого: шахматист А играет на уровне 2000 в 90% процентах случаях, и на уровне 2200 в 10% случаях, если исключить посторонние факторы.

Такого точно не может быть. Но исключить-то мы их не можем. Поэтому играть шахматист в этот день может и на 2200, если он с дикого бодуна, или у него почечный криз. А вот сила его - она по-прежнему при нём, хотя какую-то часть нейронов дикий запой может и нарушить.

В общем, это уже впрос, скорее, философский.

Это интересно в контексте проблемы измерений вообще (которые постоянно варьируются, даже при измерении чувствительности к сенсорным сигналам).

Измерение силы и сама сила - это, понятное дело, не одно и то же.

Об оптимальном формате я ничего не говорил, идея проводить для отбора серию турниров мне кажется хорошей.

Спасибо. Как-то даже странно вести в этом треде спокойную беседу, без взаимных нападок.

номер сообщения: 150-4-25378

470	Ukrfan Киев 22.10.2019 \| 19:31:57 все его сообщения: за день, за месяц, за все время

RoxyS:
Небольшое эссе.

Хороший текст. Вторую часть я, правда, где-то уже читал.

Ваш?

номер сообщения: 150-4-25379

471	RoxyS 23.10.2019 \| 12:03:20 все его сообщения: за день, за месяц, за все время

Ukrfan:

RoxyS:
Небольшое эссе.

Хороший текст. Вторую часть я, правда, где-то уже читал.

Ваш?

Нет. Просто понравился текст для аргументации мнения. Автор указан.

__________________________
особое мнение

номер сообщения: 150-4-25385

472	RoxyS 23.10.2019 \| 12:08:05 все его сообщения: за день, за месяц, за все время

Мне кажется, что ошибки имеют разную природу. Проигрыш Карслена Топалову из-за флага , ход 4...Кре7? или 18...Cd5? от Howell - это очень разные ошибки, которые понимать и интерпретировать тоже лучше постараться по-разному.

leshkastar,
возможно следует выделить системные ошибки (недостаток шахматных знаний) и случайные (просмотр, зевок).

__________________________
особое мнение

номер сообщения: 150-4-25386

473	Vova17 кмс 09.06.2020 \| 17:50:27 все его сообщения: за день, за месяц, за все время

Попался на глаза. Не знаю насколько справедливо.

__________________________
Спасение там, где опасность.

номер сообщения: 150-4-27262

474	Jacob08 Копенгаген 10.06.2020 \| 00:37:13 все его сообщения: за день, за месяц, за все время

Vova17:

Попался на глаза. Не знаю насколько справедливо.

Клик !

номер сообщения: 150-4-27264

475	Vizvezdenec Ниже нуля Севастополь 13.07.2020 \| 15:38:05 все его сообщения: за день, за месяц, за все время

Почитатель: Приволок пустую железную бочку и давай стучать по ней дубиной. Получается громко, но никого эта "музыка" почему-то не впечатляет.
Короткое замечание RoxyS звучит гораздо осмысленнее:

Живые люди играют все-таки

Это смотря откуда эти "исходные рейтинги" выдрать, вообще говоря.
Т.к. у шахматных программ нет никакого централизованного рейтинга, то и, вообще говоря, и говорить о том, что, мол, сыграли не по рейтингу, достаточно сложно.
Бывают, конечно, апсеты, когда в финал турнира проходит не 2 лучшие программы, но бывает куда реже, чем у людей, во-первых, потому что программы не зависят от настроения, здоровья и прочего, да и сама их природа позволяет в отборочной стадии наиграть не 10 игр, а хоть 100 или 1000. Из примеров - 10 сезон TCEC, где в финал не попал Stockfish, и 16, где в финал не попала Leela, каждый из которых, пожалуй, был наиболее сильной программой тогда. В остальном обычно играет топ-1 против топ 2-3 (отрыв между ними зачастую совсем небольшой, поэтому кто пройдёт - тут как повезёт. Против какого-нибудь топ-7 матчей финальных не бывает толком, но это потому, что топ-7 в мире шахматных движков отстаёт от топ-1 куда больше, чем топ-7 людей от Карлсена, вот недавно делали бонусный матч Stockfish-Komodo, топ-1 против топ-5 (топ-2 среди не-нейросетевых движков), который закончился со счётом +45-3=52, что как бы намекает на разрыв

).
А про альфазиро пример неудачный, т.к. это, простите, уровень "у нас новый бегун, он бегает 100 метров за 8 секунд, вот запись пробега его на первых 7 метрах, но на соревнования он ездить не будет" - ни в одном даже полуофициальном соревновании А0 так и не поучаствовал, поэтому, хоть он, пожалуй, и был объективно несколько сильнее, чем всё, что тогда было, но это отыграли где-то в течение полугода.
Почему я говорю "несколько сильнее" - потому что 30-100 эло отрыва (а скорее даже 30, потому что никто толком не тестирует шахматные движки на игру со стартовой позиции, это прилично, но не так уж и много для движков. Примерно полгода работы или около того.

номер сообщения: 150-4-27390

476	Почитатель 14.07.2020 \| 20:29:58 все его сообщения: за день, за месяц, за все время

Vizvezdenec:
А про альфазиро пример неудачный

Этот пример уже не "из меня", я даже поначалу глаза выпучил.
Но я и про свой вопрос забыть забыл, так что спасибо!

номер сообщения: 150-4-27399

Страницы: [1] ... [12] [13] [14] [15] [16]