пари vs TylerRM

18
Статистика
Статистика
18
1 9 10 11 12 13
  • Ясно,
    а мне кажется это 33% от 35%,

    где 35- блеф часть 2го игрока.
    а 33- мин. частота с кот. 1й должен коллить.

    Может кстати и наоборот, но это согласуется с ПОТбетом в условиях.
    Ответить Цитировать
    5/8
    + 1
  • alexandrelop, господи...
    Ответить Цитировать
    33/43
    + 0
  • формально, 1й предполагает, что у 2го игрока в бете 67% вэлью- 33блефа
    и он как бы должен оставить эти 35% себе на колл.

    Это с учётом что 1й не знает страты 2го,
    но по условиям, мы знаем спектры обоих.. и в этой ситуации знаем тактику игры 2го
    Ответить Цитировать
    6/8
    + 0
  • TylerRM @ 6.3.2015
    Но это всё не отменяет того, что мы сами выбрали судью, для того, чтобы он вел процесс, так или иначе, принимая, любые его решения и способы выяснить кто прав, а кто нет.


    С чего это вы обязаны принимать его любые решения? Не стоит путать отношения, возникающие после:

    "Так уж и быть, ребятки, рассужу вас по дружбе, только давайте сделаем по-моему плз"

    и отношения возникающие после:

    "Так уж и быть, ребятки, рассужу вас за 50$"

    В первом случае человек делает тебе одолжение, и не пойти на уступки ему действительно нельзя. А во втором мы имеем чистой воды контракт, где ты клиент, а клиент всегда прав и его пожелания всегда первостепенны.

    TylerRM @ 6.3.2015
    Не знаю, как остальным, но мне например очень приятно, что мой спор рассуживает человек, которого я когда-то в детстве видел по телевизору, следил за играми и болел за его команду или за телезрителей (в зависимости от ситуации).


    Мне тоже было приятно, тем больнее было разочароваться в человеке. Но полученный мной урок, "не создай себе кумира из не топ регов" стоил всего этого цирка.
    Ответить Цитировать
    3/9
    + 0
  • Ответить Цитировать
    1/1
    + 0

  • Khishtaki, если я покажу, что мое равновесие лучше, чем равновесие рааи, я могу у него выиграть?



    Формулировка Рави против Тайлера попроще.
    Рави не надо ничего доказывать, его утверждение очевидно истинно: стратегия бет 100% - фолд 100% бесспорно является равновесием по Нэшу, и Тайлер это признал.
    Тайлеру же также надо доказать своё утверждение (такое же, как в пари с Витей).
    Если ему это удастся – то расход. Если нет – то Рави выигрывает.

    Тайлер, у тебя против Рави максимум расход. Вообще удивительно, что ты смог все свести к формулировке Khishtaki, так как изначально Рави достаточно было доказать, что ситуация когда 1 пушит, а 2 фолдит является равновесием Неша.
    Ответить Цитировать
    1/1
    + 1
  • Интересно, я один что-ли на форуме кто поддерживает Тайлера? Кто-нибудь вообще что-нибудь читал по теории игр (в частности карточных)?

    Давайте по-порядку, вот определение равновесия Нэша.

    Равновесие Нэша (англ. Nash equilibrium) названо в честь Джона Форбса Нэша — так в теории игр называется тип решений игры двух и более игроков, в котором ни один участник не может увеличить выигрыш, изменив своё решение в одностороннем порядке, когда другие участники не меняют решения.

    Мы предполагаем что бет 100% игроком 1 является решением для первого игрока и фолд 100% времени для второго игрока. Может ли увеличить свой выигрыш одна из сторон, зная стратегию другого оппонента? Второй игрок не может, т. к. колл против ставки 100% рук от первого игрока всегда хуже фолда. А может ли первый увеличить свой выигрыш, зная что второй игрок всегда фолдит? Заметьте, что нам неизвестны действия игрока 2 на чек от игрока 1. Очевидно что да - мы можем бетить все блефы и чекать все натсы. Эта стратегия будет очевидно лучше чем ставка 100% против игрока который фолдит 100% (вы же сами используете чек с натсом если оппонент очень часто фолдит на ставку), т. е. мы изменили свою стратегию на более выигрышную => стратегия со ставкой в 100% рук первым игроком не является решенем равновесной стратегии для первого игрока! Важно понимать что мы не знаем будет ли ставить оппонент на наш чек, но зная что оппонент фолдит на ставку 100 времени нельзя сказать что он будет и брать ответный чек. Если мы предположим что игрок 2 фолдит всегда на ставку и всегда чекает в ответ, то очевидно что данное решение для игрока 2 не будет лучшим решением, т. к. зная статегию игрока 1 - лучшее решение будет коллировать все ставки оппонента и чекать на чек. Тогда игрок 1 начинает ставить только натсы и чекать блефы - игрок 2 фолдить на ставки и ставить на чеки и т. д. игроки будут пытаться подстраивать свои стратегии по кругу. В том-то и состоит сложность нахождения равновесия для обоих игроков. Мы можем заставить играть игроков, принимая рандомные решения, но в зависимости от результатов корректировать свои решения по ходу игры и через много итераций будет видно что чтобы никто не мог увеличить свой выигрыш игроку 1 надо какой-то процент рук бетить, а какой-то чекать. Возьмите цефея, он очень со многими руками практически никогда не играет 100% времени одинаково (и там применяется не нейронная сеть, а один из лучших на данный момент алгоритмов по поиску равновесия в карточных играх)
    Ответить Цитировать
    8/12
    + -4
  • k0nstantinus, это интересно, два вопроса.

    1. Почему ты считаешь, что мы изменили свою стратегию на более выигрышную (со стороны первого игрока), если ожидание не изменилось?
    2. Если твое утверждение верно, означает ли это, что в Равновесии Нэша в профиле стратегий первого игрока, мы должны использовать круглые скобки, вместо квадратных.

    Вместо:


    20% - ставка в воздухом.
    40% - ставка с натсами.
    [0%;40%] - чек с воздухом.
    [0%;40%] - чек с натсами.


    Так:


    20% - ставка в воздухом.
    40% - ставка с натсами.
    (0%;40%) - чек с воздухом.
    (0%;40%) - чек с натсами.
    Ответить Цитировать
    34/43
    + 0
  • k0nstantinus @ 6.3.2015
    Интересно, я один что-ли на форуме кто поддерживает Тайлера? Кто-нибудь вообще что-нибудь читал по теории игр (в частности карточных)?

    Давайте по-порядку, вот определение равновесия Нэша.

    Мы предполагаем что бет 100% игроком 1 является решением для первого игрока и фолд 100% времени для второго игрока. Может ли увеличить свой выигрыш одна из сторон, зная стратегию другого оппонента? Второй игрок не может, т. к. колл против ставки 100% рук от первого игрока всегда хуже фолда. А может ли первый увеличить свой выигрыш, зная что второй игрок всегда фолдит? Заметьте, что нам неизвестны действия игрока 2 на чек от игрока 1. Очевидно что да - мы можем бетить все блефы и чекать все натсы. Эта стратегия будет очевидно лучше чем ставка 100% против игрока который фолдит 100% (вы же сами используете чек с натсом если оппонент очень часто фолдит на ставку), т. е. мы изменили свою стратегию на более выигрышную => стратегия со ставкой в 100% рук первым игроком не является решенем равновесной стратегии для первого игрока! Важно понимать что мы не знаем будет ли ставить оппонент на наш чек, но зная что оппонент фолдит на ставку 100 времени нельзя сказать что он будет и брать ответный чек. Если мы предположим что игрок 2 фолдит всегда на ставку и всегда чекает в ответ, то очевидно что данное решение для игрока 2 не будет лучшим решением, т. к. зная статегию игрока 1 - лучшее решение будет коллировать все ставки оппонента и чекать на чек. Тогда игрок 1 начинает ставить только натсы и чекать блефы - игрок 2 фолдить на ставки и ставить на чеки и т. д. игроки будут пытаться подстраивать свои стратегии по кругу. В том-то и состоит сложность нахождения равновесия для обоих игроков. Мы можем заставить играть игроков, принимая рандомные решения, но в зависимости от результатов корректировать свои решения по ходу игры и через много итераций будет видно что чтобы никто не мог увеличить свой выигрыш игроку 1 надо какой-то процент рук бетить, а какой-то чекать. Возьмите цефея, он очень со многими руками практически никогда не играет 100% времени одинаково (и там применяется не нейронная сеть, а один из лучших на данный момент алгоритмов по поиску равновесия в карточных играх)


    ты старался
    Ответить Цитировать
    27/28
    + 0
  • k0nstantinus,


    Важно понимать что мы не знаем будет ли ставить оппонент на наш чек, но зная что оппонент фолдит на ставку 100 времени нельзя сказать что он будет и брать ответный чек.


    Поясню: если оппонент не будет брать ответный чек, то он не будет играть оптимально, набор стратегий перестанет быть равновесным по нэшу. Поэтому полная стратегия второго игрока: пас на ставку, чек на на чек.


    Равновесие Нэша (англ. Nash equilibrium) названо в честь Джона Форбса Нэша — так в теории игр называется тип решений игры двух и более игроков, в котором ни один участник не может увеличить выигрыш, изменив своё решение в одностороннем порядке, когда другие участники не меняют решения.


    Вывод: как бы первый игрок ни менял свою стратегию в одностороннем порядке, свой выигрыш он не увеличит.


    Кто-нибудь вообще что-нибудь читал по теории игр


    Поддерживаю данный вопрос
    Ответить Цитировать
    1/1
    + 2
  • TylerRM @ 6.3.2015
    1. Почему ты считаешь, что мы изменили свою стратегию на более выигрышную (со стороны первого игрока), если ожидание не изменилось?

    Не понял. В условиях, когда нам неизвестны действия второго оппонента на чек, но известно что он всегда фолдит, стратегия чекать натсы и ставить воздух всегда лучше ставки 100%. Ожидание либо не меняется, либо выше.
    Ответить Цитировать
    9/12
    + -1
  • k0nstantinus @ 6.3.2015
    Не понял. В условиях, когда нам неизвестны действия второго оппонента на чек, но известно что он всегда фолдит, стратегия чекать натсы и ставить воздух всегда лучше ставки 100%. Ожидание либо не меняется, либо выше.


    Против равновесной стратегии (которая включает чеки-бихайнд и мы это вполне себе знаем) оно не выше. Оно такое же.
    Почему нам неизвестны действия второго на чек, если мы считаем что он использует равновесную стратегию?
    Ответить Цитировать
    35/43
    + 0
  • Да, извиняюсь, походу все таки бет 100% является равновесием. Но это точно не лучшее равновесие и есть лучшее решение для игрока 1 чем ставка 100% времени.
    Ответить Цитировать
    10/12
    + 0
  • k0nstantinus, чем отличается лучшее равновесие от "почти" лучшего?
    Ответить Цитировать
    36/43
    + 1
  • TylerRM @ 5.3.2015
    2) Дисперсия

    Если с ожиданием всё понятно, и моя стратегия и предложенная Рави и Витей имеют одинаковое ожидание, то с дисперсией всё не так однозначно.

    Для начала рассмотрим отвлеченный пример. Если мы играем в игру "забрать 100$ или 10.000$ с вероятностью 1%", то при одинаковом EV обоих дейстивый и отсутствии дополнений вроде того которое я привел в предыдущем посте, первый вариант с минимальной дисперсией будет являться лучшим (или оптимальным). Все мы покеристы и мы, как никто другие знаем, что если два действия имеют одинаковое EV, то нужно выбирать то, которое имеет наименьшую дисперсию. Мне тяжело представить, чтобы какой-нибудь рациональный человек (например феруель), сказал, нет, в этой игре оптимально будет выбрать 10.000$ с вероятностью в 1%. Нет, феруель так никогда не скажет. Человек склонный к лудомании может так ответить. Человек со специфичной жизненной ситуацией, которому жизненно необходимы 10.000$ может ответить, что выберет вероятность в один процент и для него это будет оптимально. Но, без дополнительных уточнений к задаче, я склонен утверждать, что, при одинаковом EV двух действий, действие с минимальной дисперсией будет являться оптимальным.

    Теперь перейдем к нашему примеру.
    У оппонента в матрице решений есть возможность совершить две ошибки (поставить в чек и заколлировать ставку).

    После того, как мы сбалансировали диапазон ставки у нас осталось еще 40% натсов, которые мы можем распределить в две линии. Любая стратегия с распределением натсов от [0%;40%] в спектр чека и ставкой 20% блефов 40% натсов и всех оставшихся натсов, которые не вошли в спектр чека будет иметь одинаковое ожидание. Вопрос стоит в том, какая из них будет иметь наименьшую дисперсию?

    Давайте разберемся. Оппонент может совершить две возможные ошибки. По условиям задачи, мы считаем, что:
    а) Он может их совершать
    б) Мы считаем их равновероятными, так как у нас нет никакой информации об оппоненте.

    Если мы переносим все эти нераспределенные натсы в спектр бета, то мы не зарабатываем дополнительных денег, если оппонент совершает 1-ую ошибку (ставить в наш чек), но дополнительно зарабатываем 40% банка, когда он совершает вторую ошибку (коллировать ставку).

    Если мы переносим эти натсы в спектр чека, то мы не зарабатываем никаких дополнительных денег, если оппонент совершает 2-ую ошибку, при этом зарабатываем те же 40% банка, когда он совершает 1-ую ошибку (ставить в наш чек).

    Если мы разнесем одинаково эти натсы между чеком и бетом, то мы будем зарабатывать дополнительно 20% банка, когда оппнент сделает первую ошибку и еще 20% банка, когда сделает вторую ошибку. То есть при каждой ошибке, будем зарабатывать 20% банка.

    Другими словами теперь игру можно представить следующим образом:
    Оппонент может совершить два типа ошибки, совершает их с одинаковой частотой.
    Мы можем выбрать заработать N$, когда он совершит любую из возможных ошибок, или 2*N$ каждый раз когда совершит одну конкретную из них.

    Дополнение (насчет вывода моей стратегии):
    Для того, чтобы вывести стратегию, которая в равной степени эксплуатирует обе ошибки, мы должны сделать наше ожидание от одной ошибки равным ожиданию от другой ошибки. Допустим X% - частота с которой мы играем чеком с данным нам 40%-ым диапазоном, который мы должны распределить. Тогда (100%-X%) - частота с которой мы играем бетом.

    X%*(EVBLUFFMISTAKE) = (100%-X%)*(EVCALLMISTAKE)

    В данном случае, при одинаковом сайзинге ставки, ожидание от кола оппонента будет равно ожиданию от ставки в наш чек, поэтому в половине случаев наш нераспределенный 40%-ый спектр натсов мы отправляем в чек, в половине случаев в бет.
    *при различных сайзингах ставки, ожидание было бы разным и соответственно распределение рук была бы иным.

    Итого наша стратегия, уравнивающая стоимость каждой ошибки для оппонента, выглядит так:
    20% - чек с натсами
    60% - бет с натсами
    20% - блеф с воздухом

    Если мы сравним в отношении дисперсии сравним данную стратегию, с предложенной Рави и Витей.
    Мы найдем аналогию со следующим примером:
    В случае ошибки оппонента, мы можем получить либо 20%*POT (когда он совершит любую из двух ошибок), либо 40%*POT но в два раза
    реже (когда он совершит только одну конкретную ошибку - заколлирует ставку). Какая из двух стратегий будет оптимальной? (вопрос риторический).

    В условиях пари было уточнение, что я должен доказать, что не только стратегия Рави и Вити уступает моей, но и остальные, которые от неё отличаются. Это можно сделать по аналогии.

    Исключение составляет, лишь стратегия со случайным выбором из тех, которые имеют максимальное ожидание:
    20% - ставка в воздухом,
    40% - ставка с натсами.
    [0%;40%] - чек с воздухом.
    [0%;40%] - чек с натсами.

    Но она отличается от моей лишь формулировкой и по сути является моей стратегией.

    Подводя итог поста, я считаю, что при обсуждении оптимальной стратегии, мы не можем игнорировать вопросы дисперсии и при одинаковом эквити двух стратегий, оптимальной будет являться та, которая имеет меньшую дисперсию.

    Если у господина Муна или у участников спора есть какие-то вопросы по аргументации, задавайте, я на них отвечу.


    Там одинаковые дисперсии будут вроде
    Ответить Цитировать
    1/3
    + 1
  • proudlikeagoat, в игре "100$ сразу или 200$ с вероятностью 50%" - дисперсии двух действий одинаковые?
    Ответить Цитировать
    37/43
    + 0
  • TylerRM @ 6.3.2015
    proudlikeagoat, в игре "100$ сразу или 200$ с вероятностью 50%" - дисперсии двух действий одинаковые?


    Нет, а в сдаче вроде да. Дисперсия это не что-то абстрактное. Это величина, которую можно посчитать.
    Ответить Цитировать
    2/3
    + 0
  • proudlikeagoat, блин, хиштаки тоже написал, что вроде не согласен, не понимаю что не так и где я ошибаюсь.
    Ответить Цитировать
    38/43
    + 0
  • HUTrader @ 6.3.2015
    А участники сами уже могут решать, стоит ли им, отвлекаясь от катки, тратить свое время на это.


    это, как мне кажется, подразумевается само собой. Участники могут отказаться аргументировать свою позицию, тогда они сэкономят время и понизят свои шансы на победу в пари, но понизят не до нуля.

    HUTrader @ 6.3.2015
    а про 30-40 часов потраченных на подобную аргументацию.


    ты реально потратил 30-40 часов чистого времени? это действительно очень много, я согласен, что наверное оно того не стоило, но зачем же ты потратил так много???

    В данном случае все стороны пари в том или ином виде дали понять, что хотят привести аргументы. И не хотят, чтобы я выступил в роли некоего чёрного ящика, который прочитал весь топик, и потом вынес вердикт "этот прав, а тот проиграл" без всяких объяснений. Если кто-то хотел именно такого судейства - что ему мешало заявить об этом в самом начале разбора???
    Ответить Цитировать
    17/28
    + 1
  • TylerRM, твоя ошибка в том, что действия второго игрока - случайны. Поэтому если ты выбираешь стратегию 1, то собираешь велью со 100% ошибок оппа-коллера, но с 0% ошибок оппа-беттора, а если ты выбираешь стратегию 2 - то собираешь велью с обоих типов ошибок, зато НЕ по 100%.

    Распиши все возможные исходы по дереву игры в двух стратегиях, и ты увидишь, что поле исходов совершенно одинаково для обоих стратегий первого игрока.
    Ответить Цитировать
    18/28
    + 0
1 9 10 11 12 13
1 человек читает эту тему (1 гость):
Зачем регистрироваться на GipsyTeam?
  • Вы сможете оставлять комментарии, оценивать посты, участвовать в дискуссиях и повышать свой уровень игры.
  • Если вы предпочитаете четырехцветную колоду и хотите отключить анимацию аватаров, эти возможности будут в настройках профиля.
  • Вам станут доступны закладки, бекинг и другие удобные инструменты сайта.
  • На каждой странице будет видно, где появились новые посты и комментарии.
  • Если вы зарегистрированы в покер-румах через GipsyTeam, вы получите статистику рейка, бонусные очки для покупок в магазине, эксклюзивные акции и расширенную поддержку.