Написано несколько сумбурно, т.к. это компиляция из примерно 5-6 моих постов на эту тему.
Линия ЕВ абсолютно адекватно показывает всё только в ХА, когда оппонентов больше, мы должны учитывать тот фактор, что они сфолдили со своими спектрами.
Например, АК против 22 на столе с фишами 90/0 (которые сфолдили, кроме одного) эквити выше, чем на другом столе, с нитами 3/3.
На пальцах - если фиш со впипом 90 сфолдил, значит у него нет туза, значит вероятность туза в колоде увеличивается. Вообще искажение ЕВ - это достаточно сложный вопрос, я пока не анализировал, как стиль игры влияет на расхождение этой линии от профита, но то, что она есть - определенно.
Кстати, предполагаю, что эта одна из причин, по которой у большинства регов ПС недоборы по ЕВ - многие из них учились по одним водам и играют по более-менее схожей стратегии - соотв. из-за искажения ЕВ тенденции будут одинаковыми.
Чем нитовей поле - тем меньше расхождение ЕВ прог от реального ЕВ, при лузовом поле - разрывы могут быть достаточно большими.
Ну да ладно, это всё конкретно я планировал исследовать позже, перейду к сути дела.
Игра по ICM - неоптимальная модель хотя бы потому, что она не учитывает блинов , ближайшего повышения блинов и связанной с ней войны таймбанков (правда это больше для донов актуально), позиции, агрессивности оппов - т.е. симуляция будущего развития розыгрыша в т.ч. Она много что не учитывает, но даже эттих факторов уже достаточно.
А ев-то считается по ICM!
Т.е. принимая решения -EV, мы вполне можем иметь +Real_Ev А принимая +EV решения, на самом деле принимать -EV_real решения.
Безусловно, на слово никто мне верить в этом не должен - это вполне неочевидно, поэтому будем разбирать на конкретном примере. Распределение призов тут и далее - 50/50
Мы баттон - seat1, блины 100/100
Мы идём оллин, нас коллит ББ с 600 фишками. Рассмотрим для простоты случай с 50% эквити (искл. для простоты счета)
Воспользуемся моделью ICM, по которой и посчитается ЕВ. Пренебрегая дележкой, получим два возможных исхода:
Ev_1=0
Посчитаем Ev_2
баттон на seat2.
Турнирная доля по ЕВ : 313,294 Сравнение по ЕВ: +85.516
Но очевидно, что у нас турнирная доля значительно меньше 398.81 , а у seat 3 соотв. значительно больше из-за блинов, наши турнирные доли не могут быть равны. Значит, матожидание выигрыша в этой модели не совпадает с Ev_ICM. Таким образом, данное сравнение, будучи сравнением +85 по ЕВ, по матожиданию таковым не является.
Вообще тут стоит сказать, что так определять не очень хорошо, т.к. я должен был бы посчитать и true_ev до сравнения а потом их сравнивать. Сделаем это ;)
Определим Real_Ev как lim (n->inf) ($Winnings/n).
Реально же мы этого определить не можем, поэтому рассмотрим Near_real_Ev, которое будет определяться из следующих предположений:
а) Блайнды не растут б) моделирование дальнейшей игры оппонентов.
Near_real_Ev_1 и Near_real_Ev_2 можно получить например, используя метод Монте-Карло (много случайных испытаний, потом вычисляется среднее, кто не знает - гуглите :) )
Я знаю, что ev и мо это полные синонимы, но все так привыкли, что ев - это что-то выдаваемое прогами, что я решил разделить эти термины :)
Кстати, чтобы не пользоваться безусловно сильным аргументом "я гарантирую это!" посчитал реальное матожидание, не по строгому ICM
Real_EV_Fold = 201.9 (откуда взялись цифры - предпочту не писать, но можете быть уверены, что они не из головы взялись, это результат расчета при помощи одного громоздкого алгоритма :) ) Real_Ev_2 = 375.8
fe=0, eq=0.5
Real_+ = 86.95
Мы делаем сравнение в +86.95 , а ХМ считает, что мы сделали сравнение в +85.52
Первый из головы взявшийся пример, даёт разницу в 2%. Можно найти реальные примеры с большей разницей.
А по мнению ХМа, мы перебрали по ЕВ на дистанции :f_cool:
А ведь это только один фактор. Мы ещё не говорили о
а) Card Removal effect в) повышение блинов, из-за чего турнирная доля меняется даже без изменения стеков. Поэтому матожидание_сравнения зависит даже от времени! Сравнение произошло на секунду позже и всё, блины повысились - МО сравнения - другое.
и ещё о некоторых, безусловно, очень важных факторах, из-за которых Ev <> MO
добавлю, что эти расчеты тем актуальней, чем жеще структура.
В нетурбо фактор позиции вносит гораздо меньший вклад, чем в гипертурбо, там наш стек и стек оппонентов редко меньше 3-5 бб
Сообщение отредактировал Groging - 3.8.2012, 19:55
Часть текста оставлю на английском (отвратительном, но сорри, часть поста родилась из дискуссий на 2+2 , просто пост достаточно объемный и все это переписывать лень :)
Кроме того, иногда я буду цитировать статьи и книги, они тоже на английском ---
Что же такое равновесие Неша? Сразу оговорюсь, что достаточно часто распространенная мысль о том, что
nash is an equilibrium for hu play.It has blind size with and without antes and it can be breakeven when both players use nash
неверна.
Равновесие Нэша — так в теории игр называется тип решений игры двух и более игроков, в котором ни один участник не может увеличить выигрыш, изменив своё решение в одностороннем порядке, когда другие участники не меняют решения. Такая совокупность стратегий выбранных участниками и их выигрыши называются равновесием Нэша Игра может иметь равновесие Нэша в чистых стратегиях или в [B]смешанных (то есть при выборе чистой стратегии случайно, но с фиксированной частотой (стохастическая модель) ). Нэш доказал, что если разрешить смешанные стратегии, тогда в каждой игре n игроков будет хотя бы одно равновесие Нэша.[/B]
Но истинное равновесие существовало бы лишь при игре с непрерывными спектрами. Это невозможно, поэтому мы ограничиваемся неким приближением к равновесию Неша в дискретных спектрах.
В равновесии Неша Наша турнирная доля (для кэш-игр турнирная доля равна стеку) до начала раздачу равна равна ожидаемой турнирной доли в конце раздачи (на блайндах ожидаемая доля, естественно, равна -блайнду)
Какие есть пути решения? Вариант 1. Рассмотреть абсолютно все возможные спектры всех игроков. Мощность множества возможных спектров: 52*51~=2500 Мощность множества подмножеств: 2^2500 А это, в свою очередь примерно 10^750. И это только для одного игрока! Для 6 игроков возможных вариантов будет 10^4500!!!
А теперь мы должны взять все варианты и найти тот, в котором отклонение от 0EV у всех минимально
Например, мы можем сделать так: 1) выбираем minimal of sqrt((d1^2+d2^2+...d6^2)), where d1..dn - T$Ev_of_i_player_until_start_of_hand - T$Ev_of_i_player_AFTER_end_of_hand
Это задача исключительно для суперкомпьютеров.
Можно ещё сделать вот что:
Ввести некое множество спектров таких спектров, что каждый более широкий спектр слабее предыдущего. Например, реально мы имеем 200 спектров(в 0%, 0.5%, 1% ... 100%) И мы пытаемся достичь равновесия в этих спектрах
Данным путем пошли разработчики ICM Trainer Но получаем результат мало того, что далек от равновесия, так и ещё эти псевдоНешевы спектры мало близки к реальным спектрам. Но в общем-то, более-менее использовать можно.
Рассмотрим третий путь:
Нам нужен некий алгоритм, который позволяет приблизиться к равновесию Неша. Почитать о нем нужно тут и тут(pdf)
For a good in-detail description of Fictitious Play, please refer to The Mathematics of Poker by Chen/Ankenman. The basic idea is quite simple: Players are iteratively adjusting their strategies, based on their opponents strategy of the last iteration. If the process converges,we found a Nash Equilibrium
Идея1. Разобьем все спектры на пары, одномастные руки и разномастные руки (5 4 и 5 4 имеют одинаковое эквити простив нужных нам спектров)
Таким образом, всего разных комбинаций карт имеется 14*13/2+14*13/2+13=13*15=195
Составляем матрицу размером (14*13/2+14*13/2+13*13)^2=195*195
УПРОЩЕНИЕ. после трех пушей игроки игроки после могут лишь сфолдить
А теперь рассмотрим для хедзапа.
1) Подбираем некие стартовые спектры (топ-50% по версии эквилятора, например)
нынешние спектры - rangeA0 и range B0 (A,B-игроки, 0 - номер итерации)
2)Берем игрока А. Смотрим все 351 комбинаций, какое у них ЕВ против спектра B. ЕВ>=0 в спектре, ЕВ<0 - выкидываем получаем rangeA1 3) Берем игрока B, смотрим все 351 комбинаций, и какое у них EV против rangeA0 (важно!!!) получаем rangeB1 4) повторять (2) с rangeA1 и rangeB1, до получения нужного результаты (например реализовать остановку как то, что разница в спектрах между двумя соседними итерациями не превысила eps)
Пример кода для двух игроков, написано пользователем jukofyork с 2+2
// Use this to calculate the push/call matrices for a given R. void RunFictitiousPlay(const double RRatio,const int MaxIters,const double UpdateRate, double* PushMatrix,double* CallMatrix) { // These are the temp matrices that hold the final NE stratergy. double TempPushMatrix[169]; double TempCallMatrix[169];
// Init the matrices to 0.5 for all values. for (int I=0;I<169;I++) { PushMatrix[I]=0.5; CallMatrix[I]=0.5; }
// Keep running the ficticious play for a set number of iterations. for (int Iter=0;Iter<MaxIters;Iter++) {
// Update SB strategy... // For each possible hand work out if it is +EV or -EV to call vs the main matrix. for (int I=0;I<169;I++) {
// Init EV_Sum to 0 for calling with this hand. double EV_Push=0.0;
// This is the sum of hole multiplicity values. double NormalizationSum=0.0;
// Work out the EV vs each of the opposing hands. for (int J=0;J<169;J++) {
// EV when we push and he dont fold. EV_Push+=CallMatrix[J]*(double)HoleMultiplicityIfHolding[I][J]*(((2.0*RRatio*PWin[I][J])+(RRatio*PTie[I][J]))-RRatio);
// EV when we push and he folds. EV_Push+=(1.0-CallMatrix[J])*(double)HoleMultiplicityIfHolding[I][J]*1.0;
// Keep a total of the sums so we can use to normailize after. NormalizationSum+=(double)HoleMultiplicityIfHolding[I][J];
}
// Normalize the EV_Push value. EV_Push/=NormalizationSum;
// If the sum of EV is +ve then we should play this hand, else we shouln\'t. if (EV_Push>(-0.5)) TempPushMatrix[I]=1.0; else TempPushMatrix[I]=0.0;
}
// Update BB strategy... // For each possible hand work out if it is +EV or -EV to call vs the main matrix. for (int I=0;I<169;I++) {
// Init EV_Sum to 0 for calling with this hand. double EV_Call=0.0;
// This is the sum of hole multiplicity values. double NormalizationSum=0.0;
// Work out the EV vs each of the opposing hands. for (int J=0;J<169;J++) {
// EV when he pushes and we call. EV_Call+=PushMatrix[J]*(double)HoleMultiplicityIfHolding[I][J]*(((2.0*RRatio*PWin[I][J])+(RRatio*PTie[I][J]))-RRatio);
// Keep a total of the sums so we can use to normailize after. NormalizationSum+=PushMatrix[J]*(double)HoleMultiplicityIfHolding[I][J];
}
// Normalize the EV_Push value. EV_Call/=NormalizationSum;
// If the sum of EV is +ve then we should play this hand, else we shouln\'t. if (EV_Call>(-1.0)) TempCallMatrix[I]=1.0; else TempCallMatrix[I]=0.0;
}
// Replace old with new. for (int I=0;I<169;I++) { PushMatrix[I]=((1.0-UpdateRate)*PushMatrix[I])+(UpdateRate*TempPushMatrix[I]); CallMatrix[I]=((1.0-UpdateRate)*CallMatrix[I])+(UpdateRate*TempCallMatrix[I]); //PushMatrix[I]=((1.0-w)*PushMatrix[I]) + (w*TempPushMatrix[I]); //<- True Game Theory method... //CallMatrix[I]=((1.0-w)*CallMatrix[I]) + (w*TempCallMatrix[I]); }
}
} // End RunFictitiousPlay.
Для более, чем двух игроков
3 peoples.
Ranges is start (have more 0.5 equity to any two, for examle, top-50%), fold_eq = 50%
Calculate ICM chip cost ($)
All cases:
Bu SB BB push fold fold push call fold push fold call push call call fold push call .. solve that there is heads-up. fold push fold fold fold give BB&SB
Continuing to consider that range of Button is range_Bu, change range_sb to new
Simillary, range BB change, consider that ranges BU and SB is old
New iteration with new ranges. repeat....
We can use requirement to stop a calculations, for example stop when any ranges(of all players!) on current iteration differ for ranges of previous iteration less or equal 2(or 1) elements.
Вот как-то так.
Теперь выясним следующий факт, всегда ли выгодно играть по равновесию Неша?
Рассмотрим простой пример - камень, ножницы, бумага
Показывая случайным образом их с вероятностями {1/3,1/3,1/3} мы игру с любым соперником будем сводить в 0.
Но если опп играет например с вероятностями {0.33,0.33,0.34} нам выгодно играть {0,1,0} - то есть всегда выбирать ножницы
Рановесием же Неша будут стратегия {1/3,1/3,1/3} против той же. Более того, даже игра одного человека по такой стратегии приводит её к нулевому ЕВ.
В ХА Нешев пуш гарантирует плюсовую игру, в не ХА, к сожалению, это не так. Но применять это иначе как при симуляции, или против сильных регов, или против неизвестных не имеет смысла.
А вот как базовая стратегия, отправная точка - Неш вполне хорош.
Сообщение отредактировал Groging - 3.8.2012, 19:57
Будет настроение почитаю, при беглом взгляде мысли интересные и во многом пересекаются с моими :)
Не стоит ожидать наплыва посетителей только от того, что ты открыл дневник 17 часов назад :) дай людям присмотреться Плюс в снг разделе по миом оценкам не так много активных постеров :) Человек 20-30
прочитал первые два поста - и какбы не совсем понял, чем это прочтение улучшило мою игру. смысл-то на эту тему дискутировать? по нэшу не играю, т.к. помимо пуша есть еще и лимп и минрейз.
sasha-dem @ 2.1.2012 прочитал первые два поста - и какбы не совсем понял, чем это прочтение улучшило мою игру. смысл-то на эту тему дискутировать? по нэшу не играю, т.к. помимо пуша есть еще и лимп и минрейз.
Вопрос об адекватности линии ЕВ - достаточно часто обсуждаемый вопрос. Кроме того, было бы странно, если бы я писал про те вещи, от которых у всех прочитавших рои инста поднимался бы (и думаю, ни один адекватный человек этого писать не будет). Всё, о чём я пишу - либо можно найти в относительно открытых источниках - либо является информацией, для использования которой необходима её пере-/доработка
Сообщение отредактировал Groging - 3.1.2012, 22:47
Многие вещи мы считаем истиной и принимаем без доказательств. В реальности может происходить что угодно, начиная от существования бога, до того, что абсолютно всё, что мы видим вокруг нас - масштабная иллюзия, к которой мы никакого отношения не имеем.
Я могу верить, что абсолютно все люди, кроме меня, обладают магией, и почему-то скрывают это именно от меня. Я могу верить в то, что вселенная - это желудок Огромной Зеленой Черепахи Я могу верить в то, что на самом деле все наши мысли, это некая отыгрываемая кем-то роль, а на самом деле никакой свободы мы не имеем, и все наши мысли появляются не от нас, мы можем и не иметь самосознания Я могу верит в то, что часто вокруг меня происходит нечто, помня о котором сейчас, я бы просто жутчайше изменил все свои взгляды. Но я не помню, потому что мне стирают память Я могу верить во что угодно, и при внутренней непротиворечивости этой веры никто не имеет шансов опровергнуть меня. Даже при противоречивости веры на это шансов мало.
Помните о чайнике Рассела и о Летающем Макаронном монстре ? Вот-вот.
Я верю в законы физики. Почему? Что такое законы мироздания? Некие статистические закономерности, не более. Почему на землю падает яблоко?
а) Господь делает так, ему нравится направлять каждое яблоко к земле. б) Это иллюзия, мы живем в выдуманном мире, яблоки не падают в) Закон всемирного тяготения (а что это?!) Чем он отличается от его Наимакароннейшей десницы?
Каждый из этих вариантов вполне имеет право на жизнь.
Возможно, падение яблок на землю зависит от года в календаре, почему бы и нет? Можно придумать формулу, которая будет зависеть от кучи факторов, и при этом давать нужные нам результаты. Формулы, зависимости? Пфф, мы берем черный ящик и думаем, что знаем, как он работает. Ха-ха.
Физические законы работают лишь в определенной области значений.
Все физические законы - модель. Лишь статистическая модель. Что будет при экстремальных условиях, что будет в будущем - неизвестно! Мы лишь предполагаем, что раз это было много раз, то так произойдет.
Вы сможете оставлять комментарии, оценивать посты, участвовать в дискуссиях и повышать свой уровень игры.
Если вы предпочитаете четырехцветную колоду и хотите отключить анимацию аватаров, эти возможности будут в настройках профиля.
Вам станут доступны закладки, бекинг и другие удобные инструменты сайта.
На каждой странице будет видно, где появились новые посты и комментарии.
Если вы зарегистрированы в покер-румах через GipsyTeam, вы получите статистику рейка, бонусные очки для покупок в магазине, эксклюзивные акции и расширенную поддержку.
Меня зовут Лёша, я учусь на 3 курсе ВМК МГУ и играю помаленьку СНГ и МТТ
[upd от августа 2012] теперь уже только МТТ
Вообще, я веду блог на стратеджи, но думаю пока буду вести оба блога параллельно, а далее посмотрим.
Сюда для начала запощу перепечатки нескольких крупных дискусионно-аналитических постов, которые я постил на стратеджи.
Причины этого - желание пообщаться по этим вопросам и получить некую обратную связь - чем больше - тем лучше :)
Поехали!
[upd]
некоторые мои результаты - на 3 августа 2012
Что-то среднее между
.
и
Опр классно считает ребаи, да
Примерная динамика на графике:
Это старзы.
В других румах профита на пару штук наберется примерно, но мне лень из кучи румов все это выискивать :)