¿Puede el solver ganar en NL25? La respuesta parece demasiado obvia. Por supuesto que puede, ¿verdad? Pero no estoy nada convencido. Por supuesto, estamos hablando del winrate después de pagar el rake; no es tan fácil superar este límite con el rake. Sí, hay muchos regulares débiles y aficionados en este límite, pero el rake es realmente alto.

Tratemos de abordar el problema de manera lógica. Discutiremos el rake, las fortalezas del solver, en qué supera a todos los rivales, y luego hablaremos sobre las situaciones en las que el winrate del solver será más bajo que el de los regulares. Comparémoslo con los regulares débiles, luego con los fuertes, cuyas tasas de ganancias en NL25 son conocidas para nosotros. Este es un buen punto de partida. A continuación, quiero hablar sobre por qué a la gente le gusta tanto repetir las acciones del solver y por qué esto no siempre es correcto. Tal vez incluso pueda convencer a algunos de ustedes de que dejen de copiarlo. Si los entrenadores me escuchan y obligan a los alumnos a jugar estrictamente de acuerdo con el solver, tal vez se pregunten por qué lo hacen: ¿porque es útil para el jugador o porque es más fácil? Y luego emitiremos un veredicto.

Así que el rake. El rake es el impuesto que pagamos cuando ganamos botes. Equivale a un porcentaje del pozo y un límite superior. En Zoom25 en PokerStars, el límite superior parece rondar las 8bb y la tajada es del 5%. Es decir, cuando ganas un bote estándar de 200 ciegas, pagas menos del 5%, pero solo un poco. En límites más altos, el límite superior del rake disminuye y la carga se vuelve ligeramente menor. Si calcula el rake en NL25 en bb/100, estará entre 7.5 y 9 bb. Eso es muchísimo. Probablemente, una parte de él se puede recuperar a expensas del rakeback, pero olvidémoslo por un momento. Es muy difícil ganar el juego con tal comisión, incluso cuando superas notablemente al field. Por lo tanto, la cuestión de si el solver puede vencer al rake en este límite me parece abierta.

Por supuesto, ahora estoy hablando de 6-max. El heads-up es otro asunto. Allí se juegan casi todas las manos, el botón se retira solo en el 15% de las manos y en el 85% restante puede usar la ventaja de posición. En 6-max, entramos al pozo con mucha menos frecuencia. Si su VPIP está alrededor del 22% óptimo, esto significa que de 70 a 80 veces de cada 100 simplemente foldeará sus cartas. Habrá J4o en cutoff, y ochos cuando te llegue una subida y un 3bet, y así sucesivamente. Por lo tanto, el winrate será menor en comparación con el heads-up.

Nos encontramos en un mundo hostil desde el principio: por un lado, tarifas altas, por el otro, la necesidad de retirarse de muchas manos antes del flop. Y aunque un solver que juega una estrategia de equilibrio de Nash no explotable, por definición, no perderá ante la gente sin tener en cuenta el rake, no hay garantía de que permanecerá en números positivos después de pagar la comisión.

¿De qué manera un solver es superior a un humano? Primero, en equilibrio y no explotación. No hay agujeros en su estrategia, todas las frecuencias son perfectas. Ninguna cantidad de ajustes te ayudará a aumentar tus expectativas contra él. Su algoritmo se basa en el equilibrio. (Por supuesto, se puede crear un bot que juegue con un estilo de explotación, pero estamos hablando específicamente del solver GTO). Su fortaleza es que incluso si conoce su estrategia exactamente, ninguna cantidad de ajustes lo ayudará a aumentar la expectativa en su contra.

¿Qué importancia tiene esto en la práctica? ¿Qué tan valioso es que el oponente no pueda explotarte, incluso conociendo tu estrategia en todos sus matices? Si quieres, piénsalo bien. En mi opinión, no traerá ningún beneficio. Incluso si hubiera vulnerabilidades en la estrategia del solver, la gente nunca las revelaría.

En segundo lugar, el solver selecciona las líneas con el EV máximo con mucha más precisión. Si el GTO considera que una apuesta de continuación en una textura en particular con una mano en particular es un error, el solver no cometerá ese error. Si una mano tiene suficiente valor de showdown como para no farolear en el turn, el solver no faroleará. Una vez en el river, con un bluff catcher con un mal blocker, no pagará la apuesta de su oponente.

Es valioso. Pero el valor de la infalibilidad no es absoluto. Está claro que el bot mostrará un resultado mucho mejor que el pez que pierde cometiendo errores graves y costosos. Sin embargo, cuando comparamos el ideal del solver con las soluciones de los regulares cercanos a cero, que han aprendido bastante bien a evitar errores obvios, ¿quién dijo que la diferencia será tan grande? Escucho sus objeciones: “¡Vamos! ¿Qué absurdo? ¡Por supuesto, el solver jugará mucho más fuerte!” Quiero asumir el papel de abogado del diablo y discutir con una declaración tan trivial.

La precisión ideal de un solver en situaciones límite son pequeños trazos en el gran lienzo del juego. ¡Los trazos grandes son soluciones simples y obvias, así como un exploit descarado!

Los movimientos contundentes contra ciertos tipos de jugadores tienen un impacto mucho mayor en la tasa de ganancias que los toques finos basados ​​en blockers y otras sutilezas teóricas. Enfrentando un pez en tilt que ha perdido la capacidad de foldear, el solver hará algo que ningún regular haría: en respuesta a una apuesta del pozo en el turn, hará check-raise e irá all-in en el river no solo con manos de valor, sino también con faroles. Por supuesto, su valor recuperará todo el EV perdido en los faroles, pero el punto aquí es que no solo un reg fuerte, sino también un regular bastante promedio jugará su valor de la misma manera, pero disminuirá la velocidad con los bluffs, viendo con qué oponente tiene que lidiar. Dudo que el juego sin errores del solver le dé tantas ganancias en contra de los peces como las que obtendría un regular con sus ajustes toscos. Este es mi principal argumento.

39405-1679509295.jpg

Me encantaría saber siempre la línea teórica ideal y el EV de cada acción durante la mano, pero no creo que muchas pequeñas ventajas compensen algunas grandes ventajas de los ajustes afilados contra los fishes. En NL25, el dinero proviene de los jugadores débiles. Es por eso que la selección juega un papel clave en este límite. Es por eso que Garrett Adelstein se desempeñó tan bien en las transmisiones de cash de Hustler, porque terminó en una mesa llena de jugadores recreativos. No es coincidencia que los buenos regulares estén tan obsesionados con la selección. Como mostraron los cálculos en mi grupo de Discord, un jugador perdedor agrega 5-8 bb/100 al winrate del resto. Esto es más que cualquier ventaja que un reg superior pueda obtener sobre un reg débil.

El solver jugará con más precisión que los regulares, pero nunca se desviará del equilibrio. Un regular, jugando contra un fish, hará muchas más desviaciones positivas que negativas. Cuando me siento en una mesa de zoom200 o zoom500 con cuatro regulares y un pez, hago ajustes muy duros contra los fishes que tienen muchas probabilidades de ser rentables. No puedo calcular, pero intuitivamente me parece que estos ajustes afectarán la tasa de ganancias más que la precisión del solver.

Sé por la práctica del coaching que un regular débil juega con un winrate de -2...-3bb/100, a veces incluso -5bb/100. Los regulares más fuertes en el límite lo vencen con una tasa de ganancias de 3-4bb/100; los winrates más altos en NL25 son muy difíciles de obtener sin una selección seria y una muy buena comprensión de los oponentes débiles, aunque esto también es posible. Por lo tanto, la diferencia entre regulares débiles y fuertes no es tan grande: 6-7bb/100 como máximo.

Al mismo tiempo, incluso un regular débil obviamente jugará muchos botes grandes contra fishes desequilibrados de manera más eficiente que un solver.

Cuando discutí este tema en Twitter, a menudo surgía el siguiente contraargumento: el solver aplastará a los oponentes porque hará faroles mucho más a menudo y con más fuerza, lo que obligará a las personas a cometer errores costosos. Estoy parcialmente de acuerdo, pero todos sabemos que hay situaciones en las que el fold equity es cercano a cero, y en el mundo de los solvers no hay ninguna, y la máquina se golpea la cabeza contra la pared y bluffea irremediablemente en las líneas más fuertes. Por otro lado, hay botes pequeños en los que los aficionados a menudo se exceden monstruosamente, y los regulares explotan esta debilidad con mucha más frecuencia que el solver. Entonces, otra pregunta es quién ganará más sin un showdown: ¡un solver o un buen regular!

Tal vez no crea que mis argumentos son lo suficientemente convincentes y permanece en su opinión de que el solver destruiría NL25. Tal vez dudaste y piensas que hay algo en eso. No pido más.

Pero, ¿por qué la gente está tan preocupada por el éxito hipotético del solver? ¿Por qué les cuesta tanto aceptar la posibilidad de que la máquina no le gane al rake? En los comentarios, muchos han entrado en la etapa de negación total sin argumentos serios. No quiero ofender a nadie, pero no veo de dónde vendrán los EV adicionales para compensar la falta de un exploit difícil.

Probablemente, el punto es que a la gente le resulta muy atractivo llegar a un juego ganador simplemente copiando las líneas del solver. Sin embargo, este es un concepto dañino y equivocado del que te insto a que te deshagas de él lo antes posible. La gente tiende a buscar un apoyo confiable para protegerse del caos. La incertidumbre da miedo. Necesitamos orden y estamos buscando protección del solver. Sin embargo, piensa por ti mismo: ¿lo que hace el robot contra una estrategia que nadie usa contra nosotros puede generar la máxima expectativa? Si da una respuesta positiva, simplemente no entiendo su lógica. Parece ser sólo una cuestión de fe.

No me malentiendas. No descuido la teoría. Creo que esa teoría es increíble, ¡qué genial! Pasé años aprendiendo de un solver cómo funciona el poker. Pero jugar en una mesa real es un caos, y debe aceptarse tal como es. En cada mano jugamos contra un oponente con una estrategia específica, no contra la máquina con la que practicamos anoche. Y nuestra tarea es comprender rápidamente sus diferencias.

Finalmente, analicemos los datos empíricos. No, no jugué 100.000 manos con una ayuda de GTO, eso no sería ético. Sin embargo, tengo datos de entrenamientos en GTO Wizard donde las respuestas de los jugadores se pueden comparar con las líneas del solver: el programa calcula la diferencia en EV contigo. Lo creas o no, conozco personas que no pueden vencer en NL5, pero son fanáticos del GTO y están muy cerca de resolver las líneas: ¡sus decisiones son solo 2-3bb/100 peores que las del soft! Parece que estar cerca del GTO tiene poco efecto en su tasa de ganancias prácticas.

También experimentamos con un par regulares cercanos a 0 de zoom500. Sus resultados en GTO Wizard fueron casi indistinguibles de los del solver. Por lo tanto, estando en su lugar, el solver jugaría sólo microscópicamente mejor, y esto es incluso antes de los ajustes para los oponentes. Lo más probable es que el solver no supere zoom500.

¿Superará un límite mucho más débil (aunque con un rake más alto)? Es un problema complejo. Si me obligan a responder, diría, más bien, que no. 70/30, lo que significa que no.