Strategie vincenti ti portano a successi a lungo termine nel poker online – Registrati gratis!

Le migliori strategie Con le corrette strategie il poker diventa un gioco facile. I nostri autori ti spiegano come vincere passo dopo passo.

I più intelligenti imparano da e con i professionisti internazionali nei nostri live coaching e sul forum.

Poker bonus gratis PokerStrategy.com è gratuito. Inoltre c'è un poker bonus gratis che ti aspetta.

Sei già un membro di PokerStrategy.com? Fai il log in qui

StrategiaNo Limit (NL)

I bluff in una prospettiva di teoria del gioco

Introduzione

In questo articolo
  • Il background matematico
  • Strategie ottimali
  • L’equilbrio di Nash

I bluff sono una parte essenziale del gioco del poker e ogni bravo pokerista dovrebbe averli nel suo repertorio. I giocatori sbagliano se non effettuano mai dei bluff, ma commettono un errore anche se ne fanno troppi. Come trovi il giusto equilbrio? Quando sai che bluffare è una buona idea, quando puoi sapere quando e quanto dovresti bluffare contro certi avversari per giocare in modo redditizio?

Questo articolo si occupa del background matematico dei bluff e usa un approccio teorico al gioco per presentare le possibili strategie.

Dovrei bluffare?

Sei al river. Il board è 6s9hKsAd5c.

Sei abbastanza sicuro che il tuo avversario abbia completato una mano. Dalle sue azioni pensi che abbia probabilmente AA, KK o AK. Tu hai JsTs.

Un progetto mancato. Il piatto è 100€ e ognuno di voi due ha 100€. Tu sei il primo a giocare. Se fai check, perdi. (O il tuo avversario fa check behind e vinci allo showdown, o lui punta e non hai abbastanza soldi per cercare poi di bluffare.)

Supponiamo che il tuo avversario abbia avuto un read corretto su di te e prima della carta del river pensi che tu abbia un progetto. In nome della semplicità, immaginiamo anche che pensi che la probabilità di un colore o progetto mancato (o di una gutshot) sia dell’80%, e ti attribuisce il 20% di possibilità di avere 87 e, con la carta del river, di completare la tua scala.

Se avessi una scala con 87, punteresti per valore. Ma purtroppo questa volta non l’hai pescata. Hai due opzioni: o lasci perdere e fai check, o cerchi di comprare il piatto con un bluff. Supponiamo che quando bluffi vai all-in con i tuoi 100€, che è una puntata dell’ammontare del piatto. Con che frequenza dovresti bluffare?

Come possiamo rispondere a questa domanda?

Per questo abbiamo bisogno di qualche conoscenza matematica. Ma non ti preoccupare, niente di complicato, solo un po’ di algebra elementare e una dose di senso comune. Ah, mi stavo dimenticando della teoria di gioco, ma quello rientra nel senso comune.

Tradurre la domanda in termini matematici

Avremo bisogno di qualche abbreviazione. P starà per pot size, mentre B è la tua bet size. Definiamo la probabilità (vista dalla parte del tuo avversario) che tu abbia la mano vincente con q. Di conseguenza, nel nostro esempio P = €100, B = €100 e q = 0.20. Se non ti piace il nostro presupposto del 20%, puoi modificare questa cifra e il calcolo resta uguale, cambierà solo il risultato. In modo simile, potresti cambiare anche il pot size o l’ammontare della tua puntata. E le abbreviazioni generalizzeranno la questione.

Dobbiamo in qualche modo definire la nostra frequenza di bluff e la frequenza di call del nostro avversario quando puntiamo. Mettiamo che la prima sia x, e la seconda y. Così x significa la probabilità dei nostri bluff. Per esempio, se bluffiamo con il 30% di probabilità (x = 0.3), la nostra frequenza di bluff sarà appena del 30% a lungo termine. In modo simile, y significa la probabilità che il tuo avversario chiami la nostra puntata.

Nel nostro quesito originale quindi ci chiediamo quale sia il valore ottimale di x.

La ricompensa attesa e strategie pure

Per iniziare, torniamo proprio alle origini. Qual è il nostro scopo nel poker? Vincere soldi o più precisamente, vincere più soldi possibili. Ogni volta che prendiamo una decisione, ci chiediamo (o almeno dovremmo chiederci) quale azione pensiamo che ci possa ripagare.

Nel nostro esempio, se avessi la mano vincente, punteresti per valore. Quando punti, il tuo avversario o chiama la tua puntata (parte legata all’y) o passa la sua mano (1 – parte legata all’y). Quando chiama, vinci il piatto attuale più i soldi con cui il tuo avversario chiama la tua puntata: P + B. Quando passa, vinci solo il piatto attuale: P. (`Piatto attuale` si riferisce sempre all’ammontare originario del piatto prima della tua bet). Di conseguenza, se avessi la mano vincente, la tua rciompensa prevista Ew (w sta per `winning`, vincente) sarebbe

Ew = y(P + B) + (1 – y)P.

Per la mano perdente (il tuo progetto mancato), le cose si complicano un po’. Qui o bluffi (parte x), o lasci perdere la mano e fai check (1 – parte x).

Se bluffi, il tuo avversario o chiama la tua bet (parte y) o passa la sua mano (1 – parte y). Quando chiama, perdi la tua puntata, quindi la tua ricompensa è negativa: – B. Quando passa, vinci il piatto attuale: P. Di conseguenza, quando bluffi, la tua ricompensa prevista è data da due casi e sarà

(1 – y)P – yB.

Se fai check (lasci), non vinci nulla, quindi non vieni ripagato. Con questa ricompensa pari a zero, ovvero El (l sta per `losing`, ossia perdente) con la tua mano perdente è

El = (1 – x)0 + x[(1 – y)P – yB]

(combina i casi qui sopra con le corrispondenti probabilità).

Ovviamente, la prima parte è zero e possiamo ometterla e ci da

El = x[(1 – y)P – yB].

Se sai che il tuo avversario non chiama mai (y = 0) – – la tua ricompensa sarebbe:

El, y=0 = xP

Per massimizzare la tua ricompensa attesa devi scegliere x = 1, cioè dovresti sempre bluffare.

Dall’altra parte, se sai che il tuo avversario chiama sempre (y = 1), dovresti essere ripagato così

El, y=1 = – xB

Per massimizzare questo valore ora devi scegliere x = 0, cioè non devi mai bluffare. (Ricordati il motto `Mai bluffare una calling station!`)

Detto in termini teorici di gioco, abbiamo calcolato solo la nostra miglior risposta, conoscendo la strategia del tuo avversario in due casi speciali. Ma questi erano i due estremi, le cosiddette strategie pure. Nella vita reale, il tuo avversario sarà impredicibile. Chiamerà la tua puntata con una determinata probabilità (non 0 e non 1). A livello teorico di gioco diremmo che ha una strategia mista.

Strategie ottimali

E’ interessante che il tuo avversario possa scegliere una frequenza di call quando la tua presunta ricompensa è la stessa indipendentemente dalla strategia scelta (ovvero qualsiasi x). Definiamo questa frequenza di call con yopt (in qualche modo il valore ottimale di y).

E’ abbastanza facile calcolare il valore di yopt. Se ti interessano i particolari, li trovi nell’appendice. Questo il risultato finale

yopt = P/(P + B).

Nel nostro esempio, P = B = €100, quindi yopt = 1/2. Se il tuo avversario chiama esattamente la metà delle volte, non puoi superarlo. Quando il tuo avversario gioca secondo la strategia y = yopt, la tua ricompensa attesa sarà

El,y=yopt = x[PB/(P + B) – PB/(P + B)] = 0.

(Inserisci ciò che abbiamo ottenuto per yopt nell’equazione generale che abbiamo ottenuto per El). Siccome x non appare nell’equazione (veramente non appare nulla, solo zero), qualsiasi strategia (qualsiasi x) tu scelga, non potrai comunque nè aumentare nè diminuire la tua ricompensa prevista.

E’ interessante come yopt dipenda solo dall’ammontare del piatto e della puntata. Non dipende invece da q per esempio. Questo dimostra che yopt non è l’optimum di y in senso universale. Se per esempio q = 1, ovvero il tuo avversario è sicuro che tu abbia la mano vincente, non chiamerà la metà delle volte – infatti, non chiamerà proprio per niente. Poi sceglierebbe la strategia corrispondente a y = 0. Vedremo poi in che senso yopt è ottimale.

In modo simile, puoi scegliere x in modo tale da rendere uguale la sua ricompensa prevista qualsiasi strategia scelga il tuo avversario (qualsiasi y). Come prima, definiremo questo speciale valore di x con xopt. Tuttavia, è un po’ più complicato ricavare il valore di xopt. Omettendo i particolari, alla fine otteniamo

xopt = qB/[(1 – q)(P + B)].

(Se ti interessano i particolari, per calcolare l’espressione qui sopra devi prima ottenere {vedi "la ricompensa prevista vista dal tuo avversario" nell’appendice}. Con questo, {vedi "ottienere il valore di xopt" nell’appendice} è facile. Se bluffi spesso con la tua mano perdente, {vedi ""la ricompensa prevista vista dal tuo avversario" nell’appendice } sarà

Eop = (1 – q)P – qPB/(P + B).

Non essendoci nessun y in questa formula, non può semplicemente cambiare la sua ricompensa.

Nel nostro esempio P = B = €100 e q = 0.2, così xopt = 1/8. Se bluffi con una probabilità di 1/8, il tuo avversario non può superarti nonostante osservi molto e conosca la tua strategia (ovvero sa che x = xopt). Se bluffi più o meno spesso, il tuo avversario osservatore può sfruttare la tua strategia trovando la corrispondente strategia per contrattaccare. Se quindi hai davanti a te un avversario bravo, xopt ti assicura la miglior strategia.

Quante volte un avversario così bravo chiamerà la tua puntata? Questo viene dato da yopt. Se giochi secondo la strategia in cui x = xopt, in realtà potrebbe scegliere qualsiasi strategia. Abbiamo visto che non può aumentare (nè diminuire) la sua ricompensa prevista. Ma se non usa la strategia in cui y = yopt, tu, in qualità di giocatore osservatore, potresti sfruttare il suo errore, scegliendo una risposta ottimale alla sua strategia. L’unico caso in cui non puoi sfruttare la sua strategia è quando sceglie y = yopt – qui, qualsiasi sia la strategia che giochi, la tua ricompensa attesa resterà la stessa. Ma attento, se scegli una strategia diversa da xopt, il tuo avversario può sfruttare il tuo gioco adattando la sua strategia di conseguenza.

Così ora vediamo in che senso xopt e yopt sono ottimali: forniscono delle strategie che non possono essere sfruttate. A livello teorico di gioco questa coppia di strategie (xopt, yopt ) viene chiamata Equilbrio di Nash. Si tratta di un concetto molto importante nella teoria e nell’economia del gioco (sì, lui è lo stesso Nash dell’eroe del film `A beautiful mind`, vincitore del premio Nobel per l’Economia nel 1994!). Questo aspetto gioca un ruolo fondamentale anche nella teoria del poker.

Ricompensa attesa in alcuni casi speciali

Concludiamo con due tabelle che mostrano le tue ricompense previste in alcuni casi speciali. La prima ti fornisce la ricompensa per il tuo progetto mancato (mano perdente), calcolata per l’esempio citato:

La tua strategia La strategia del tuo avversario
Ricompensa prevista (El) Note
x = 0 y = 0 €0 Sei in svantaggio.
Se non bluffi,
non puoi vincere.
y = 1 €0
y = yopt €0
x = 1 y = 0 €100 Bluffa gli assi!
y = 1 - €100
Non bluffare mai un mangiatore di soldi!
y = yopt €0
x = xopt y = 0 €12.5 xopt non è un `optimum universale`.
Se sai di ricevere un call, non bluffare!
y = 1 – €12.5
y = yopt €0

La ricompensa attesa del tuo avversario è il negativo della tua, più i 100€ già nel piatto. (Riceve la tua perdita netta nel round di puntate più il piatto attuale. Ovviamente, quando vinci il piatto, la tua perdita netta è – 100€ e lui non ottiene niente. O prendi il caso più semplice: quando la tua ricompensa prevista è pari a zero, il tuo stack resta intatto – lo stesso di quando è arrivata la carta del river. Di conseguenza il piatto non può essere tuo, ma di qualcu naltro – ovvero lo prenderà il tuo avversario. Nel linguaggio della teoria del gioco, potremmo dire che il nostro gioco di esempio – essendo già al river – non è un gioco che somma zero.)

Mentre tu sai quando stai bluffando e quando invece stai puntando per valore, il tuo avversario non lo sa. Quindi per lui (e forse anche per te), questa tabella è più istruttiva. Ti fornisce la tua ricompensa prevista per il mix delle tue mani vincenti e perdenti. In situazioni simili sarai in vantaggio il 20% delle volte e in svanataggio l’80%. Di conseguenza la tua ricompensa prevista media è qEw + (1 – q)El. (Di nuovo il negativo di questo più i 100€ del piatto attuale costituisce la ricompensa prevista del tuo avversario, Eop.)

La tua strategia La strategia del tuo avversario Ricompensa prevista Note
x = 0 y = 0 €20 Ecco perchè amiamo le calling station!
y = 1 €40
y = yopt €30
x = 1 y = 0 €100 Bluffa gli assi!
y = 1 - €40
Mai bluffare un mangiatore di soldi!
y = yopt €30
x = xopt y = 0 €30 xopt è ottimale nel senso
che il tuo avversario non può
superarti.
y = 1 €30
y = yopt €30

Conclusioni

Quando hai di fronte un bravo avversario, la tua scelta migliore è usare la strategia data dall’equilibrio di Nash: xopt. In questo caso, il tuo avversario giocherà la strategia data da yopt. Altrimenti, sta commettendo un errore (ovvero non è poi un giocatore così bravo) e puoi sfruttare questo errore trovando la miglior risposta alla sua strategia. Se tende a chiamare troppo spesso, bluffa meno. Se lo fa troppo di rado, bluffa di più. Se puoi indovinare la sua frequenza reale di call, puoi calcolare quanto di più (o di meno) dovresti bluffare massimizzando la tua ricompensa attesa, come abbiamo fatto sopra.

Appendice

Ottenere il valore di yopt

Se y = yopt, la tua ricompensa prevista sarà la stessa per tutti i valori di x. Mettiamo innanzitutto che x = 0. Qui non puoi vincere nulla, il che è espresso da questa formula:

El, x=0 = 0.

Ora mettiamo che x = 1. Allora la nostra equazione di El ci da

El, x=1 = (1 – yopt)P – yoptB.

Siccome El, x=0 deve essere lo stesso di El, x=1, otteniamo

(1 – yopt)P – yoptB = 0,

che ci da

(1 – yopt)P = yoptB,
P – yoptP = yoptB,
P = yopt(P + B),

e infine

yopt = P/(P + B).

{la ricompensa prevista vista dal tuo avversario}, {la ricompensa prevista del tuo avversario}:

Cosa vede il tuo avversario

Diamo ora un’occhiata alla mano dalla prospettiva del tuo avversario. Prima trascriviamo la sua ricompensa prevista, Eop. Siccome – diversamente da te – non sa se sei in vantaggio o in svantaggio, la sua ricompensa prevista dipenderà anche da q, quindi è un po’ più complicata:

Eop = – qyB + q(1 – y)0 + (1 – q)[xy(P + B) + x(1 – y)0 + (1 – x)P].

Il primo termine corrisponde al caso in cui hai la mano vincente, punti e lui chiama, perdendo la sua puntata. Il secondo termine si riferisce al caso in cui hai la mano vincente e lui passa non vincendo (nè perdendo) niente. Il resto corrisponde ai casi in cui lui è in testa. La prima parte nella parentesi quadra sta per il caso in cui bluffi e lui chiama, vicendo il piatto attuale più la tua puntata. La parte del mezzo corrisponde al caso in cui bluffi e lui passa, non vincendo nè perdendo nulla, mentre l’ultimo termine si riferisce al caso in cui lasci perdere e lui vince il piatto (o facendo check dopo di te o puntando, inducendoti a passare).

Omettendo i termini pari a zero otteniamo

Eop = (1 – q)[xy(P + B) + (1 – x)P] – qyB.

Se il tuo avversario sapesse che non bluffi mai (x = 0), quale sarebbe la sua miglior risposta? Non chiamerebbe ovviamente. Questo può essere dedotto dal’equazione precedente, se scriviamo 0 al posto di x.

Eop x=0 = (1 – q)P– qyB.

Per massimizzare tutto questo, dobbiamo scegliere y = 0 (mai chiamare).

Dall’altra parte, se il nostro avversario sapesse che bluffi sempre (x = 1), la miglior risposta non sarebbe così ovvia. Per x = 1 otteniamo

Eop x=1 = (1 – q)y(P + B) – qyB = y[(1 – q)(P + B) – qB].

Se

(1 – q)(P + B) – qB > 0,

y = 1 (chiamare sempre) massimizzeremo la ricompensa prevista del tuo avversario.

Se

(1 – q)(P + B) – qB < 0,

dovrebbe scegliere y = 0 (mai chiamare) invece.

(1 – q)(P + B) – qB < 0

ovvero

(1 – q)(P + B) < qB,
P + B – qP – qB < qB,
P + B < q(P + 2B),

che alla fine da

q > (P + B)/(P + 2B).

Nel nostro esempio, quando P = B = €100, se q > 2/3, il tuo avversario non dovrebbe mai chiamare la tua puntata (anche se sa che punti sempre; e perciò in un caso così dovresti smepre bluffare), mentre se q < 2/3, dovrebbe sempre chiamare (se sa che bluffi sempre). Nota che anche questo valore speciale di q dipende solo dall’ammontare del piatto e da quello della puntata.

Ottenere il valore di xopt

Se x = xopt, la ricompensa prevista del tuo avversario sarà la stessa per tutti i valori di y. Come sopra, prendiamo prima y = 0. La nostra equazione per Eop ci da

Eop y=0 = (1 – q)(1 – xopt)P.

Ora prendiamo y = 1. Questa volta otteniamo

Eop y=1 = (1 – q)[ xopt (P + B) + (1 – xopt)P] – qB.

Siccome Eop y=0 deve essere lo stesso di Eop y=1, otteniamo

(1 – q)(1 – xopt)P = (1 – q)[ xopt (P + B) + (1 – xopt)P] – qB,

che ci da

qB = (1 – q) xopt (P + B)

((1 – q)(1 – xopt)P appare da tutte e due le parti, quindi cancella), così alla fine otteniamo

xopt = qB/[(1 – q)(P + B)].

 
Abbreviazioni Significato
Valore nel nostro esempio
P (€)
L’ammontare del piatto 100
B (€) L’ammontare della tua puntata 100
q La probabilitè che
tu abbia la mano vincente
(visto dall’avversario)
0,2
x La tua frequenza di bluff (variabile)
y La frequenza di call dell’avversario (variabile)
xopt La tua frequenza di bluff‘ottimale’ 0,125
yopt La frequenza di call ’‘ottimale’ del tuo avversario 0,5
Ew (€) La tua ricompensa prevista quando hai la mano vincente 100 (1 + y)
El (€) La tua ricompensa prevista quando hai la mano perdente

100x (1 – 2y)

Eop (€) La ricompensa prevista dell’avversario 80[2xy + 1 – x] – 20y

1 Quando lavoriamo con delle probabilità, di solito scriviamo 0.2 invece di 20%, 0.5 invece di 50%, etc. In questa situazione, la probabilità di un evento impossibile è 0 (0%), mentre una `cosa sicura` ha una probabilità 1 (100%). La probabilità di qualsiasi altra cosa deve essere tra 0 e 1.

 

Questo non è l'articolo intero...

Diventando gratuitamente un membro di PokerStrategy.com, otterrai un capitale gratuito con cui iniziare a giocare a poker e, inoltre, potrai accedere a centinaia di articoli strategici come questi - potrai sfruttare video di poker, sessioni di live coaching e forum di strategia. Registrati ora gratuitamente e inizia a giocare per sbloccare tutte le nostre offerte.

Registrati ora

Commenti (2)

#1 PonteDeiSospiri, 25.12.10 12:00

In effetti mancava un po' di teoria del bluff..! <br /> <br /> Veramente ben fatto, complimenti! (^_^)

#2 Thukam, 10.10.15 11:15

L'asso di quadri sul board al turn si vede nei sorgenti della pagina ma per qualche motivo è nascosto e non visualizzato dal browser....dategli una rassettata!