Legyőzhetetlen pókerprogramot fejlesztettek


A tudósok szerint az algoritmus úgy játssza a póker népszerű verzióját, a Texas Hold’emet, hogy sosem hibázik. A szinte tökéletes stratégia hasznos lehet többek között a biztonsági berendezéseknél. A programnak olyan a stratégiája, hogy valószínűleg egy végigpókerezett emberöltő alatt sem lehetne legyőzni – tudósított a BBC hírportálja a Science tudományos lapban megjelent tanulmányról. Az algoritmust az interneten most ki lehet próbálni. Mióta a tudósok játékokat játszó mesterséges intelligenciákat fejlesztenek, több olyan eset is híressé vált, amikor a számítógép programja jobb stratégiát dolgozott ki, mint a legjobb emberi játékos. Az IBM Deep Blue nevű szuperszámítógépe 1997-ben például megverte Gary Kaszparov sakkvilágbajnokot.

Ám ezeket a gépi győzelmeket úgynevezett „tökéletesen informált játékokban” aratták, azaz ott, ahol minden játékos tud mindent arról, ami a játszmában a döntéshozatal előtt történt. A pókerben ez azonban nem így van, a játékosok nem tudhatják, partnereiknek milyen lapokat osztottak. Az új pókerprogram „megtanította magának”, hogyan legyen úrrá ezen az információhiányon. Sok milliárd játszmát játszott végig, és úgy fejlesztették, hogy rögződjön benne minden olyan döntés, amely nem az optimális eredményhez vezetett. „Modellünk két hónapon át pókerezett, minden másodpercben leosztások milliárdjait játszotta le, többet, mint amennyit az egész emberiség le tudna játszani, tehát bizonyos értelemben nem meglepő, hogy kialakította a tökéletes stratégiát” – mondta Michael Bowling, az Albertai Egyetem munkatársa, a kutatás vezetője. Noha játékosnak tűnhet a projekt, a játékelméleten alapuló eredményeknek számos terület vehetik hasznát. A repülőtéri biztonsági ellenőrzőpontok automatikus rendszereit például lehet úgy tervezni, hogy a pókerhez hasonló bizonytalanságot és hiányzó információt is beépítsék. MTI

Nyomj egy lájkot is, ha tetszett a cikk