IA Póker - Ki nyer?

0 Comments

Most már húsz évvel azóta, hogy Garry Kasparov és a Chess világbajnok közötti hírhedt mérkőzés az IBM szuper számítógépe. Kaszparov elveszett Deep Blue-hoz - és folytatta azzal vádolni a számítógépet, hogy egy tényleges, emberi sakk-mester irányította. Lényegében Kasparov úgynevezett shenanigans. A sakkmester nem volt hajlandó elhinni, hogy egy hideg, számológép meg tudott verni egy gondolkodást, gondolkodást, emberi lényt. A valóság az volt, hogy valószínűleg éppen a Deep Blue merev, kiszámoló jellege miatt volt, amit a gépnek sikerült megvernie az emberi párjaival.

A Deep Blue-nak nem volt képessége arra, hogy kreatív legyen, vagy bármilyen „megvilágosodott” érvelést alkalmazzon - a dolgok gyakran zavarják a megalapozott ítéletet. A Deep Blue arról szólt, hogy a lehető legoptimálisabb módon alkalmazza a sakkjáték szabályait, hogy elérjék az eredményt. A Deep Blue előadása és az azt követő győzelem egy új korszak hajnalát jelentette: a mesterséges intelligencia kora és annak képessége, hogy túlhaladjon, felülmúlja az emberiséget és az emberiséget.

Deep Blue a Big Data korában rendezett.

A verhetetlenek meghatározása

A Deep Blue megdöbbentő sikere ellenére vannak olyan játékok, amelyek a fej közömbös karcolását okozták; még gépszerű fejek is. Ezek közül az egyik a StarCraft - egy valós idejű stratégiai játék, amely magában foglalja a játékos saját katonai bázisának fejlesztését és az azt követő támadást a többi játékoshoz. A StarCraft volt az első eSports játék, és az olyan óriások kutatói, mint a Facebook és a Microsoft, közzétették a StarCraft és az AI képtelensége miatt a játék golyóálló belső működését, elsősorban a játék végtelen számú változójának látszólag végtelen száma miatt. .

Ismerje meg a gépeket, amikor a Hold'em?

Nyilvánvalóan a válasz igen. Az AI fejlesztők A DeepStack kifejlesztett mesterséges intelligenciát, amely képes versenyezni a (humán) póker üzlet legjobbjaival. A DeepStack sikerének titka? Mély gépi tanulás. A DML az emberi agyat utánozza az alapvető gondolkodási folyamataiban, és lényegében lehetővé teszi a gép számára, hogy új trükköket tanítson.

A Texas Hold'em Poker természete az intuíció emberi tulajdonságán alapul. Az intuíció mechanikai változata nyilvánvalóan felfedezhető az AI rendszerek által alkalmazott korábbi stratégiából, amely a játék hátralévő részében minden lépést próbált kiszámítani, és ehelyett csak néhány lépéssel lépett a fejlesztésekhez.

Az új AI módja a dolgoknak (ahogy azt a DeepStack alkalmazza) magában foglalja az algoritmusok és a jövőbeni stratégia folyamatos újraszámítását, amint az új információ elérhetővé válik. Hogyan tanította meg a DeepStack ezt a különleges képességet az alázatos védelemnek? Az 10 000 véletlenszerű pókerjáték helyzeteinél többet dobva.

Keresztelés tűzzel

Az 2016-ben a Póker Nemzetközi Szövetsége harminc három profi pókerjátékost választott ki, és a DeepStack stratégiáinak ellenezte. Miután elválasztottuk azokat az eseteket, amikor a szerencse a stratégia eseteiből nyer, a következtetést vonták le: a DeepStack nyerési rátája több mint 10-szerese volt, mint amit a profi játékosok tisztességes árrésnek tartanak.

A következtetés és a megállapítások egyetértenek a Libratus legújabb sikereivel - egy pókerjátékos AI-val és a Pittsburgi Carnegie Mellon Egyetem kutatóinak agyszüleményével. A Libratus számos, a világ legjobb Texas Hold'em pókerjátékosával szemben lépett fel egy csodálatos 120,000 kezekből. Libratus négyet blöffölött.

Dong Kim egyike volt a gépnek, aki a gépet túlszárnyalta, és azt követően azt jelentette, hogy a félúton már elkezdte gyanítani, hogy Libratus valójában láthatja a kártyáit. Azt is elmondta, hogy nem vádolta Libratus-t a csalásról önmagában, de az AI egyszerűen ilyen jó volt.

Sokan vagyunk

Carnegie Mellon vidám emberei nem tűntek szívesen arra, hogy sokat adjanak a Libratusról vagy a döntéshozatal belső működéséről a stand-off során, de később kiderült, hogy a Libratus nem egy egyedülálló AI, hanem inkább egy három egy közös cél elérése érdekében.

A megerősítő tanulásra támaszkodva, lényegében a próba- és hibamódszer, a Libratus sikerrel járt a játékkal szemben. Kezdve nem tudott semmit a különleges pókerstratégiákról vagy hasonlókról - egyszerűen csak tudatában volt a játék szabályainak. A háromszoros hálózat keretein belül ismételten önmagával szemben játszva minden lehetséges utat és kombinációt felfedezett, így sikeresen felkészült az előtte lévő feladatra.

Mindenesetre meg kell említeni, hogy a Libratus kihasználta az előnyöket, hogy képesek voltak felmérni a helyzetet, ahogyan az minden este a nap fordulója után.

Mégis, minden dolog egyenlő, Libratus felülmúlta az emberi alkotók elvárásait is.

Spin Palace Nincs betéti kaszinó bónusz >>


Forrás: spinpalace.com
IA Póker - Ki nyer? Frissítve: Június 18, 2019 Szerző: Damon
Share kaszinó bónusz: