Дослідники з американського університету Карнегі-Меллон розробили алгоритм, який виграв майже 2 млн доларів у одному з різновидів покеру.
Програма, яка має назву Libratus, перемогла чотирьох кращих професійних гравців у покер в безлімітному Техаському Холдемі, пише ресурс EurekAlert!.
У своїй статті автори програми детально пояснили, як їй вдалося домогтися надлюдської продуктивності, розбиваючи гру на керовані частини і, ґрунтуючись на грі своїх опонентів, усувати можливі недоліки в своїй стратегії під час змагань. Libratus використовує тристоронній підхід для обліку прихованої інформації.
Як зазначають розробники, їхня версія штучного інтелекту вміє знаходити спільні риси у різних комбінаціях карт, ставок і інших елементів гри, і вважати їх приблизно одним і тим же варіантом розвитку подій. Такий підхід значною мірою спрощує гру і дозволяє знаходити прості рішення для найочевидніших комбінацій карт і варіантів ходів суперника.
«Прийоми, які ми розробили під час створення цієї системи штучного інтелекту, не специфічні для покеру, їх можна застосовувати в будь-яких ситуаціях, коли немає повної інформації для прийняття рішень», – заявив Ной Браун з Університету Карнегі-Меллон.
Libratus складається з трьох модулів. Перший обчислює так звану абстракцію гри, ґрунтуючись на загальних рисах між ставками та комбінаціями. Це дозволяє програмі розробити детальну стратегію на перші раунди торгівлі та грубу стратегію для наступних раундів.
Під час гри другий модуль змінює стратегію в залежності від дій противника. Це робиться за допомогою суперкомп’ютера Bridges. Кожного разу, коли суперник робить хід, який не передбачався початковою стратегією, модуль робить відповідні обчислення. Третій модуль призначено для поліпшення стратегії під час партії.