2018 (15), №3

РАСПОЗНАВАНИЕ ЭВРИСТИК И ОБУЧЕНИЕ В ИГРЕ «КАМЕНЬ, НОЖНИЦЫ, БУМАГА»: ЭКСПЕРИМЕНТАЛЬНЫЙ ПОДХОД

DOI:

10.31063/2073-6517/2018.15-3.6

Для цитирования:

Аннотация:

Классическая теория обучения в повторяющихся играх рассматривает обучение как реакцию на успех или неуспех конкретного выбора в предыдущих периодах игры. Однако на практике возможны и другие правила обучения: например, люди могут подмечать характерные регулярности в поведении оппонента и предсказывать на их основе его дальнейшее поведение. Мы изучаем успешность обучения в соответствии с правилами этого последнего типа на примере экспериментальной игры «Камень, ножницы, бумага». Участники нашего лабораторного эксперимента — 70 студентов и школьников из Москвы — играли в эту игру на протяжении 100 раундов против компьютерного алгоритма, который был запрограммирован играть оптимально против ограниченно рационального игрока, но делал это с переменным уровнем шума. Как и ожидалось, мы получили, что чем менее зашумлена стратегия компьютера, тем успешнее участники эксперимента распознают регулярность в поведении оппонента-компьютера и способны обучаться действовать оптимально против такой программы. Кроме того, игроки лучше выучивают ту часть правил, которая помогает им выигрывать, и хуже учатся на поражениях. Результаты исследования говорят о том, что люди могут успешно использовать процедурно рациональные стратегии, основанные на обучении правилам (rule learning), а не только на реакции на предыдущие успехи или неудачи.

Скачать статью в формате PDF
Скачано: 57, размер: 436.2 KB

Чернов Григорий Витальевич — аспирант, аспирантская школа по экономике НИУ ВШЭ, стажер-исследователь международной лаборатории экспериментальной и поведенческой экономики НИУ ВШЭ (Москва, Российская Федерация, e-mail: gr.chernov54@ya.ru).

Сусин Иван Сергеевич — аспирант, аспирантская школа по экономике НИУ ВШЭ (Москва, Российская Федерация, e-mail: isusin@nes.ru).

1. Поддьяков А. Н. Нетранзитивность превосходства и ее использование для обмана и тренировки мышления // Психолого-экономические исследования. — 2016. — Т. 3 (9). — № 4. — С. 43–50.

2. Axelrod R., Hamilton W. D. The evolution of cooperation. Science. — 1981. — 211(4489). — Р. 1390–1396.

3. Abrahamyan A., Silva L. L., Dakin S. C., Carandini M., Gardner J. L. Adaptable history biases in human perceptual decisions // Proceedings of the National Academy of Sciences of the United States of America. — 2016. — 113(25). — Р. E3548-E3557.

4. Camerer C., Ho T. H. Experience-weighted attraction learning in normal form games // Econometrica. — 1999. — Vol. 67(4). — P. 827–874.

5. Camerer C. F., Ho T. H., Chong J. K. A cognitive hierarchy model of games // The Quarterly Journal of Economics. — 2004. — Vol. 119(3). — Р. 861–898.

6. Cason T. N., Friedman D., Hopkins E. Cycles and instability in a rock–paper–scissors population game: a continuous time experiment // Review of Economic Studies. — 2013. — Vol. 81(1). — Р. 112–136.

7. Chen D. L., Schonger M., Wickens Ch. oTree. An open-source platform for laboratory, online, and field experiments // Journal of Behavioral and Experimental Finance. 2016. — Vol. 9. — P. 88–97 [Electronic resource]. URL: https://doi. org/10.1016/j.jbef.2015.12.001.

8. Cheung Y. W., Friedman D. Individual learning in normal form games: Some laboratory results // Games and Economic Behavior. — 1997. — Vol. 19(1). — Р. 46–76.

9. Duersch P., Kolb A., Oechssler J., Schipper B. C. Rage against the machines: how subjects play against learning algorithms // Economic Theory. — 2010. — Vol. 43(3). — Р. 407–430.

10. Duersch P., Oechssler J., Schipper B. C. When is tit-for-tat unbeatable? // International Journal of Game Theory. — 2014. — Vol. 43(1). — Р. 25–36.

11. Duersch P., Oechssler J., Schipper B. C. Unbeatable imitation. Games and Economic Behavior. — 2012. — Vol. 76(1). — Р. 88–96.

12. Dyson B. J., Wilbiks J. M. P., Sandhu R., Papanicolaou G., Lintag J. Negative outcomes evoke cyclic irrational decisions in Rock, Paper, Scissors // Scientific reports. — 2016, feb. 5. — Vol. 6 [Electronic resource]. URL: https://www.nature.com/ articles/srep20479.

13. Roth A. E., Erev I. Learning in extensive-form games: Experimental data and simple dynamic models in the intermediate term // Games and economic behavior. — 1995. — Vol. 8(1). — Р. 164–212.

14. Erev I., Roth A. E. Predicting how people play games: Reinforcement learning in experimental games with unique, mixed strategy equilibria // American economic review. — 1998. — Р. 848–881.

15. Fishburn P. C. Nontransitive preferences in decision theory // Journal of risk and uncertainty. — 1991. — Vol. 4(2). — Р. 113–134.

16. Frey S., Goldstone R. L. Cyclic game dynamics driven by iterated reasoning // PloS one. — 2013. — Vol. 8(2). — Р.e56416.

17. Fudenberg D., Levine D. K. The theory of learning in games. — MIT press, 1998.

18. Li Y., Massey C., Wu G. Learning to Detect Change, 2014.

19. Massey C., Wu G. Detecting regime shifts: The causes of under-and overreaction // Management Science. — 2005. — Vol. 51(6). — Р. 932–947.

20. Nagel R. Unraveling in guessing games: An experimental study // The American Economic Review. — 1995. — Vol. 85(5). — Р. 1313–1326.

21. Rabin M., Vayanos D. The gambler’s and hot-hand fallacies: Theory and applications // The Review of Economic Studies. — 2010. — Vol. 77(2). — Р. 730–778.

22. Spiliopoulos L. Strategic adaptation of humans playing computer algorithms in a repeated constant-sum game. Autonomous agents and multi-agent systems. — 2013. — Vol. 27(1). — Р. 131–160.

23. Spiliopoulos L. Pattern recognition and subjective belief learning in a repeated constant-sum game // Games and economic behavior. — 2012. — Vol. 75(2). — Р. 921–935.

24. Shachat J., Swarthout J. T. Do we detect and exploit mixed strategy play by opponents? // Mathematical Methods of Operations Research. — 2004. — Vol. 59(3). — Р. 359–373.

25. Shachat J., Swarthout J. T. Learning about learning in games through experimental control of strategic interdependence // Journal of Economic Dynamics and Control. — 2012. — Vol. 36(3). — Р. 383–402.

26. Tversky A. Intransitivity of preferences. Psychological review. — 1969. — Vol. 76(1).

27. Sony E. Valdez, Barayuga V. J. D., Fernandez P. L. The Effectiveness of using a Historical Sequence-based Predictor Algorithm in the First International RoShambo Tournament. International Journal of Innovative Research in Information Security (IJIRIS). — November 2014. — Vol. 1, Issue 5. — Р. 59–65.

28. Wang Z., Xu B., Zhou H. J. Social cycling and conditional responses in the Rock-Paper-Scissors game // Scientific reports, 2014. — Vol. 4.

29. Weibull J. W. Evolutionary game theory. — MIT press., 1997.

30. West R. L., Lebiere C. Simple games as dynamic, coupled systems: Randomness and other emergent properties // Cognitive Systems Research. — 2001. — Vol. 1(4). — Р. 221–239.