DOI:
10.31063/2073-6517/2018.15-3.6
Для цитирования:
Аннотация:
Классическая теория обучения в повторяющихся играх рассматривает обучение как реакцию на успех или неуспех конкретного выбора в предыдущих периодах игры. Однако на практике возможны и другие правила обучения: например, люди могут подмечать характерные регулярности в поведении оппонента и предсказывать на их основе его дальнейшее поведение. Мы изучаем успешность обучения в соответствии с правилами этого последнего типа на примере экспериментальной игры «Камень, ножницы, бумага». Участники нашего лабораторного эксперимента — 70 студентов и школьников из Москвы — играли в эту игру на протяжении 100 раундов против компьютерного алгоритма, который был запрограммирован играть оптимально против ограниченно рационального игрока, но делал это с переменным уровнем шума. Как и ожидалось, мы получили, что чем менее зашумлена стратегия компьютера, тем успешнее участники эксперимента распознают регулярность в поведении оппонента-компьютера и способны обучаться действовать оптимально против такой программы. Кроме того, игроки лучше выучивают ту часть правил, которая помогает им выигрывать, и хуже учатся на поражениях. Результаты исследования говорят о том, что люди могут успешно использовать процедурно рациональные стратегии, основанные на обучении правилам (rule learning), а не только на реакции на предыдущие успехи или неудачи.
Чернов Григорий Витальевич — аспирант, аспирантская школа по экономике НИУ ВШЭ, стажер-исследователь международной лаборатории экспериментальной и поведенческой экономики НИУ ВШЭ (Москва, Российская Федерация, e-mail: gr.chernov54@ya.ru).
Сусин Иван Сергеевич — аспирант, аспирантская школа по экономике НИУ ВШЭ (Москва, Российская Федерация, e-mail: isusin@nes.ru).
1. Поддьяков А. Н. Нетранзитивность превосходства и ее использование для обмана и тренировки мышления // Психолого-экономические исследования. — 2016. — Т. 3 (9). — № 4. — С. 43–50.
2. Axelrod R., Hamilton W. D. The evolution of cooperation. Science. — 1981. — 211(4489). — Р. 1390–1396.
3. Abrahamyan A., Silva L. L., Dakin S. C., Carandini M., Gardner J. L. Adaptable history biases in human perceptual decisions // Proceedings of the National Academy of Sciences of the United States of America. — 2016. — 113(25). — Р. E3548-E3557.
4. Camerer C., Ho T. H. Experience-weighted attraction learning in normal form games // Econometrica. — 1999. — Vol. 67(4). — P. 827–874.
5. Camerer C. F., Ho T. H., Chong J. K. A cognitive hierarchy model of games // The Quarterly Journal of Economics. — 2004. — Vol. 119(3). — Р. 861–898.
6. Cason T. N., Friedman D., Hopkins E. Cycles and instability in a rock–paper–scissors population game: a continuous time experiment // Review of Economic Studies. — 2013. — Vol. 81(1). — Р. 112–136.
7. Chen D. L., Schonger M., Wickens Ch. oTree. An open-source platform for laboratory, online, and field experiments // Journal of Behavioral and Experimental Finance. 2016. — Vol. 9. — P. 88–97 [Electronic resource]. URL: https://doi. org/10.1016/j.jbef.2015.12.001.
8. Cheung Y. W., Friedman D. Individual learning in normal form games: Some laboratory results // Games and Economic Behavior. — 1997. — Vol. 19(1). — Р. 46–76.
9. Duersch P., Kolb A., Oechssler J., Schipper B. C. Rage against the machines: how subjects play against learning algorithms // Economic Theory. — 2010. — Vol. 43(3). — Р. 407–430.
10. Duersch P., Oechssler J., Schipper B. C. When is tit-for-tat unbeatable? // International Journal of Game Theory. — 2014. — Vol. 43(1). — Р. 25–36.
11. Duersch P., Oechssler J., Schipper B. C. Unbeatable imitation. Games and Economic Behavior. — 2012. — Vol. 76(1). — Р. 88–96.
12. Dyson B. J., Wilbiks J. M. P., Sandhu R., Papanicolaou G., Lintag J. Negative outcomes evoke cyclic irrational decisions in Rock, Paper, Scissors // Scientific reports. — 2016, feb. 5. — Vol. 6 [Electronic resource]. URL: https://www.nature.com/ articles/srep20479.
13. Roth A. E., Erev I. Learning in extensive-form games: Experimental data and simple dynamic models in the intermediate term // Games and economic behavior. — 1995. — Vol. 8(1). — Р. 164–212.
14. Erev I., Roth A. E. Predicting how people play games: Reinforcement learning in experimental games with unique, mixed strategy equilibria // American economic review. — 1998. — Р. 848–881.
15. Fishburn P. C. Nontransitive preferences in decision theory // Journal of risk and uncertainty. — 1991. — Vol. 4(2). — Р. 113–134.
16. Frey S., Goldstone R. L. Cyclic game dynamics driven by iterated reasoning // PloS one. — 2013. — Vol. 8(2). — Р.e56416.
17. Fudenberg D., Levine D. K. The theory of learning in games. — MIT press, 1998.
18. Li Y., Massey C., Wu G. Learning to Detect Change, 2014.
19. Massey C., Wu G. Detecting regime shifts: The causes of under-and overreaction // Management Science. — 2005. — Vol. 51(6). — Р. 932–947.
20. Nagel R. Unraveling in guessing games: An experimental study // The American Economic Review. — 1995. — Vol. 85(5). — Р. 1313–1326.
21. Rabin M., Vayanos D. The gambler’s and hot-hand fallacies: Theory and applications // The Review of Economic Studies. — 2010. — Vol. 77(2). — Р. 730–778.
22. Spiliopoulos L. Strategic adaptation of humans playing computer algorithms in a repeated constant-sum game. Autonomous agents and multi-agent systems. — 2013. — Vol. 27(1). — Р. 131–160.
23. Spiliopoulos L. Pattern recognition and subjective belief learning in a repeated constant-sum game // Games and economic behavior. — 2012. — Vol. 75(2). — Р. 921–935.
24. Shachat J., Swarthout J. T. Do we detect and exploit mixed strategy play by opponents? // Mathematical Methods of Operations Research. — 2004. — Vol. 59(3). — Р. 359–373.
25. Shachat J., Swarthout J. T. Learning about learning in games through experimental control of strategic interdependence // Journal of Economic Dynamics and Control. — 2012. — Vol. 36(3). — Р. 383–402.
26. Tversky A. Intransitivity of preferences. Psychological review. — 1969. — Vol. 76(1).
27. Sony E. Valdez, Barayuga V. J. D., Fernandez P. L. The Effectiveness of using a Historical Sequence-based Predictor Algorithm in the First International RoShambo Tournament. International Journal of Innovative Research in Information Security (IJIRIS). — November 2014. — Vol. 1, Issue 5. — Р. 59–65.
28. Wang Z., Xu B., Zhou H. J. Social cycling and conditional responses in the Rock-Paper-Scissors game // Scientific reports, 2014. — Vol. 4.
29. Weibull J. W. Evolutionary game theory. — MIT press., 1997.
30. West R. L., Lebiere C. Simple games as dynamic, coupled systems: Randomness and other emergent properties // Cognitive Systems Research. — 2001. — Vol. 1(4). — Р. 221–239.