Как плохому шахматисту победить хорошего
Добавлено: 21 фев 2021, 17:03
Кратко смысл: В матче из 5 партий мы можем в любой игре придерживаться "осторожной" стратегии, при которой вероятность ничьей 0.9, а вероятность нашего проигрыша 0.1, а можем рискованной, где у нас вероятность выигрыша 0.45, а проигрыша 0.55. И оказывается, есть тактика с вероятностью выигрыша матча 0,526 (в этой задаче для простоты игнорируется преимущество белых фигур)Assume that you play a chess match with a friend. If you play timid your probability of making a draw is p = 0.9, the probability to win is 0 and the probability to lose is 0.1. If you play bold you either win with probability q = 0.45, or you lose. Each win brings one point to the score of the winner. The match consists of 5 games. If the score is a tie after the fifth game, then a “sudden death” rule is adopted; that is, whoever wins the next game is a winner of the math; if it is a draw, then the game is repeated with the same rule.
Formulate a Markov decision problem to determine the optimal strategy of your play (to maximize the probability of winning the match) and solve it. Clearly describe the state space, control space, transition probabilities, and the reward function.