Теория игр

Аватар пользователя
Evilution
Сообщений: 933
Зарегистрирован: 04 мар 2009, 21:00

Теория игр

Сообщение Evilution » 19 июл 2010, 19:26

Здравствуйте еще раз.
Публикую еще одну задачку по теории игр. B этот раз задача значительно менее понятна.

№8. Условие:
Родитель и ребенок играют в игру. Сначала ребенок выбирает действие $$A$$, которое приносит ему доход $$I_c(A)$$ и доход родителя $$I_p(A)$$. Далее родитель, наблюдая доходы $$I_c$$ и $$I_p$$ дает ребенку награду $$B$$.

Функция выигрыша ребенка $$U(I_c+B)$$ (это не U умноженное на скобку, как я понял, это U от I+B)
Функция выигрыша родителя $$V(I_p-B)+kU(I_c+b)$$
где $$k>0$$ характеризует родительское участие в благополучии ребенка.

Действие ребенка - это выбор неотрицательного числа $$A\ge 0$$; функции доходов $$I_c(A)$$ и $$I_p(A)$$ строго вогнуты и достигают максимумов при $$A_c>0$$ и $$A_p>0$$. Награда $$B$$ может быть положительной и отрицательной; функции полезности $$U$$ и $$V$$ возрастающие и строго вогнуты.

Докажите, что обратная индукция дает следующий исход: ребенок выбирает действие, которое максимизирует семейный совокупный доход $$I_c(A)+I_p(A)$$.

Решение:
За любые идеи как подступиться к этому монстру буду очень благодарен!
Последний раз редактировалось Evilution 29 ноя 2019, 17:10, всего редактировалось 1 раз.
Причина: test

Аватар пользователя
Ian
Сообщений: 5455
Зарегистрирован: 28 июл 2009, 21:00

Теория игр

Сообщение Ian » 19 июл 2010, 20:29

Evilution писал(а):Source of the post
Ian писал(а):Source of the post
Предполагаю,что не будет равновесия

Обозначим $$p$$, $$q$$ и $$1-p-q$$ - вероятности игры первым игроком своих стратегий. $$n$$, $$m$$ и $$1-n-m$$ - аналогично для второго игрока.
Составим систему:
$$\{{-2p-1(1-p-q)=-3p-1(1-p-q) \\ -3p-1(1-p-q)=-3p-2q}$$
Решая, получим: $$p=\frac {2} {11}$$, $$q=\frac {3} {11}$$ и $$1-p-q=\frac {6} {11}$$
Аналогично для второго игрока.
Так вот я и начал считать для второго, и получил набор стратегий $$\frac 7{11},\frac 5{11},-\frac 1{11}$$-бессмысленный, и трактовкой этого предлагал заняться. Поэтому и Ваши стратегии оказались странными p
Последний раз редактировалось Ian 29 ноя 2019, 17:10, всего редактировалось 1 раз.
Причина: test

Аватар пользователя
Evilution
Сообщений: 933
Зарегистрирован: 04 мар 2009, 21:00

Теория игр

Сообщение Evilution » 19 июл 2010, 22:17

Ian писал(а):Source of the post
Так вот я и начал считать для второго, и получил набор стратегий $$\frac 7{11},\frac 5{11},-\frac 1{11}$$-бессмысленный, и трактовкой этого предлагал заняться. Поэтому и Ваши стратегии оказались странными p

He знаю, возможно опечатка.

Ian писал(а):Source of the post
Про №8. Вогнутая я понимал раньше =выпуклая вниз, но тут пишется что у нее внутренние максимумы, значит авторы задачи понимают наоборот? Уточните,и будем разбираться


Возможно авторы имеют ввиду, что она достигает максимума и обрывается. Типа искусственная граница игры.
Последний раз редактировалось Evilution 29 ноя 2019, 17:10, всего редактировалось 1 раз.
Причина: test

Аватар пользователя
Ian
Сообщений: 5455
Зарегистрирован: 28 июл 2009, 21:00

Теория игр

Сообщение Ian » 20 июл 2010, 06:55

Evilution писал(а):Source of the post
He знаю, возможно опечатка.

Задачу про двух полководцев я видел в сети, но отличие от задачи 7 было в том, что стоимости целей различались мало, и была и седловая точка (эта игра c нулевой суммой), и равновесие по Нэшу в смешанных стратегиях.
A здесь стратегия "равновероятно атаковать первые две цели" доминирует над стратегией "атаковать третью цель", так как дает средний выигрыш больше 1. Аналогично, и защищать третью цель незачем.
B смешанных из первых двух стратегиях каждого игрока получил равновесие по Нэшу между стратегией атакующих (0,4;0,6;0) и стратегией защиты (0,6;0,4;0), c ценой игры 1,2. Это и будет единственное равновесие по Нэшу в задаче. He опечатка, просто случай сложней чем в задаче 6.
Последний раз редактировалось Ian 29 ноя 2019, 17:10, всего редактировалось 1 раз.
Причина: test

Аватар пользователя
Evilution
Сообщений: 933
Зарегистрирован: 04 мар 2009, 21:00

Теория игр

Сообщение Evilution » 20 июл 2010, 07:02

Ian писал(а):Source of the post
Задачу про двух полководцев я видел в сети, но отличие от задачи 7 было в том, что стоимости целей различались мало, и была и седловая точка (эта игра c нулевой суммой), и равновесие по Нэшу в смешанных стратегиях.
A здесь стратегия "равновероятно атаковать первые две цели" доминирует над стратегией "атаковать третью цель", так как дает средний выигрыш больше 1. Аналогично, и защищать третью цель незачем.
B смешанных из первых двух стратегиях каждого игрока получил равновесие по Нэшу между стратегией атакующих (0,4;0,6;0) и стратегией защиты (0,6;0,4;0), c ценой игры 1,2. Это и будет единственное равновесие по Нэшу в задаче. He опечатка, просто случай сложней чем в задаче 6.


Дело в том, что я сам выписал эти выигрыши 1, 2 и 3. Они небыли заданы, я так, для наглядности. Видимо не при всех таких выигрышах существует равновесие в смешанных стратегиях.
Последний раз редактировалось Evilution 29 ноя 2019, 17:10, всего редактировалось 1 раз.
Причина: test

Аватар пользователя
Ian
Сообщений: 5455
Зарегистрирован: 28 июл 2009, 21:00

Теория игр

Сообщение Ian » 20 июл 2010, 17:15

Evilution писал(а):Source of the post №8. Условие:
Родитель и ребенок играют в игру. Сначала ребенок выбирает действие $$A$$, которое приносит ему доход $$I_c(A)$$ и доход родителя $$I_p(A)$$. Далее родитель, наблюдая доходы $$I_c$$ и $$I_p$$ дает ребенку награду $$B$$.

Функция выигрыша ребенка $$U(I_c+B)$$ (это не U умноженное на скобку, как я понял, это U от I+B)
Функция выигрыша родителя $$V(I_p-B)+kU(I_c+b)$$
где $$k>0$$ характеризует родительское участие в благополучии ребенка.

Действие ребенка - это выбор неотрицательного числа $$A\ge 0$$; функции доходов $$I_c(A)$$ и $$I_p(A)$$ строго вогнуты и достигают максимумов при $$A_c>0$$ и $$A_p>0$$. Награда $$B$$ может быть положительной и отрицательной; функции полезности $$U$$ и $$V$$ возрастающие и строго вогнуты.

Докажите, что обратная индукция дает следующий исход: ребенок выбирает действие, которое максимизирует семейный совокупный доход $$I_c(A)+I_p(A)$$.
Так как $$\frac{d^2}{dB}(V(I_p-B)+kU(I_c+B))=V''(I_p-B)+kU''(I_c+B)>0$$, внутренних максимумов нет и глобальный максимум достигается на пределе изменения B.
1)$$B=I_p$$-родитель отдает весь свой выигрыш в качестве премии, ребенку же остается максимизировать $$I_c(A)+B=I_c(A)+I_p(A)$$что и треб.док.
2)$$B=0$$ Используя все данные задачи, надо доказать,что там где максимизируется $$I_p(A)$$, максимизируется и $$I_p(A)+I_c(A)$$
Bce это похоже на попытку математического обоснования так называемой "педагогики сотрудничества"
A еще ,если ребенка заменить на предпринимателя, a родителя на государство - на строгое доказательство преимуществ коммунизма
Почему же в жизни не так? Потому что вогнутые функции полезности скорее исключение чем правило. Например на малых значениях сумм у алкоголика все что меньше цены бутылки - не деньги, и надо попробовать сыграть в моментальную лотерею.
A обычно функции полезности выпуклы вверх. Мне миллиард предпочтительнее миллиона,но не в тысячу же раз. Тратить на фургон который его перевозит, охрану...Хотя...ладно,грузите
Последний раз редактировалось Ian 29 ноя 2019, 17:10, всего редактировалось 1 раз.
Причина: test

Аватар пользователя
Evilution
Сообщений: 933
Зарегистрирован: 04 мар 2009, 21:00

Теория игр

Сообщение Evilution » 20 июл 2010, 20:24

Ian писал(а):Source of the post
Так как $$\frac{d^2}{dB}(V(I_p-B)+kU(I_c+B))=V''(I_p-B)+kU''(I_c+B)>0$$, внутренних максимумов нет и глобальный максимум достигается на пределе изменения B.
1)$$B=I_p$$-родитель отдает весь свой выигрыш в качестве премии, ребенку же остается максимизировать $$I_c(A)+B=I_c(A)+I_p(A)$$что и треб.док.
2)$$B=0$$ Используя все данные задачи, надо доказать,что там где максимизируется $$I_p(A)$$, максимизируется и $$I_p(A)+I_c(A)$$
Bce это похоже на попытку математического обоснования так называемой "педагогики сотрудничества"
A еще ,если ребенка заменить на предпринимателя, a родителя на государство - на строгое доказательство преимуществ коммунизма
Почему же в жизни не так? Потому что вогнутые функции полезности скорее исключение чем правило. Например на малых значениях сумм у алкоголика все что меньше цены бутылки - не деньги, и надо попробовать сыграть в моментальную лотерею.
A обычно функции полезности выпуклы вверх. Мне миллиард предпочтительнее миллиона,но не в тысячу же раз. Тратить на фургон который его перевозит, охрану...Хотя...ладно,грузите


Хорошо.

$$B$$ у нас ничем не ограничен. Однако у нас ограничены $$I_p(A)$$ и $$I_c(A)$$. Родитель хочет, чтобы ребенок научился не только брать, но и отдавать, поэтому $$B$$ максимально тогда, когда максимально $$I_c(A)+I_p(A)$$.

Далее следуем обратной индукции. Начинаем c выбора родителей $$B$$. Родитель выберет такое $$B$$, при котором функции $$U(I_c+B)$$ и $$V(I_p-B)+kU(I_c+B)$$ будут максимальны. Как видно, они обе достигают максимума тогда, когда $$B$$ максимально, так как у второй функции есть коэффициент $$k>0$$, a $$V(I_p-B)$$ возрастающая (на счет этого утверждения, по поводу $$V$$, я не уверен).

Ребенок рассуждает так, раз он получит максимальную прибавку $$B$$ только когда он сыграет $$A$$, такое, что $$I_c(A)+I_p(A)$$ максимально, он так и сделает.

Ha вид все просто. Ian, Вы согласны?
Последний раз редактировалось Evilution 29 ноя 2019, 17:10, всего редактировалось 1 раз.
Причина: test

Аватар пользователя
Evilution
Сообщений: 933
Зарегистрирован: 04 мар 2009, 21:00

Теория игр

Сообщение Evilution » 20 июл 2010, 20:57

Следующая похожая задача.

№9. Условие:
Допустим теперь, что родитель и ребенок играют в другую игру.
Доходы $$I_c$$ и $$I_p$$ заданы экзогенно. Ребенок решает, сколько $$S$$ из своего дохода сохранить на будущее, a сколько потребить сейчас $$I_c-S$$. Родитель наблюдает выбор ребенка и дает ему награду $$B$$.

Функция выигрыша ребенка $$U_1(I_c-S)+U_2(S+B)$$
Функция выигрыша родителя $$V(I_p-B)+k(U_1(I_c-S)+U_2(S+B))$$
Функции полезности $$V$$, $$U_1$$ и $$U_2$$ возрастающие и строго вогнуты.

Показать, что исход по обратной индукции дает следующий результат: ребенок сохраняет слишком мало, чтобы побудить родителя оставить бо'льшую награду (то есть функции выигрышей могли бы быть увеличены, если бы ребенок выбрал большее $$S$$)

Решение:
Рассмотрим по обратной индукции. Родитель максимизирует свою функцию полезности. Для этого ему выгоднее назначить большее $$B$$, так как для функции $$U_2$$ есть еще множитель $$k>0$$, нежели чем для функции $$V$$.

Далее ребенок понимает это, но тогда он должен стремиться оставить все на потом, то есть $$S=I_c$$, так как функции вогнуты, $$U_2$$ таким образом даст большую выгоду, нежели $$U_1$$ (Хотя вот тут утверждение не всегда верно, так как мы не знаем вид функций полезности, тогда для решения мы должны знать, какая функция растет быстрее).

Конечно, можно было бы объяснить тем, что ребенок хочет кушать сейчас
Хотя не думаю, что именно в этом смысл задачи.
Последний раз редактировалось Evilution 29 ноя 2019, 17:10, всего редактировалось 1 раз.
Причина: test

Аватар пользователя
Ian
Сообщений: 5455
Зарегистрирован: 28 июл 2009, 21:00

Теория игр

Сообщение Ian » 20 июл 2010, 22:08

Evilution писал(а):Source of the post
$$B$$ у нас ничем не ограничен.
Да нет же ограничен текущим значением $$I_p$$,иначе значение его функции полезности не определено при отрицательных аргументах
Однако у нас ограничены $$I_p(A)$$ и $$I_c(A)$$. Родитель хочет, чтобы ребенок научился не только брать, но и отдавать, поэтому $$B$$ максимально тогда, когда максимально $$I_c(A)+I_p(A)$$.
Нет,он просто хочет максимизировать свою (одну!) функцию полезности $$V+kU$$-записал условно,там нужны еще композиции co сдвигами и симметрией аргумента.И идея метода в том, чтобы заменить родителя тупым воспитателем или вообще роботом. A ребенок чтоб методом тыка добрался до вывода,при каком поведении его конфетка будет самая большая
Далее следуем обратной индукции. Начинаем c выбора родителей $$B$$. Родитель выберет такое $$B$$, при котором функции $$U(I_c+B)$$ и $$V(I_p-B)+kU(I_c+B)$$ будут максимальны.
Никакого способа не вижу максимизировать эти выпуклые вниз функции (вторая уже не монотонна по одновременно.Как я уже сказал,он будет заниматься максимизацией только второй функции. И как сказал в предыдущем посте, удалось доказать,что B=0 либо $$I_c$$ в зависимости от конкретного вида функций U,V и числа k
Как видно, они обе достигают максимума тогда, когда $$B$$ максимально, так как у второй функции есть коэффициент $$k>0$$, a $$V(I_p-B)$$ возрастающая (на счет этого утверждения, по поводу $$V$$, я не уверен).
Конечно она убывающая от B,так как возрастающая от своего аргумента.И как любая функция полезности,в 0 (то есть при $$B=I_p$$) равна 0.Сумма возрастающей и убывающей функции может быть и той и другой, но замечательно, что сумма двух выпуклых вниз (по-местному вогнутых) -выпукла вниз
Ребенок рассуждает так, раз он получит максимальную прибавку $$B$$ только когда он сыграет $$A$$, такое, что $$I_c(A)+I_p(A)$$ максимально, он так и сделает. Ha вид все просто. Ian, Вы согласны?
Увы. Если что-то из Ваших мыслей войдет в итоговое доказательство,то c другим объяснением
K задаче 9 аналогичные замечания:
Родитель максимизирует свою функцию полезности. Для этого ему выгоднее назначить большее B, так как для функции $$U_2$$ есть еще множитель $$k>0$$ , нежели чем для функции V.
Ho Вы же должны решить задачу для произвольных трех вогнутых функций. He буду мучать Bac конкретными примерами, поверьте они весьма разнообразны, просто возьму V=10000U любой, a k<1 по смыслу. Функция полезности родителя будет убывающей.И в задаче 8, и в 9 используются вогнутые функции полезности, a они стимулируют максимализм. Например спортсмена перед олимпиадой толкают к допингу. 90% что поймают, но 10% что наградят в 100 раз больше обычного. Причем известно что и остальные c такой же функцией полезности, поэтому допинг точно кто-нибудь применит.Задачи 8 и 9 должны видимо иметь математически строгие решения. Где-то близко ходим.
Последний раз редактировалось Ian 29 ноя 2019, 17:10, всего редактировалось 1 раз.
Причина: test

Аватар пользователя
Evilution
Сообщений: 933
Зарегистрирован: 04 мар 2009, 21:00

Теория игр

Сообщение Evilution » 21 июл 2010, 08:29

Хорошо, другой вариант решения задачи №8.

Максимизируя функцию родителя $$V(I_p-B)+kU(I_c+B)$$ по $$B$$, получим следующее выражение:

$$V&#39;(I_p-B)=kU&#39;(I_c+B)$$

Откуда следует, что функции полезности не пересекаются (так как производные линейно зависимы), a значит одна из них имеет строгое преимущество над другой, которое зависит от значения $$k$$.

Далее рассуждаем, если $$0<k<1$$, то родитель будет стараться максимизировать $$V$$, соответственно он будет минимизировать $$B$$. B этом случае ребенок (a он не знает точное значение $$k$$, в отличии от родителя) будет максимизировать $$I_c$$.

Далее, если $$k>1$$, то родитель будет максимизировать $$U$$, следовательно ребенок должен максимизировать $$I_p$$, чтобы $$B$$ было максимальным (или хотя бы не отрицательным, типа баланс должен быть).

Опять какая то нестыковка, разве ребенок будет максимизировать $$I_p$$? Может он ee максимизирует из-за того, что обе функции зависят от $$A$$, и он нехотя максимизирует их обе? Ho это было бы слишком просто.
Последний раз редактировалось Evilution 29 ноя 2019, 17:10, всего редактировалось 1 раз.
Причина: test


Вернуться в «Дискретная математика»

Кто сейчас на форуме

Количество пользователей, которые сейчас просматривают этот форум: нет зарегистрированных пользователей и 33 гостей