ПОИСК Статьи Чертежи Таблицы Критерии принятия решений в играх с нулевой суммой из "Системы человек-машина Модели обработки информации, управления и принятия решений человеком-оператором " Наиболее широко используемым критерием выбора хода в формальной игре является критерий, называемый минимаксом проигрыша, т. е. минимизирующий максимум проигрыша. Это значит предполагай, что должно произойти самое худшее, какой бы ход ты сам не сделал, поэтому делай такой ход, который гарантировал бы наилучший из всех наихудших исходов . На рис. 21. 2, в, если А выберет Аи то его наихудшим исходом будет —1 если А выберет Ла, то наихудшим исходом будет —3 если Л выберет Лд, то наихудшим исходом будет также —3. Наилучший из всех наихудших исходов равен —1, следовательно, в соответствии с критерием минимакса проигрыша игрок Л выбирает А . Аналогично, если В выберет В , то его наихудшим исходом будет —10, в то же время если он выберет В , то наихудшим исходом будет 1. Следовательно, наилучшим из всех наихудших исходов для В является выбор Вз и получение выигрыша, равного по меньшей мере 1. [c.368] Критерий минимакса проигрыша — это один из нескольких наиболее часто используемых критериев. Это критерий консервативного пессимиста. Оптимист же может иметь склонность предполагать (надеяться ), что его противник сделает наилучший (с его, оптимиста, точки зрения) из всех возможных ходов, и тогда наш оптимист может выбрать тот ход, который максимизирует его максимальное вознаграждение, т. е. максимакс. [c.368] Другой критерий, часто называемый критерием минимакса потерь, или критерием отрицательных потерь, получается путем применения критерия минимакса не к исходной матрице выигрышей, а к другой матрице, элементы которой состоят из потерь — разностей между исходным значением выигрыша и максимальным выигрышем при том же самом ходе противника. Таким образом, исходная матрица выигрышей преобразуется в матрицу потерь (рис. 21.3). Севидж [75] предложил применить критерий минимакса проигрыша к матрице отрицательных потерь в данном примере этот критерий определяет ходы Лз и Ва. Отметим, что последнее приводит к выбору ходов, отличному от того случая, когда минимакс проигрыша применялся к исходной матрице выигрышей. Отметим также, что матрица отрицательных потерь уже не имеет нулевой суммы. [c.369] Выходом из этого положения для Л является выбор своего хода путем бросания монеты, поскольку в этом случае В никогда не сможет получить преимущество Перед ним благодаря предвидению его выбора. Если Л выбирает ходы случайным образом с равной вероятностью, то когда В выбирает Вх, Л будет ожидать выигрыш 0,5 (1) + 0,5 (4) = 2,5, а когда В выбирает B , А будет ожидать выигрыш 0,5 (3) + 0,5 (2) = 2,5. В этом случае равная вероятность выбора является наилучшей, поскольку если Л отдает предпочтение или Ах, или Ла, и В знает это и действует рационально, то ожидаемый выигрыш А будет всегда меньше этого значения. [c.370] Если предположить, что В знает стратегию А и действует рационально, то очевидно, что наиболее безопасным значением является 0,5. Любое другое значение может привести к уменьшению полезности. Таким образом, этот метод есть просто один из методов выбора минимакса для смешанной вероятностной стратегии ходов. Конечно, В должен сам воспользоваться тем же методом, чтобы не дать А преимущества знания его хода. Из рис. 21.5, б видно, что наиболее безопасным значением вероятности — вероятности выбора Вх в смешанной стратегии — является 0,25. Эти две стратегии находятся в равновесии в том смысле, что ни один игрок не может выиграть путем изменения своей стратегии, если другой игрок придерживается своей стратегии. [c.371] Для игр с нулевой суммой, в которых участвуют два человека, всегда существует решение. Если одна стратегия является доминирующей, то выбор ясен. Чистая стратегия минимакса может быть определена непосредственно по седловой точке, если она существует, или из уравнений смешанной стратегии (как это сделано выше), если седловой точки нет. [c.371] Вернуться к основной статье