Minimax - Что это такое, определение и понятие

В теории игр минимакс - это метод, направленный на минимизацию ожидаемых потерь. Для этого игрок предполагает, что решение его оппонента будет неблагоприятным. То есть худший сценарий ожидается до движения противника.

Другими словами, метод минимакса состоит в том, как принять наилучшее решение, предполагая, что другой игрок выберет для вас наихудший сценарий.

Мы должны принять во внимание, что этот метод применим в игре двух человек (два игрока) и что это не кооперативная игра, а игра с нулевой суммой. Это означает, что то, что выигрывает один игрок, теряется другим, и наоборот. Следовательно, каждый агент будет заинтересован в максимальном увеличении своей полезности, даже если это вредит другому.

Здесь мы также должны помнить, что теория игр - это раздел математики и экономики, изучающий выбор, который оптимизирует ситуацию отдельного человека, когда затраты и выгоды не фиксируются заранее, а зависят от решений других.

Минимаксный алгоритм в дереве решений

Мы можем увидеть, как метод минимакса применяется в дереве решений с несколькими узлами. Игра начинается внизу и заканчивается результатом на верхнем уровне.

У основания дерева противник делает первый ход, поэтому ожидается худший результат. Затем, на втором уровне, игрок x будет стремиться максимизировать свою прибыль, принимая во внимание решение, ранее принятое противником.

На третьем уровне снова очередь соперника и так далее. Ниже мы покажем пример.

Пример минимаксного алгоритма

В следующем дереве решений мы показываем результаты, полученные игроком x в каждый момент игры. В основе, на первом уровне, противник принимает решение. По этой причине приведены сценарии, в которых игрок может проиграть -10 или выиграть 5.

На втором уровне это зависит от игрока x, поэтому он максимизирует свою прибыль. Между проигрышем 10 или выигрышем 1 вы выиграете 1. Точно так же между выигрышем 5 или 7 вы выиграете 7.

Затем снова наступает очередь противника, поэтому будут даны сценарии, в которых игрок x имеет худший результат, -3 и 4, в зависимости от случая. Наконец, между проигрышем 3 или выигрышем 4 игрок x примет решение, которое позволит последнее.

Мы должны учитывать, что значения каждого узла будут зависеть от функции полезности.

Чтобы лучше понять дерево, предположим, что в основе лежит решение о распределении продукта. Конкурент (противник) может передать распределение на аутсорсинг (см. Левую часть дерева). В этом случае он должен выбрать, например, между дилером A и B. Таким образом, он выбирает первого, в результате чего игрок x проигрывает 10 (если он выбрал B, игрок x выиграет 12).

Однако, возможно, противник предпочитает распространять свои товары сам, имея возможность арендовать моторизованные транспортные средства или купить грузовик. Из обоих сценариев выберите первый, который менее лестен для игрока x, потому что он выиграет 5, а не 10.

Популярные посты

Велосипедный закон и экономическая реальность

Закон велосипеда - это экономический термин, который относится к взаимодействию между рынками товаров и денег в открытой экономике. На сайте Economy-Wiki.com мы уже писали статью об этом законе в Аргентине. Однако, учитывая вызванный интерес, мы решили объяснить это в более общем виде. Согласно Подробнее…

Фридман захватил АСВ

Стоимость акций испанской распределительной группы DIA выросла до 0,59 евро. Интерес, проявленный Фридманом из группы LetterOne, привел к увеличению стоимости ее акций на 6%. Однако как это возможно, что акции компании, несущей больше…

Экономика Чили вырастет, если улучшится регулирование бизнеса

Экономика Чили будет расти, если ее компании будут расти. В этом нет ничего нового. Бизнес играет решающую роль в экономическом развитии стран. И в этом смысле Чили не исключение. По этой причине Чили должна провести реформы для стимулирования деловой активности и обеспечения большего развития страны в целом.Подробнее…