Критерий байеса пример решения матрицы. Принятие решений в условиях неопределенности

Экспертные оценки минимаксного метода и методов Байеса - Лапласа и Сэвиджа

Приведенные в подпараграфе 2.8.1 простейшие критерии и стратегии принятия решений (2.8.1) (2.8.5) имеют ясное и логическое объяснение мотивов, которыми руководствуются лица, принимающие решения. Далее можно перейти к рассмотрению обобщенных классических критериев принятия решений. К ним относятся минимаксный критерий, критерий Байеса - Лапласа, критерий Сэвиджа, а также другие обобщения.

Минимаксный критерий и метод

Минимаксный критерий использует оценочную функцию (2.8.1, а), соответствующую пессимистической позиции, формализуемой соотношением

Справедливо соотношение

причем Zn„„ в (2.8.8) - оценочная функция минимаксного критерия.

Правило выбора решения в соответствии с минимаксным критерием интерпретируется следующим образом. Матрица решений {ву} дополняется еще одним столбцом из наименьших результатов еГ каждой строки. При принятии решения следует выбрать такие варианты Ею, строки которых соответствуют наибольшим значениям ег этого столбца. Выбранные таким образом варианты полностью исключают риск, поскольку лицо, принимающее решение, ориентировано на пессимистическую позицию, что не позволяет получить худший результат. Вне зависимости от условий Fj результат выбора не может оказаться ниже 2.тт. Минимаксный критерий относится к числу фундаментальных, поскольку используется весьма часто. Применение минимаксного критерия оправдано в следующих ситуациях:

  • 1) о возможности появления внешних состояний (условий) Б] ничего неизвестно (например, неизвестны вероятности появления состояний Р])щ,
  • 2) приходится считаться с появлением различных внешних состояний Рр
  • 3) решение реализуется только один раз;
  • 4) необходимо исключить всякий риск (недопустимо получение результата ниже значения 2,„,„).

Критерий и метод Байеса - Лапласа

Для построения оценочной функции данного критерия используется априорная информация о вероятностях ц} появления внешних условий Ру Тем самым данная вероятностная модель учитывает каждое из возможных последствий. Пусть - вероятность появления внешнего состояния (условия) Ру Тогда критерий Байеса - Лапласа

соответствует множеству

Фактически в данном критерии в качестве оценочной функции выбирается математическое ожидание оценки, соответствующей у"-му варианту, причем усреднение происходит по множеству условий Г^.

Правило принятия решении (2.8.11)-(2.8.13) имеет вероятностную интерпретацию. При этом ситуация, в которой принимается решение, характеризуется следующими обстоятельствами:

  • - вероятности появления состояний (условий) известны и не зависят от времени;
  • - решение реализуется (теоретически) бесконечно много раз;
  • - для малого числа реализаций решения допускается некоторый риск.

Позиция лица, принимающего решения на основе критерия Байеса - Лапласа, является более оптимистичной, чем по минимаксному критерию.

Критерий и метод Сэвиджа

Этот критерий основывается на предварительном преобразовании матрицы системных оценок в соответствии с соотношениями

Оценочная функция имеет вид

Множество оптимальных вариантов решения определяется соотношением

Смысл критерия (2.8.16) становится ясным после анализа соотношений (2.8.14)-(2.8.17).

Величины а =(тахе, еЛ, вычисляемые в соответствии

(2.8.14), можно трактовать как максимальный дополнительный выигрыш, который достигается, если В состояний Fj вместо варианта £", выбрать другой, оптимальный для этого внешнего состояния. Величины ay =(тахву е^) можно также интерпретировать и как потери (штрафы), возникающие в состоянии Fj при замене оптимального для него варианта

Тогда величина eir определенная равенством (2.8.12), представляет собой - при интерпретации йу как потерь - максимально возможные (по всем внешним состояниям Fj) потери в случае выбора варианта Ej. Согласно соотношениям (2.8.15), (2.8.17) максимально возможные потери минимизируются за счет выбора £;.

С точки зрения матрицы {еф критерий Сэвиджа связан с риском, однако с позиции матрицы {ау) он от риска свободен, поскольку использует стратегию минимаксного критерия.

Обобщенный минимаксный критерий и метод

Этот критерий использует расширение доли вероятностно заданной неопределенности. Предположим, что для каждого из возможных внешних состояний Fj определена вероятность его появления

Введем вероятность Р, применения г"-го варианта решения и будем предполагать возможность реализации т вариантов решения. Тогда среднее значение

где Р= (/>„ ...,/>,„), д = (

В реальной ситуации вектор ц неизвестен. В этом случае, ориентируясь на наименее выгодное распределение ц состояний Fj, можно добиться максимального увеличения е(Р, д) за счет выбора наиболее удачного распределения Р вариантов решения £;. Подобная стратегия соответствует расширенному минимаксному критерию, причем в данной ситуации реализуется игровая стратегия: состояния Fj минимизируют критерий, а варианты Е, его максимизируют. Общая формулировка данного расширенного минимального критерия имеет вид

где векторы Рид определены в (2.8.18).

Таким образом, цель расширенного минимаксного критерия - нахождение наилучшего распределения вероятностей на множестве вариантов Е, когда в многократно использовавшейся ситуации ничего не известно о вероятностных состояниях ^, относительно которых предполагается "невыгодное" распределение.

Производные критерии, оценки и принятие решений

Данный класс критериев позволяет рассматривать задачи принятия решения с обобщенных позиций, причем обобщение предполагает более полный учет априорно известных факторов, а также введение новых функциональных элементов.

Следует иметь в виду, что для интерпретации критериев можно воспользоваться идеями подпараграфа 2.8.1. В соответствии с подпараграфом 2.8.1 целесообразно свести рассмотренные производные (обобщенные) критерии в табл. 2.8.

Критерий Гурвица

Оценочная функция критерия Гурвица находится между точками предельного оптимума (С = 0) и крайнего пессимизма (С = 1). Характерно, что при С = 1 критерий Гурвица превращается в минимаксный критерий (см. подпараграф 2.8.1).

Критерий Ходжа - Лемана

Критерий основан на минимаксном критерии и критерии Байеса - Лапласа, характеризуется тем, что с помощью параметра в выражает степень доверия к используемому распределению вероятностей. При V = 1 критерий переходит в критерий Байеса - Лапласа, а при V = 0 - в минимаксный критерий. Ситуация, в которой рекомендовано применение этого критерия, характеризуется следующими условиями: вероятности появления состояний Е] неизвестны, но некоторые предположения о распределениях вероятностей возможны; принятое решение теоретически допускает бесконечно много реализаций: при малых числах реализации допускается некоторый риск.

Критерий Ю. Б. Гермейера

Данный критерий ориентирован на оценочные функции, отражающие величину потерь, т.е. на отрицательные значения всех е-у матрицы оценок, применяется в хозяйственных задачах и ориентирован на цены и затраты. Смысл остальных параметров: <77 - вероятность условия Еу а ег - минимум математического ожидания затрат. В критерии Ю. Б. Гермейера допускается некоторый риск при принятии решения, а также должны быть известны вероятности Цр

Таблица 2.8.

Минимаксный критерий и метод Байеса - Лапласа

Метод позволяет лучше адаптироваться к ситуации за счет введения составных частей, логически унаследованных от других критериев (см. табл. 2.8). На первом этапе формирования критерия фиксируется опорное значение 2тт, задаваемое минимаксным критерием. Затем задается допустимый риск 5д0|| >0 и определяется множество согласия Величины £,-=£^0- ште^ё 1 характеризуют наиболее возможные потери в сравнении с е^. После этого формируется выигрышное множество /2. Множеству /] п ¡2 принадлежат варианты решений, для которых в определенных состояниях могут иметь потери по сравнению с состоянием, задаваемым минимаксным критерием, однако в других состояниях имеется, по меньшей мере, прирост выигрыша.

Таким образом, рассмотренные методы позволяют расширить классы методов, используемых для принятия решений в условиях неполной статистически заданной неопределенности на основе обработки таблиц экспертных оценок.

Предполагалось бы, что месторождения расположены равномерно по всей территории. Такой подход навряд ли можно считать правомерным, поскольку выводы, полученные с его помощью, не имеют под собой логической основы. Впрочем, критерий Байеса - Лапласа не произвольнее критерия Гурвица.  


Оптимистичный подход, подходы на основе критерия Гурвица , критерия Байеса - Лапласа и критерия Сэвиджа имеют в данном случае следующий вид  

Байеса (Лапласа) критерий 27, 224 Байесовский подход 27 Баланс 27 Балансирующая (или равновесная)  

Среди этих критериев и правил особое место занимают правила и критерии, основанные на известной теореме Байеса. Подход, основанный на этой теореме, позволяет, во-первых, использовать некоторые методологические принципы естественных наук в управлении, а во-вторых, обеспечить корректировку суждений и принятия решений по мере накопления опыта. Последнее означает обучение управлению (в смысле принятия решений) в процессе самого управления 1.  

Иногда в ходе операции неопределенность раскрывается постепенно, по мере поступления информации. В этом случае для обоснования решений удобно использовать такой объективный критерий, как апостериорная вероятность события. Саму эту вероятность проще всего вычислять с использованием формулы Байеса в терминах шансов. Рассмотрим суть этого подхода.  

Критерий Байеса применяется в тех случаях, когда известно распределение вероятностей возможных состояний. Если это дискретное распределение вероятностей задано набором вероятностей , то по критерию Байеса стратегия Si предпочтительнее Sj (s > если  

Частными случаями этого критерия являются критерий Байеса (при А = 1) и критерий Вальда (при А = 0).  

Критерий Байеса-Лапласа в отличие от критерия Вальда учитывает каждое из возможных следствий всех вариантов решений  

Критерий Байеса-Лапласа предъявляет к ситуации, в которой принимается решение , следующие требования  

При z = 1 критерий преобразуется в критерий Байеса-Лапласа, а при z = О превращается в критерий Вальда . Таким образом, выбор параметра z подвержен влиянию субъективизма. Кроме того, без внимания остается и число реализаций. Поэтому этот критерий редко применяется при принятии технических решений.  

Мы рассмотрели несколько основных подходов к принятию решения в случае неопределенных факторов в изучаемой модели. Можно привести примеры, когда все критерии принятия решения приводят к выбору одного и того же решения x e X, обычно же этого не происходит, каждый критерий приводит к своему решению (пример такого рода рассмотрен в следующей главе). Поэтому возникают дискуссии о том, какой критерий и когда предпочтительнее,. делаются попытки построить на основе нескольких критериев единственный. В частности, критерий Гурвица является таким объединением двух критериев. Предпринимались также попытки объединить критерий Гурвпца и критерий Байеса - Лапласа. Все получаемые критерии имеют высокую степень произвольности. По нашему мнению, единственным путем преодоления этих трудностей является многокритериальный подход, в котором ЛПР смогло бы рассмотреть варианты принимаемого решения, эффективные с точки зрения совокупности показателей, и выбрать среди них наиболее подходящий. Такой подход использован в примере, приведенном в следующей главе. Конечно, совокупность показателей при этом должна, быть не слишком велика.  

Обычно опробуется несколько конфигураций с различным числом элементов и структурой соединений. Одними из наиболее важных показателей являются объем обучающего множества и обеспечение способности к обобщению при дальнейшей работе, и нужного результата можно достичь на различных схемах. Чаще всего используются процедуры последовательного спуска (с подтверждающим множеством) или N-кратного перекрестного подтверждения . Могут быть применены и более мощные информационные критерии (1) обобщенное перекрестное подтверждение (G V), итоговая ошибка предсказания Акаике (FPE), критерии Байеса (BI) и Акаике (AI) (см. ). Для того чтобы улучшить способности к обобщению и устранить опасность переобучения, применяются также уменьшение весов и их исключение (прореживание дерева). При этом изменяется архитектура сети удаляются некоторые связи и изучается, какое влияние они оказывали на эффективность. >,  

БАЙЕСА (ЛАПЛАСА) КРИТЕРИЙ - в теории решений критерий принятия решений в условиях отсутствия какой-либо информации об относительных вероятностях стратегий "природы". (См. Неопределенные задачи .) По Б.(Л.)к. предлагается придать равные вероятности всем рассматриваемым стратегиям, после чего принять ту из них, при которой ожидаемый выигрыш окажется наибольшим. Имеет тот недостаток, что круг оцениваемых альтернатив в одной и той же задаче может быть различным и соответственно различной может быть также относительная вероятность каждой из них.  

Критерий Ходжеса - Лемана. При реализации этого критерия используются два субъективных показателя во-первых, распределение вероятностей , используемое в критерии Байеса, во-вторых, "параметр оптимизма" из критерия Гурвица  

Критерий Ходжа-Лемана базируется одновременно на критериях Вальда и Байеса-Лапласа  

Критерий Байеса - правило, в соответствии с которым стратегия решений выбирается таким образом, чтобы обеспечить минимум среднего риска. Применение критерия Байеса целесообразно в случае, когда система распознавания многократно осуществляет распознавание неизвестных объектов или явлений в условиях неизменного признакового пространства, при стабильном описании классов и неизменной платежной матрице.

Минимум риска, усредненного по множеству решений задачи распознавания неизвестных объектов, обеспечивается тогда, когда решения о принадлежности объектов классу Ω 1 и Ω 2 принимаются в соответствии со следующим правилом: если измеренное значение признака у данного объекта расположено в области R 1 то объект относится к классу Ω 1 если в области R 2 - к классу Ω 2

Стратегию, основанную на этом правиле, называют байесовской стратегией, а минимальный средний риск - байесовским риском.

Использование другой стратегии, отличной от байесовской, сопряжено с увеличением среднего риска. Пусть, например, используется некоторая стратегия А, в соответствии с которой решение о принадлежности объекта классу Ω 1 принимается тогда, когда измеренное значение признака х=х 0 <х А, и классу Ω 2 , когда х=х 0 >х А (рис. 4.2).

Разность среднего риска Rã А при подобной стратегии и байесовского риска Rã min в предположении, что с 11 =c 22 = 0, c 12 = c 1 и с 21 = с 2 , составит

В области r 2 ÎR 2 .f 2 (x)>l 0 f 1 (x). Значит, Rã A -Rã min >0, т. е. Rã A >Rã min

При выборе стратегии В, в соответствии с которой принимается решение о принадлежности объекта классу Ω 1 если х<х B , и классу Ω 2 , если х>х B , разность средних рисков подобной и байесовской стратегии

В области Значит, Rã B -Rã min >0, т. е. Rã B >Rã min т. е.

Рис. 4.2

Байесовская стратегия может быть описана также следующим образом. Пусть в результате опыта установлено, что значение признака у распознаваемого объекта w составляет величину х=х 0 . Тогда условная вероятность принадлежности объекта классу Ω 1 (условная вероятность первой гипотезы в соответствии с теоремой гипотез или формулой Байеса)

а условная вероятность принадлежности объекта классу Ω 2 (условная вероятность второй гипотезы)

где - совместная плотность распределения вероятностей значений признака х по классам, в свою очередь величины - апостериорные вероятности, принадлежности распознаваемого объекта классам Ω 1 и Ω 2 , соответственно.

Условные риски, связанные с решениями wÎΩ 1 и wÎΩ 2 , соответственно

Система распознавания, основанная на байесовской стратегии, должна решать задачу с минимальным условным риском. Это значит, что предпочтение решению coeCli следует отдавать тогда, когда Подставим в это выражение значения определяемые (4.29). Тогда неравенства или определят, в каких условиях необходимо принять решение о том, что wÎΩ 1

Таким образом, байесовский подход к решению задачи распознавания состоит в вычислении условных апостериорных вероятностей и принятии решения на основании сравнения их значений. Именно такой подход обеспечивает минимум среднего риска и минимум ошибочных решений.

Если число классов больше двух и равно т, то апостериорная вероятность отнесения объекта к Ω-му классу будет

Когда объект характеризуется N признаками x j , j=1, ..., N и признаки распознаваемого объекта приняли значения x 1 = x 0 1 ; х 2 = х 0 2 ; ...; x N =x 0 N , вероятность того, что при осуществлении события a N =(x 0 1 , x 0 2 , ..., х 0 N) объект относится к i-му классу, равна

Рассмотрим другую форму записи байесовского критерия отнесения объекта к соответствующему классу. Пусть имеются классы Ω 1 и Ω 2 . Априорные вероятности появления объектов этих классов соответственно P(Ω 1) и Р(Ω 2), с 11 = с 22 = 0, c l 2 = c 1 и с 21 = с 2 . Известны также многомерные условные плотности распределения вероятностей значений признаков f 1 (х 1 ..., x N) и f 2 (х 1 ..., x N) по классам. Тогда условные вероятности ошибок первого и второго рода соответственно

Средний риск

Так как интеграл от плотности вероятности по областям R 1 и R 2 равен единице, то

Задача состоит в том, чтобы минимизировать значение среднего риска. Для этого необходимо так выбрать области R 1 и R 2 , чтобы интеграл в (4.34) принял наибольшее отрицательное значение. Это достигается тогда, когда подынтегральное выражение принимает наибольшее отрицательное значение и вне области R 1 не существует такой области, где подынтегральное выражение отрицательно, т. е. с 2 Р(Ω 2)f 2 (х 1 ..., x N) – c 1 P(Ω 1)f 1 (х 1 ..., x N)<0. Отсюда следует уже известное решающее правило. Распознаваемый объект w, признаки которого, как установлено в результате проведения экспериментов, равны x l = x 0 1 , х 2 = х 0 2 , ..., x N =x 0 N , относится к классу Ω 1 если

где - пороговое значение коэффициента правдоподобия.

Краткая теория

Любую хозяйственную деятельность человека можно рассматривать как игру с природой. В широком смысле под природой будем понимать совокупность неопределенных факторов, влияющих на эффективность принимаемых решений.

Управление любым объектом осуществляется путем принятия последовательности управленческих решений. Для принятия решения необходима информация (совокупность сведений о состоянии объекта управления и условиях его работы). В тех случаях когда отсутствует достаточно полная информация, возникает неопределенность в принятии решения. Причины этого могут быть различны: требующаяся для полного обоснования решения информация принципиально не может быть получена (неустранимая неопределенность); информация не может быть получена своевременно, к моменту принятия решения; затраты, связанные с получением информации, слишком высоки. По мере совершенствования средств сбора, передачи и обработки информации неопределенность управленческих решении будет уменьшаться. К этому нужно стремиться. Существование неустранимой неопределенности связано со случайным характером многих явлений. Например, в торговле, случайный характер изменения спроса делает невозможным его точное прогнозирование, a, следовательно, и формирование идеально точного заказа на поставку товара. Принятие решения в этом случае связано с риском. Приемка партии товара на основании выборочного контроля также связана с риском принятия решения в условиях неопределенности. Неопределенность может быть снята путем полного контроля всей партии, однако это может оказаться слишком дорогостоящим мероприятием. В сельском хозяйстве, например, с целью получения урожая человек предпринимает ряд действии (пашет землю, вносит удобрения, борется с сорняками и т. п.). Окончательный результат (урожай) зависит от действий не только человека, но и природы (дождь, засуха, вечер и т. п.). Из приведенных примеров видно, что полностью исключить неопределенность в управлении экономической системой нельзя, хотя, повторим, к этому нужно стремиться. В каждом конкретном случае следует принимать во внимание степень риска при принятии управленческих решений, по возможности максимально учитывать имеющуюся информацию с целью уменьшения неблагоприятных последствий, которые могут возникнуть из-за ошибочных решений.

Две стороны, участвующие в игре, будем называть игрок I и игрок II. Каждый из игроков располагает конечным набором действий (чистых стратегий), которые он может применять в процессе игры. Игра имеет повторяющийся, циклический характер. о каждом цикле игроки выбирают одну из своих стратегии, что однозначно определяет платеж . Интересы игроков противоположны. Игрок I старается вести игру так, чтобы платежи были как можно большими. Для игрока II желательны как можно меньшие значения платежей (с учетом знака). Причем в каждом цикле выигрыш одного из игроков в точности совпадает с проигрышем другого. Игры такого типа называются играми с нулевой суммой.

Решить игру - значит определить оптимальное поведение игроков. Решение игр является предметом теории игр. Оптимальное поведение игрока инвариантно относительно изменения всех элементов платежной матрицы на некоторую величину.

В общем случае определение оптимального поведения игроков связано с решением двойственной пары задач линейного программирования. В отдельных случаях могут быть использованы более простые методы. Часто платежную матрицу удается упростить путем удаления из нее строк и столбцов, соответствующих доминируемым стратегиям игроков, доминируемой называется стратегия, все платежи которой не лучше соответствующих платежей некоторой другой стратегии и хотя бы один из платежей хуже соответствующего платежа этой другой стратегии, называемой доминирующей.

В обычной стратегической игре принимают участие «разумные и антагонистические» противники (противоборствующие стороны). В таких играх каждая из сторон предпринимает именно те действия, которые наиболее выгодны ей и менее выгодны противнику. Однако очень часто неопределенность, сопровождающая некоторую операцию, не связана с сознательным противодействием противника, а зависит от некой, не известной игроку I объективной действительности (природы). Такого рода ситуации принято называть играми с природой. Игрок II - природа - в теории статистических игр не является разумным игроком, так как рассматривается как некая незаинтересованная инстанция, которая не выбирает для себя оптимальных стратегий. Возможные состояния природы (ее стратегии) реализуются случайным образом. В исследовании операций оперирующую сторону (игрока I) часто называют статистиком, а сами операции - играми статистика с природой или статистическими играми.

Рассмотрим игровую постановку задачи принятия решения в условиях неопределенности. Пусть оперирующей стороне необходимо выполнить операцию в недостаточно известной обстановке относительно состояний которой можно сделать предположений. Эти предположения будем рассматривать как стратегии природы. Оперирующая сторона в своем распоряжении имеет возможных стратегий - . Выигрыши игрока I при каждой паре стратегий и - предполагаются известными и заданы платежной матрицей .

Задача заключается в определении такой стратегии (чистой или смешанной), которая лри ее применении обеспечила бы оперирующей стороне наибольший выигрыш.

Выше уже говорилось, что хозяйственная деятельность человека может рассматриваться как игра с природой. Основной особенностью природы как игрока является ее не заинтересованность в выигрыше.

Анализ матрицы выигрышей игры с природой начинается с выявления и отбрасывания дублирующих и заведомо невыгодных стратегий лица, играющего с природой. Что касается стратегий природы, то ни одну из них отбросить нельзя, так как каждое из состояний природы может наступить случайным образом, независимо от действий игрока I. Ввиду того что природа не противодействует игроку I, может показаться, что игра с природой проще стратегической игры. На самом деле это не так. Противоположность интересов игроков в стратегической игре в некотором смысле как бы снимает неопределенность, чего нельзя сказать о статистической игре. Оперирующей стороне в игре с природой легче в том отношении, что она скорее.всего выиграет больше, чем в игре против сознательного противника. Однако ей труднее принять обоснованное решение, так как в игре с природой неопределенность ситуации сказывается в гораздо более сильной степени.

После упрощения платежной матрицы игры с природой целесообразно не только оценить выигрыш при той или иной игровой ситуации, но и определить разность между максимально возможным выигрышем при данном состоянии природы и выигрышем, который будет получен при применении стратегии в тех же условиях. Эта разность в теории игр называется риском.

Природа меняет состояние стихийно, совершенно не заботясь о результате игры. В антагонистической игре мы предполагали, что игроки пользуются оптимальными (в определенном выше смысле) смешанными стратегиями. Можно предположить, что природа применяет наверняка не оптимальную стратегию. Тогда какую? Если бы существовал ответ на этот вопрос, то принятие решения лицом, принимающим решения (ЛПР) сводилось бы к детерминированной задаче.

Если вероятности состояний природы известны, то пользуются критерием Байеса, в соответствии с которым оптимальной считается чистая стратегия , при которой максимизируется средний выигрыш:

Критерий Байеса предполагает, что нам хотя и неизвестны условиях выполнения операций (состояния природы) , но известны их вероятности .

С помощью такого приема задача о выборе решения в условиях неопределенности превращается в задачу о выборе решения в условиях определенности, только принятое решение является оптимальным не в каждом отдельном случае, а в среднем.

Если игроку представляются в равной мере правдоподобными все состояния природы, то иногда полагают и, учитывая, «принцип недостаточного основания» Лапласа, оптимальной считают чистую стратегию , обеспечивающую:

Если же смешанная стратегия природы неизвестна, то в зависимости от гипотезы о поведении природы можно предложить ряд подходов для обоснования выбора решения ЛПР. Свою оценку характера поведения природы будем характеризовать числом , которое можно связывать со степенью активного «противодействия» природы как игрока Значение соответствует наиболее пессимистичному отношению ЛПР в смысле «содействия» природы в достижении им наилучших хозяйственных результатов. Значение соответствует наибольшему оптимизму ЛПР. Как известно, в хозяйственной деятельности указанные крайности опасны. Скорее всего, целесообразно исходить из некоторого промежуточного значения . В этом случае используется критерий Гурвица, согласно которому наилучшим решением ЛПР является чистая стратегия , соответствующая условию:

Критерий Гурвица (критерий «оптимизма-пессимизма») позволяет руководствоваться при выборе рискового решения в условиях неопределенности некоторым средним результатом эффективности, находящимся в поле между значениями по критериям «максимакса» и «максимина» (поле между этими значениями связано посредством выпуклой линейной функции).

В случае крайнего пессимизма ЛПР указанный критерий называется критерием Вальда. Согласно этому критерию, наилучшей считается максиминная стратегия. Это критерий крайнего пессимизма. По этому критерию ЛПР выбирает ту стратегию, которая гарантирует в наихудших условиях максимальный выигрыш:

Такой выбор соответствует наиболее робкому поведению ЛПР, когда он предполагает наиболее, неблагоприятное поведение природы, боится больших потерь. Можно предположить, что он не получит больших выигрышей. Согласно критерию Сэвиджа, следует выбирать чистую стратегию соответствующую условию:

где риск .

Критерий Сэвиджа (критерий потерь от «минимакса») предполагает, что из всех возможных вариантов «матрицы решений» выбирается та альтернатива, которая минимизирует размеры максимальных потерь по каждому из возможных решений. При использовании этого критерия «матрица решения» преобразуется в «матрицу риска», в которой вместо значений эффективности проставляются размеры потерь при различных вариантах развития событий.

Недостатком критериев Вальда, Сэвиджа и Гурвица является субъективная оценка поведения природы. Хотя указанные критерии и дают некоторую логическую схему принятия решений, резонно все же задать вопрос: «А почему сразу не выбрать субъективное решение, вместо того чтобы иметь дело с разными критериями?» Несомненно, определение решения по различным критериям помогает ЛПР оценить принимаемое решение с различных позиций и избежать грубых ошибок в хозяйственной деятельности.

Пример решения задачи

Условие задачи

После нескольких лет эксплуатации оборудование может оказаться в одном из трех состояний:

  1. требуется профилактический ремонт;
  2. требуется замена отдельных деталей и узлов;
  3. требуется капитальный ремонт.

В зависимости от ситуации руководство предприятия может принять следующие решения:

Требуется найти оптимальное решение данной проблемы по критерию минимизации затрат с учетом следующих предположений:

a 4 6 9 b 5 3 7 c 20 15 6 q 0.4 0.45 0.15

Решение задачи

Если возникли сложности с решением задач, то сайт сайт оказывает онлайн помощь студентам по методам оптимальных решений с контрольными или экзаменами.

Игра парная, статистическая. В игре участвуют 2 игрока: руководство предприятия и природа.

Под природой в данном случае понимаем совокупность внешних факторов, которые определяют состояние оборудования.

Стратегия руководства:

Отремонтировать оборудование своими силами

Вызвать бригаду специалистов

Заменить оборудование новым

Стратегия природы - 3 возможных состояния оборудования.

Требуется профилактический ремонт;

Следует заменить отдельные детали и узлы;

Требуется капитальный ремонт.

Расчет платежной матрицы и матрицы рисков

Поскольку элементы матрицы - затраты, то будем считать их выигрышными но со знаком минус. Платежная матрица:

-4 -6 -9 -9 -5 -3 -7 -7 -20 -15 -6 -20 0.4 0.45 0.15

Составляем матрицу рисков:

-4-(-20)=16 -6-(-15)=9 -9-(-9)=0 16 -5-(-20)=15 -3-(-15)=12 -7-(-9)=2 15 -20-(-20)=0 -15-(-15)=0 -6-(-9)=3 3

Критерий Байеса

Определяем средние выигрыши:

По критерию Байеса оптимальной является стратегия - вызвать бригаду специалистов

Критерий Лапласа

Определим средние выигрыши:

По критерию Лапласа оптимальной является стратегия - вызвать бригаду специалистов

Критерий Вальда

По критерию Вальда оптимальной является стратегия - вызвать бригаду специалистов

Критерий Сэвиджа

По критерию Сэвиджа оптимальной является стратегия - заменить оборудование новым

Критерий Гурвица

По критерию Гурвица оптимальной является стратегия - вызвать бригаду специалистов

Ответ

По всем критериям, за исключением критерия Сэвиджа, оптимальной является стратегия «Вызвать бригаду специалистов». По критерию Сэвиджа, который минимизирует риски, оптимальной является стратегия «Заменить оборудование новым».


Содержит изложенные в краткой и доступной форме теоретические сведения о матричной игре без седловой точки и способе сведения такой задачи к задаче линейного программирования, для отыскания ее решения в смешанных стратегиях. Приведен пример решения задачи.

Многоканальная СМО с неограниченной очередью
Приведены необходимые теоретические сведения и образец решения задачи по теме "Многоканальная система массового обслуживания с неограниченной очередью", подробно рассмотрены показатели многоканальной системы массового обслуживания (СМО) с ожиданием обслуживания - среднее число каналов, занятых обслуживанием заявки, длина очереди, вероятность образования очереди, вероятность свободного состояния системы, среднее время ожидания в очереди.

Критический путь, критическое время и другие параметры сетевого графика работ
На примере решения задачи рассмотрены вопросы построения сетевого графика работ, нахождение критического пути и критического времени. Также показано вычисление параметров и резервов событий и работ - ранних и поздних сроков, общих (полных) и частных резервов.



Поделиться