<< Пред. стр.

стр. 8
(общее количество: 14)

ОГЛАВЛЕНИЕ

След. стр. >>

Теорема 2.1. В нечетком анонимном механизме активной экс-
пертизы для любого АЭ и для любого равновесного по Нэшу его
сообщения существует недоминируемое равновесное по Нэшу
четкое сообщение.
Доказательство. В силу предположения А.2.2 множество Xi(fi)
состоит не более чем из двух точек (и не менее, чем одной точки),
которые мы обозначим x i? ( f i ) и x i+ ( f i ) , x i? ( f i ) ? x i+ ( f i ) .
Очевидно, что при этом выполнено:
? f i1 > f i 2 x i? ( f i 2 ) ? x i? ( f i1 ) ? ri ? x i+ ( f i1 ) ? x i+ ( f i 2 ) .
Выражение (9) при этом упрощается и принимает вид:
(13) µ ˜ ( f i ) = max { µ ˜ ( x i? ( f i ) ), µ ˜ ( x i+ ( f i ) )}.
x x
f i

Пусть при нечеткой обстановке ˜?i для i-го АЭ существует
s
нечеткая недоминируемая стратегия ˜i* . Сделаем ее четкой (про-
s
изведем «дефаззификацию»), положив соответствующую функцию
принадлежности µ ˜* ( s i ) равной нулю всюду, за исключением
si
точки, на которой достигается максимум в (12)-(13).
Получим четкую недоминируемую стратегию i-го АЭ. Анало-
гичным образом можно поступить по одиночке и для других АЭ,
получив в итоге четкое равновесие Нэша типа (6), эквивалентное
исходному. •
Следствием утверждения теоремы 2.1 является тот факт, что
для любого АЭ и для любой его нечеткой стратегии всегда сущест-
вует не худшая для него четкая стратегия. Поэтому, с одной сторо-
ны, можно утверждать, что допущение возможности сообщения
экспертами нечеткой информации качественно не изменяет2 струк-
туру и свойства равновесных стратегий.

1
Нормальным называется нечеткое множество, максимальное значение
функции принадлежности которого равно единице [82].
2
С содержательной точки зрения нечеткое коллективное решение
может давать лицу, принимающему решение (ЛПР), большую информа-
цию, нежели чем четкое коллективное решение экспертов.
70
С другой стороны, при нечетких сообщениях АЭ расширяется
˜
множество равновесных по Нэшу стратегий (P(?) ? P (? ) ), что
порождает определенные трудности при построении соответст-
вующего прямого механизма (см. также модель интервальной
экспертизы ниже). Поясним последнее утверждение более подроб-
но. Соответствующим исходному механизму ?(s), ?: S > X, пря-
мым механизмов h(r), h: ?n > X, называется механизм [17, 78, 85],
в котором АЭ сообщают центру информацию о своих точках пика,
после чего центр вычисляет равновесные s*(r) в исходном меха-
низме при данных точках пика заявки, то есть h(r) = ?(s*(r). Если
соответствующий прямой механизм неманипулируем, то есть в
нем сообщение достоверной информации является равновесной
стратегией каждого АЭ, то он называется эквивалентным прямым
механизмом [78, 85].
Если для каждого профиля предпочтений (профилем предпоч-
тений в случае однопиковых целевых функций называется вектор
точек пика) в исходном (непрямом) механизме существует единст-
венное равновесие Нэша (вектор равновесных по Нэшу сообщений
АЭ), то это равновесие подставляется в соответствующий прямой
механизм. Именно так дело обстоит в четком механизме активной
экспертизы, в котором существует единственное равновесие Нэша
и для которого можно построить эквивалентный прямой механизм.
Сложнее дело обстоит, когда существует несколько равнове-
сий Нэша. В этом случае для задания соответствующего прямого
механизма используют соответствие отбора равновесий, опреде-
ляющее единственное для каждого профиля предпочтений равно-
весие в непрямом механизме. При этом возникают следующие
трудности. Основная проблема заключается в том, что при практи-
ческом использовании соответствия отбора равновесий нет ника-
кой гарантии, что АЭ выберут равновесие, отбираемое применяе-
мым соответствием. Выходов из этой ситуации несколько: либо
использование максимального гарантированного (по множеству
равновесий при каждом профиле) результата, либо введение до-
полнительных гипотез о поведении АЭ (см. интервальные модели
экспертизы ниже). В первом случае уменьшается эффективность
управления, во втором требуется обоснование вводимых гипотез.
Таким образом, можно сделать следующий качественный вы-
вод – при использовании механизмов нечеткой активной эксперти-
71
зы увеличивается информация, поступающая к ЛПР, но, в то же
время, возникает неопределенность относительно равновесных
стратегий экспертов, снятие которой либо приводит к снижению
эффективности данного механизма, либо требует дополнительной
информации для введения обоснованных предположений о пове-
дении экспертов. И тот и другой способ применимы далеко не во
всех ситуациях, встречающихся на практике, поэтому наиболее
прямолинейным способом решения проблемы множественности
равновесий является отказ от нечеткости, то есть переход к четким
механизмам экспертизы, в которых равновесие единственно.
Частным случаем механизмов нечеткой активной экспертизы
является класс механизмов интервальной активной экспертизы, к
описанию которых мы и переходим. Пусть каждый эксперт (ак-
тивный элемент) сообщает центру отрезок ˜i = [ s i? ; s i+ ], где
s
0 ? s i? ? s i+ ? 1, i ? I. Механизм интервальной экспертизы являет-
ся частным случаем механизма нечеткой экспертизы, так как
первому соответствует конкретная функция принадлежности:
?1, s i ? [ s i? ; s i+ ]
(14) µ ˜i ( s i ) = ? , i ? I.
0, s i ? [ s i? ; s i+ ]
s
?
При использовании анонимного механизма множество S(x)
имеет вид:
n
? si
S(x) = {s ? S | = nx}.
i =1
Коллективное решение является интервалом с функцией при-
надлежности:
? n n
? +
?1, nx ? [? s i ; ? s i ]
? i =1 i =1
(15) µ ˜ ( x ) = ? .
x n n
?0, nx ? [? s i ; ? s i ]
? +
?
? i =1 i =1




72
Интервальный выигрыш i-го АЭ имеет функцию принадлеж-
ности µ ˜ ( f i ) , определяемую следующим образом
f i

? n n n n
? ? + + ? +
?1, nxi ( f i ) ? [ ? si ; ? si ] или nxi ( f i ) ? [ ? si ; ? si ]
? i =1 i =1 i =1 i =1
(16) µ ˜ = ? .
fi n n n n
? 0, nxi? ( f i ) ? [ ? si? ; ? si+ ] и nxi+ ( f i ) ? [ ? si? ; ? si+ ]
?
? i =1 i =1 i =1 i =1
Построим равновесие Нэша. Пусть АЭ упорядочены в порядке
возрастания их точек пика: r1 ? r2? …? rn. Построим разбиение
n ? i n ? i +1
отрезка [0; 1]: ?i = [ ], i ? I. По аналогии с четким
;
n n
случаем [15] можно утверждать, что если существует (а он если
существует, то единственен) АЭ с номером k таким, что rk ? ?k, то
он является диктатором, то есть его тока пика будет принадлежать
интервальному коллективному решению.
Обозначим ? i? = ? s? , ? i+ = ? s+ . Структура равновесия
j j
j ?i j ?i

Нэша ˜ * и его свойства в рамках предположений А.2.1-А.2.2
s
даются следующей теоремой.
Теорема 2.2. 1) Если ? i? > nri, то ˜i* = [0; a], где a – произ-
s
вольное число из отрезка [0; 1];
Если ? i+ + 1 < nri, то ˜i* = [a; 1], где a – произвольное число
s
из отрезка [0; 1];
Если nri ? [ ? i? ; ? i+ + 1], то ˜i* = [a; b], где a ? b и
s
a ? [0; min {nri - ? i? ; 1}].
Доказательство теоремы 2.2 тривиально, так как заключается в
проверке того, что построенные сообщения при фиксированной
обстановке являются недоминируемыми, и опускается.
Следствие. В интервальном механизме активной экспертизы
диктатором является АЭ с номером k (см. определение выше).
Равновесные сообщения имеют следующий вид:
(17) ? i < k ˜i* = [0; a], ? i > k ˜i* = [b; 1],
s s
а сообщение диктатора таково, что rk ? ?( ˜ * ).
s
73
Отметим, что в соответствии с результатом теоремы 2.2 одним
из равновесий Нэша является сообщение всеми экспертами одина-
ковых сообщений, совпадающих с отрезком [0; 1] (см. выражение
(17)), то есть всем интервалом возможных значений оцениваемой
величины. Понятно, что подобные сообщения (являющиеся равно-
весными!) не несут для ЛПР никакой информации.
Основной качественный результат теоремы 2.2 заключается в
том, что в интервальных механизмах активной экспертизы сущест-
вует множество равновесий Нэша. Для уменьшения их числа
необходимо вводить те или иные гипотезы о поведении АЭ или
модифицировать механизм, например, ограничивать «ширину»
отрезков, сообщаемых АЭ, и т.д.
Выше мы рассмотрели модель нечеткой активной экспертизы,
в которой механизм планирования и целевые функции АЭ были
четкими, а нечеткими могли быть сообщения АЭ. «Фаззифициро-
вать» можно и другие параметры, например, механизм планирова-
ния и др. В качестве иллюстрации в заключение настоящего разде-
ла кратко рассмотрим модель экспертизы, в которой все параметры
за исключением предпочтений АЭ четкие.
˜
Пусть Ri – НОП i-го АЭ, i ? I, на множестве X = [0; 1],
имеющее функцию принадлежности µ R ( x, y ) , i ? I. Если страте-
˜
i
гии АЭ и механизм планирования четкие, то четким является и
результат экспертизы – коллективное решение.
˜
Механизм планирования ?(?) и НОП АЭ Ri индуцируют на
˜
множестве Si = [0; 1] НОП Q i с функцией принадлежности
µ Q ( s i1 , s i2 , s ?i ). При фиксированной обстановке игры s-i, в част-
˜
i
˜
ном случае, функцию принадлежности НОП Q i можно записать в
виде: µ Q ( s i1 , s i2 , s ?i ) = µ R (? ( s i1 , s ?i ), ? ( s i2 , s ?i )) . Значит НОП
˜ ˜
i
i
˜ ˜
Qi является прообразом НОП Ri при отображении ?(?), то есть
объединением всех нечетких множеств в Si ? Si, образы которых
при этом отображении лежат в нечетком множестве µ Q (опреде-
˜
i




74
ление прообраза нечеткого множества для общего случая приведе-
но в [82]).
Построим в Si нечеткое подмножество недоминируемых аль-
тернатив с функцией принадлежности
(18) ?i(si, s-i) = 1 - sup [ µ Q ( z, s i , s ?i ) - µ Q ( s i , z, s ?i ) ].
˜ ˜
i i
z?Si
Функцию (18) можно рассматривать как функцию выигрыша
i-го АЭ и определять по ней нечеткое равновесие Нэша. В пре-
дельном случае (при переходе к четким предпочтениям АЭ) нечет-
кое равновесие Нэша переходит в четкое (см. выражение (6)).




75
2.2. Механизмы стимулирования

Рассмотрим задачу оперативного управления продолжительно-
стью проекта. Пусть проект состоит из двух участников – руково-
дителя проекта (центра в терминологии теории активных систем
[22, 78]), осуществляющего управление проектом, и исполнителя
(активного элемента (АЭ) в терминологии теории активных сис-
тем). Таким образом, проект рассматривается в виде активной
системы (АС), имеющей следующую структуру.
Участники АС - менеджер проекта (центр) и исполнитель (АЭ).
Центр выполняет планирующие, управляющие и контролирующие
функции и несет ответственность за завершение проекта в дирек-
тивные сроки с требуемым качеством и запланированными затра-
тами. Активный элемент является исполнителем работ по проекту,
то есть от его действий (и, быть может, от состояния природы – см.
первую главу) зависят качество, сроки и т.д.
В качестве основного выберем такой показатель как время за-
вершения проекта (см. также обсуждение во введении к данной
главе). Если в процессе реализации проекта оказывается, что про-
гнозируемое время его завершения отличается от планового, то
возникает необходимость в оперативном управлении – дополни-
тельных мерах по сокращению продолжительности выполнения
незавершенной части проекта. Реализация этих мер требует соот-
ветствующих затрат, то есть возникает задача определения опти-
мальных коррекционных воздействий, причем критерием эффек-
тивности, как правило, выступают финансовые показатели,
зависящие как от продолжительности проекта (санкции и штрафы
за задержку сроков завершения и т.д.), так и от затрат на выполне-
ние проекта (см. примеры в первой главе).
При решении задачи управления центр должен учитывать ак-
тивность АЭ, то есть вознаграждение исполнителя в зависимости
от сокращения им сроков должно быть согласовано с его предпоч-
тениями. В теории активных систем задачи согласования предпоч-
тений и интересов изучаются при синтезе механизмов стимулиро-
вания [77, 79], поэтому рассмотрим постановку задачи
стимулирования исполнителей, в которой критерием эффективно-
сти являются финансовые показатели центра, зависящие в свою
очередь от продолжительности проекта.
76
Последовательность изложения материала настоящего раздела
следующая. Сначала рассматривается задача стимулирования в
детерминированной АС, то есть в АС, функционирующей в усло-
виях полной информированности о существенных внешних и внут-
ренних параметрах. Затем исследуются более сложные модели,
учитывающие возможность наличия интервальной, вероятностной
или нечеткой неопределенности. В качестве одного из способов
снижения неопределенности предлагается также использовать
механизмы с сообщением информации, которые подробно рассмат-
риваются в следующем разделе.

2.2.1. Детерминированная АС (отсутствие неопределенности)

Будем считать, что известны плановое T0 и прогнозируемое T
времена завершения проекта (ограничимся наиболее распростра-
ненным на практике случаем T ? T0). Как отмечалось выше, рас-
сматриваемая модель охватывает как задачи планирования (решае-
мые до начала реализации проекта), так и задачи оперативного
управления, которые могут последовательно решаться в ходе реа-
лизации проекта по мере поступления новой информации – уточне-
ния прогнозируемого времени завершения проекта и других пара-
метров (см. модели в разделах 1.2. и 1.3, а также механизмы
экспертного прогнозирования в разделе 2.1).
Предположим, что в случае задержки выполнения проекта
центр выплачивает, например, заказчику или вышестоящей органи-
зации, штрафы ?(t), t ? T0 (в частном случае, например, штрафы
могут быть линейны: ?(t) = ?0 t). Исполнитель имеет возможность
сократить срок реализации проекта (относительно прогнозируемо-
го) или, что то же самое – сократить продолжительность одной или
нескольких критических операций, что требует от него определен-
ных затрат1 c(y), где y ? A – время, на которое сокращается про-
должительность проекта. Переменная y может интерпретироваться
как действие АЭ – выбираемая им стратегия.


1
Следует подчеркнуть, что в настоящем и следующем разделе c(y) –
затраты исполнителя, но не затраты на проект (как это имело место
во введении и первой главе)!
77
Для того, чтобы побудить АЭ к выбору некоторой стратегии
центр должен использовать соответствующую систему стимулиро-
вания, то есть назначить зависимость ?(y) вознаграждения АЭ от
выбираемых им действий. Эта зависимость ?(?) ? M называется
функцией стимулирования (M – множество допустимых функций
стимулирования).
Интересы участников проекта (активной системы) выражены
их целевыми функциями. Будем считать, что рациональность пове-
дения участников проекта заключается в стремлении к максимиза-
ции целевых функций. Более подробно, предположим, что центр
заинтересован в том, чтобы минимизировать свои выплаты (сум-
марные выплаты по штрафам и стимулированию АЭ), то есть
целевая функция центра •(?(?), y) имеет вид:
(1) ?(?(?), y) = ?(y) + ?(T – T0 – y).
Целевая функция активного элемента f(?(?), y) представляет
собой разность между стимулированием и затратами:
(2) f(?(?), y) = ?(y) – c(y).
Введем следующие предположения:
А.2.3. A = [0; T – T0].
А.2.4. M – множество кусочно-непрерывных положительно-
значных функций.
А.2.5. c(y) – положительнозначная, монотонно возрастающая,
строго выпуклая, непрерывно дифференцируемая функция, такая,
что c(0) = 0.
В ходе всего изложения материала настоящего раздела, если не
будет оговорено особо, будем предполагать, что выполнена гипоте-
за благожелательности (ГБ) – из множества реализуемых действий1
P(?) = Arg max f(y, ?)
y? A
активный элемент выбирает действия, наиболее благоприятные для
центра.
Последовательность функционирования следующая: центр со-
общает АЭ функцию стимулирования, после чего АЭ при извест-
ной функции стимулирования выбирает свое действие. Следова-

1
Реализуемым некоторой системой стимулирования действием АЭ
называется такое его допустимое действие, на котором достигается
максимум его целевой функции [78, 79].
78
тельно, задача центра заключается в выборе такой допустимой
системы стимулирования, которая минимизировала бы значение
его целевой функции при условии, что АЭ выбирает допустимое
действие, максимизирующее его собственную целевую функцию:
?? (? ( y * ), y * ) > min
? ? ?M , y * ?[ 0;T ? T0 ]
(3) ? .
? y ? Arg max f ( y )
*
? y? A
Задача (3) является игрой типа Г2 (в терминологии теории ие-
рархических игр [38, 40, 56]) и может рассматриваться как детер-
минированная задача стимулирования второго рода (в терминоло-
гии теории активных систем [22, 78]). Ее решение дается
следующей теоремой1.
Теорема 2.3. Оптимальное решение ?*(y) задачи (3) имеет вид:
?c( y * ), y = y *
(4) ? (y) = ?
*
,
y ? y*
? 0,
где оптимальное действие АЭ y* определяется следующим выраже-
нием:
(5) y* = arg min ?(y).
y?[ 0, T ?T0 ]
При использовании центром системы стимулирования (4) (на-
зываемой в теории активных систем квазикомпенсаторной
[22, 78, 79]), максимальное значение целевой функции равно нулю
и принимает это значение в двух точках, то есть P(?*) = {0} ? {y*}.
В [78, 79] доказано, что оптимальной является такая допусти-
мая система стимулирования, на которой достигается минимум
затрат центра на стимулирование по реализации действий АЭ.
Поэтому докажем, что система стимулирования (4)-(5) характери-
зуется минимальными затратами центра на стимулирование. Пусть
˜
?,
существует система стимулирования такая, что
˜ ),? (y*) < ?*(y*). Условие реализуемости имеет вид:
˜
y ? P(?
*


1
В теории активных систем существует семейство теорем, дающих
оптимальное решение задачи стимулирования в различных моделях АС

<< Пред. стр.

стр. 8
(общее количество: 14)

ОГЛАВЛЕНИЕ

След. стр. >>