Семья

Оптимальное поведение. Оптимальное поведение системы по А.Л. Шамису. Уровни социальной сложности

«… главной постоянной задачей поведения живых организмов являются не реакции на внешние стимулы, а активное, целенаправленное достижение целевых ситуаций в среде.

Необходимость защитных и других реакций на внешние стимулы, естественно, не отрицается. Однако, хотя исследование рефлекторного и инстинктивного поведения очень много дало для понимания работы нейронов и нервной системы в целом, для понимания мышления этих знаний недостаточно. Поэтому нас в основном будут интересовать более сложные типы поведения, требующие формирования целей, оценки вариантов поведения и принятия решения в ситуации выбора.

Ограничиваться, как это часто делают в физиологии, словами о конечном приспособительном эффекте, явно недостаточно. Хотелось бы сформулировать задачу более точно. Целевых ситуаций может быть много. Какие ситуации, в каком порядке и почему становятся целями направленного поведения? Какая задача решается в поведении? Каковы правила принятия решения в поведении? Ниже мы попробуем сформулировать ответы на эти вопросы в виде принципа оптимальности (вариационного принципа) и вытекающих из этого принципа следствий.

Развитие науки обычно идет от эксперимента к теории, от наблюдения фактов к их обобщению. Эти обобщения могут фиксироваться в виде законов, которые в совокупности объясняют все наблюдаемые факты и предсказывают новые. Такими законами, например, являются законы Ньютона или законы геометрической оптики. Но возможен и следующий шаг обобщения в виде принципа оптимальности, который формулируется как требование минимума или максимума какой-либо величины. Так, все законы механики обобщает принцип наименьшего действия, а законы геометрической оптики - принцип скорейшего пути Ферма.

Многие учёные давно пришли к мысли о том, что в природе всё делается оптимально, и все обобщения, а значит и факты в любой области естествознания, могут быть выведены из единого принципа оптимальности. Нужно только понять, что экономит природа в объектах и явлениях, относящихся к этой области естествознания. В пределе может существовать и общий вариационный принцип, определяющий все в нашем мире.

Мысль о том, что науку можно строить не снизу вверх - от эксперимента к теории, а сверху вниз - от принципа оптимальности к частным законам, была высказана Эйлером . Однако ни Эйлеру, ни кому-либо другому найти такой общий принцип не удалось.

Что же экономит природа? В качестве вариантов напрашиваются и чаще всего рассматриваются: энергия, вещество, действие (произведение массы, пути и скорости), энтропия (негэнтропия), информация.

А, может быть, экономится время?

Например, экономия энергии при условии удовлетворения нужд организма или при условии достижения целевой ситуации, экономия ресурсов при достижении заданного результата, или максимум взаимной информации между стимулами и реакциями при условии достижения определенного результата и т. п. С помощью подобных нестрогих условий (оговорок) можно практически всегда объяснить несовпадения результатов эксперимента и теории. Кроме того, почти всегда то, что задаётся только как находящееся на втором плане нестрогое внешнее условие, необходимое для выполнения этих принципов оптимальности, на самом деле должно находиться в центре внимания и определять цели и принципы поведения.

Более общим и естественным представляется рассматриваемый ниже принцип mах Т - принцип максимизации времени пребывания системы внутри условной области существования, определяемой как область допустимых значений регулируемых переменных.

Введение принципа mах T и упрощенной формальной модели поведения базируется на следующих конкретизирующих предпосылках. Для живых организмов характерно наличие потребностей. Удовлетворение физиологических потребностей, являющееся необходимым условием существования, может происходить только в определенных ситуациях взаимодействия организма со средой. Эти ситуации являются альтернативными целями направленного поведения. Поведение животных в каждый момент направлено в общем случае на достижение одной цели, соответствующей одной потребности.

Живой организм как целое неустойчив в том смысле, что физиологические потребности имеют общее свойство, заключающееся в их нарастании с течением времени. Поддержание устойчивости - непрерывная задача живых организмов, решаемая как на клеточном уровне за счет внутренней работы, т. е. ассимиляции органических веществ и синтеза живой неравновесной структуры, так и на уровне целого организма за счёт внешней работы, т. е. активного целенаправленного поведения в среде.

Физиологические переменные, определяющие наличие и величину первичных физиологических потребностей, должны иметь согласованные значения. Можно упрощённо предположить, что в многомерном пространстве физиологических переменных имеется область, соответствующая нормальному состоянию организма. Можно также предположить, что имеется ещё одна более широкая область - область допустимых значений, выход за пределы которой гибелен для организма, и объективная задача поведения - максимально долго поддерживать величины физиологических переменных в пределах этой области.

Задача поведения не исчерпывается прямой задачей выживания отдельной особи, т. е. необходимостью поддержания значений первичных физиологических переменных организма и соответствующих им потребностей внутри области допустимых значений. К первичным физиологическим потребностям самого организма добавляются потребности, определяемые необходимостью продолжения рода, а также вторичные потребности, косвенно влияющие на первичные. Последнее особенно характерно для человека вследствие его сложного общественного способа существования. Добавление в рассмотрение вторичных потребностей не меняет общей схемы: система (живой организм) обладает внутренней неустойчивостью - неудовлетворяемые потребности увеличиваются. Потребности в общем случае альтернативны, т. е. удовлетворяются раздельно и поочередно.

Теперь сформулируем принцип оптимальности в поведении. Цель поведения - это максимизация времени пребывания системы внутри области допустимых значений регулируемых переменных (первичных и вторичных потребностей) - принцип mах T».

Шамис А.Л., Пути моделирования мышления: активные синергические нейронные сети, мышление и творчество, формальные модели поведения и «распознавания с пониманимем», М., «КомКнига», 2006 г., с. 27-30.

Общая схема принятия решений. Виды и параметры экономических задач оптимизации и управления

Любая задача по принятию решений характеризуется наличием некоторого количества лиц, которые имеют определенные возможности и преследуют определенные цели. Поэтому чтобы построить модель принятия решений необходимо ответить на вопросы:

· кто принимает решения;

· каковы цели принятия решения;

· в чем состоит принятие решения;

· определить круг вариантов;

· при каких условиях принимается решение.

Для того чтобы построить модель, нужно ввести некоторые обозначения.

N – это множество всех сторон, принимающих решение. N=(1; n) , т.е. имеется n участников. Каждый участник называется лицом, принимающим решение (физическое лицо, юридическое лицо).

Допустим, множество всех допустимых решений предварительно изучено и описано в виде неравенства (математически).

Если обозначить через х 1 , х 2 ,…,х n представленные альтернативы, то процесс принятия решения сводится к следующему: каждое лицо выбирает конкретный элемент из всего множества решений, т. е. .

В результате набор х 1 , х 2 ,…,х n можно назвать определенной ситуацией.

Для оценки вектора с точки зрения преследуемых целей строится функция , которая называется целевой функцией, которая ставит в соответствие каждой ситуации числовые значения (оценки) . Например, доходы фирм в ситуации либо затраты тех же фирм в данной ситуации.

Исходя из вышесказанного, цель i -ого лица, принимающего решение можно сформулировать так: выбрать такое , чтобы в ситуации х число будет либо максимальным, либо минимальным.

Однако влияние на данную ситуацию других сторон усложняет процесс, т.е. происходит пересечение интересов отдельных лиц. Возникает конфликтность, которая выражается в том, что функция помимо х i зависит еще и от x j , . Поэтому в моделях принятия решений с несколькими участниками их цели приходится формализовать иначе, чем максимизация (минимизация) значений функции .

Таким образом, общая схема задачи по принятию решений может быть сформулирована следующим образом:

Это совокупность всех характеристик (условий), при которых приходится принимать решение.

Если в формуле (*) N состоит только из одного элемента, а все условия и предпосылки исходной реальной задачи можно описать в виде множества допустимых решений, то получаем структуру оптимизационной или экстремальной задачи:

Данная схема используется лицом, принимающим решение, как планирующая и с помощью нее можно описать две экстремальные задачи:

Если в данной задаче учитывается фактор времени, то называется задачей оптимального управления.


Если у лица, принимающего решение, существует несколько целей, то уравнение (*) будет иметь вид . В данном случае функции определены на одном и том же множестве Х. Такие задачи называют задачами многокритериальной оптимизации.

Существуют задачи по принятию решений, которые получили название исходя из своего назначения: системы массового обслуживания, задачи сетевого и календарного планирования, теория надежности и т. д.

Если элементы модели (*) не зависят от времени, т. е. процесс принятия решения является мгновенным, то задача называется статической, в противном случае – динамической.

Если элементы (*) не содержат случайных величин, то задача является детерминированные, в противном случае – стохастические.

Примеры задач:

1. Задача оптимального раскроя

Фирма изготавливает изделия из нескольких деталей (p) . Причем в одно изделие эти детали входят в количествах . С этой целью производится раскрой m партий. В i -ой партии имеется b i единиц материала. Каждую единицу материала можно раскроить n способами. При этом получается a ijn количество деталей. Требуется составить план раскроя, чтобы получить максимальное число изделий.

2. Транспортная задача

Имеется n поставщиков и m потребителей одного и того же продукта. Известен выпуск продукции у каждого поставщика и потребности в ней каждого потребителя, а также затраты на перевозки продукции от поставщика к потребителю. Требуется построить план перевозок с минимальными транспортными расходами с учетом пожеланий поставщиков и спроса потребителей.

3. Задача о назначении на работу

Имеется n работ и n исполнителей. Стоимость выполнения работы i исполнителем j равна c ij . Нужно распределить исполнителей на работы, чтобы минимизировать оплату труда.

4. Задача о распределении вложений

Имеется n проектов. Причем для j -ого проекта известен ожидаемый эффект от реализации d и необходимая величина капиталовложений g j . Общий объем капиталовложений нее может превышать заданной величины b . Требуется определить, какие проекты необходимо реализовать, чтобы суммарный эффект был наибольшим.

5. Задача о размещении производства

Планируется выпуск m видов продукции, которые могут производиться на n предприятиях. Издержки производства, сбыта единицы продукции, плановый объем годового производства и плановая стоимость единицы продукции каждого вида известны. Требуется из n предприятий выбрать такие m , каждое из которых будет производить один вид продукции.

В задачах принятия решений под принципом оптимальности понимается совокупность правил, при помощи которых лицо, принимающее решение, определяет свои действия, причем таким образом, чтобы максимально обеспечить достижение определенной цели. Такое решение называется оптимальным.

Конечная цель исследования любой задачи – это нахождение оптимального решения для всех лиц, их принимающих.

Принцип оптимальности выбирается без учета конкретных условий принятия решений (количество участников, целей, возможностей, характер столкновения интересов).

Формализация оптимального поведения – это один из сложных этапов математического моделирования.

Разработка любого принципа оптимальности оправдана, если отвечает следующим требованиям:

2. Существование оптимального решения при различных дополнительных предположениях.

3. Возможность выявления отличительных признаков оптимальных решений для их обнаружения (необходимость и достаточность оптимальности).

4. Наличие методов вычисления оптимального решения (точного или приблизительного).

В теории принятия решений разработано большое количество формальных принципов оптимального поведения:

1. Принцип максимизации (минимизации) применяется в основном в задачах математического программирования, рассчитанных на нахождение оптимальных минимума или максимума.

2. Принцип свертки критериев применяется в основном в задачах при оптимизации многих критериев одним координирующим центром (задача многокритериальной оптимизации).

Для каждого из критериев или целевых функций экспертным путем назначаются веса или числа , причем каждое из них положительное и их сумма равна 1. Каждое показывает важность или значимость своего критерия . Принимаемое решение должно максимизировать или минимизировать свертку критериев, причем решение х выбирается из множества Х.

3. Принцип лексикографического предпочтения. Сначала критерий оптимальности ранжируется по важности и составляется в виде набора целевых функций . Некоторое решение х предпочтительнее решения , если выполняется одно из условий:

Содержится n+1 уравнений. n+1 – когда все совпадают: .

4. Принцип минимакса применяется при столкновении интересов противоборствующих сторон, т. е. в условиях конфликта. Каждое лицо, принимающее решение, для каждой своей стратегии рассчитывает гарантированный результат. Затем окончательно выбирает ту стратегию, для которой этот результат будет наибольшим. Такое действие не дает максимального выигрыша, однако является единственно разумным принципом в условиях конфликта. В частности исключается всякий риск.

5. Принцип равновесия по Нэшу является обобщением принципа минимакса, когда во взаимодействии участвует много сторон, каждая из которых преследует свою цель, но прямого противостояния нет. Если количество лиц, принимающих решение, равно n , то набор выбранных ситуаций х 1 , х 2 ,…,х n называется равновесным, если одностороннее отклонение любого лица от этой ситуации, то может привести лишь к уменьшению его выигрыша. В ситуации равновесия участники не получают максимального выигрыша, но они даются придерживаться данной ситуации.

6. Принцип оптимальности по Парето предполагает в качестве оптимальных те ситуации, в которых улучшение выигрыша отдельного участника невозможно без ухудшения выигрышей других участников. Данный принцип предъявляет более слабые требования к понятию оптимальности, чем принцип равновесия по Нэшу, поэтому парето-оптимальные ситуации существуют почти всегда.

7. Принцип недоминирующих исходов является представителем многих принципов оптимальности в задачах коллективного принятия решений. Это приводит к понятию ядра решений. В данном случае все участники объединяются и совместными согласованными действиями максимизируют общий выигрыш. Принцип недоминируемости – один из принципов справедливого дележа между участниками общего выигрыша. Возникает ситуация, когда один из участников не может аргументировано возразить против предлагаемого способа дележа.

8. Принцип устойчивости (угрозы и контругрозы). Каждая команда участников выдвигает свое предложение с определенными условиями. Если это условия не будут выполнены, то последуют определенные санкции. Оптимальным является решение, когда против всякой угрозы находится контругроза со стороны другой команды.

9. Арбитражные схемы, основанные на положении конфликта и на решении его с помощью арбитражного судьи. Оптимальное решение строится при помощи системы аксиом, включающих в себя несколько принципов оптимальности.

10. Принцип крайнего пессимизма или критерий Вальда. По этому принципу игра с природой или принятие решения в условиях неопределенности ведется как с разумным агрессивным противником, делающим все для того, чтобы помещать достигнуть определенного успеха.

11. Принцип минимаксимального риска является пессимистическим по своей природе, но при выборе оптимальной стратегии ориентируется не на выигрыш, а на риск, т. е. риск определяется как разность между максимальным выигрышем и реальным выигрышем. Оптимальной считается величина минимального выигрыша.

12. Принцип пессимизма-оптимизма или критерий Гурвица. Принцип использует максимальное взвешенное среднее между крайним оптимизмом и крайним пессимизмом. Варианты выбираются из субъективных соображений, исходя из опасности ситуации.

Концепция динамической устойчивости заключается в следующем. Так как все изложенные принципы сформулированы относительно статистических задач, поэтому применение их в динамических задачах сопровождается осложнениями, т. к. любой принцип оптимальности, выбранный в начальном состоянии, оставался оптимальным до конца динамического процесса. Такое свойство называется динамической устойчивостью и может рассматриваться как принцип реализуемости статистических принципов оптимального поведения в динамических моделях принятия решений.

Организационная деятельность. Альтернативные парадигмы организационного процесса.

Все многообразие подходов к организационной деятельности можно представить в виде двух альтернативных парадигм (табл. 5.1). Приведенные парадигмы отражают два принципиально разных подхода к организационной деятельности. Первый можно условно назвать подходом принуждения, когда для создания и поддержания необходимо прикладывать усилия. Как только эти усилия прекращаются, система возвращается к исходному состоянию. Можно конструировать сколь угодно много искусственных организационных схем, но они будут непрочными и неэффективными. История знает немало таких примеров: колхозы, совнархозы, производственные объединения и т.д.

Таблица 5.1

Альтернативные парадигмы организационного процесса

Второй подход ориентирован на естественные процессы организации, развивающийся достаточно долго, чтобы дать место и волеизъявлению человека. Цели человека, выпадающие из диапазона естественного развития (например, создание колхозов), обречены на провал, какие бы ресурсы ни привлекались для их достижения. Вместе с тем здесь нет фатализма – человек с его целеполагающей и волевой деятельностью не исключается из процесса развития, надо лишь выполнить условие: пространство целей человека должно совпадать с диапазоном направлений естественного (возможного в принципе) развития. Ориентацию на естественное развитие можно найти и в исследованиях А. Смита, который утверждал, что для социально-экономического развития общества необходимы мир, легкие налоги и терпимость в управлении, а все остальное сделает естественный ход вещей.

Система управления - кибернетический подход. Принципы управления: принцип разомкнутого управления; принцип разомкнутого управления с компенсацией возмущений; принцип замкнутого управления; принцип однократного управления.

Организация как процесс организовывания – одна из основных функций управления. Под функцией управления понимают совокупность повторяющихся управленческих действий, объединенных единством содержания. Поскольку организация (как процесс) служит функцией управления, любое управление представляет собой организационную деятельность, хотя и не сводится только к ней.

Управление – особым образом ориентированное воздействие на систему, обеспечивающее придание ей требуемых свойств или состояний. Одним из атрибутов состояния является структура.

Организовать – значит, прежде всего создать (или изменить) структуру.

При различиях в подходах к построению систем управления существуют общие закономерности, разработанные в кибернетике. С позиций кибернетического подхода система управления представляет собой целостную совокупность субъекта управления (управляющая система), объекта управления (управляемая система), а также прямых и обратных связей между ними. Предполагается также, что система управления взаимодействует с внешней средой.

Базовым классификационным признаком построения систем управления, определяющим вид системы и ее потенциальные возможности, способ организации контура управления. Согласно последнему выделяют несколько принципов организации контура управления.

Принцип разомкнутого (программного) управления. В основе этого принципа лежит идея автономного воздействия на систему независимо от условий ее работы. Очевидно, что область практического применения этого принципа предполагает достоверность знания состояния среды и системы на всем интервале ее функционирования. Тогда можно предопределить реакцию системы на рассчитанное воздействие, которое заранее программируется в виде функции (рис. 5.1).

Рис. 5.1. Принцип разомкнутого управления

Если данное воздействие отлично от предполагаемого, немедленно последуют отклонения в характере изменения выходных координат, т.е. система окажется незащищенной от возмущений в исходном смысле этого слова. Поэтому подобный принцип используется при уверенности в достоверности сведений об условиях работы системы. Например, для организационных систем подобная уверенность допустима при высокой исполнительской дисциплине, когда отданное распоряжение не нуждается в последующем контроле. Иногда такое управление называют директивным. Несомненным достоинством такой схемы управления является простота организации управления.

Принцип разомкнутого управления с компенсацией возмущений. Содержание подхода состоит в стремлении ликвидировать ограниченность первой схемы, т.е. нерегулируемое воздействие возмущений на функционирование системы. Возможность компенсации возмущений, а значит, ликвидация недостоверности априорной информации базируется на доступности возмущений измерениям (рис. 5.2).


Рис. 5.2. Принцип компенсационного управления

Измерение возмущений позволяет определить компенсирующее управление, парирующее последствия возмущений. Обычно наряду с корректирующим управлением система подвергается программному воздействию. Однако на практике далеко не всегда удается зафиксировать информацию о внешних возмущениях, не говоря уже о контроле отклонений параметров системы или неожиданных структурных изменениях. При наличии информации о возмущениях принцип их компенсации путем введения компенсирующего управления представляет практический интерес.

Принцип замкнутого управления. Рассмотренные выше принципы относятся к классу разомкнутых контуров управления: величина управления не зависит от поведения объекта, а представляет собой функцию времени или возмущения. Класс замкнутых контуров управления образуют системы с отрицательной обратной связью, воплощающие базовый принцип кибернетики.

В таких системах заранее программируется не входное воздействие, а требуемое состояние системы, т.е. следствие воздействия на объект, в том числе управления. Следовательно, возможна ситуация, когда возмущение позитивно воздействует на динамику системы, если приближает ее состояние к желаемому. Для реализации принципа априорно находится программный закон изменения состояния системы во времени Спр(t), а задача системы формулируется как обеспечение приближения действительного состояния к желаемому (рис. 5.3). Решение этой задачи достигается определением разности между желаемым состоянием и действительным:

∆С(t) = Спр(t) – С(t).


Рис 5. 3 Принцип замкнутого управления

Данная разность используется для управления, призванного свести к минимуму обнаруженное рассогласование. Тем самым обеспечивается приближение регулируемой координаты к программной функции независимо от причин, вызвавших появление разности, будь то возмущения различного происхождения или ошибки регулирования. Качество управления сказывается на характере переходного процесса и установившейся ошибке – несовпадении программного и действительного конечного состояния.

В зависимости от входного сигнала в теории управления различают:

■ системы программного регулирования (рассматриваемый случай);

■ системы стабилизации, когда cпр(t) = 0;

■ системы слежения, когда входной сигнал априорно неизвестен.

Эта детализация никак не сказывается на реализации принципа, но вносит специфику в технику построения системы.

Широкое распространение этого принципа в естественных и искусственных системах объясняется продуктивностью организации контура: задача управления эффективно решается на концептуальном уровне благодаря введению отрицательной обратной связи.

Рассмотрен случай программирования изменения во времени состояния системы Спр(t),что означает предварительный расчет траектории в пространстве состояний. Но из поля зрения выпал вопрос, как это сделать. Ответ лимитируется двумя требованиями к траектории, которая должна:

1) проходить через цель;

2) удовлетворять экстремуму критерия качества, т.е. быть оптимальной.

В формализованных динамических системах для отыскания подобной траектории привлекается аппарат вариационного исчисления или его современные модификации: принцип максимума Л. Понтрягина или динамическое программирование Р. Беллмана. В том случае, когда задача сводится к поиску неизвестных параметров (коэффициентов) системы, для ее решения привлекаются методы математического программирования – требуется отыскать экстремум функции качества (показателя) в пространстве параметров. Для решения плохо формализуемых проблем остается уповать на эвристические решения, основанные на футурологических прогнозах, или на результаты имитационного математического моделирования. Точность подобных решений оценить сложно.

Возвратимся к задаче программирования. Если существует способ расчета программной траектории для формализованных задач, то естественно потребовать от системы управления, чтобы она довольствовалась целеуказанием, а программное изменение состояния системы находила непосредственно в процессе управления (терминальное управление). Такая организация системы, конечно, усложнит алгоритм управления, но позволит свести к минимуму исходную информацию, а значит, сделает управление более оперативным. Подобная задача в 1960-х гг. была теоретически решена профессором Е. Горбатовым для управления движением баллистических ракет и космических аппаратов.

В отношении постановки и решения задачи оптимального управления следует учитывать следующее принципиальное обстоятельство.

Выбрать оптимальное поведение системы можно, только если достоверно известны поведение изучаемого объекта на всем интервале управления и условия, в которых происходит движение.

Оптимальные решения могут быть получены и при выполнении других, дополнительных допущений, но дело как раз в том, что каждый случай следует оговорить особо, решение будет справедливо “с точностью до условий”.

Проиллюстрируем сформулированное положение на примере поведения бегуна, стремящегося достичь высокого результата. Если речь идет о короткой дистанции (100, 200 м), то подготовленный спортсмен ставит целью обеспечить максимальную скорость в каждый момент времени. При беге на более длинные дистанции успех определяется его умением правильно распределять силы на трассе, а для этого он должен отчетливо представлять свои возможности, рельеф маршрута и особенности соперников. В условиях ограниченных ресурсов ни о какой максимальной скорости в каждый момент не может идти и речи.

Вполне очевидно, что приведенное ограничение выполняется только в рамках детерминированной постановки задачи, т.е. когда априорно все достоверно известно. Такие условия оказываются чрезмерными для реальных задач: прокрустово ложе детерминизма не соответствует действительным условиям функционирования системы. Априорность нашего знания чрезвычайно сомнительна как в отношении самой системы, так и среды и ее взаимодействия с тем или иным объектом. Достоверность априорных сведений тем меньше, чем сложнее система, что не добавляет оптимизма исследователям, проводящим процедуру синтеза.

Подобная неопределенность привела к появлению целого направления в теории управления, базирующегося на учете стохастических условий существования системы. Самые конструктивные результаты были получены при разработке принципов адаптивных и самонастраивающихся систем.

Оптимизация управления. Адаптивные и самонастраивающиеся, системы.

Адаптивные системы позволяют справляться с неопределенностью путем получения дополнительной информации о состоянии объекта и его взаимодействии со средой в процессе управления с последующей перестройкой структуры системы и изменением ее параметров при отклонении условий работы от априорно известных (рис. 5.4). При этом, как правило, цель трансформаций состоит в приближении характеристик системы к априорным, использовавшимся при синтезе управления. Таким образом, адаптация ориентирована на сохранение гомеостаза системы в условиях возмущений.


Рис. 5.4. Адаптивная система

Одной из сложнейших конструктивных составляющих этой задачи является получение сведений о состоянии среды, без чего затруднительно проводить адаптацию.

Примером успешного получения информации о состоянии среды может служить изобретение трубки Пито, которой снабжены практически все летательные аппараты. Трубка позволяет измерить скоростной напор – важнейшую характеристику, от которой зависят непосредственно все аэродинамические силы. Результаты измерения используются для настройки автопилота. Аналогичную роль в социальных системах играют социологические опросы, позволяющие корректировать решения внутри- и внешнеполитических проблем.

Эффективным приемом изучения динамики объекта управления является метод дуального управления, некогда предложенный А. Фельдбаумом. Суть его состоит в том, что на объект наряду с командами управления подаются специальные тестирующие сигналы, реакция на которые заранее установлена для априорной модели. По отклонению реакции объекта от эталонной судят о взаимодействии модели с внешней средой.

Подобный прием использовался в русской контрразведке во время Первой мировой войны для выявления шпиона. Выделялся круг сотрудников, подозреваемых в предательстве, и каждому из этого круга “доверялась” важная, но ложная информация, имеющая уникальный характер. Наблюдалась реакция противника, по которой и идентифицировался изменник.

От адаптивных систем отличают класс самонастраивающихся систем. Последние в процессе адаптации настраиваются. Однако на принятом уровне общности структура самонастраивающейся системы аналогична структуре адаптивной системы (см. рис. 5.4).

Относительно процессов адаптации и самонастройки можно отметить, что их возможность в конкретных случаях в основном определяется назначением системы и ее техническим воплощением. Подобная теория систем изобилует иллюстрациями, но, как представляется, не содержит обобщающих достижений.

Другой путь преодоления недостаточности априорных данных о процессе управления заключается в совмещении процесса управления с процедурой его синтеза. Традиционно алгоритм управления есть результат синтеза, базирующийся на допущении детерминированного описания модели движения. Но очевидно, что отклонения в движении принятой модели сказываются на точности достижения цели и на качестве процессов, т.е. приводят к отклонению от экстремума критерия. Отсюда следует, что строить управление нужно как терминальное, рассчитывая траекторию в реальном времени и обновляя сведения о модели объекта и условиях движения. Конечно, и в данном случае необходимо экстраполировать условия движения на весь оставшийся интервал управления, но по мере приближения к цели точность экстраполяции возрастает, а значит, повышается качество управления.

В этом видна аналогия с действиями правительства, которое не в состоянии выполнять плановые задания, например бюджетные. Условия функционирования экономики меняются нерасчетным образом, с нарушением прогнозов, поэтому приходится постоянно корректировать намеченный план в стремлении достичь итоговых показателей, в частности, производить секвестр. Отклонения от априорных предположений могут быть столь велики, что имеющимися ресурсами и принимаемыми мерами управления уже нельзя обеспечить выполнение цели. Тогда приходится “приближать” цель, размещая ее внутри новой области достижимости. Отметим, что описанная схема справедлива только для устойчивой системы. Низкое качество организации управления может привести к дестабилизации и, как следствие, к разрушению всей системы.

Остановимся еще на одном принципе управления, лежащем в основе развитой теории исследования операций.

Принцип однократного управления. Широкий круг практически значимых задач предполагает необходимость осуществить однократный акт управления, а именно – принять некоторое решение, последствия которого сказываются длительное время. Разумеется, и традиционное управление можно интерпретировать как последовательность разовых решений. Здесь мы вновь сталкиваемся с проблемой дискретности и непрерывности, граница между которыми так же размыта, как и между статическими и динамическими системами. Однако различие все-таки существует: в классической теории управления исходят из того, что воздействие на систему есть процесс, функция времени или параметров состояния, а не однократная процедура.

Другой отличительной особенностью исследования операций является то, что эта наука оперирует с управлениями – константами, параметрами системы. Тогда если в динамических задачах в качестве критерия используется математическая конструкция – функционал, оценивающий движение системы, то в исследовании операций критерий имеет вид функции, заданной на множества исследуемых параметров системы.

Область практических задач, охватываемая исследованием операций, весьма обширна и включает мероприятия по распределению ресурсов, выбору маршрутов, составлению планов, управлению запасами, очередями в задачах массового обслуживания и др. При решении соответствующих задач привлекается изложенная выше методология их описания с учетом категорий модели, состояния, цели, критерия, управления. Так же формулируется и решается проблема оптимизации, состоящая в нахождении экстремума критериальной функции в пространстве параметров. Задачи решаются как в детерминированной, так и в стохастической постановках.

Поскольку процедура оперирования с константами существенно проще, чем действия с функциями, теория исследования операций оказалась более продвинутой, нежели общая теория систем и, в частности, теория управления динамическими системами. Исследование операций предлагает больший арсенал математических средств, порой весьма утонченных, для решения широкого круга практически значимых задач. Вся совокупность математических методов, обслуживающих исследование операций, получила название математического программирования. Так, в рамках исследования операций развивается теория принятия решений – чрезвычайно актуальное направление.

Теория принятия решений, по сути, рассматривает процедуру оптимизации условий детального описания векторного критерия и особенности установления его экстремального значения. Так, для постановки задачи характерен критерий, состоящий из нескольких составляющих, т.е. многокритериальная задача.

Чтобы подчеркнуть субъективизм критерия и процесса принятия решения, в рассмотрение вводится лицо, принимающее решение (ЛИР), обладающее индивидуальным взглядом на проблему. При изучении решений формальными методами это проявляется через систему предпочтений при оценке той или иной составляющей критерия.

Как правило, для принятия решения ЛПР получает несколько вариантов действий, каждый из которых подвергается оценке. Такой подход максимально приближен к реальным условиям действий ответственного субъекта в организационной системе при выборе одного из вариантов, подготовленных аппаратом. За каждым из них стоит проработка (аналитическая, имитационное математическое моделирование) возможного хода развития событий с анализом конечных результатов – сценарий. Для удобства принятия ответственных решений организуются ситуационные комнаты, оборудованные наглядными средствами отображения сценариев на дисплеях или экранах. Для этого привлекаются специалисты (операционалисты), владеющие не только математическими методами анализа ситуаций и подготовки принятия решений, но и предметной областью.

Понятно, что результатом применения к объекту теории исследования операций, в частности, и теории принятия решений, является некоторый оптимальный план действий. Следовательно, на вход некоторого блока, “начиненного” оптимизационным алгоритмом и построенного с применением соответствующего метода математического программирования модели ситуации, подается информация: начальное состояние, цель, критерий качества, перечень варьируемых параметров, ограничения. (Модель системы используется при построении алгоритма.) Выход блока и есть искомый план. С точки зрения кибернетики такое построение классифицируется как разомкнутый контур управления, поскольку выходная информация не влияет на входной сигнал.

В принципе, рассмотренный подход можно применить и для случая замкнутого управления. Для этого необходимо организовать итерационный процесс во времени: после реализации плана ввести новое состояние системы в качестве начального условия и повторить цикл. Если позволяет задача, можно сократить плановый период за счет приближения цели к начальному состоянию системы. Тогда просматривается аналогия предлагаемых действий с рассмотренной выше итерационной процедурой терминального управления, также базирующейся на периодическом обновлении исходной информации. Более того, динамическую задачу, оперирующую с процессами, можно свести к аппроксимации функций функциональными рядами. При этом варьируемыми переменными будут уже параметры таких рядов, а значит, применим аппарат теории исследования операций. (Подобное осуществлено в теории вероятностей, когда случайные процессы описываются каноническим разложением.)

Изложенная методология начала находить применение в теории искусственного интеллекта при синтезе ситуационного управления.

Следует указать на опасность, связанную с практическим применением теории принятия решений недостаточно компетентными в теории систем лицами. Так, часто в организационных системах (государственных учреждениях, фирмах, финансовых организациях) принятие решения абсолютизируют и сводят к оперированию многочисленными показателями и оптимальному осуществлению разового управленческого акта. При этом из поля зрения упускают последствия произведенного действия для системы, забывают, что управляют не критерием, а системой, не учитывая многостадийность замкнутого процесса – от системы к ее состоянию, далее через показатели к решению и вновь к системе. Конечно, на этом долгом пути делается множество ошибок, объективных и субъективных, которых уже достаточно для серьезного отклонения от плановых результатов.

Осуществляется на базе структурно-динамического подхода. Важнейшими разделами этологии являются:

  1. морфология поведения - описание и анализ элементов поведения (поз и движений);
  2. функциональный анализ - анализ внешних и внутренних факторов поведения;
  3. сравнительные исследования – эволюционно-генетический анализ поведения [Дерягина, Бутовская, 1992, с. 6].

В рамках системного подхода поведение определяется как система взаимосвязанных компонентов, обеспечивающая интегрированный оптимальный ответ организма при взаимодействии со средой; это процесс, происходящий в определенном промежутке времени [Дерягина, Бутовская 1992, с.7]. В качестве компонентов системы выступают «внешние» двигательные реакции организма, возникающие в ответ на изменение окружающей среды. Объектом этологических исследований являются как инстинктивные формы поведения, так и те, которые связаны с длительным процессов научения (социальные традиции, орудийная деятельность, неритуальные формы коммуникации).

Современный анализ поведения строится на следующих принципах: 1) иерархичность; 2) динамичность; 3) количественный учет; 4) системный подход, учитывающий, что формы поведения между собой тесно взаимосвязаны.

Поведение организовано по иерархическому принципу . В системе поведения поэтому выделяют разные уровни интеграции:

  1. элементарные двигательные акты;
  2. позы и движения;
  3. последовательности взаимосвязанных поз и движений;
  4. ансамбли, представленные комплексами цепей действий;
  5. функциональные сферы - комплексы ансамблей, связанные с конкретным типом активности [Панов, 1978].

Центральным свойством системы поведения является упорядоченное взаимодействие ее компонентов для достижения конечной цели. Взаимосвязь обеспечивается с помощью цепей переходов между элементами и может рассматриваться в качестве специфического этологического механизма функционирования этой системы [Дерягина, Бутовская, 1992, с. 9].

Основные концепции и методы этологии человека заимствованы из этологии животных, но они адаптированы с учетом уникального положения человека среди других представителей животного царства. Важной особенностью этологии, в отличие от культурной антропологии, является применение методов прямого невключенного наблюдения (хотя методы включенного наблюдения также используются). Наблюдения организуются таким образом, чтобы наблюдаемый не подозревал об этом, или же не догадывался о цели проводимых наблюдений. Традиционным объектом исследования этологов является поведение, свойственное человеку как виду. Этология человека особое внимание уделяет анализу универсальных проявлений невербального поведения. Вторым аспектом исследований является анализ моделей социального поведения (агрессии, альтруизма, социального доминирования, родительского поведения).

Интересен вопрос о границах индивидуальной и культурной изменчивости поведения. Наблюдения за поведением могут вестись и в лаборатории. Но в этом случае чаше всего речь идет о прикладной этологии (применение этологических методов в психиатрии, в психотерапии или для экспериментальной проверки конкретной гипотезы). [Самохвалов и др., 1990; Cashdan, 1998; Grummer et al, 1998].

Если исходно этология человека концентрировалась на вопросах о том, как и до какой степени запрограммированы человеческие поступки и действия, что вело к противопоставлению филогенетических адаптаций процессам индивидуального научения, то в настоящее время уделяется внимание изучению моделей поведения в разных культурах (и субкультурах), анализу процессов формирования поведения в процессе индивидуального развития. Таким образом, на современном этапе эта наука изучает не только поведение, имеющее филогенетическое происхождение, но и учитывает, каким образом поведенческие универсалии могут трансформироваться в рамках культуры. Последнее обстоятельство способствовало развитию тесного сотрудничества этологов с искусствоведами, архитекторами, историками, социологами и психологами. В результате такого сотрудничества показано, что уникальные этологические данные могут быть получены путем тщательного анализа исторических материалов: летописей, эпоса, хроник, литературы, прессы, живописи, архитектуры и других предметов искусства [Еibl-Eibesfeldt, 1989; Dunbar et а1, 1995; Dunbar, Spoors, 1995].

Уровни социальной сложности

В современной этологии считается очевидным, что поведение отдельных особей у социальных животных и человека во многом зависит от социального контекста [Нindе, 1990]. Социальное влияние является комплексным. Поэтому Р. Хайндом было предложено выделить несколько уровней социальной сложности. Помимо отдельного индивида, выделяется уровень социальных взаимодействий, взаимоотношений, уровень группы и уровень социума. Все уровни оказывают взаимное влияние друг на друга и развиваются под постоянным воздействием физической среды и культуры. Следует четко понимать, что закономерности функционирования поведения на более сложном социальном уровне несводимы к сумме проявлений поведения на более низком уровне организации . Для объяснения поведенческого феномена на каждом уровне требуется отдельная дополнительная концепция. Так, агрессивные взаимодействия между сиблингами анализируются с учетом непосредственных стимулов, лежащих в основе этого поведения, тогда как агрессивная природа отношений между сиблингами может рассматриваться с точки зрения концепции «конкуренции сиблингов».

Поведение отдельного индивида в рамках указанного подхода рассматривается как следствие его взаимодействия с другими членами гpyппы. Предполагается, что каждая из взаимодействующих особей имеет определенные представления о вероятном повелении партнера в данной ситуации. Необходимые представления особь получает на основе предшествующего опыта общения с другими представителями своего вида. Контакты двух незнакомых особей, носящие отчетливо враждебный характер, часто ограничиваются лишь сериями демонстраций. Такого общения бывает достаточно, чтобы один из партнеров признал себя побежденным и продемонстрировал подчинение. Если конкретные особи взаимодействовали много раз, то между ними возникают определенные взаимоотношения, осуществляющиеся на общем фоне социальных контактов. Социaльная среда и для человека, и для животных является своеобразной оболочкой», которая окружает особей и трансформирует воздействие на них физической среды. Социальность у животных можно рассматривать в качестве универсальной адаптации к среде обитания. Чем сложнее и гибче социальная организация, тем большую роль она играет в защите особей данного вида. Пластичность социальной организации могла служить базовой адаптацией наших общих с шимпанзе и бонобо предков, обеспечившей исходные предпосылки гоминизации [Бутовская, Файнберг, 1993].

Важнейшей проблемой современной этологии является поиск причин, по которым социальные системы животных и человека всегда структурированы, причем чаще всего по иерархическому принципу. Реальная роль концепции доминирования для понимания сути социальных связей в со­циуме постоянно дискутируется . Сети отношений между особями описываются у животных и человека в понятиях родственных и репродуктивных связей, систем доминирования, индивидуальной избирательности. Они могyт перекрываться (например, ранговые, родственные и репродуктивные отношения), но могут и существовать независимо друг от друга (например, сети отношений подростка в семье и школе со сверстниками в современном человеческом обществе).

Разумеется, следует со всей осторожностью применять прямые параллели при сравнительном анализе поведения животных и человека, ибо все уровни социальной сложности влияют друг на друга. Многие виды человеческой деятельности специфичны и носят символический характер, понять который можно, лишь обладая знаниями относительно социального опыта данного индивидуума и особенностей социально-культурной структуры общества [Еibl-Eibesfeldt, 1989], Тем не менее, неоспоримым достоинством этологического подхода при обсуждении проблем преемственности принципов социальной организации является унифицированность методов оценки и описания поведения приматов, включая человека, позволяющая объективно оценивать базовые параметры сходства и различия. Схема Р. Хайнда позволяет устранить основные недоразумения между представителями биологических и социaльных наук относительно возможностей сравнительного анализа поведения человека и животных и предсказать, на каких уровнях организации можно искать реальное сходство.

Введение к работе

Актуальность проблемы. Одной из характерных тенденций современного этапа развития науки является формирование новых направлений, объединяющих различные области научного знания. Именно к таким направлениям принадлежат исследования в области системного анализа, относящиеся к проблемам принятия решений. Как отмечает академик Н.Н.Моисеев, системный анализ -это дисциплина, занимающаяся проблемами принятия решений в условиях, когда выбор альтернативы требует анализа разнообразной сложной информации. Поэтому методические концепции, аппаратные методы реализации системного анализа основываются на общей теории систем и на дисциплинах, занимающихся проблемами принятия решений - теории исследования операций, общей теории управления и теории игр.

При построении математически моделей функционирования или развития даже сравнительно небольших реальнък систем исследователи сталкиваются с необходимостью учета сложных взаимосвязей компонент модели, оказывающих действеачое влияние на реализацию альтернатив развития и достижение поставленных целей. Значительное число сложных систем управления характеризуется конфликтностью процесса принятия решений, что является следствием наличия у ряда субъектов управления, системой различных представлений как о глобальной цели развития системы, так и локальных целях и критериях развития ее элементов.

Еще одним характерным признаком сложных систем является их иерархическая структура, которая выражается как-в наличии в системо вертикально соподчиненных подсистем, та:с и в иерархии процесса управления.

Иерархическая структура управления в слозшой системе представляет собой последовательность уровней управления, следующих друг за другом в порядке определенного приоритета. Одной из причин появления иерархической структуры в системах управления и принятия решений является большой объем информации об управляемых процессах в системе, невозможность обработки этой информации об управляемых процессах одним управляющим центром. Другой причиной является существующая в реальных системах децентрализация процесса принятия решений, когда олемсн-

4 -ты, подчиненные центру, вырабатывают управляюче воздействия

исходя из решений центра и с учетом собственных интересов.

К настоящему времени лучше всего изучены двухуровневые статические и динамические системы, а также некоторые классы систем с иерархической структурой частного вида.

Задачи управления в конфликтных двухуровневых системах, впервые сформулированные в 30-х годах в связи с исследованиями в области экономики, получили затем свое развитие и изучались многими советскими и зарубежными исследователями.

Основы информационной теории иерархических систем были разработаны Н.Н.Моисеевым, й.Б.Гермейером, А.Ф.Кононенко и их учениками. Одной из основных задач моделирования конфликтных систем, как отмечает Н.Н,Воробьев, является конструирование и анализ принципов оптимальности. Вопрос о принципах оптимальности, различных модификациях равновесия продолжает привле -кать внимание специалистов и широко обсуждается в литературе, например, в работах Э.И.Вилкаса, Н.Н.Воробьева, В.С.Вубялиса, Э.Дамме, Д.М.Крепса и др.

Разработка проблематики конфликтных динамических систем с иерархической структурой базируется на основополагаямдих результатах в теории дифференциальных игр, полученных в конце 60-х - начале 70-х годов Л.С.Понтрягиным и Н.Н.Краеовским и развитых в работах А.Ф.Кононенко, В.Н.Лагунова, М.С.Никольского, Ю.С.Осипова, Н.Н.Петрова, Л.А.Петросяна, Б.Н.Пшеничного, Н.Ю.Сатимова, А.И.Субботина, Г.В.Томского и многих других советских и зарубежных математиков.

Необходимость исследования иерархических дифференциальных игр подчеркивалась в работах А.Ф.Кононенко, А.Ф.Клейменова, Н.С.Кукушкина, А.Бапчи, Т.Базара, внесших значительный Бклад в разработку возникающих здесь проблем.

Фундаментальной проблемой, которая в последние годы привлекла к себе внимание многих специалистов по теории конфликтных динамических систем, является проблема динамической устойчивости решений. Это обусловлено тем, что динамическая устойчивость является важнейшим фактором реализуемости во времени Быбранных принципов оптимальности. Постановка этой проблемы была впервые осуществлена Л.А.Петросяном в конце 70-х годов и разрабатывалась в дальнейшем в работах Н.Н.Данилова, С.В.Чистякова, В.В.Захарова и других исследователей. Следует отме-

5 -тить также более поздние работы зарубежных ученых Д.Краса,

С.Холли, В.Хиллера, в которых исследуется проблема "временной состоятельности" оптимальных решений, аналогичная проблеме динамической устойчивости. Анализ этой проблемы для различных классов дифференциальных игр показывает настоятельную необходимость получения условий, при которых динамическая устойии-востьимеет место. Упитывая, что практически все принципы оптимальности, применяемые в конфликтных иерархических системах управления данным свойством не обладают, актуальной является проблема разработки методов регуляризации решений иерархических дифференциальных игр, обеспечивающих динамическую устойчивость решений.

В предлагаемой работе указанным проблемам уделено значительное место. С прикладной точки зрения ценность любого подхода определяется практической ценностью разработанных методов. Поото.му в работе теоретические результаты применяются при исследовании конкретных иерархических моделей принятия решений.

Цель работы состоит в развитии теории управления и прикатил ранений в конфликтных иерархических системах общего вида;

применении традиционных и построении и исследовании новых принципов оптимальности в статических и динамических конфликтных системах управления с иерархической структурой;

исследовании свойств решений иерархических игр общего вида, сравнении принципов оптимальности, выявлении закономерностей в реализации решений для произвольного принципа оптимальности;

исследования проблемы динамической устойчивости принципов оптимальности и решений в иерархических дифференциальных играх и разработке методов регуляризации решений на различных классах стратегий;

построении конкретных моделей иерархических систем и применении полученных результатов для анализа и нахождения оптимальных решений.

Наугжая нов изна. Впервые сформулирована задача управления в конфликтных иерархических системах общего вида. На основании предложенных подходов разработаны коше принципы оптимальности и процедуры выбора оптимальных решений в статических и динамических системах. Введено новое понятие и получены нэ-

обходимые и достаточные условия иерархической устойчивости решений игр общего вида для произвольного принципа оптимально ст и.

Сформулирована проблема динамической устойчивости решений иерархических дифференциальных игр и доказаны теоремы о необходимых и достаточных условиях динамической устойчивости решений для различных классов игр. Впервые для иерархических дифференциальных игр разработены методы регуляризации решений, обеспечивающие их динамическую, а татоке монотонно динамическую устойчивость.

Рассмотрен класс иерархических, игр с разрывными функциями выигрышей, для которых сформулированы необходимые и достаточные условия существования и единственности решений, предложены конструктивные методы нахождения решений в этих играх.

Практиче ская ценность. Разработанные в диссертации методы и подходы, полученные условия существования и единственности решений иерархических игр, методы регуляризации решений использованы при исследовании ряда теоретико-игровых моделей принятия решений в конфликтных эколого-экономических системах. Полученные теоретические результаты могут найти применение для дальнейшего развития теории иерархических систем, исследования проблемы динамической устойчивости решений и принципов оптимальности в иерархических дифференциальных играх.

Методы исследований . Ь работе используются методология и аппаратные метода реализации системного анализа, основанные на понятиях и утверждениях общей теории динамических систем, теории управления и теории игр. Построение и анализ ряда моделей иерархических систем управления базировались на методах теории обыкновенных дифференциальных уравнений и уравнений в частных производных, линейного программирования.

Апробация работы . Основные положения и результаты работы докладывались и обсуждались на 1-ом Ленинградском симпозиуме по теории игр (1978 г.) , на Ш Всесоюзной конференции по исследованию операций (Горький, 1978 г.), на Всесоюзном семинаре "Прикладные.аспекты управления сложными системами" (Кемерово, 19ЭЗ г.), на Всесоюзной конференции "Проблемы теоретической кибернетики" (Иркутск, 1985 г.), на Всесоюзной школе "Оптимальное управление. Геометрия и анализ" (Кемерово, 1986 г.), на Всесоюзной школе "Математические методы в экологии"

(Чита, 1936 г.), на Всесоюзной школе "Математические проблеми биологии" (Чита, 1988 г.), на научных семинарах БЦ АН СССР, Института кибернетики АН УССР, Института социально-экономических проблем АН СССР, факультета Вычислительной математики и кибернетики Ї.ІГУ им.Ы.В.Ломоносова, Иркутского Вычислительного центра СО АН СССР, Института природных ресурсов СО АН СССР, Научно-исследовательского центра экологической безопасности Д1Ц АН СССР, Вычислительного центра АН Армянской ССР, кафедры теории управления и кафедры математической статистики, теории надежности и массового обслуживания факультета приклад -ной математики-процессов управления ЛГУ.

Структура работы . Диссертация состоит из введения, трех глав, девятнадцати параграфов, заключения и списка литературы Об^ий объем диссертации 317 страниц. Список литературы включает 133 наименования.