(01) (02) (03) (04) (05) (06) (07) (08) (09) (10) (11) (12) (13) (14) (15) (16) (17) (18) (19) (20) (21) (22) (23) (24) (25) (26) (27) (28) (29) (30) (31) (32) (33) (34) (35) (36) (37) (38) (39) (40) (41) (42) (43) (44) (45) (46) (47) (48) (49) (50) (51) (52) (53) (54) (55) (56) (57) (58) (59) (60) (61) (62) (63) (64) (65) (66) (67) (68) (69) (70) (71) (72) (73) (74) (75) (76) (77) (78) (79) (80) (81) (82) (83) (84) (85) (86) (87) (88) (89) (90) (91) Управляемый процесс в каждый момент времени 1- плохое качество управления; 2-среднее качество управления; 3-хорошее качество управления По мере накопления знаний в базе знаний управляющей системы Pilot(количество цветных точек в верхнем прямоугольнике) растет качество управлениякосмическим аппаратом: графики угла рассогласования (верхний) и угловойскорости (нижний) приближаются к нулю (горизонтальной черте).Важно, что с небольшими изменениями система Pilot может быть использованадля управления и многими другими объектами: активными подвесками транспортныхсредств, стабилизаторами блоков питания и других энергетических установок,обрабатывающими станками и так далее. "Тактик" - прототип системы поддержки принятиярешений при управлении социальными объектами. Метод автономного адаптивного управления может быть использован и длярешения социальных задач.По заказу Центра президентских программ мы исследовали возможность применениянашего метода в системе поддержки принятия решений при управлении социальнымиобъектами. Сначала нас тревожило, возможно ли вообще представлять в цифровойформе состояния социального объекта. Но оказалось, что такая задача вполнерешаема.Следующая проблема возникла в связи с очень медленным поступлением входнойинформации, что крайне замедляло бы процесс накопления эмпирических знаний.Это натолкнуло нас на идею обучения системы по архивным данным. Экспериментына архивных данных, описывающих социальные процессы в одном из районовСибири, показали, что такое обучение возможно и после накопления необходимыхзнаний управляющая система может в некоторых ситуациях принимать эмпирическиобоснованные решения.Сравнив возможности системы "Тактик" с возможностями обычной нейросети,мы показали, что "Тактик", в отличие от нейросети, не только предсказываетнекоторые события, но и предлагает на каждом шаге управляющие воздействия,которые способны улучшить текущую ситуацию.Конечно, при управлении социальными объектами окончательные решениядолжны приниматься ответственными лицами. Задача управляющей системы -помочь выявить некоторые закономерности в развитии социальной ситуации,которые могут ускользнуть от взгляда человека.В настоящее время наша группа работает и над другими системами управления,имеющими как практическое, так и теоретическое значение. Мы надеемся, чтосвойства созданных прототипов управляющих систем привлекут к ним вниманиеразработчиков объектов, которым требуется автономное адаптивное управление.Это в свою очередь поможет развивать его теорию и продвигаться по путисоздания систем "автономного искусственного интеллекта".Наши исследования финансировались, в частности, грантами Российскогофонда фундаментальных исследований и Министерства науки и технологий РФ. Доктор физико-математических наук А. ЖДАНОВ, заведующийОтделом имитационных систем Института системного программирования РАН.
Первая часть данной статьи была опубликована в предыдущем номережурнала (см. "самый интересный журнал Наука и жизнь " № 1, 2000 г.). Мы вынуждены принести извиненияза досадное смешение строк в таблице на первой странице статьи, произошедшееиз-за чрезмерной интеллектуальности компьютерных систем подготовки текстов.Любознательный читатель, конечно, догадался, что таблица должна иметь следующийвид: Надо заметить почти без иронии, что ошибки не только свойственныпроявлениям высшей нервной деятельности, но и необходимы ей для поискаи получения новых знаний. Вспомним, что на населенном учеными летающемострове "Лапута" в романе Свифта о Гулливере практиковалось случайное смешениеслов, порождавшее иногда фразы, похожие на осмысленные. Эти фразы тут жезаписывались в анналы научных трудов лапутянцев. Генерация случайных последовательностейчисел, символов, слов, звуков, графических элементов и других объектовочень часто используется в современных системах искусственного интеллектадля самых разных целей. Существует даже мнение, опубликованное в научнойработе Р. С. Нахмансона, что наличие случайности в поведении какой-либосистемы (даже элементарной частицы) есть признак ее интеллектуальности. Итак, в первой части статьи был описан подход к построению модели нервнойсистемы, вытекающий из исходных представлений о дискретности, автономности,аппаратной приспособленности и минимуме исходных знаний управляющей системы.Конечно, построить подобную систему "автономного адаптивного управления"(ААУ) в полном объеме - задача непростая, поскольку каждая из входящихв нее подсистем должна решать весьма сложную задачу, составляющую в нашевремя предмет отдельных научных направлений. Напомним, что речь идет отаких задачах, как автоматическая классификация и распознавание, поиски представление знаний, моделирование эмоций, принятие решений, и некоторыхдругих. Однако даже самые простые по реализации варианты подсистем, решающихтакие задачи, объединенные в единое целое - управляющую систему ААУ, даютновый эффект. Коротко опишем некоторые примеры управляющих систем, построенныхпо принципу ААУ. Pilot - прототип адаптивной системы управленияугловым движением космического аппарата. Желая найти практическое применение разработанному нами методу "автономногоадаптивного управления", мы обратились в НПО им. С. А. Лавочкина, где разрабатываются системы управления для некоторых автоматических космических аппаратов.Специалисты НПО поставили нам задачу: построить систему управления угловымдвижением (поворотом и стабилизацией в пространстве) автоматического космическогоаппарата на основе нашего метода. Дело в том, что существующие системыуправления дают ограниченную точность ориентации (±0,1 угловой секунды),которой недостаточно для некоторых космических аппаратов. В этих системахуправление строится на основе математической модели углового движения космическогоаппарата. Параметры модели, учитывающие такие факторы, как невесомость,вакуум, резкие перепады температуры, измеряются на наземных испытательныхстендах. Естественно, что такие измерения не могут быть точными, посколькуполностью воспроизвести уникальные условия реального космоса невозможно.Кроме того, детерминированная математическая модель не позволяет учестьвозможность случайных изменений свойств космического аппарата в ходе полета.Необходима адаптивная схема управления, когда управляющая система автоматическиподстраивается к текущим свойствам объекта управления.Входной информацией для разрабатываемой управляющей системы служилипоказания датчиков, измеряющих угол между действительным и заданным положениямикосмическо го аппарата, а также скорость его углового движения. Управляющейсистеме ставиласьКорпус космического аппарата можно представить как твердое тело с наборомупругих нелинейных осцилляторов - антенн, солнечных батарей, навесногооборудования и т.п. Корпусу аппарата надо придать требуемое угловое положениев пространстве и поддерживать его в этом положении заданное время. На космическийаппарат действуют возмущения от солнечного ветра, магнитного поля, утечекгаза. Возникающие отклонения можно устранить, раскручивая один из приводов- маховиков, что приведет к повороту аппарата в обратную сторону. Но труднорассчитать заранее, каким будет движение аппарата в ответ на движение маховика.Помочь может адаптивная система управления Pilot.цель: поддерживать угол и угловую скорость по возможности ближе к нулевымзначениям. Выходные (управляющие) воздействия управляющей системы представлялисобой команды приводам развить те или иные крутящие моменты, поворачивающиекосмический аппарат в соответствующем направлении с соответствующей скоростью.Управляющая система должна была адаптироваться к характерным реакциям космическогоаппарата на управляющие моменты. Именно эти реакции и трудно рассчитатьзаранее с надлежащей точностью, так как космический аппарат несет на себеупругие нелинейные осцилляторы, которые в условиях космоса ведут себя несовсем так, как в наземных испытаниях.Построенный нами прототип системы управления Pilot показал, что онадействительно успешно адаптируется к свойствам космического аппарата испособна повысить качество управления его угловым движением в несколькораз. Чтобы достичь аналогичного результата традиционными методами, потребовалисьбы значительно большие затраты времени и сил.Система Pilot демонстрирует интересные свойства, основное из которых- адаптивность, то есть способность управляющей системы приспосабливатьсяк свойствам объекта управления и окружающей среды. Этим свойством обладаютмногие блоки управляющей системы Pilot. В процессе обучения управляющаясистема совершает по определенному плану пробные управляющие воздействияна объект управления и выясняет его реакции на эти воздействия. Вся информацияо происходящем отображается в управляющей системе в виде "образов" - образовуглового положения, образов управляющих воздействий, образов эмоциональныхоценок состояний. Последние вырабатываются "эмоциональным аппаратом" управляющейсистемы, подсказывающим, насколько "хорошо" или "плохо" то или иное текущееугловое положение космического аппарата. Если эту эмоциональную оценкувыражать не числом, а некоторой мимикой "лица" управляющей системы, тобудет весьма любопытно наблюдать за ее "гримасами".Если управляющая система выясняет, что причинно-следственные связи некоторыхобразов неслучайны, то она запоминает это в своей базе знаний. Заметим,что такие "знания" управляющая система добывает самостоятельно, в этомпроявляется ее автономность. Чем больше знаний о свойствах космическогоаппарата накопила управляющая система, тем более успешно она может управлятьим. Если свойства космического аппарата изменяются, например, аппарат сталлегче из-за выработки горючего или изменилась конфигурация аппарата _ раскрылисьантенны, изменились упругие свойства осцилляторов из-за поломки, появиласьутечка газа и аппарат стало разворачивать, - управляющая система, обнаруживухудшение качества управления, начинает переучиваться, корректирует своизнания, и качество управления вновь повышается. Если на аппарат воздействоватькратковременным возмущением (толкнуть его), управляющая система быстрогасит возмущение.Одно свойство управляющей системы для нас оказалось неожиданным. Послеобучения управляющей системы, при котором на космический аппарат оказываютслучайные пробные воздействия, качество управления вначале невысоко, ноуже в процессе управления оно постепенно возрастает. Выяснилось, что свойстваобъекта управления зависят от того, каким способом вы его испытываете:обращаетесь ли с ним бесцеремонно, дергая его во все стороны, "тряся какгрушу" в процессе исследования-обучения, или испытываете его осторожно.Это имеет прямую аналогию с жизненными ситуациями: так врач, бережно исследующийпациента, точнее поставит диагноз, нежели обращающийся с пациентом неделикатно.Оказалось также, что из обученной базы знаний можно извлечь самые важныезнания и, представив их в удобной форме, передать более простой детерминированнойсистеме управления, которая сможет управлять объектом, но уже без адаптации. База знаний (три последовательных момента времени)
(01) (02) (03) (04) (05) (06) (07) (08) (09) (10) (11) (12) (13) (14) (15) (16) (17) (18) (19) (20) (21) (22) (23) (24) (25) (26) (27) (28) (29) (30) (31) (32) (33) (34) (35) (36) (37) (38) (39) (40) (41) (42) (43) (44) (45) (46) (47) (48) (49) (50) (51) (52) (53) (54) (55) (56) (57) (58) (59) (60) (61) (62) (63) (64) (65) (66) (67) (68) (69) (70) (71) (72) (73) (74) (75) (76) (77) (78) (79) (80) (81) (82) (83) (84) (85) (86) (87) (88) (89) (90) (91)
|
|