→ Пошук по сайту       Увійти / Зареєструватися
Знання Керування знаннями

Представление данных в интеллектуальных системах

 Представления и моделирование знаний

Важное место в теории искусственного интеллекта занимает проблема представления знаний, являющаяся, по мнению многих исследователей, ключевой.

Знания представляют собой совокупность сведений о мире (конкретной предметной области, совокупности объектов или объекта), включающих в себя информацию о свойствах объектов, закономерностях процессов и явлений, правилах использования этой информации для принятия решений.

Первоначально вычислительная техника была ориентирована на обработку данных. Это было связано как с уровнем развития техники и программного обеспечения, так и со спецификой решае­мых задач. Дальнейшее усложнение решаемых задач, их интеллектуализация, развитие вычислительной техники ставят задачу создания машин обработки знаний. Существенным отличием зна­ний от данных, несомненно, является их интерпретируемость. Если для интерпретации данных необходимы соответствующие программы и сами по себе они не несут содержательной инфор­мации, то знания всегда содержательны. Другой отличительной чертой знаний является наличие отношений, например, вида «тип — подтип», «элемент—множество» и т. д. Знания характери­зуются наличием ситуативных связей, определяющих ситуативную совместимость отдельных событий и фактов, позволяющих устанавливать причинно-следственные связи.

В общем виде модели представления знаний могут быть ус­ловно разделены на концептуальные и эмпирические.

Концептуальная модель дает эвристический метод для решения некоторой проблемы. Метод эвристичен, поскольку концептуаль­ное описание не дает гарантии того, что он может быть применен во всех соответствующих практических ситуациях. Концептуаль­ная модель делает возможным распознавание проблемы, позволя­ет уменьшать время для ее предварительного анализа.

Практическое использование концептуальной модели влечет за собой необходимость преобразования ее в эмпирическую. Знания могут быть накоплены в виде эмпирических моделей, как правило, описательного характера. Эти модели могут варьировать от прос­того набора правил до полного описания того, как ЛПР решает задачу.

Модели представления знаний можно условно разделить на декларативные и процедурные.

Декларативная модель представления знаний основывается на предположении, что проблема представления некоей предметной области решается независимо от того, как эти знания потом бу­дут использоваться. Поэтому модель как бы состоит из двух частей: статических описательных структур знаний и механизма вывода, оперирующего этими структурами и практически неза­висимого от их содержательного наполнения. При этом в какой-то степени оказываются раздельными синтаксические и семантичес­кие аспекты знания, что является определенным достоинством указанных форм представления из-за возможности достижения их определенной универсальности.

В декларативных моделях не содержатся в явном виде описа­ния выполняемых процедур. Эти модели представляют собой обычно множество утверждений. Предметная область представ­ляется в виде синтаксического описания ее состояния (по возмож­ности полного). Вывод решений основывается в основном на про­цедурах поиска в пространстве состояний.

В процедурном представлении знания содержатся в про­цедурах - небольших программах, которые определяют, как вы­полнять специфичные действия (как поступать в специфичных ситуациях). При этом можно не описывать все возможные состояния среды или объекта для реализации вывода. Достаточно хранить некоторые начальные состояния и процедуры, генерирующие необходимые описания ситуаций и действий.

При процедурном представлении знаний семантика непос­редственно заложена в описание элементов базы знаний, за счет чего повышается эффективность поиска решений. По сравнению с процедурной частью статическая база знаний у них мала. Она содержит не «неизменные аксиомы», а лишь так называемые «ут­верждения», которые приемлемы в данный момент, но могут быть изменены или удалены в любое время. Общие знания и пра­вила вывода представлены в виде специальных целенаправленных процедур, активизирующихся по мере надобности.

Процедуры могут активизировать друг друга, их выполнение может прерываться, а затем возобновляться. Возможно использо­вание процедур — «демонов», активизирующихся при выполнении операций введения, изменения или удаления данных.

Средством повышения эффективности генерации вывода в про­цедурных моделях является добавление в систему знаний о применении, т. е. знаний о том, каким образом использовать на­копленные знания для решения конкретной задачи. Эти знания, как правило, тоже представляются в процедурной форме.

Главное преимущество процедурных моделей представле­ния знаний заключается в большей эффективности механизмов вывода за счет введения дополнительных знаний о применении, что, однако снижает их общность. Другое важное преимущество заключено в выразительной силе. Процедурные системы спо­собны смоделировать практически любую модель представления знаний. Выразительная сила процедурных систем проявляется в расширенной системе выводов, реализуемых в них.

В заключение необходимо отметить, что деление моделей пред­ставления знаний на декларативные и процедурные весьма ус­ловно, так как в реальных системах представления знаний исполь­зуются в равной мере элементы и сочетания всех указанных вы­ше форм моделей представления знаний.

 Структура интеллектуальной системы

Говоря об архитектуре, прежде всего понимают организацию структуры, в рамках которой происходило бы при­менение знаний и решение проблем в конкретной предметной об­ласти. Выбор соответствующей структуры, свойства и функции компонентов, в особенности производственных, опре­деляется и направляется формулируемыми принципами инжене­рии знаний. На формирование этих принципов в значительной степени оказывают влияние, как специфика предметной области, так и характер задач и функций, решение которых возлагается на интеллектуальные системы. Обобщение структуры интеллектуальной системы рассмотрено для предметной области производства. Как отмечалось выше в производственных предприятиях достаточно полно представлены многие задачи экономической деятельности.

Как уже отмечалось, успешное решение проблемы интеграции систем и задач автоматизированного управления производством на различных уровнях связано также с их интеллектуализацией, т. е. организацией функционирования на базе технологии инжене­рии знаний. Основными функциональными и организационными частями автоматизированного производства являются проектиро­вание, планирование, организация производства и диспетчериза­ция, управление технологическими процессами, диагностирование, роботизация технологических участков в составе гибких производ­ственных систем.

В зависимости от характера выполняемых функций и области действий эксперты выполняют несколько характерных задач, ко­торые являются типичными. Их анализ послужит ориентиром при рассмотрении архитектуры производственных систем, осно­ванных на знаниях. Эти задачи следующие: интерпретация, плани­рование, управление, проектирование, прогнозирование, диспетчирование и мониторинг, диагностика. А главное — эксперт спосо­бен обновлять свои знания (т. е. обучаться), объяснять действия, обосновывать решения, прогнозировать развитие ситуаций, актив­но взаимодействовать с внешней средой и воспринимать информа­цию различного характера, получать решения на основе имею­щихся знаний, хранить в памяти необходимую информацию и фактографические данные.

Таким образом, чтобы создать систему, работающую со зна­ниями и способную в какой-то мере заменить эксперта или по­мочь ему в принятии решений при управлении производством, не­обходимо стремиться заложить в архитектуру нашей системы возможности по реализации названных функций.

Производственная система ИИ организует и направляет свое функционирование в соответствии с воплощенными в нее архи­тектурными проектными принципами. Для каждой управляющей схемы могут потребоваться своя база знаний и соответствующий механизм вывода, который работает со знаниями. Обычно интеллектуальные системы взаимодействуют с конечными пользователями, экспертом, инже­нером знаний, внешними БД, прикладным программным обеспе­чением.

Пользовательский интерфейс обеспечивает связь на ограни­ченном естественном языке, речевой ввод, а также визуальные представления (графику, техническое зрение). В качест­ве пользователя может выступать либо человек-оператор, либо сам производственный процесс в случае закрытых циклических операций. Для некоторых производственных процессов бывают необходимы средства для автоматического получения данных и их обработки, а также обратной связи по управлению. С инженером знаний интеллектуальная система обычно связывается с помощью структурных ре­дакторов, которые позволяют ему получать и модифицировать компоненты базы знаний.

Взаимодействие интеллектуальной системы с прикладным программным обеспече­нием осуществляется при выполнении специальных вычислений, так как часто возникает необходимость использовать в качестве подзадач стандартные операции по обработке данных.

Связь с распределенной БД интегрированной системы управ­ления производством и Интернет используется интеллектуальными системами для получения данных и знаний, рассредоточенных на различных уровнях иерархии уп­равления. Кроме того, организуется взаимодействие с внешними базами данных и Интернет.

В задачах управления производством экспертом обычно ис­пользуются три уровня знания: «умения», соответствующие по­верхностному знанию рефлекторных реакций; правила для случа­ев стандартных рассуждений; глубинные знания для трудных, не­ординарных ситуаций. При проектировании базы знаний интеллект необходимо стремиться принимать в расчет глубинные здания, чтобы создать систему, способную при поддержке решений поль­зователя предлагать (рекомендации, наиболее адекватные возни­кающим ситуациям.

При проектировании интеллектуальных систем и выборе их архитектуры следует разрабатывать не просто независимое программное обеспечение, которое оценивает существующий производственный объект. На­до стремиться к тому, чтобы интеллектуальная система была приближена к различ­ным элементам процесса, выступала в качестве одного из основ­ных звеньев технологической цепочки управления и организации.

Важное значение при создании интеллектуальных систем имеют способы пред­ставления знаний о предметной области и моделирования мысли­тельной деятельности человека, методов рассуждения и поиска при принятии решений. Разработчик интеллектуальной системы (инженер знаний) длительное время работает совместно со специалистом-экспертом в данной области, который является источником информации для создания базы знаний. В результате нескольких итераций изби­раются схема представления знаний в системе и стратегия логи­ческого вывода.

Помимо структуризации знаний в базе знаний и ор­ганизации механизмов вывода, рассуждений и поиска важное зна­чение имеют функции объяснения решений и выводов. Как прави­ло, интеллектуальные системы объясняют и подтверждают свои заключения и реко­мендации, тем самым увеличивая к ним доверие со стороны поль­зователей.

Чтобы реализовать и представить объяснение, интеллектуальная система обычно преобразует экспертные эвристические правила в цепочку рассуж­дений, которая показывает, как начальное множество данных и утверждений, а также набор эвристических или иных правил при­водят систему к заключению. Это свойство интеллектуальной системы реализуется пользователем также для периодической оценки качества функ­ционирования системы.

Оценка ситуаций, складывающихся во внешней среде, а так­же необходимость оценки развития событий в результате принятия решения ИС, т. е. определение и прогнозирование наиболее важных свойств процесса или объекта на основе интерпретации имеющихся данных, является важнейшей операцией во многих задачах управления производством. На основании этих оценок и прогнозов принимаются управляющие решения, вырабатываются обоснованные рекомендации. Они являются результатом функцио­нирования компонента интеллектуальной системы, реализующего обоснование реше­ний и прогнозирование.

Структура интеллектуальной СПР в значительной мере определяется предметной экономической областью и характером решаемых задач при наличии определенных модулей, реализующих функции, определяющих систему как интеллектуальную.

 Задачи оценки сложных объектов в интеллектуальной системе

В рамках модели объекты представляются в виде множества S - свойств объектов. Заметим важную деталь - множество S является объединением непересекающихся множеств N и E - соответственно множеств численных и перечислимых свойств. Каждое перечислимое свойство Ei может принимать значение из определенного конечного множества значений. Каждое численное свойство Ni может принимать значения лежащие в области действительных чисел, ограниченной минимальным и максимальным пределами Nimin Nimax соответственно. Введением такого деления мы фактически даем возможность системе учесть как количественные (численные), так и качественные (перечислимые) характеристики объекта.

Задачи, решаемые универсальной экспертной системой, делятся на два вида - задачи квалиметрии (оценки качества) и классификации (распознавания образов). В процессе решения задачи квалиметрии каждому оцениваемому объекту ставится в соответствие число I - являющееся оценкой данного объекта. В процессе решения задачи классификации каждому объекту ставится в соответствие наименование класса, к которому относится данный объект.

В рамках оценочной задачи к оцениваемым объектам предъявляются требования из множества T, а также устанавливаются соответствия F между свойствами и требованиями. При этом одно требование может ссылаться на несколько свойств. Например, в задаче оценки объекта недвижимости (например квартиры), требование “удобная квартира” ссылается на свойства “район”, “этаж”, “наличие телефона”, поскольку эти свойства и определяют удобство квартиры. Вообще, смысл введения требований, как инструмента, используемого для адекватной оценки объекта следующий: требования выражают цель субъекта оценки при решении конкретной оценочной задачи; свойства же, являясь описанием, представлением объекта оценки, вообще говоря существую достаточно независимо от решаемой задачи. Конкретную окраску свойства получают лишь с точки зрения системы требований, предъявленной субъектом оценки.

Кроме того, в задаче классификации формируется множество C - множество классов. В задаче квалиметрии каждому требованию из множества T ставится в соответствие вес (значимость) этого требования. В задаче классификации каждому требованию ставятся в соответствие n весов, где n - количество классов. В этом случае Pij - это вес (значимость) i-го требования из множества T в j-ом классе из множества C. А все множество P - называется множеством весов (весовых коэффициентов). Кроме этого в задаче квалиметрии для каждого элемента из множества F - соответствий требования и зависимых от него свойств задается т.н. дуговой весовой коэффициент, значение которого определяет значимость конкретного свойства в рамках конкретного требования. Например, при оценке компьютеров требованию “быстродействие” соответствуют свойства - “тип процессора”, “тактовая частота”, “тип системной шины”. При этом тип процессора, например, вносит в быстродействие компьютера больший вклад, чем тип системной шины. Соответственно дуговой коэффициент свойства “тип процессора” в рамках требования “быстродействие” будет больше, чем коэффициент свойства “тип системной шины” в рамках того же требования, ввиду того, что тип процессора вносит больший вклад в быстродействие системы, чем тип системной шины. При решении задачи классификации в соответствие каждому элементу множества F ставятся в соответствие n коэффициентов, где n - количество классов, определяющих значимость свойства в пределах данного требования для данного класса из множества C. Полученное таким образом множество D - называется множеством дуговых весовых коэффициентов.

После формулировки множества требований можно говорить о формировании следующего множества E - множества эталонов. Эталон как идеал может в действительности не существовать, но для принятия решения он должен быть задан. Причем, в рамках описываемой модели эталон - это вовсе не эталон в общепринятом смысле этого слова. Эталон с точки зрения модели не только несет информацию об идеальном значении того или иного свойства, но и о том на сколько все остальные значения данного свойства “хороши” с точки зрения предъявленных требований к объекту оценки.

Характер задач решаемых ИС, а также основные функции, выполняемые системой, во многом предопределяют ее структуру. Любая система только тогда может претендовать на звание экспертной, когда в ее состав входят блоки, обеспечивающие непосредственно формирование экспертных оценок и об.

Для ИС необходимы средства настройки на конкретную предметную область.

Все вышесказанное обуславливает необходимость выделения в разработанной ИС следующих, относительно самостоятельных подсистем:

  • подсистема настройки и адаптации;
  • подсистема управления базами данных;
  • подсистема принятия и анализа решений;
  • подсистема обучения;
  • подсистема управления сетью.

Описание основных структур данных в интеллектуальных системах

Исходя из основной цели, которую необходимо достичь при разработке структур данных - универсальности, следует, прежде всего, разделить весь объем перерабатываемой информации на информацию, разделяемую несколькими оценочными задачами и информацию приватную (доступную только одной задаче). Ввиду того, что для одного и того же набора объектов (базы данных) может быть сформулировано несколько оценочных задач весь перечень объектов, подвергающихся оценке, является разделяемой информацией, т.е. объекты, оцениваемые в одной задаче, должны быть доступны также и другим задачам (например, на базе данных объектов недвижимости может решаться как задача поиска оптимальной квартиры с точки зрения цены и района, так и задача поиска наилучшей квартиры с точки зрения площади и удобств). Назовем всю информацию (в виде физических структур данных) о конкретной оценочной задаче, решаемой универсальной экспертной системой - проектом, тогда перечень объектов, а, следовательно, и их описание, т.е. конкретная реализация множества S является информацией, доступной нескольким проектам. Ввиду того, что перечень объектов легко представляется в виде таблицы где столбцы соответствуют конкретным свойствам из множества S, а строки соответствуют объектам, примем решение использовать для хранения перечня объектов существующие инструментарии поддержки популярных форматов данных (поддержки СУБД). Это обеспечит нам, кроме того, возможность подготовки данных вне оболочки экспертной системы, что в будущем может оказаться немаловажным.

С другой стороны, из выше приведенного примера с объектами недвижимости видно, что если перечень объектов - это информация разделяемая, то перечень оценок этих объектов - информация приватная для каждого проекта. Следовательно, следует всю базу данных объектов разделить на два физических файла - один, хранящий информацию о значениях свойств объектов и второй, хранящий информацию о вычисленных оценках объектов. Каждому объекту, с другой стороны, должна быть поставлена в соответствие оценка, т.е. таблицы должны быть связаны. Выберем реляционный тип связывания таблиц, как наиболее распространенный с одной стороны, и наиболее легко реализуемый, если основываться на существующих программных библиотеках. Для связывания таблиц по реляционному принципу введем в обе таблицы, поля, значения которых идентифицирующих объект - регистрационные поля.

Далее выясняется, что существующих терминов описания баз данных недостаточно для полного описания множества S. Например, для того чтобы составить весь перечень возможных исходов перечислимого поля нужно полностью перебрать всю базу данных по этому полю (и даже в этом случае мы получим неполный перечень возможных значений), определить же пределы изменения численных полей тем более затруднительно. Исходя из вышеизложенного, выясняется, что необходимы дополнительные структуры данных для хранения информации о множестве S. Эта структура должна содержать информацию во-первых, о наименовании свойства, во-вторых, о его типе (численное, перечислимое или регистрационное), в-третьих, о пределах изменений значения для численных свойств и о перечне значений для перечислимых свойств.

Что касается перечня классов, то здесь нет смысла использовать форматы данных СУБД, во-первых, потому что этот перечень невелик, а во-вторых, потому что перечень содержит только наименования классов.

Далее представляется целесообразным объединить множества T, D, P, K и соответствий F в одну структуру данных, во-первых, потому что эти множества логически связаны между собой (существование множеств P и D вытекает из смысла и формулировки множества Т), во-вторых, появляется возможность совместить параметры P и F (таким образом, что если соответствия между i-ым требованием и j-ым свойством нет то вес Pij = 0).

И, наконец, для того, чтобы связать все эти файлы вместе необходима структура данных, хранящая информацию о самом проекте в целом (о типе решаемой задачи, об именах файлов и т.д.).

Файл с расширением *.pjt. Этот файл хранит информацию о модели в целом.

Файл с расширением *.stc. Этот файл хранит информацию о множестве свойств объектов. Файл имеет следующую структуру:

Файлы с расширением *.db. Этих файлов в каждом проекте два. Один из них имеет имя, такое же как у вышеописанного stc-файла и хранит перечень объектов, подвергаемых оценке. Второй имеет имя, такое же как у pjt-файла и хранит оценки объектов, полученные в процессе решения оценочной задачи. Имена полей файлов формируются по принципу: первый символ - это буква обозначающая тип свойства, соответствующего данному полю R - для регистрационных и I для информационных (численных и перечислимых) полей; следующие символы представляют собой порядковый номер поля в символьном виде(причем нумерация информационных и регистрационных полей ведется раздельно).Оба файла связаны друг с другом по реляционному принципу. Файл имеет формат Paradox 3.5.

Файл с расширением *.tpt. Файл имеет имя, такое же как имя pjt-файла и хранит информацию о множествах T, P, D, К и соответствиях F.

Кроме вышеописанных алгоритмов необходимо сформировать совокупность структур и алгоритмов для хранения информации о модели в оперативной памяти т.н. логические структуры и алгоритмы управления ими. Ввиду того, что физически информация о компонентах модели записана последовательно имеет смысл придерживаться того же принципа и при разработке логических структур. В то же время при работе других подсистем, может понадобится иметь доступ к определенному элементу структуры не последовательно, а например, по порядковому номеру.

Исходя из этого, логические структуры должны совмещать достоинства структур с последовательным доступом и структур со случайным доступом. При этом структуры должны хранить информацию, записанную в файлах-компонентах системы и предоставлять по требованию других программных модулей разностороннюю информацию о хранимых данных.Для структуризации описания целесообразно поделить реализуемые функции на уровни. При этом функции первого уровня вызываются непосредственно при обработке того или иного сообщения главного окна приложения. Функции второго уровня вызываются функциями первого уровня и т.д.

Модель представления знаний в нейронных сетях

Начало современным моделям нейронных сетей было положено в работе Маккаллока и Питтса, где авторы сделали первую попытку эмулировать человеческие способности классифицировать и распознавать образы. В их формализме нейроны имеют состояния 0, 1 и пороговую логику перехода из состояния в состояние. Каждый нейрон в сети определяет взвешенную сумму состояний всех других нейронов и сравнивает ее с порогом, чтобы определить свое собственное состояние. Дальнейшее развитие связано с тем, что Розенблат ввел в модель Маккаллока и Питтса способность связей к модификации, что сделало ее обучаемой. Эта модель была названа персептроном.

Новый виток быстрого развития моделей нейронных сетей, который начался 9-10 лет тому назад, связан с работами Амари, Андерсона, Карпентера, Кохена и других, и в особенности, Хопфилда, а также под влиянием обещающих успехов оптических технологий и зрелой фазы развития СБИС для реализации новых архитектур.

В основу искусственных нейронных сетей положены следующие черты живых нейронных сетей, позволяющие им хорошо справляться с нерегулярными задачами:

  • простой обрабатывающий элемент - нейрон;
  • очень большое число нейронов участвует в обработке информации;
  • один нейрон связан с большим числом других нейронов (глобальные связи);
  • изменяющиеся по весу связи между нейронами;
  • массированная параллельность обработки информации.

Основная их черта - использование взвешенных связей между обрабатывающими элементами как принципиальное средство запоминания информации. Обработка в таких сетях ведется одновременно большим числом элементов, благодаря чему они устойчивы к неисправностям и способны к быстрым вычислениям.

Задать нейронную сеть, способную решить конкретную задачу, это значит определить модель нейрона, топологию связей, веса связей. Нейронные сети, предназначенные для решения различных задач, отличаются друг от друга менее всего моделями нейрона, а в основном топологией связей и правилами определения весов или правилами обучения.

По структуре связей сети делятся на два больших класса: однослойные и многослойные. К однослойным относятся модель Хопфилда и последующие разработки, некоторые типы модели нейронной сети, известной под названием "машина Больцмана". Многослойная сеть имеет входной, выходной и скрытые слои, на входной подается информация, с выходного снимается ответ, скрытые слои участвуют в обработке.

Подходы к обучению однослойных и многослойных сетей различны. В однослойных часто удается выразить веса связей через параметры задачи (так обстоит дело с моделью Хопфилда и однослойной машиной Больцмана). Обучение многослойных сетей состоит в том, что на основе набора примеров {входное состояние -> выходное состояние} постепенно подбираются веса всех связей так, чтобы каждое входное состояние вызывало соответствующее выходное. Обучающие алгоритмы представляют собою итерационные процедуры с постепенным приближением к окончательным значениям весов связей.

Начало современному математическому моделированию на базе нейронных вычислений было положено работами Хопфилда, в которых была предложена математическая модель ассоциативной памяти на нейронной сети. Но не столько сама модель послужила главным толчком к появлению работ других авторов на эту тему, сколько введенная Хопфилдом функция вычислительной энергии нейронной сети. Это аналог функции Ляпунова в динамических системах. Показано, что для однослойной нейронной сети со связями типа "каждый с каждым" характерна сходимость к одной из конечного множества равновесных точек, которые являются локальными минимумами функции энергии. Понимание такой динамики нейронной сети было и у других исследователей. Однако Хопфилд и Тэнк показали, как конструировать функцию энергии для конкретной оптимизационной задачи и использовать ее для отображения задачи в нейронную сеть. Этот подход получил развитие и для решения других комбинаторных оптимизационных задач. Привлекательность подхода Хопфилда состоит в том, что нейронная сеть для конкретной задачи может быть запрограммирована без обучающих итераций. Веса связей вычисляются на основании вида функции энергии, сконструированной для этой задачи.

Развитием модели Хопфилда для решения комбинаторных оптимизационных задач и задач искусственного интеллекта является машина Больцмана, предложенная Хинтоном и другими и далее исследованная в. В ней, как и в других моделях, нейрон имеет состояния 1, 0 и связь между нейронами обладает весом. Каждое состояние сети характеризуется определенным значением функции консенсуса (аналога функции энергии). Максимум функции консенсуса соответствуют оптимальному решению задачи.

Итак, в рамках данного подхода элементом знания является состояние сети -- вектор состояний всех нейронов сети. Это можно считать средним уровнем абстрактности представления знаний. Для решения конкретной задачи необходимо организовывать сети со значительным числом нейронов. Небольшой объем памяти, необходимый для хранения нейрона позволяет эффективно пользоваться такими сетями.

Основными преимуществами нейросетей является их высокая адаптивность, а также их способность к обработке зашумленной и неполной информации.. Однако переобучение или дообучение сети затрагивает только значения весовых коэффициентов на межнейронных соединениях. Создание же алгоритма обучения, так же как и проектирование структуры сети, являются творческими задачами, выполняемыми специалистами высокой квалификации для конкретных задач. Данный недостаток серьезно затрудняет создание ИС на основе нейронных сетей.

Еще один недостаток нейронных сетей - ненаглядность представления знания – образы, запомненные сетью при обучении, закодированы в виде состояний всех нейронов сети, а процесс принятия решения в сети не может быть представлен в виде наглядных конструкций ЕСЛИ - ТО.

Модель может применяться для решения задач распознавания образов в практически любой предметной области. Широкое применение нейронные сети нашли при решении задач прогнозирования сложных процессов.

Так, по заказу Chemical Bank (США) фирма Logica разработала и внедрила систему для прогнозирования динамики биржевых курсов. На технической базе Sun SPARCstation LX с помощью аппарата нейронных сетей моделировались рынки валютных курсов доллар/швейцарский франк и немецкая марка/швейцарский франк. Выбор именно этих валют объяснялся высоким уровнем подвижности первого соотношения и малым - второго. Данные о динамике кросс-курсов этих валют собирались с 1 октября 1992 года по 1 сентября 1993, при этом ценовые прогнозы выражались пятью значениями: большой рост, малый рост, без изменений, малый спад, большой спад. В итоге был достигнут высокий процент достоверности прогноза около 60%.

Mellon equity Associates -- подразделение Mellon Bank в Питсбурге(США) - внедрила у себя систему Neural-Works Professional II /Plus 5.0 фирмы Neural-Ware. Эта система ориентирована на IBM-совместимые компьютеры. Пакет внедрялся около 4-5 мес. Основные решаемые задачи: распределение фондов и специальная селекция акций.

Группа специалистов по заказу департамента торговли и индустрии правительства Великобритании создала систему для выработки тактики распределения фондов на глобальных рынках облигаций. С ноября 1992 года эта система внедрялась в Североамериканской страховой компании в Бостоне (США). В итоге капитал этой компании быстро увеличился с 25 до 50 млн. долл., а портфель ценных бумаг показал доходность свыше 25% в первый же год внедрения системы.

Нейронные сети могут быть реализованы как программно, так и аппаратно. В настоящий момент на компьютерном рынке предлагается весьма широкий спектр аппаратных средств, обладающих различными функциями, возможностями и естественно ценой.

В качестве типичного примера нейроплаты можно назвать плату МВ 86232 японской фирмы Fujitsu. На плате размещены процессор цифровой обработки сигналов и оперативная память емкостью 4 Мбайт, что позволяет использовать такую плату для реализации нейронных сетей, содержащих до тысячи нейронов.

Среди разрабатываемых в настоящее время нейроБИС, которых насчитывается несколько десятков типов, выделяются модели фирмы Adaptive Solutions (США) и Hitachi (Япония). НейроБИС фирмы Adaptive Solutions, вероятно, станет одной из самых быстродействующих: объявленая скорость обработки составляет 1,2 млрд. соединений в секунду. (нейронная сеть содержит 64 нейрона и 262144 соединения). НейроБИС фирмы Hitachi позволяет реализовать нейронную сеть, содержащую до 576 нейронов. Эти нейроБИС, несомненно, станут основой новых нейрокомпьютеров и специализированных многопроцессорных изделий.

Большинство сегодняшних нейрокомпьютеров представляют собой просто персональный компьютер или рабочую станцию, в состав которых входит дополнительная нейроплата. К их числу относятся, например, компьютеры серии FMR фирмы Fujitsu. Такие системы имеют бесспорное право на существование, поскольку их возможностей вполне достаточно для разработки новых алгоритмов и решения большого числа прикладных задач методами нейроматематики. Однако наибольший интерес представляют специализированные нейрокомпьютеры, непосредственно реализующие принципы нейронных сетей. Типичными представителями таких систем являются компьютеры семейства Mark фирмы TRW (первая реализация персептрона, разработанная Розенблатом, называлась Mark I). Модель Mark III фирмы TRW представляют собой рабочую станцию, содержащую до 15 процессоров семейства Motorola 68000 с математическими сопроцессорами. Все процессоры объединены шиной VME. Архитектура системы, поддерживающая до 65 000 виртуальных процессорных элементов с более чем 1 млн. настраиваемых соединений, позволяет обрабатывать до 450 тыс. межсоединений в секунду. Mark IV - это однопроцессорный суперкомпьютер с конвейерной архитектурой. Он поддерживает до 236 тыс. виртуальных процессорных элементов, что позволяет обрабатывать до 5 млн. межсоединений в секунду. Компьютеры семейства Mark имеют общую программную оболочку ANSE (Artificial Neural System Environment), обеспечивающую программную совместимость моделей. Другой интересной моделью является нейрокомпьютер NETSIM, созданный фирмой Texas Instruments на базе разработок Кембриджского университета. 

По материалам сайта:
sites.google.com/site/upravlenieznaniami

загрузка...
Сторінки, близькі за змістом