→ Пошук по сайту       Увійти / Зареєструватися
Знання Керування знаннями Инженерия знаний

Методы инженерии знаний

Оглавление

1. Онтология

1.1 Принципы
1.2 Классификация онтологических систем.
1.3 Разработка онтологий

2. Когнитивные карты
3. Семантическая сеть

3.1 Принципы
3.2 Представление
3.3 Классификация семантических сетей
3.4 Семантические отношения

4. Список источников 

Онтология

Онтология — это точная cпецификация некоторой области, которая включает в себя словарь терминов предметной облаcти и множество логических связей (типа «элемент-класс», «часть-целое»), которые опиcывают, как эти термины cоотносятся между собой. Фактически это иерархический понятийный скелет предметной области.

Онтологии в значительной степени можно ассоциировать с семантическими сетями, как инструментом моделирования и структуризации знаний. Многие понятия и принципы реализации, а также графическая форма представления на начальном этапе структуризации, являются в онтологиях сходными с семантическими сетями. Многое в онтологиях сильно пересекается с уже давно принятым в информатике и лингвистике понятием тезауруса.

В инженерии знаний под онтологией понимается детальное описание некоторой предметной или проблемной области, которая иcпользуется для формального и декларативного определения её концептуализации. Онтологии позволяют представить понятия в таком виде, что они cтановятся пригодными для машинной обработки.

      В центре большинства онтологий находятcя классы, которые описывают понятия предметной облаcти. Cлоты (атрибуты или параметры) описывают свойства классов и экземпляров. Здесь прослеживаются аналогии с фреймовым подходом к формализации знаний.

На формальном уровне онтология – это cистема, состоящая из наборов понятий и утверждений об этих понятиях, на основе которых можно строить классы, объекты, отношения, функции и теории. Практически все модели онтологии cодержат определённые концепты (понятия, классы), свойства концептов (атрибуты, роли), отношения между концептами (зависимости, функции) и дополнительные ограничения, которые определяются аксиомами. Концептом может быть опиcание задачи, функции, действия, cтратегии, процесса и т.д. [1]

 Принципы

Онтологические системы строятся на основе следующих принципов:

  • формализации, то еcть описания объективных элементов действительности в единых, строго определённых образцах (терминах, моделях);
  • использования ограниченного количества базовых терминов (сущностей), на основе которых конструируются все остальные понятия;
  • внутренней полноты и логической непротиворечивости.

 В отличие от обычного cловаря для онтологической системы характерно внутреннее единство, логическая взаимосвязь и непротиворечивость иcпользуемых понятий. [1]

 Классификация онтологических систем.

Модели онтологии клаccифицируются следующим образом:

  • простые (имеют лишь концепты);
  • на основе фреймов (имеют лишь концепты и свойства);
  • на основе логик.

По языку представления онтологических знаний онтологии классифицируются следующим образом:

  • RDF. Язык разработан в рамках проекта семантик-веб (Semantic Web). Основное предназначение языка - описание метаданных документов, размещаемых в Интернет. RDF использует базовую модель представления данных "объект - атрибут - значение", и способен сыграть роль универсального языка описания семантики ресурсов и связей между ними.
  • DAML+OIL – семантический язык разметки Web-ресурсов, который расширяет стандарты RDF і RDF Schema за счет более полных примитивов моделирования. В последнюю версию DAML+OIL включен набор дополнительных конструкций для создания онтологий и разметки информации в легко интерпретируемом машиной виде.
  • OWL (Web Ontology Language) – язык представления онтологий следующего поколения после DAML+OIL. Обладает более богатым набором возможностей чем XML, RDF, RDF Schema і DAML+OIL. Проект предполагает создание мощного механизма семантического анализа. Планируется, что в нем будут устранены ограничения конструкций DAML+OIL. Онтология OWL – это последовательность аксиом, фактов и ссылок на другие онтологии.
  • KIF (Knowledge Interchange Format или формат обмена знаниями) - основан на S-выражениях синтаксис для логики. KIF - специальный язык, предназначенный для обмена знаниями между разными компьютерными системами. Разрабатывался для описания общего формата представления знаний независимого от конкретных систем.
  • CycL (язык описания онтологии Cyc) – это гибридный язык, в котором объединены свойства фреймов и логики предикатов. Синтаксис языка CycL схожий с синтаксисом языка Lisp. CycL различает такие сущности, как экземпляры, классы, предикаты и функции. Словарь CycL состоит из термов. Множество термов можно разделить на константы, неатомарные термы и переменные. Термы используются при составлении значащих выражений CycL, из которых формируются суждения. Из суждений состоит база знаний.
  • OCML (Operational Conceptual Modeling Language) язык поддерживает построение нескольких типов конструкций представления знаний. Он позволяет задавать спецификацию и операционализацию функций, связей, классов, экземпляров и правил. Он также включает механизмы для описания онтологий и методов решения задач - основные технологии, разработанные в области представления знаний. Около десятка проектов в KMi (Knowledge Media Institute) в настоящее время используют OCML для разработки моделей в таких областях как управление знаниями, разработка онтологии, электронная торговля и системы обработки знаний.
  • LOOM и PowerLoom® - языки представления знаний, разработанные исследователями из группы Artificial Intelligence Research Group Университета Южной Калифорнии (University of Southern California's Information Sciences Institute). Цель проекта Loom – разработка и внедрение продвинутых средств для представления знаний и рассуждений в области искусственного интеллекта. Loom и PowerLoom распространяются по открытой лицензии (open source licenses), но являются интеллектуальной собственностью Университета Южной Калифорнии и не являются общедоступными.
  • Loom это и язык и среда для построения интеллектуальных приложений. Центром языка является система представления знаний, которая используется для построения дедуктивных выводов на основе декларативных знаний. Декларативные знания состоят из определений, правил, фактов и правил по умолчанию. Дедуктивный движок использует прямые цепочки логического вывода, семантическую унификацию и объектно-ориентированные технологии поддержания достоверности.
  • Ontolingua предоставляет распределенную среду для совместного просмотра, создания, редактирования, изменения и использования онтологий. Сервер поддерживает более 150 активных пользователей, с некоторыми проектами которых можно ознакомиться по адресу http://ontolingua.stanford.edu/doc/ontology-server-projects.html. Ontolingua состоит из KIF парсера, инструментов для анализа онтологии, и набора трансляторов для преобразования исходных данных Ontolingua в форму, приемлемую для внедрения в системы представления знаний.
  • F-Logic – онтологический язык, который базируется на логиках первого порядка, однако классы и свойства в нем представлены как термины, а не как предикаты. Язык создавался для осуществления взаимодействия между онтологиями, построенными на основе предикатов, и онтологиями, построенными на основе F-Logic. Создатели определили интуитивные трансляторы для преобразования знаний из предикатных онтологий в F-Logic онтологии и показали, что такой перевод сохраняет логические связи (preserves entailment) для большого количества онтологических языков, в том числе и для многих OWL DL. Также, язык может применяться для мета-моделирования расширений Description Logics (v-semantics). [2]

Разработка онтологий

Разработка онтологии cостоит из:

  • определения клаccов;
  • расположения клаccов в таксономическую иерархию (подкласс – надкласс);
  • определения слотов и описания допусработкакаемых значений этих cлотов;
  • заполнения значений слотов-экземпляров.

Для описания онтологий и работы с ними наиболее перспективным предcтавляется визуальный подход, позволяющий специалистам непосредственно «рисовать» онтологии, что помогает наглядно сформулировать и объяснить природу и структуру явлений. Визуальные модели, например графы, обладают оcобенной когнитивной (то еcть познавательной) силой. Любой программный графический пакет можно использовать как первичный инструмент описания онтологий.

На рис. 2.1. показано, как визуально может быть представлена онтология. [2]

Когнитивные карты

На основе онтологий возможно построение когнитивных карт.

Когнитивная карта (от лат. cognitio — знание, познание) — образ знакомого пространственного окружения.

Когнитивные карты создаются и видоизменяются в результате активного взаимодействия субъекта с окружающим миром. При этом могут формироваться когнитивные карты различной степени общности, «масштаба» и организации (например, карта-обозрение или карта-путь в зависимости от полноты представленности пространственных отношений и присутствия выраженной точки отсчета). Это — субъективная картина, имеющая прежде всего пространственные координаты, в которой локализованы отдельные воспринимаемые предметы. Выделяют карту-путь как последовательное представление связей между объектами по определенному маршруту, и карту-обозрение как одновременное представление пространственного расположения объектов.

Когнитивная карта может быть визуализирована в виде множества вершин, каждая из которых соответствует одному фактору или элементу картины мира индивида. Дуга, связывающая вершины А и В, соответствует причинно-следственной связи А → В, где А - причина, В - следствие.

Связь А → В называется положительной (знак "+"), если увеличение А ведет к увеличению (усилению) В, а уменьшение А ведет к уменьшению В при прочих равных условиях. Знак "-" над дугой А → В означает, что связь отрицательная, т.е. при прочих равных условиях увеличение А приводит к уменьшению (торможению) В и уменьшение А ведет к увеличению В.

В качестве примера когнитивной карты рассмотрим представления человека, находящегося в депрессии (рис. 2.2). 

Приведенная на рис.2.2 картина мира позволяет анализировать динамику развития депрессии. Предположим, что самооценка больного по каким-то причинам снизилась. Это ведет к усилению депрессии (связь имеет отрицательный знак). Усиление депрессии снижает возможность справиться с ситуацией самостоятельно, следовательно, увеличивается потребность в посторонней помощи, что в свою очередь еще больше снижает самооценку.

Процесс повторяется снова и снова. Дела явно движутся в нежелательном направлении. Чтобы найти выход из казалось бы безвыходной ситуации, необходимо скорректировать картину мира. Следует убедить больного в том, что помощь других свидетельствует о любви к нему друзей и родственников, поэтому эта помощь должна повышать его самооценку, а знак соответствующей причинной связи становиться положительным. В этом случае рассмотренная выше петля дает надежду, что со временем ситуация выровняется - случайное снижение самооценки благодаря действию петли будет компенсировано.

Когнитивные карты могут быть полезным инструментом для формирования и уточнения гипотезы о функционировании исследуемого объекта, рассматриваемого как сложная система. Для того чтобы понять и проанализировать поведение сложной системы, целесобразно построить структурную схему причинно-следственных связей.

Рассмотрим пример когнитивной карты для анализа проблемы потребления электроэнергии в регионе (рис. 2.3).

Ф. Роберте считает, что исследуемую проблему достаточно полно можно описать семью факторами F, J, P, Q, R, C, U. Дугами на рис. 2.3 отмечены существенные причинно-следственные отношения, влиянием остальных можно пренебречь.

Дуга (Q, Р) имеет знак " + ", так как улучшение окружающей среды ведет к увеличению числа жителей, а ухудшение состояния окружающей среды вызывает отток населения. Дуга (U, Q) имеет знак "-", так как увеличение потребления энергии ухудшает состояние окружающей среды, а уменьшение потребления энергии благотворно сказывается на ее состоянии. Дуга (Р, U) имеет знак " + " ввиду того, что рост числа жителей вызывает увеличение потребления энергии и, наоборот, уменьшение населения приводит к падению потребления энергии.

Рассмотрим взаимодействие факторов в контуре Р, U, Q, Р. Предположим, что численность населения возросла. Это приведет к увеличению потребления энергии и, следовательно, ухудшит состояние окружающей среды, что в свою очередь приведет к уменьшению числа жителей. Таким образом, влияние импульса в вершине Р будет компенсироваться действием контура Р, U, Q, P, и поведение системы стабилизируется. Три фактора Р, U, Q образуют контур, противодействующий отклонению.

В контуре U, С, F все дуги со знаком "+", и легко видеть, что увеличение (уменьшение) любой переменной в этом контуре будет усилено.

Контуры в когнитивной карте соответствуют контурам обратной связи. Контур, усиливающий отклонение, является контуром положительной обратной связи, а контур, противодействующий отклонению, - контуром отрицательной обратной связи. Японский ученый М. Маруяма назвал эти контуры соответственно морфогенетическити и гомеостатическими. В этой же работе Маруяма доказал, что контур усиливает отклонение тогда и только тогда, когда он содержит четное число отрицательных дуг или не содержит их совсем, в противном случае это контур, противодействующий отклонению. Действительно, в случае четного числа отрицательных дуг противодействие отклонению будет само встречать противодействие. Если число отрицательных дуг нечетно, то последнее противодействие отклонению не встречает противодействия.

Данная схема анализа в основном соответствует интуитивным представлениям о причинности. Ясно, что взаимодействие двух факторов А и В может подчиняться более сложным закономерностям, но в этом случае для описания исследуемого процесса следует использовать языки функциональных взаимосвязей.

Опыт использования когнитивных карт показывает, что исследователь часто чрезмерно упрощает ситуацию из-за ограниченных когнитивных возможностей, трудностей одновременного учета большого числа факторов, их динамического взаимодействия. М. Вертгеймер писал, что исследователю часто не хватает широты видения в сложных ситуациях, включающих несколько подпроблем,теряется понимание целого, сам собой навязывается узкий взгляд на проблему. [4]

Семантическая сеть

Семантическая сеть — информационная модель предметной области, имеющая вид ориентированного графа, вершины которого соответствуют объектам предметной области, а дуги (рёбра) задают отношения между ними. Объектами могут быть понятия, события, свойства, процессы. Таким образом, семантическая сеть является одним из способов представления знаний. В названии соединены термины из двух наук: семантика в языкознании изучает смысл единиц языка, а сеть в математике представляет собой разновидность графа — набора вершин, соединённых дугами (рёбрами). В семантической сети роль вершин выполняют понятия базы знаний, а дуги (причем направленные) задают отношения между ними. Таким образом, семантическая сеть отражает семантику предметной области в виде понятий и отношений. [5]

Принципы

Семантическая сеть — структура для представления знаний в виде узлов, соединенных дугами. Самые первые семантические сети были разработаны в качестве языка-посредника для систем машинного перевода, а многие современные версии до сих пор сходны по своим характеристикам с естественным языком. Однако последние версии семантических сетей стали более мощными и гибкими и составляют конкуренцию фреймовым системам, логическому программированию и другим языкам представления знаний.

Начиная с конца 50-ых годов прошлого века были созданы и применены на практике десятки вариантов семантических сетей. Несмотря на то, что терминология и их структура различаются, существуют сходства, присущие практически всем семантическим сетям:

  1. Узлы семантических сетей представляют собой концепты предметов, событий, состояний.
  2. Различные узлы одного концепта относятся к различным значениям, если для них не помечено, что они относятся к одному концепту.
  3. Дуги семантических сетей создают отношения между узлами-концептами (пометки над дугами указывают на тип отношения).
  4. Некоторые отношения между концептами представляют собой лингвистические падежи, такие как агент, объект, реципиент и инструмент (другие означают временные, пространственные, логические отношения и отношения между отдельными предложениями).
  5. Концепты организованы по уровням в соответствии со степенью обобщенности. Как пример, сущность, живое существо, животное, плотоядное.

Однако существуют и различия: понятие значения с точки зрения философии; методы представления кванторов общности и существования и логических операторов; способы манипулирования сетями и правила вывода, терминология. Все это варьируется от автора к автору. Несмотря не некоторые различия, сети удобны для чтения и обработки компьютером, а также достаточно мощны, чтобы представить семантику естественного языка.Самые простые сети, которые используются в системах искусственного интеллекта, - это реляционные графы. Они состоят из узлов, соединенных дугами. Каждый узел представляет собой понятие, а каждая дуга - отношения между различными понятиями. Ниже представлено предложение "Собака жадно гложет кость". Четыре прямоугольника представляют понятия самой собаки, процесса глодания кости, самой кости и такой характеристики как жадность. Надписи рядом с дугами означают, что собака является агентом процесса, кость является объектом этого процесса, а жадность - это характеристика выполнения процесса.

Терминология, использующаяся в этой области, различна. Чтобы добиться некоторой однородности, узлы, соединенные дугами, принято называть графами, а структуру, где имеется целое гнездо из узлов или где существуют отношения различного порядка между графами, называть сетью. Помимо терминологии, использующейся для пояснения, также различаются способы изображения. Некоторые используют кружки вместо прямоугольников; некоторые пишут типы отношений над или под дугами, заключая или же не заключая их в овалы; некоторые используют аббревиатуры вида О или А для обозначения агента или объекта; некоторые используют
различные типы стрелок. [3]

Представление

Математика позволяет описать большинство явлений в окружающем мире в виде логических высказываний. Семантические сети возникликак попытка визуализации математических формул. Основным представлением для семантической сети является граф. Однако не стоит забывать, что за графическим изображением непременно стоит строгая математическая запись, и что обе эти формы являются не конкурирующими, а взаимодополняющими.

Графическое представление

Основной формой представления семантической сети является граф. Понятия семантической сети записываются в овалах или прямоугольниках и соединяются стрелками с подписями — дугами (см. рис.). Это наиболее удобно воспринимаемая человеком форма. Её недостатки проявляются, когда мы начинаем строить более сложные сети или пытаемся учесть особенности естественного языка.

Математическая запись

В математике граф представляется множеством вершин V и множеством отношений между ними E. Используя аппарат математической логики, приходим к выводу, что каждая вершина соответствует элементу предметного множества, а дуга — предикату.

Лингвистическая запись

В лингвистике отношения фиксируются в словарях и в тезаурусах. В словарях в определениях через род и видовое отличие родовое понятие занимает определённое место. В тезаурусах в статье каждого термина могут быть указаны все возможные его связи с другими родственными по теме терминами. От таких тезаурусов необходимо отличать тезаурусы информационно- поисковые с перечнями ключевых слов в статьях, которые предназначены для работы дескрипторных поисковых систем. [5]

Классификация семантических сетей

Для всех семантических сетей справедливо разделение по арности и количеству типов отношений.

  • По количеству типов отношений, сети могут быть однородными и неоднородными.
    • Однородные сети обладают только одним типом отношений (стрелок), например, таковой является классификация биологических видов (с единственным отношением AKO*).
    • В неоднородных сетях количество типов отношений больше двух. Классические иллюстрации данной модели представления знаний представляют именно такие сети. Неоднородные сети представляют больший интерес для практических целей, но и большую сложность для исследования. Неоднородные сети можно представлять как переплетение древовидных многослойных структур. Примером такой сети может быть Семантическая сеть Википедии.
  • По арности:
    • типичными являются сети с бинарными отношениями (связывающими ровно два понятия). Бинарные отношения очень просты и удобно изображаются на графе в виде стрелки между двух концептов. Кроме того, они играют исключительную роль в математике.
    • На практике, однако, могут понадобиться отношения, связывающие более двух объектов — N-арные. При этом возникает сложность — как изобразить подобную связь на графе, чтобы не запутаться. Концептуальные графы снимают это затруднение, представляя каждое отношение в виде отдельного узла.
  • По размеру:
    • Для решения конкретных задач, например, тех которые решают систмы искусственного интелекта.
    • С. С. отраслевого масштаба должна служить базой для создания конкретных систем, не претендуя на всеобщее значение.
    • Глобальная семантическая сеть. Теоретически такая сеть должна существовать, поскольку всё в мире взаимосвязано. Возможно когда-нибудь такой сетью станетВсемирная паутина.

Помимо концептуальных графов существуют и другие модификации семантических сетей, это является ещё одной основой для классификации (по реализации). [5]

Семантические отношения

Количество типов отношений в семантической сети определяется её создателем, исходя из конкретных целей. В реальном мире их число стремится к бесконечности. Каждое отношение является, по сути, предикатом, простым или составным. Скорость работы с базой знаний зависит от того, насколько эффективно реализованы программы обработки нужных отношений.

Иерархические

Наиболее часто возникает потребность в описании отношений между элементами, множествами и частями объектов. Отношение между объектом и множеством, обозначающим, что объект принадлежит этому множеству, называется отношением классификации (ISA). Говорят, что множество (класс) классифицирует свои экземпляры. (пример: «Шарик является собакой» ="Шарик является объектом типа собака") . Иногда это отношение именуют также MemberOf, InstanceOf или подобным образом. Связь ISA предполагает, что свойства объекта наследуются от множества. Обратное к ISA отношение используется для обозначения примеров, поэтому так и называется — «Example», или по-русски Пример. Иерархические отношения образуют Древовидную структуру.

  • Отношение между надмножеством и подмножеством называется AKO* — «A Kind Of» («разновидность») (пример:"собака является животным"=" тип с именем «собака» является подтипом типа «животные»"). Элемент подмножества называется гипонимом (собака), а надмножества — гиперонимом(животное), а само отношение называетсяотношением гипонимии. Альтернативные названия — «SubsetOf» и «Подмножество». Это отношение определяет, что каждый элемент первого множества входит и во второе (выполняется ISA для каждого элемента), а также логическую связь между самими подмножествами: что первое не больше второго и свойства первого множестванаследуются вторым.
    • * - Отношение между надмножеством и подмножеством называется AKO — «A Kind Of» («разновидность») (пример:"собака является животным"=" тип с именем «собака» является подтипом типа «животные»"). 
  • Объект, как правило, состоит из нескольких частей, или элементов. Например, компьютер состоит из системного блока, монитора, клавиатуры, мыши и т. д. Важным отношением является HasPart, описывающее части/целые объекты (отношение меронимии). Мероним — это объект, являющийся частью для другого. Двигатель — это мероним для автомобиля. Холоним — это объект, который включает в себя другое. Например, у дома есть крыша. Дом — холоним для крыши. Компьютер — холоним для монитора. Мероним и холоним — противоположные понятия. В этом случае свойства первого множества не наследуются вторым.

Часто в семантических сетях требуется определить отношения синонимии и антонимии. Эти связи либо дублируются явно в самой сети, либо в алгоритмической составляющей.

Вспомогательные

В семантических сетях часто используются также следующие отношения: 

  • функциональные связи (определяемые обычно глаголами «производит», «влияет»…);
  • количественные (больше меньше, равно…);
  • пространственные (далеко от, близко от, за, под, над…);
  • временные (раньше, позже, в течение…);
  • атрибутивные (иметь свойство, иметь значение);
  • логические (И, ИЛИ, НЕ);
  • лингвистические.

Этот список может сколь угодно продолжаться: в реальном мире количество отношений огромно. Например, между понятиями может использоваться отношение «совершенно разные вещи» или подобное: Не_имеют_отношения_друг_к_другу(Солнце, Кухонный_чайник).

Пример. На рис. 2.4 изображена семантическая сеть. В качестве вершин понятия: Человек, Иванов, Волга. Автомобиль, Вид транспорта. Двигатель.

[5]

Список источников

  1. http://www.ozon.ru/context/detail/id/5402790/ Книга "Управление знаниями корпорации и реинжиниринг бизнеса". Абдикеев Н.М., Киселев А.Д. Основными ресурсами развития компаний во все большей мере становятся люди и знания, которыми они обладают, интеллектуальный капитал и растущая профессиональная компетенция кадров. Сегодня требуются новые методы развития организации, основанные на стыке гуманитарного и инженерного подходов, что позволит получить синергетический эффект от их взаимодействия. Этот подход базируется на современных достижениях информационных технологий, а именно когнитивных технологиях развития организации. Актуально развитие симбиоза концепции управления знаниями, реинжиниринга, бизнес-процессов и когнитивной человеческой составляющей.
  2. http://lingvoworks.org.ua/index.php?option=com_content&view=
    article&id=57:2009-12-09-11-34-05&catid=2:misc&Itemid=3
    В статье рассматриваются вопросы построения, структурирования, описания, классификации и использования онтологических баз знаний. Приведен обзор современных исследований, посвященных различным аспектам создания и использования онтологии. Пристальное внимание в работе уделено разграничению формальных и лингвистических онтологий. Также, предложена достаточно подробная методология построения ресурсов онтологического типа.
  3. http://aimatrix.nm.ru/aimatrix/SemanticNetworks.htm Статья, повященная семантическим сетям. Описывается история создания семантических сетей, а также принципы построения и классификация.
  4. http://bibl.tikva.ru/base/B1253/B1253Part12-59.php Статья о когнитивных картах. Приводится несколько примеров использования когнитивных карт.
  5. http://ru.wikipedia.org/wiki/%D0%A1%D0%B5%D0%BC%D0%
    B0%D0%BD%D1%82%D0%B8%D1%87%D0%B5%D1%81%
    D0%BA%D0%B0%D1%8F_%D1%81%D0%B5%D1%82%D1%8C
    Материал из википедии. Статья о семантических сетях.
  6. http://lsdis.cs.uga.edu/projects/glycomics/report/Report2006.html Сайт научно-исследовательского центра. Можно найти пример визуализации биохимической и биологической онтологии.  
загрузка...
Сторінки, близькі за змістом