Инженерия знаний. Инженерия знаний и получение знаний Инженерия знаний определяется как

17.2. Практические методы извлечения знаний

17.3. Структурирование знаний

Центральной проблемой при создании интеллектуальных информационных технологий является адекватное отображение знаний специалиста в памяти компьютера. Это привело к развитию нового направления в информатике – инженерии знаний, где определяется соотношение человеческого знания и его формализованного (информационного) отображения в ЭВМ. Инженерия знаний изучает и разрабатывает вопросы, связанные с получением знаний, их анализом и формализацией для дальнейшей реализации в интеллектуальной системе.

Цель главы – дать обзор основных теоретических аспектов инженерии знаний и познакомить с некоторыми практическими методами работы инженеров по знаниям.

После изучения главы вы должны знать:

Подходы к получению знаний при разработке экспертных систем

Теоретические проблемы, возникающие при извлечении знаний

Особенности психологических и лингвистических факторов, которые необходимо учитывать инженеру по знаниям

Влияние философии познания на работу инженера по знаниям

Методы инженера по знаниям при работе с источником знаний

Методы извлечения знаний

Суть экспертных игр

Методы извлечения знаний из текстов

Структурирование полученных знаний

Формирование понятийной и функциональной структуры предметной области

Каким образом формализуются знания и формируется база знаний

17.1. Теоретические аспекты получения знаний

Стратегии получения знаний

Психологический аспект

Лингвистический аспект

Гносеологический аспект

СТРАТЕГИИ ПОЛУЧЕНИЯ ЗНАНИИ

Существует несколько стратегий получения знаний. Наиболее распространенные:

приобретение;

извлечение;

формирование.

Под приобретением знаний понимается способ автоматизированного построения базы знаний посредством диалога эксперта и специальной программы (при этом структура знаний заранее закладывается в программу). Эта стратегия требует существенной предварительной проработки предметной области. Системы приобретения знаний действительно приобретают готовые фрагменты знаний в соответствии со структурами, заложенными разработчиками систем. Большинство этих инструментальных средств специально ориентировано на конкретные экспертные системы с жестко обозначенной предметной областью и моделью представления знаний, т.е. не являются универсальными. Например, система TEIRESIAS , ставшая прародительницей всех инструментариев для приобретения знаний, предназначена для пополнения базы знаний системы MYCIN или ее дочерних ветвей, построенных на "оболочке" EMYCIN в области медицинской диагностики с использованием продукционной модели представления знаний.

Термин извлечение знаний касается непосредственного живого контакта инженера по знаниям и источника знаний. Авторы склонны использовать этот термин как более емкий и более точно выражающий смысл процедуры переноса компетентности эксперта через инженера по знаниям в базу знаний экспертной системы.

Термин форм up ование знаний традиционно закрепился за чрезвычайно перспективной и активно развивающейся областью инженерии знаний, которая занимается разработкой моделей, методов и алгоритмов анализа данных для получения знаний и обучения. Эта область включает индуктивные модели формирования гипотез на основе обучающих выборок, обучение по аналогии и другие методы.

Таким образом, можно выделить три стратегии проведения стадии получения знаний при разработке экспертных систем (рис. 17.1).

Рис. 17.1. Три стратегии получения знаний

На современном этапе разработки экспертных систем в нашей стране стратегия извлечения знаний, по-видимому, является наиболее актуальной, поскольку промышленных систем приобретения и формирования знаний на отечественном рынке программных средств практически нет.

Извлечение знаний – это процедура взаимодействия эксперта с источником знаний, в результате которой становятся явными процесс рассуждений специалистов при принятии решения и структура их представлений о предметной области.

В настоящее время большинство разработчиков экспертных систем отмечают, что процесс извлечения знаний остается самым "узким" местом при построении промышленных систем.

Процесс извлечения знаний – это длительная и трудоемкая процедура, в которой инженеру по знаниям, вооруженному специальными знаниями по когнитивной психологии , системному анализу, математической логике и пр., необходимо воссоздать модель предметной области, которой пользуются эксперты для принятия решения. Часто начинающие разработчики экспертных систем, желая избежать этой мучительной процедуры, задают вопрос: может ли эксперт сам извлечь из себя знания? По многим причинам это нежелательно.

Во-первых, большая часть знаний эксперта – это результат многочисленных наслоений, ступеней опыта. И часто зная, что из А следует В, эксперт не дает себе отчета, что цепочка его рассуждений была гораздо длиннее, например С  D , D  А, А  В, или А  Q , Q  R , R  B .

Во-вторых, как было известно еще древним (вспомним "Диалоги" Платона), мышление диалогично. И поэтому диалог инженера по знаниям и эксперта – наиболее естественная форма "раскручивания" лабиринтов памяти эксперта, в которых хранятся знания, частью носящие невербальный характер, т.е. выраженные не в форме слов, в форме наглядных образов, например. Именно в процессе объяснения инженеру по знаниям эксперт на эти размытые ассоциативные образы надевает четкие словесные ярлыки, т.е. вербализует знания.

В-третьих, эксперту гораздо труднее создать модель предметной области вследствие той глубины и необозримости информации, которой он обладает. Многочисленные причинно-следственные связи реальной предметной области образуют сложную систему, из которой выделить "скелет", или главную структуру, иногда доступнее аналитику, владеющему к тому же системной методологией: Любая модель – это упрощение, а упрощать легче с меньшим знанием деталей.

Чтобы разобраться в природе извлечения знаний, выделим три основных аспекта этой процедуры (рис. 17.2): психологический, лингвистический, гносеологический, которые подробно описаны в .

Рис. 17.2. Основные аспекты извлечения знаний

ПСИХОЛОГИЧЕСКИЙ АСПЕКТ

Модель общения при извлечении знаний

Из трех выделенных аспектов извлечения знаний психологический является, по-видимому, главным, поскольку он определяет успешность и эффективность взаимодействия инженера по знаниям (аналитика) с основным источником знаний – экспертом-профессионалом. Мы выделяем психологический аспект еще и потому, что извлечение знаний происходит чаще всего в процессе непосредственного общения разработчиков системы.

Стремление и умение общаться могут характеризовать степень профессионализма инженера по знаниям.

Известно, что потери информации при разговорном общении велики (рис. 17.3). В связи с этим рассмотрим проблему увеличения информативности общения аналитика и эксперта за счет использования психологических знаний.

Рис. 17.3. Потери информации при общении

Мы можем предложить такую структурную модель общения при извлечении знаний:

участники общения (партнеры);

средства общения (процедура);

предмет общения (знания).

В соответствии с этой структурой выделим три "слоя" психологических проблем, возникающих при извлечении знаний (рис. 17.4), и последовательно рассмотрим их.

Рис. 17.4. Структура психологического аспекта извлечения знаний

Контактный слой

Практически все психологи отмечают, что на любой коллективный процесс влияет атмосфера, возникающая в группе участников. Существуют эксперименты, результаты которых неоспоримо говорят, что дружеская атмосфера в коллективе больше влияет на результат, чем индивидуальные способности отдельных членов группы. Особенно важно, чтобы в коллективе разработчиков складывались кооперативные, а не конкурентные отношения. Для кооперации характерна атмосфера сотрудничества, взаимопомощи, заинтересованности в успехах друг друга, т.е. уровень нравственного общения, а для отношений конкурентного типа – атмосфера индивидуализма и межличностного соперничества (более низкий уровень общения).

К сожалению, прогнозировать совместимость в общении со 100%-ной гарантией невозможно. Однако можно выделить ряд черт личности, характера и других особенностей участников общения, несомненно, оказывающих влияние на эффективность процедуры. Знание этих психологических закономерностей составляет часть багажа психологической культуры, которым должен обладать инженер по знаниям для успешного проведения стадии извлечения знаний:

доброжелательность и дружелюбие;

чувство юмора;

хорошая память и внимание;

наблюдательность;

воображение и впечатлительность;

большая собранность и настойчивость;

общительность и находчивость;

аналитичность;

располагающая внешность и манера одеваться;

уверенность в себе.

Процедурный слой

Инженер по знаниям, успешно овладевший наукой доверия и взаимопонимания с экспертом (контактный слой), должен еще уметь воспользоваться благоприятным воздействием этой атмосферы. Проблемы процедурного слоя касаются проведения самой процедуры извлечения знаний. Здесь мало проницательности и обаяния, полезного для решения проблемы контакта, тут необходимы профессиональные знания.

Остановимся на общих закономерностях проведения процедуры.

Беседу с экспертом лучше всего проводить в небольшом помещении tête-à-tête. Освещение, тепло, уют влияют непосредственно на настроение. Чай или кофе создадут дружескую атмосферу. Американский психолог И. Атватер считает, что для делового общения наиболее благоприятная дистанция от 1,2 до 3 м. Минимальным "комфортным" расстоянием можно считать 0,7 - 0,8 м.

Реконструкция собственных рассуждений – нелегкий труд, и поэтому длительность одного сеанса обычно не превышает 1,5 - 2 ч. Эти два часа лучше выбрать в первой половине дня (например, с 10 до 12ч). Известно, что взаимная утомляемость партнеров при беседе наступает обычно через 20 - 25 мин, поэтому в сеансе нужны паузы.

Любой инженер по знаниям имеет свою уникальную манеру разговора. Одни говорят быстро, другие медленно; одни громко, другие тихо и т.д. Стиль разговора изменить практически невозможно – он закладывается в человеке в раннем детстве. Однако извлечение знаний – это профессиональный разговор, и на его успешность влияет также длина фраз, которые произносит инженер по знаниям.

Этот факт был установлен американскими учеными – лингвистом Ингве и психологом Миллером. Оказалось, что человек лучше всего воспринимает предложения глубиной (или длиной) 7 плюс-минус 2 слова. Это число (7+2) получило название число Ингве-Миллера. Можно считать его мерой "разговорности" речи.

Необходимость фиксации процедуры извлечения знаний ни у кого не вызывает сомнений. Встает вопрос: в какой форме это делать? Можно предложить три способа протоколирования результатов:

запись на бумагу непосредственно по ходу беседы (недостатки – это часто мешает беседе, кроме того, трудно успеть записать все, даже при наличии навыков стенографии);

магнитофонная запись, помогающая аналитику проанализировать весь ход сеанса и свои ошибки (недостаток – может сковывать эксперта);

запоминание с последующей записью после беседы (недостаток – годится только для аналитиков с блестящей памятью).

Когнитивный слой

Когнитивная психология (англ. cognition – познание) изучает механизмы, при помощи которых человек познает окружающий мир.

Предложим несколько советов инженеру по знаниям с позиций когнитивной психологии:

не навязывать эксперту ту модель представления, которая ему (аналитику) более понятна и естественна;

использовать различные методы работы с экспертом исходя из условия, что метод должен подходить к эксперту, как "ключ к замку";

четко осознавать цель процедуры извлечения или ее главную стратегию, которая может быть определена как выявление основных понятий предметной области и связывающих их отношений;

чаще рисовать схемы, отображающие рассуждения эксперта. Это связано с образной репрезентацией информации в памяти человека.

Материал, изложенный выше, тесно связан с азами психологической культуры, которая включает понимание и знание себя и других людей; адекватную самооценку и оценку других людей; саморегулирование психического состояния. Овладеть этой культурой легче с помощью специалистов – психологов, психотерапевтов, но можно самостоятельно с помощью книг, хотя бы популярных, например . Кроме этого успешному преодолению психологических неудач способствует овладение основами актерского мастерства и участие в специальных занятиях по социально-психологическому видеотренингу.

В заключение приведем ряд традиционных психологических неудач начинающего аналитика:

отсутствие контакта между экспертом и инженером по знаниям (из-за психологических особенностей того или другого; ошибок в процедуре; возникновения эффекта "фасада", т.е. желания эксперта "показать себя");

отсутствие понимания (из-за эффекта "проекции", т.е. переноса взгляда аналитика на взгляды эксперта; или эффекта "порядка", т.е. концентрации внимания в первую очередь на том, что высказывается вначале, и др.);

низкая эффективность бесед (слабая мотивация эксперта, т.е. отсутствие у него интереса; или неудачный темп беседы; или неподходящая форма вопросов; или неудовлетворительные ответы эксперта).

ЛИНГВИСТИЧЕСКИЙ АСПЕКТ

Структура лингвистического аспекта

Поскольку процесс общения инженера по знаниям и эксперта – это языковое общение, рассмотрим лингвистический аспект инженерии знаний. Выделим три слоя важных для инженерии знаний лингвистических проблем (рис. 17.5).

Рис. 17.5. Структура лингвистического аспекта извлечения знаний

Проблема общего кода

Большинство психологов и лингвистов считают, что язык – это основное средство мышления наряду с другими знаковыми системами "внутреннего пользования". Языки, на которых говорят и размышляют аналитик и эксперт, могут существенно отличаться.

Итак, нас интересуют два языка – язык аналитика, состоящий из трех компонентов:

терминов предметной области, которые он почерпнул из специальной литературы в период подготовки;

общенаучной терминологии из его "теоретического багажа";

бытового разговорного языка, которым пользуется аналитик;

и язык эксперта, состоящий:

из специальной терминологии, принятой в предметной области;

общенаучной терминологии; бытового языка;

неологизмов, созданных экспертом за время работы (его профессиональный жаргон).

Если считать, что бытовой и общенаучный языки у двух участников общения примерно совпадают, то некоторый общий язык, или код, который необходимо выработать партнерам для успешного взаимодействия, будет складываться из потоков, представленных на рис. 17.6. В дальнейшем этот общий код преобразуется в некоторую понятийную (семантическую) сеть, которая является прообразом поля знаний предметной области.

Рис. 17.6. Схема получения общего кода

Выработка общего кода начинается с выписывания аналитиком всех терминов, употребляемых экспертом, и уточнения их смысла. Фактически это составление словаря предметной области. Затем следуют группировка терминов и выбор синонимов (слов, означающих одно и то же). Разработка общего кода заканчивается составлением словаря терминов предметной области с предварительной группировкой их по смыслу, т.е. по понятийной близости (это уже первый шаг структурирования знаний).

Рис. 17.7 дает представление о неоднозначности интерпретации терминов двумя специалистами. В семиотике, науке о знаковых системах, проблема интерпретации является одной из центральных. Интерпретация связывает "знак" и "означаемый предмет". Только в интерпретации знак получает смысл. Так, на рис. 17.7 слова "прибор X" для эксперта означают некоторую конкретную схему, которая соответствует схеме оригинала прибора, а в голове начинающего аналитика слова "прибор X" вызывают пустой образ или некоторый "черный ящик" с ручками.

Рис. 17.7. Неоднозначность проблемы интерпретации

Понятийная структура

Большинство специалистов по искусственному интеллекту и когнитивной психологии считают, что основная особенность естественного интеллекта и памяти в частности – это связанность всех понятий в некоторую сеть. Поэтому для разработки базы знаний нужен не словарь, а энциклопедия, в которой все термины объяснены в словарных статьях со ссылками на другие термины.

Таким образом, лингвистическая работа инженера по знаниям на данном слое проблем заключается в построении таких связанных фрагментов с помощью "сшивания" терминов. При тщательной работе аналитика и эксперта в понятийных структурах начинает проглядывать иерархия понятий, что в общем согласуется с результатами когнитивной психологии.

Иерархия понятий – это глобальная схема, которая может быть в основе концептуального анализа структуры знаний любой предметной области.

Следует подчеркнуть, что работа по составлению словаря и понятийной структуры требует лингвистического "чутья", легкости манипулирования терминами и богатого словарного запаса инженера по знаниям, так как зачастую аналитик вынужден самостоятельно разрабатывать словарь признаков. Чем богаче и выразительнее общий код, тем полнее база знаний.

Аналитик вынужден все время помнить о трудности передачи образов и представлений в вербальной форме. Часто инженеру по знаниям приходится подсказывать слова и выражения эксперту.

Словарь пользователя

Лингвистические результаты, соотнесенные со слоями общего кода и понятийной структуры, направлены на создание адекватной базы знаний. Однако не следует забывать, что профессиональный уровень конечного пользователя может не позволить ему применить специальный язык предметной области в полном объеме. Для разработки пользовательского интерфейса необходима дополнительная доработка словаря общего кода с поправкой на доступность и "прозрачность" системы.

В заключение перечислим характерные лингвистические неудачи, подстерегающие начинающего инженера по знаниям:

разговор на разных языках (из-за слабой подготовки инженера по знаниям);

несоотнесение с контекстом и неадекватная интерпретация терминов (из-за отсутствия обратной связи, т.е. слишком независимой работы инженера по знаниям);

отсутствие отличий между общим кодом и языком пользователя (не учтены различия в уровне знаний эксперта и пользователя).

ГНОСЕОЛОГИЧЕСКИЙ АСПЕКТ

Суть гносеологического аспекта

Гносеология – это раздел философии, связанный с теорией познания, или теорией отражения действительности в сознании человека.

Инженерия знаний как наука, если можно так выразиться, дважды гносеологична – действительность (О) сначала отражается в сознании эксперта (M 1), а затем деятельность и опыт эксперта интерпретируются сознанием инженера по знаниям (М 2), что служит уже основой для построения третьей интерпретации (P z) – поля знаний экспертной системы (рис. 17.8). Процесс познания в сущности направлен на создание внутреннего представления окружающего мира в сознании человека.

Рис. 17.8. Гносеологический аспект извлечения знаний

В процессе извлечения знаний аналитика в основном интересует компонент знания, связанный с неканоническими индивидуальными знаниями экспертов, поскольку предметные области именно с таким типом знаний считаются наиболее восприимчивыми к внедрению экспертных систем. Эти области обычно называют эмпирическими, так как в них накоплен большой объем отдельных эмпирических фактов и наблюдений, в то время как их теоретическое обобщение – вопрос будущего.

Познание всегда связано с созданием новых понятий и теории. Интересно, что часто эксперт как бы "на ходу" порождает новые знания, прямо в контексте беседы с аналитиком. Такая генерация знаний может быть полезна и самому эксперту, который до того момента мог не осознавать ряд соотношений и закономерностей предметной области. Аналитику, который является "повитухой" при рождении нового знания, может помочь тут и инструментарий системной методологии, позволяющий использовать известные принципы логики научных исследований, понятийной иерархии науки. Эта методология заставляет его за частным увидеть общее, т.е. строить цепочки:

ФАКТ  ОБОБЩЕННЫЙ ФАКТ  ЭМПИРИЧЕСКИЙ ЗАКОН  ТЕОРЕТИЧЕСКИЙ ЗАКОН

Не всегда инженер по знаниям дойдет до последнего звена этой цепочки, но уже само стремление к движению бывает чрезвычайно плодотворным. Такой подход полностью согласуется со структурой самого знания, которое имеет два уровня:

эмпирический (наблюдения, явления);

теоретический (законы, абстракции, обобщения).

Критерии научного знания

Теория - это не только стройная система обобщения научного знания, это также некоторый способ производства новых знаний. Основными методологическими критериями научности, позволяющими считать научным и само новое знание, и способ его получения, являются :

внутренняя согласованность и непротиворечивость;

системность;

объективность;

историзм.

Внутренняя согласованность. Этот критерий в эмпирических областях на первый взгляд просто не работает: в них факты часто не согласуются друг с другом, определения противоречивы, диффузны и т.д. Аналитику, знающему особенности эмпирического знания, его модальность, противоречивость и неполноту, приходится сглаживать эти "шероховатости" эмпирики.

Модальность знания означает возможность его существования в различных категориях, т.е. в конструкциях существования и долженствования. Таким образом, часть законемерностей возможна, другая обязательна и т.д. Кроме того, приходится различать такие оттенки модальности, как: эксперт знает, что...; эксперт думает, что...; эксперт хочет, чтобы...; эксперт считает, что...

Возможная противоречивость эмпирического знания – естественное следствие из основных законов диалектики, и противоречия эти не всегда должны разрешаться в поле знаний, а напротив, именно противоречия служат чаще всего отправной точкой в рассуждениях экспертов.

Неполнота знания связана с невозможностью полного описания предметной области. Задача аналитика эту неполноту ограничить определенными рамками "полноты", т.е. сузить границы предметной области, либо ввести ряд ограничений и допущений, упрощающих проблему.

Системность. Системно-структурный подход к познанию (восходящий еще к Гегелю) ориентирует аналитика на рассмотрение любой предметной области с позиций закономерностей системного целого и взаимодействия составляющих его частей. Современный структурализм исходит из многоуровневой иерархической организации любого объекта, т.е. все процессы и явления можно рассматривать как множество более мелких подмножеств (признаков, деталей) и, наоборот, любые объекты можно (и нужно) рассматривать как элементы более высоких классов обобщений.

Объективность. Процесс познания глубоко субъективен, т.е. он существенно зависит от особенностей самого познающего субъекта. Субъективность начинается уже с описания фактов и увеличивается по мере углубления идеализации объектов.

Следовательно, более корректно говорить о глубине понимания, чем об объективности знания. Понимание - это сотворчество, процесс истолкования объекта с точки зрения субъекта. Это сложный и неоднозначный процесс, совершающийся в глубинах человеческого сознания и требующий мобилизации всех интеллектуальных и эмоциональных способностей человека. Все свои усилия аналитик должен сосредоточить на понимании проблемы. В психологии подтверждается факт, что люди, быстро и успешно решающие интеллектуальные задачи, большую часть времени тратят на понимание ее, в то время как быстро приступающие к поискам решения, чаще всего не могут его найти.

Историзм. Этот критерий связан с развитием. Познание настоящего – есть познание породившего его прошлого. И хотя большинство экспертных систем дают "горизонтальный" срез знаний – без учета времени (в статике), инженер по знаниям должен всегда рассматривать процессы с учетом временных изменений – как связь с прошлым, так и связь с будущим. Например, структура поля знаний и база знаний должны допускать подстройку и коррекцию как в период разработки, так и во время эксплуатации экспертной системы.

Структура познания

Рассмотрев основные критерии научности познания, попытаемся теперь описать его структуру. Методологическая структура познания может быть представлена как последовательность этапов (рис. 17.9) , которые рассмотрим с позиций инженера по знаниям.

Описание и обобщение фактов. Это как бы "сухой остаток" бесед аналитика с экспертом. Тщательность и полнота ведения протоколов во время процесса извлечения и пунктуальная "домашняя работа" над ними – вот залог продуктивного первого этапа познания.

На практике оказывается трудным придерживаться принципов объективности и системности, описанных выше. Чаще всего на этом этапе факты просто собирают и как бы бросают в "общий мешок"; опытный инженер по знаниям часто сразу пытается найти "полочку" или "ящичек" для каждого факта, тем самым подспудно готовясь к этапу концептуализации.

Рис. 17.9. Структура познания

Установление связей и закономерностей. В голове эксперта связи установлены, хотя часто и неявно; задача инженера – выявить каркас умозаключений эксперта. Реконструируя рассуждения эксперта, инженер по знаниям может опираться на две наиболее популярные теории мышления – логическую и ассоциативную. При этом, если логическая теория благодаря горячим поклонникам в лице математиков широко цитируется и всячески эксплуатируется в работах по искусственному интеллекту, то вторая, ассоциативная, менее известна и популярна, хотя имеет также древние корни. Красота и стройность логической теории не должны заслонять печального факта, что человек редко мыслит в категориях математической логики .

Ассоциативная теория представляет мышление как цепочку идей, связанных общими понятиями. Основными операциями такого мышления являются ассоциации, приобретенные на основе различных связей; припоминание прошлого опыта; пробы и ошибки со случайными успехами; привычные ("автоматические") реакции и пр.

Построение идеализированной модели. Дня построения модели, отражающей представление субъекта о предметной области, необходим специализированный язык, с помощью которого можно описывать и конструировать те идеализированные модели мира, которые возникают в процессе мышления. Язык этот создается постепенно с помощью категориального аппарата, принятого в соответствующей предметной области, а также формально-знаковых средств математики и логики. Для эмпирических предметных областей такой язык пока не разработан, и поле знаний, которое полуформализованным способом опишет аналитик, может быть первым шагом к созданию такого языка.

Объяснение и предсказание моделей. Этот завершающий этап структуры познания является одновременно и частичным критерием истинности полученного знания. Если выявленная система знаний эксперта полна и объективна, то на ее основании можно делать прогнозы и объяснять любые явления из данной предметной области. Обычно базы знаний экспертных систем страдают фрагментарностью и модульностью (несвязанностью) компонентов. Все это не позволяет создавать действительно интеллектуальные системы, которые, равняясь на человека, могли бы предсказывать новые закономерности и объяснять случаи, не указанные в явном виде в базе. Исключением тут являются системы формирования знаний, которые ориентированы на генерадию новых знаний и "предсказание".

В заключение перечислим наиболее часто встречающиеся неудачи, связанные с гносеологическими проблемами инженерии знаний (частично из ):

обрывочность, фрагментарность знаний (из-за нарушений принципа системности или ошибок в выборе фокуса внимания);

противоречивость знаний (из-за естественной противоречивости природы и общества, неполноты извлеченных знаний, некомпетентности эксперта);

ошибочная классификация (из-за неправильного определения числа классов или неточного описания класса);

ошибочный уровень обобщения (из-за чрезмерной детализации или обобщенности классов объектов).

Инженерия знаний представляет собой совокупность моделей, методов и технических приемов, нацеленных на создание систем, которые предназначены для решения проблем с использованием знаний. Знания – это информация с ограниченной семантикой, однако с позиции прикладных аспектов необходимо, чтобы знания имели такую форму, которой была бы в определенной степени свойственна свобода достижения поставленной цели. В какой именно степени допустима эта свобода, или каким условиям должны отвечать знания, включая и их описательные возможности, зависит от области их приложения. В сфере технического применения и в экономике используется самая разнообразная среда представления, и помимо языкового описания она включает рисунки, математические формулы и т.п.

Хотя языковое представление и ограничено сравнительно простыми формализмами, оно не всегда удобно для технической и экономической областей. Это связано с их специфическим характером, т.к. в них все определяется фактами и объективной реальностью.

В дальнейшем изложении языковое описание, требуемое в прикладных областях информации (включая язык в широком его понимании и графику), будет называться языком представления знаний. Для использования подобной информации в виде знаний требуются интеллектуальные функции, превосходящие пока возможности современных компьютеров. Представление знаний, их обработка и использование, рассматриваемое применительно к конкретной прикладной области, является предметом инженерии знаний.

Инженерия знаний заняла свое место как технология применения знаний, когда вышла из недр ИИ и продолжала интенсивно развиваться все последние года.

Исследования по ИИ позволили утвердиться во мнении, что подлинно необходимыми для решения проблем являются знания экспертов. То есть, если создать систему, способную запоминать и использовать знания экспертов, то она найдет применение в практической деятельности.

И когда исследователи по ИИ действительно создали подобного ряда системы в конце 60-х и начале 70-х годов прошлого века, все эти воззрения были подтверждены.

Это системы DENDRAL, а позднее MYCIN, созданные под руководством Э. Фейгунбаума в Стэнфордском университете США, Поскольку эти системы накапливают в памяти компьютера знания экспертов и используют эти знания для решения проблем, извлекая их при необходимости из памяти, то они получили название экспертных, а профессор Э. Фейгенбаум, являющийся одним из создателей экспертных систем (ЭС), выдвинул для данной области техники название «инженерия знаний».

Фактически инженерия знаний – это методология ЭС, которая охватывает методы добычи, анализа и выражения в правилах знаний экспертов. Развитие ЭС создало инженерию знаний – процесс построения интеллектуальных систем.

Инженерия знаний тесно связана со всем процессом разработки интеллектуальных информационных систем в целом и ЭС в частности – от возникновения замысла до его реализации и совершенствования.

Главными элементами инженерии знаний являются использование операций типа обобщение, генерация гипотез для индуктивных выводов, подготовка новых программ самими компьютерными программами и т.д.

Слово engineering в английском означает искусная обработка предметов, изобретение или создание чего-либо. Следовательно, работу по оснащению программ специальными экспертными знаниями из проблемной области, выполняемую человеком, либо компьютером (программой), также можно назвать инженерией знаний.

1.2. Развитие исследований в области искусственного интеллекта.

Искусственный интеллект как наука был основан тремя поколениями исследователей.

В таблице 9.1 представлены ключевые события в истории ИИ и инженерии знаний, начиная с первой работы Маккалока и Питса в 1943 г. и до современных тенденций в комбинированных усилиях экспертных систем, нечеткой логики и нейронных вычислений в современных системах, основанных на знаниях, способных осуществлять вычисления при помощи слов.

Таблица 9.1 - Краткий перечень главных событий в истории ИИ и инженерии знаний.

Таким образом,исторически разработки в области ИИ велись в двух основных направлениях:

Первое направление связано с попытками разработки интеллектуальных машин путем моделирования их биологического прототипа - человеческого мозга. Сейчас это направление возрождается на основе развития современных аппаратных и программных средств (микрочипы на основе нечеткой логики, распределенные многопроцессорные системы, многоагентные системы, мягкие вычисления, генетические алгоритмы и нейронные сети и т.д.).

Второе направление связано с разработками методов, приемов, специализированных устройств и программ для компьютеров, обеспечивающих решение сложных математических и логических задач, позволяющих автоматизировать отдельные интеллектуальные действия человека (системы, основанные на знаниях, экспертные системы, прикладные интеллектуальные системы).

Эти два направления как бы определяют программу минимум и программу максимум, между которыми и лежит область сегодняшних исследований и разработок систем ИИ (рис.9.4). Работы по разработке программного и аппаратного обеспечения ИИ выделены в отдельную область.

Рис.9.4 - Основные направления исследований в области ИИ.

Для нас представляет интерес прежде всего второе направление: прикладные интеллектуальные системы и ЭС в таких предметных областях, как производство, управление процессами, управление маркетингом, финансовый менеджмент, банковская сфера, фондовый рынок.

1.3. Теория и практика искусственного интеллекта.

В процессе развития устройств и систем, которые проявляют интеллектуальные характеристики, вовлекаются различные науки и технологии, такие как лингвистика, психология, философия, техническое и программное обеспечение компьютеров, механика, гидравлика и оптика.

Пересечение интересов психологии и ИИ сосредоточено в областях когнитологии и психолингвистики. Философия и ИИ сотрудничают в областях логики, философии языка и философии разума. Взаимные пересечения между инженерией и ИИ включают обработку изображений, распознавание образов и роботику.

Позже свой вклад внесли менеджмент и теория организации (такие как принятие и реализация решений), химия, физика, статистика, математика, теория управления, эвристическое программирование, информационные системы менеджмента.

ИИ является наукой и технологией, а не коммерческой сферой. Это совокупность понятий и идей, которые предназначены для исследований. Однако, ИИ обеспечивает научные основы для нескольких развивающихся коммерческих технологий. Главными прикладными технологиями ИИ экспертные системы, интеллектуальные системы поддержки решений, обработка естественного языка, понимание речи, нечеткая логика, робототехника и сенсорные системы, компьютерное зрение и распознавание образов. На рис.9.5 представлены главные дисциплины и приложения ИИ.

Рис.9.5 - Дисциплины, на которых базируется ИИ и его приложения.

Области применения существующих на сегодняшний день систем ИИ охватывает медицинскую диагностику, интерпретацию геологических данных, научные исследования в химии и биологии, военное дело, производство, финансы и другие сферы экономики. Однако, несмотря на значительные успехи в области ИИ, пока еще существует определенный разрыв между техническими разработками, программными средствами ИИ и возможностями их более широко практического применения в частности, в экономике.

Наиболее показательным сектором, аккумулирующим различные проблемные направления экономической области, является управление промышленным предприятием. На его примере особенно хорошо видны преимущества использования систем ИИ для решения как различных предметных задач, так и для управления интегрированной системой предприятия в целом.

Существует множество доводов в пользу того, что системы искусственного интеллекта могут и должны стать важнейшей составной частью в технологии современных производств. Рассмотрим основные из них.

Главная проблема, стоящая перед предприятием (в смысле управления), - это проблема преодоления сложности. Как известно, сложности управления возникают тогда, когда приходится делать выбор из множества возможных решений. Это может быть инженерный выбор решения (как проектировать данное изделие), выбор расписания (как это изделие производить) и т.д.

Данная проблема обостряется в случае гибких производственных систем. Добавление гибкости приводит к увеличению числа альтернатив и, следовательно, возможных вариантов производства изделий. Уже сегодня составление расписания этапов производства изделий на «жестком» программном обеспечении представляет большие трудности. Усложнение самих изделий также ведет к усложнению проектирования.

Управление производством требует обработки большого объема информации. Проблема получения информации с объектов, функционирующих в реальном масштабе времени, в настоящее время решена. Но это породило другую проблему: как уменьшить долю информации до того уровня, который действительно необходим для принятия решения индивидуумом? В то же время следует отметить, что потеря информации, поступающей от объектов, работающих в реальном масштабе времени, может существенно сказаться на конечном результате.

Нехватка времени на принятие решения - еще одна проблема, которая проявляется по мере усложнения производства. Не менее важна и проблема координации. Известно, что проектирование неразрывно связано с производством, распределением и вспомогательными областями. Если проектирование не оптимально по отношению к стадиям производства, складирования, распределения или вспомогательному производству, то это может увеличить цену производства и снизить качество изделий.

И, наконец, очень важный фактор - необходимость сохранения и распределения знаний отдельных опытных экспертов, полученных, ими в процессе многолетней работы и большого практического опыта. Проблема извлечения знаний и их распределения - сегодня одна из главных проблем производственных организаций.

Таким образом, происходит интеллектуализация информационных систем управления и трансформация их в интеллектуальные СПР, основной разновидностью которых являются ЭС. Это наиболее значимые и важные для экономики и бизнеса прикладные технологии ИИ.

1.4. Интеллектуальные информационные системы поддержки решений.

Опыт эксплуатации информационных систем, в организационных и экономических системах показал, что наиболее важное значение должен иметь в этих системах и в контуре управления – человек (управленец; лицо, принимающее решение – ЛПР).

Не следует забывать, что управление в экономических и организационно – технических системах является сложным творческим процессом, нуждающимся в различных формах обеспечения интеллектуальной деятельности. Преуменьшение значения творческого элемента (опыта, интуиции) и, наоборот, преувеличение возможностей формализации ряда управленческих задач, неизбежно ведет к тому, что реальные результаты далеко не полностью оправдывают ожидания, которые связывались и связываются с компьютеризацией управления и принятия решений.

Видимо, здесь кроется причина недостаточно эффективного использования в ИС и системах поддержки решений методов оптимизации. Говоря о взаимодействии пользователя с оптимизационными моделями априорно подразумевают адекватность этих моделей реальному объекту. Однако, сложность, существенная нелинейность, слабая структурированность задач, неясность предпочтений, нечеткость исходной информации не позволяют в большинстве случаев разработчикам создавать адекватные модели объектов. "Ключом" в этом направлении должны стать и уже активно становятся методы и модели ИИ, в частности прикладные, системы, базирующиеся на знаниях (или интеллектуальные системы).

Большинствоимеющихся объектов управления относятся к слабоструктурированным или плохо определяемым объектам, которые обладают рядом неожиданных для традиционного управления свойств, таких, как уникальность, отсутствие формализуемой цели существования, отсутствие оптимальности, высокая динамичность, неполнота описания объекта, и, наконец, индивидуальность поведения лица принимающего решения в процессе принятия решений.

Практика показала, что трудности, практически непреодолимые для "управленца" -компьютера оказываются под силу управленцу-человеку. Квалифицированный эксперт после определенного времени работы по управлению уникальным объектом справляется и с неполнотой описания объекта, и с нечеткостью исходной информации, и с отсутствием формализуемых целей (разумеется, имеется в виду управление основными управляющими параметра мну.

Следовательно, в процессе практической деятельности по управлению объектом ЛПР приобретает некоторый инструмент, который помогает ему в решении задач управления плохо определенными объектами. Этот инструмент есть не что иное, как знание. Таким образом, возникла идея необходимости автоматизации интеллектуальной деятельности человека.

Основное назначение информационных систем в экономике – это своевременное представление необходимой информации ЛПР для принятия им адекватных и эффективных решений при управлении процессами, ресурсами, финансовыми транзакциями, персоналом или организацией в целом. Однако в процессе развития информационных технологий, исследования операций и технологий моделирования, а также с возрастанием потребителей информационно – аналитической поддержки самих ЛПР, все больше проявлялась потребность в системах, не только представляющих информацию, но и выполняющих некоторый ее предварительный анализ, способных давать некоторые советы и рекомендации, осуществлять прогнозирование развитие ситуаций, отбирать наиболее перспективные альтернативы решений, т.е. поддерживать решения ЛПР, взяв на себя значительную часть рутинных операций, а также функции предварительного анализа и оценок.

Информационная система поддержки решений связывает интеллектуальные ресурсы управленца со способностями и возможностями компьютера для улучшения качества решений. Эти системы предназначены для менеджеров, принимающих управленческие решения в условиях полуструктурированных и слабо определенных задач.

Таким образом, дальнейшее развитие ИСПР привело к созданию интеллектуальной информационной СПР.

Интеллектуальная ИСПР – это компьютерная система, состоящая из 5 основных взаимодействующих компонентов: языковой подсистемы (механизм обеспечения связи между пользователем и другими компонентами ИСПР), информационной подсистемы (хранилище данных и средств их обработки), подсистемы управления знаниями (хранилище знаний о проблемной области, таких как процедуры, эвристики и правила, и средства обработки знаний), подсистемы управления моделями и подсистемы обработки и решения задач (связующее звено между другими подсистемами).

Подсистема обработки и решения задач распределена и функционально встроена в другие подсистемы, реализуя свои отдельные специфические функции в их рамках. Эта подсистема обладает основными способностями по манипуляции и обработке задач для принятия решений.

На рис.9.6 представлен вариант структуры интеллектуальной ИСПР.

Рис.9.6 - Схематическое представление интеллектуальной СПР.

Информационная подсистема состоит из БД, системы управления БД, средств организации запросов, справочника данных, внешних источников данных.

Подсистема управления моделями состоит из базы моделей, системы управления моделями, языков моделирования, справочника моделей и процессора, который осуществляет реализации на модели, интегрирует модели и осуществляет руководство процессом моделирования.

База моделей содержит обычные и специальные статические, финансовые, прогнозирующие, управленческие и другие количественные модели, которые обеспечивают аналитические способности ИСПР. Способность обращаться к моделям, реализовывать их прогоны, вносить изменения, комбинировать и проверять модели являются ключевой способностью ИСПР, которая отличает их от обычных информационных систем.

Модельный процессор обычно реализует следующие действия:

Исполнение модели, т.е. процесс управления текущим прогоном или реализацией модели;

Интеграция модели, т.е. совмещение операций нескольких моделей, когда это необходимо;

Подтверждение и интерпретация инструкций моделирования, поступающих от диалогового компонента системы и проведение их в систему управления моделями.

Пользовательский интерфейс реализует все аспекты коммуникации между пользователем и ИСПР. Он включает не только техническое и программное обеспечение, но также факторы, которые способствуют облегчению использования и доступности человеко-машинных взаимодействий.

Модели в базе моделей могут подразделяться на стратегические, тактические, операционные и составные стандартные блоки моделей.

Функциями системы управления моделями являются создание моделей с использованием стандартных модельных модулей, генерация новых стандартных модулей и отчетов, дополнение и модернизация моделей, их изменения и манипулирование с данными модели.

Подсистема управления знаниями . Многие неструктурированные и слабоструктурированные задачи являются такими сложными, что они требуют для своего решения экспертизы, дополнительно к обычным способностям ИСПР.

Такая экспертиза может быть обеспечена ЭС или другой интеллектуальной системой.

Поэтому большинство первых ИСПР оснащены системной компонентой, называемой управление знаниями. Такая компонента может обеспечить требуемую экспертизу для решения некоторых видов задач и обеспечивать действие других составных частей ИСПР.

Возможны различные способы интеграции интеллектуальных систем, основанных на знаниях, с математическим моделированием.

Например, часто решения, основанные на знаниях, помогают поддерживать шаги в процессе получения решения без математической поддержки; интеллектуальные системы моделирования решений могут помочь пользователям строить, использовать и управлять библиотекой или базой моделей; аналитические ЭС принятия решений могут интегрировать теоретически строгие методы неопределенности в базу знаний ЭС.

Компонента знаний состоит из одной или нескольких интеллектуальных программных составляющих. Как СУБД и система управления моделями, программное обеспечение управления знаниями обеспечивает требуемое исполнение и интеграцию в интеллектуальных системах.

Информационные СПР, которые включают такую составляющую, называются интеллектуальными информационными СПР, интеллектуальными СПР, экспертными СПР, экспертными системами или СПР, базирующимися на знаниях.

Необходимость использования интеллектуальных систем .

Существует множество доводов в пользу того, интеллектуальные системы могут и должны стать важнейшей составной частью в системах принятия и поддержки решений, при управлении сложными объектами в технологии современных производств и решении широкого спектра экономических задач.

Если в качестве примера объекта взять предприятие, то здесь при управлении возникают такие проблемы:

Преодоление сложности (сложности управления возникают тогда, когда приходится делать выбор из множества возможных решений);

Управление предприятием требует организации больших объемов информации;

Как уменьшить информациюдо того уровня, который необходим для принятия решения (потеря информации, поступающей от объектов, работающих в реальном режиме времени, может существенно сказаться на результате);

Нехватка времени на принятие решения (проявляется по мере усложнения производства);

Проблема координации (решения необходимо координировать с другими звеньями процесса или объекта);

Необходимостьсохранения и распространения знаний очень опытных экспертов, полученных ими в процессе многолетней работы и большого практического опыта. Проблема извлечения знаний и их распределения - сегодня одна из главных проблем.

В процессе своей управленческой (а вообще говоря, любой) деятельности человек получает и осознает огромное количество информации. Однако ограниченные возможности человеческого мозга заставляют его осуществлять вербальное перекодирование исходной информации в сгустки насыщенной информации, используя при этом уникальные возможности человеческого языка. Едва ли не все рассуждения человека по своей природе являются приближенными.При этом, используя простые эвристические правила вывода, человек легко справляется с нечеткими рассуждениями.

Специалисты в области ИИ всегда старались разработать программы для компьютеров, которые могли бы в некотором смысле "думать", т.е. решать задачи таким способом, который мы бы сочли разумным, если бы его применил человек.

В процессе исследований и 20-летних поисков они пришли к выводу, что эффективность программы при решении задач зависит от знаний, которыми она обладает, а не только от формализмов и схем вывода, которые она использует. То есть, чтобы сделать программу интеллектуальной, ее нужно снабдить множеством высококачественных специальных знаний о некоторой предметной области.

Понимание этого факта привело к созданию специальных систем, каждая из которых является экспериментом в некоторой узкой предметной области.

Эти программы получили название экспертных систем .

Инженерия знаний

После проектирования базы знаний и разработки соответствующего программного обеспечения либо выбора удовлетворяющего требования готового решения необходимо сформировать базу знаний, наполнив ее знаниями о предметной области, и возможно необходимыми фактами. Этап формирования базы знаний интеллектуальной системы является критическим для функционирования всей системы в целом, так как если реализация влияет на возможные границы способностей системы, то знания системы определяют ее возможности в решении задач предметной области.

Этот этап разработки ИИС называют этапом приобретения знаний. Область деятельности, изучающая проблемы формирования и наполнения баз знаний, получила название инженерия знаний.

Инженерия знания - достаточно молодое направление искусственного интеллекта, появившееся тогда, когда практические разработчики столкнулись с весьма нетривиальными проблемами трудности «добычи» и формализации знаний. В первых книгах по ИИ эти факты обычно только постулировались, в дальнейшем начались серьезные исследования по выявлению оптимальных стратегий выявления знаний. Исследования привели к возникновению дисциплины инженерии знаний, и появлению новой специальности - инженера по знаниям, или специалиста, владеющего теоретическими знаниями и практическими приемами построения интеллектуальных систем, а главное, обученного способам формирования баз знаний интеллектуальных систем.

Предметные знания интеллектуальной системы могут быть взяты из многих источников, ноо главный источник знаний современных ИИС - это специалист-эксперт в предметной области. Инженер знаний обычно получает знания, непосредственно взаимодействуя с экспертом. Этот процесс состоит из продолжительной серии напряженных, систематических интервью, обычно продолжающихся в течение многих месяцев. Во время бесед инженер знаний дает эксперту для решения задачи, близкие к реальным и того же типа, на решение которых ориентируется создаваемая экспертная система. Инженер знаний должен работать с экспертом, наблюдая, как он решает конкретные задачи. Редко оказывается эффективным подход, при котором эксперту напрямую задаются вопросы о его правилах или методах решения конкретного класса задач в его области компетентности. Эксперты обычно испытывают большие трудности при формулировании таких правил.

Представляется, что «эксперты» имеют тенденцию формулировать свои заключения и то, как они пришли к ним, в общих выражениях, которые слишком широки и расплывчаты для эффективного анализа на ЭВМ. Предпочтительнее, чтобы ЭВМ работала на более конкретном уровне, имея дело с четко определенными порциями исходной информации, которые могут быть встроены в более сложные суждения. Но эксперт редко работает на таком конкретном уровне. Он быстро делает сложные выводы, не утруждая себя тщательным анализом и формулированием каждого шага своего процесса рассуждения. Порции исходных знаний являются неявными допущениями, и они компонуются друг с другом так быстро, что эксперту трудно описать этот процесс. Когда он анализирует проблему, он не может легко описать каждый шаг и он может даже не иметь представления о тех отдельных шагах, которые были сделаны для нахождения решения. Он может приписать интуиции или назвать предчувствием то, что оказывается результатом очень сложного логического процесса, основанного на огромном количестве удерживаемых в его памяти данных и богатой практике. В последующем, объясняя свое заключение или предчувствие, он будет повторять только основные шаги, часто опуская большинство мелких шагов, которые могли показаться ему очевидными в то время. Знание о том, что считать основным и относящимся к делу и не требующим дальнейшей переоценки - вот что делает специалиста «экспертом». Этот аспект природы эксперта несколько необычен. На практике он называется парадоксом экспертизы. В контексте разработки интеллектуальных систем мы будем называть его парадоксом инженерии знаний:

Чем более компетентными становятся эксперты, тем менее способны они описать те знания, которые они используют для решения задач!

Хуже того, исследования показали, что когда эксперты пытаются объяснить, как они пришли к заключению, они часто выстраивают правдоподобные линии рассуждения, которые, однако, мало похожи на их действительное поведение при решении задач. Эта особенность имеет два важных следствия. Вот первое из них:

эксперты нуждаются в посторонней помощи, направленной на то, чтобы прояснить и сделать явным их способ мышления и решения задач. Высказанное можно сформулировать в виде следующего эмпирического правила - не будьте своим собственным экспертом!

Второе эвристическое правило, обращенное к инженеру знаний:

Не верьте всему, что говорят эксперты!

Опытные инженеры знаний развивают рабочие гипотезы, основанные на том, что говорят эксперты, и проверяют эти гипотезы на правильность и непротиворечивость, предлагая экспертам решать новые проблемы, требующие предполагаемых (согласно гипотезе) знаний. Инженер знаний считает, что он или она получили законное экспертное правило не потому, что эксперт ручается за точность правила, а потому, что эксперт демонстрирует применение этого правила при решении задачи.

Иногда поведение экспертов выглядит скорее интуитивным, чем рассудочным. Дело в том, что значительный объем знаний является важнейшей предпосылкой мастерства эксперта. Однако знания эксперта - не просто неупорядоченный свод фактов. Большое число образцов-шаблонов ситуаций служат указателями, помогающими эксперту в долю секунды обратиться к нужным частям его запасов знаний. Эта способность использовать шаблоны для управления процессом интерпретации и решения, возможно, и составляет значительную часть того, что мы называем физической интуицией.

Более того, эксперт может применять совершенно разные методы работы и методики в разных нестандартных ситуациях, и сознательно выделить критерии использования различных методик необычайно трудно.

Терминология инженерии знаний

Поле знаний - это условное неформальное описание основных понятий и взаимосвязей между понятиями предметной области, выявленных из системы знаний эксперта, в виде графа, диаграммы, таблицы или текста .

Поле знаний, как первый шаг к формализации, представляет модель знаний о предметной области, в том виде, в каком ее сумел выразить эксперт на некотором «своем» языке. Проблемы адекватного формирования языка для описания предметной области мы в данном курсе рассматривать не будем. Хорошим источником специальной информации по этой теме служит .

Поле знаний служит ключевым средством для последующего построения модели предметной области в базе знаний.

Для названия процесса получения знаний (вида выбираемой при этом стратегии) в литературе получило распространение несколько терминов: приобретение, добыча, извлечение, получение, выявление, формирование знаний. В англоязычной специальной литературе в основном используются два: acquisition (приобретение) и elicitation (выявление, извлечение, установление).

Термин «приобретение» трактуется либо очень широко - тогда он включает весь процесс передачи знаний от эксперта к базе знаний ЭС, либо уже как способ автоматизированного построения базы знаний посредством диалога эксперта и специальной программы (при этом структура поля знаний заранее закладывается в программу). В обоих случаях термин «приобретение» не касается самого таинства экстрагирования структуры знаний из потока информации о предметной области. Этот процесс описывается понятием «извлечение».

Извлечение знаний (knowledge elicitation) - это процедура взаимодействия эксперта с источником знаний, в результате которой становятся явными процесс рассуждений специалистов при принятии решения и структура их представлений о предметной области.

Приобретение знаний (knowledge acquisition) - процесс наполнения базы знаний экспертом с использованием специализированных программных средств (прямое взаимодействие ИИС с экспертом).

Термин формирование знаний традиционно закрепился за чрезвычайно перспективной и активно развивающейся областью инженерии знаний, которая занимается разработкой моделей, методов и алгоритмов обучения. Она включает индуктивные модели формирования знаний и автоматического порождения гипотез на основе обучающих выборок, обучение по аналогии и другие методы. Эти модели позволяют выявить причинно-следственные эмпирические зависимости в базах данных с неполной информацией, содержащих структурированные числовые и символьные объекты (часто в условиях неполноты информации).

Формирование знаний (machine learning) - процесс анализа данных и выявление скрытых закономерностей с использованием специального математического аппарата и программных средств.

Методы получения знаний

Инженерия знаний предлагает определенные методы (приемы, способы),работы с экспертами.

Классификация методов работы с экспертами

Под коммуникативными методами понимают все виды контактов инженера по знаниям с живым источником знаний - экспертом. Среди этих методов выделяют две большие группы: активные и пассивные.

Пассивные методы подразумевают, что ведущая роль в процедуре извлечения знаний принадлежит эксперту. При этом инженер по знаниям главным образом протоколирует рассуждения и действия эксперта.

В активных методах инициатива полностью в руках инженера по знаниям. Он ведет с экспертом беседу, предлагает различные «Игры», организует «круглый стол» и т. д.

Пассивные методы на первый взгляд просты. Вместе с тем, они требуют от инженера по знаниям умения анализировать «поток сознания» эксперта и выделять в нем ценные фрагменты знания.

Активные методы разделяют на две группы в зависимости от числа экспертов, участвующих в процедуре извлечения знаний - В групповых методах большое значение имеет дискуссия между экспертами, в которой нередко выявляются нетривиальные аспекты знаний. В то же время, ведущую роль на сегодняшний день играют индивидуальные методы. В значительной степени это связано с деликатностью процедуры «отъема знаний».

Рис. 1.31. Классификация методов работы с экспертами

Пассивные методы

Наблюдения

Метод наблюдения является единственным «чистым» методом, где инженер по знаниям не вмешивается в процесс работы эксперта и не навязывает ему какие-либо собственные представления. Выделяют две разновидности наблюдений:

· Наблюдение за реальным процессом.

· Наблюдение за имитацией процесса.

Сначала обычно применяют первую разновидность и наблюдают за реальным процессом на рабочем месте эксперта. Это помогает глубже понять предметную область и отметить все внешние особенности процедуры принятия решений, необходимые для проектирования интерфейса пользователя.

На втором этапе эксперт имитирует процесс. В таком режиме он менее напряжен и работает на «два фронта» - ведет профессиональную деятельность и одновременно демонстрирует ее.

Сеансы наблюдений предъявляют к инженеру по знаниям следующие требования:

· Владение техникой стенографии.

· Знакомство с методиками хронометрирования для четкого структурирования производственного процесса во времени.

· Развитые навыки «чтения по глазам», то есть наблюдательность к жестам, мимике и другим невербальным компонентам общения.

· Предварительное знакомство с предметной областью.

Протоколы наблюдений после проведения сеансов тщательно расшифровываются, а затем обсуждаются с экспертом.

Анализ протоколов «мыслей вслух»

При протоколировании «мыслей вслух» эксперта просят раскрыть всю цепочку рассуждений, объясняющих его действия и решения. При таком протоколировании считается важным зафиксировать не только весь «поток сознания» эксперта, но даже паузы и междометия в речи эксперта. Иногда данный метод называют «вербальными отчетами».

При протоколировании «мыслей вслух» эксперт может проявить себя максимально ярко. Он ничем не скован, ему никто не мешает, он как бы свободно парит в потоке собственных рассуждений и умозаключений, может блеснуть своей эрудицией и продемонстрировать глубину познаний. Для большого числа экспертов это самый приятный и лестный способ извлечения знаний.

Вместе с тем, как отмечалось выше, далеко не каждый специалист, даже из числа умеющих произносить впечатляющие монологи о своей работе, оказывается в состоянии формализовать и структурировать рассуждения. Однако существуют люди, склонные к рефлексии, способные к конструктивному изложению мыслей. Такие люди - находка для инженера по знаниям.

Лекторский дар встречается нечасто. Опытный лектор хорошо структурирует свои знания и ход рассуждений. Но бывает, некоторые люди обладают лекторским

даром, но не подозревают о его присутствии. В любом случае инженеру па знаниям стоит попробовать озадачить эксперта подготовкой лекции на интересующую тему. Если эксперт сумеет преодолеть специфический психологический барьер и войти в образ педагога, это может оказаться весьма эффективным для решения задачи извлечения знаний.

Хороший вопрос инженера по знаниям по ходу лекции имеет важное значение. Серьезные, глубокие и интересные вопросы, с одной стороны, стимулируют творческое воображение лектора, и с другой - повышают авторитет инженера по знаниям.

Метод извлечения знаний в форме лекций, как и все пассивные методы, применяют в начале многоэтапной процедуры извлечения знаний из памяти эксперта. Он способствует быстрому погружению инженера по знаниям в предметную область.

Активные индивидуальные методы

Анкетирование

Анкетирование является наиболее стандартизированным методом. Составление анкеты - достаточно тонкий и ответственный момент. Вот несколько рекомендаций:

· анкета не должна быть монотонной и однообразной, чтобы не вызывать скуку и усталость. Для этого вопросы должны варьироваться, тематика меняться. Кроме того, нередко в анкету вставляют специальные вопросы-шутки и игровые вопросы;

· анкета должна быть приспособлена к языку экспертов;

· следует учитывать, что вопросы влияют друг на друга. Поэтому последовательность вопросов должна быть хорошо продумана;

· анкета должна иметь «хорошие манеры». Ее нужно излагать ясным, понятным и предельно вежливым языком. Методическим мастерством составления анкеты можно овладеть только на практике.

Процедура анкетирования может проводиться двумя способами, В первом аналитик вслух задает вопросы и сам заполняет анкету по ответам эксперта. Во втором эксперт заполняет анкету Самостоятельно после предварительного инструктирования.

Выбор способа зависит от ряда условий (в частности от оформления анкеты, ее понятности, готовности эксперта). Вместе с тем, второй способ представляется предпочтительным, так как у эксперта появляется неограниченное время на обдумывание вопросов и снижается так называемый эффект присутствия.

Интервью

Перед проведением интервью неплохо спросить себя: «А умеем ли мы задавать вопросы?» Рассмотрим классификацию вопросов.

Рис.1.32. Классификация вопросов

Открытый вопрос обозначает тему или предмет, предоставляя эксперту свободу по форме и содержанию ответа.

При закрытом вопросе эксперту предлагается набор ответов, среди которых он должен сделать выбор.

Закрытые вопросы легче обрабатываются, но они в определенной мере «программируют» ответ эксперта и «закрывают» ход его рассуждений. Поэтому при составлении сценария интервью обычно чередуют открытые и закрытые вопросы и особенно тщательно продумывают «меню» и содержание закрытых вопросов.

Личный вопрос апеллирует к индивидуальному опыту эксперта. Личные вопросы обычно активизируют мышление эксперта, «играют» на его самолюбии, украшают интервью.

Безличный вопрос нацелен на выявление наиболее распространенных и общепринятых закономерностей предметной области.

При подготовке вопросов учитывают, что языковые возможности эксперта, как правило, ограничены. Кроме того, имеют в виду, что из-за замкнутости, скованности и робости отдельные эксперты не могут сразу высказать свое мнение и предоставить требуемые знания. Поэтому часто используют не прямые вопросы, которые непосредственно указывают на предмет или тему, а косвенные, опосредованно направляющие внимание на актуальную проблему. Иногда в интересах дела приходится задавать несколько косвенных вопросов вместо одного прямого.

Вербальные вопросы - это традиционные устные вопросы.

Вопросы с использованием наглядного материала разнообразят интервью и снижают утомляемость эксперта. В качестве наглядного материала используют фотографии, рисунки и карточки.

Разделение вопросов по функции на основные, зондирующие и контрольные связано с тем, что нередко эксперт по каким-то причинам уходит в сторону от вопроса и основные вопросы интервью оказываются непродуктивными. Тогда аналитик применяет зондирующие вопросы, концентрирующие внимание эксперта в нужном направлении. Контрольные вопросы используют для проверки достоверности и объективности полученной информации.

Нейтральные вопросы носят беспристрастный характер. В то же время, наводящие вопросы заставляют эксперта прислушаться или даже принять во внимание позицию интервьюера.

Кроме приведенных в классификации, полезно различать и включать в интервью следующие виды вопросов:

· контактные («ломающие лед» между аналитиком и экспертом); О буферные (для разграничения различных тем интервью);

· оживляющие память экспертов (для реконструкции отдельных случаев из практики);

· «провоцирующие» (для получения спонтанных, неподготовленных ответов).

Свободный диалог

При свободном диалоге инженера по знаниям с экспертом отсутствует какой-либо регламентированный план. Однако эта форма извлечения знаний требует самой серьезной предварительной подготовки.

Рис. 1.33. Схема подготовки к интервью и свободному диалогу

Квалифицированная подготовка к диалогу - подлинная драматургия. В ее сценарии предусматривают плавное развитие процедуры извлечения знаний от приятного впечатления в начале беседы к профессиональному контакту через пробуждение интереса и завоевание доверия эксперта.

Для обеспечения желания эксперта продолжать беседу обычно производят «поглаживания» типа: «Я Вас понимаю...», «...Это очень интересно» и т. п. При этом поведение аналитика должно быть искренним, ведь давно известно, что лучшая уловка - избегать всяких уловок и относиться к собеседнику с истинным уважением и настоящим интересом.

Существует каталог свойств идеального интервьюера: «Он должен выглядеть здоровым, спокойным, уверенным, внушать доверие, быть искренним, веселым, проявлять интерес к беседе, быть опрятно одетым, ухоженным».

Игры с экспертом

В играх с экспертом инженер по знаниям берет на себя какую-либо роль в моделируемой ситуации. Например, это может быть роль Ученика, который на глазах у эксперта (Учителя), поправляющего Ученика, выполняет работу на заданную тему. Такая игра - хороший способ разговорить застенчивого эксперта.

Другой пример - игра в Специалиста (инженер по знаниям) и Консультанта (эксперт). Эта игра дает иногда впечатляющие результаты. приведем пример из классической литературы. Эксперт выступал в роли врача, хорошо знающего больного, а консультант задавал вопросы и делал прогноз о целесообразности применения того или иного вида лечения. Такая игра позволила установить, что требуется всего 30 вопросов для успешного прогноза, в то время как первоначальный вариант вопросника, составленного медиками, содержал 170 вопросов.

Для выявления скрытых пластов знания применяется игра, в которой специалист делает прогнозы в профессиональных ситуациях и дает им обоснования. Затем по истечении определенного времени специалисту предъявляют его собственные обоснования и просят произвести по ним прогнозы. Как оказывается, такой простой прием нередко позволяет обнаружить пропущенные шаги в рассуждениях эксперта.

В игре «фокусировка на контексте» эксперт выполняет роль экспертной системы, а инженер по знаниям - роль пользователя. Моделируется ситуация консультации. Первые реакции эксперта концентрируются вокруг наиболее значимых понятий и самых важных аспектов проблемы.

В целом по играм с экспертом даются следующие основные советы инженеру по знаниям:

· Играйте смелее, придумывайте игры сами.

· Не навязывайте игру эксперту, если он не расположен.

· Не «давите» на эксперта, не забывайте цели игры.

· Не забывайте о времени и о том, что игра утомительна для эксперта.

· Играйте весело, нешаблонно.

Активные групповые методы

Активные групповые методы сами по себе не могут служить источником более или менее полного, знания. Они выступают как дополнительные и служат хорошим дополнением к индивидуальным методам извлечения знаний, активизирующим мышление и поведение экспертов.

«Круглый стол»

Метод круглого стола предполагает равноправное обсуждение интересующей проблемы несколькими экспертами. Задача дискуссии - коллективно, с разных точек зрения, под разными углами исследовать спорные проблемы предметной области. Для остроты на «круглый стол» приглашают представителей различных научных направлений и поколений. Число участников дискуссии обычно колеблется от трех до пяти-семи.

Перед началом дискуссии ведущему (инженеру по знаниям) необходимо убедиться, что все участники правильно понимают задачу. Затем нужно установить регламент и четко сформулировать тему.

По ходу дискуссии важно проследить, чтобы слишком эмоциональные и разговорчивые эксперты не подменяли тему и чтобы критика позиций друг друга была обоснованной. Определенные усилия ведущий должен приложить для уменьшения «эффекта фасада», когда у участников превалирует желание произвести впечатление на других и они говорят совсем не то, что сказали бы в нормальной обстановке.

«Мозговой штурм»

«Мозговой штурм» или «мозговая атака» - один из наиболее популярных методов раскрепощения и активизации человеческого мышления. Впервые этот метод был использован в 1939 году А. Осборном в США для генерации новых идей.

Основное положение штурма - отделение процедуры генерации идей в замкнутой группе специалистов от процесса их анализа и оценки. Обычная продолжительность штурма - порядка 40 минут. Количество участников - до 10 человек. Этим участникам предлагается высказать на заданную тему любые мысли, в том числе шутливые, фантастические и ошибочные. Критика запрещена. Регламент - до 2 минут на выступление.

Из опыта известно, что число высказанных идей Часто превышает 50. Наиболее существенный момент штурма - наступление пика (ажиотажа), когда идеи начинают буквально «фонтанировать». Последующий анализ, который проводит группа сторонних экспертов, как правило, показывает, что всего лишь 10-15 % идей разумны, но среди них встречаются весьма оригинальные.

Искусство инженера по знаниям, проводящего «мозговой штурм», заключается в способности задавать вопросы аудитории, «подогревая» аудиторию. Вопросы служат своеобразным «крючком», которым извлекаются идеи.

Ролевые игры в группе

В каждой групповой игре заранее составляется сценарий, распределяются роли, готовятся портреты-описания ролей и разрабатывается система оценивания игроков.

Известны различные способы проведения ролевых игр. В одних играх участники придумывают себе новые имена и выступают под ними. В других все игроки переходят на «ты». В третьих роли выбирают игроки, в четвертых для распределения ролей вытягивается жребий.

Обычно в игре, предназначенной для получения знания, принимают участие от трех до шести экспертов: В случае большего числа экспертов они разбиваются на группы, между которыми организуется состязание: чей диагноз окажется ближе к истинному, чей план рациональнее использует ресурсы, кто быстрее определит неисправность в техническом блоке и т. п.

Создание игровой обстановки требует фантазии и выдумки от инженера по знаниям. Главное, чтобы эксперты в игре максимально погрузилась в ситуацию, действительно «заиграли», раскрепостились и «раскрыли свои карты».

Требования и инженеру по знаниям

Завершая сжатое рассмотрение на самом деле обширной области инженерии знаний отметим ряд основных требований к инженеру по знаниям.

· Инженер по знаниям должен иметь хорошую теоретическую подготовку в области моделей представления знаний, с тем чтобы оптимально выбирать и спользовать возможности моделей представления знаний для решения посталенной задачи.

· Хотя это не было ранее сформулировано явно, но из изложения материала понятно, что инженер по знаниям должен обладать отличными коммуникационными навыками и иметь некоторые познания в области психологии общения с тем, чтобы продуктивно работать с экспертами.

· Инженер по знаниям должен обладать системным мышлением и владеть методами анализа предметной области, методами когнитивной психологии.

· Иметь комплексную общенаучную подготовку и свободно владеть методами научного исследования, формальными методами описания и документирования.

· Свободно ориентироваться в области информационных технологий.

Роль инженера по знаниям при разработке интеллектуальных информационных систем часто является ключевой для успеха проекта системы. Как правило инженерами по знаниям становятся специалисты – разработчики программного обеспечения и аналитики, обладающие необходимыми навыками и склонностями. Отметим в заключение, что роль инженера по знаниям во многом схожа с функциями аналитиков и специалистов по внедрению при разработке обычных информационных систем.

Стратегии поиска в СОЗ

Похожая информация.

Система - посредник, заключение договора на поставку.

Инженерия знаний - область информатики, в рамках которой проводятся исследования по представлению знаний в ЭВМ, поддержание их в актуальном состоянии и манипулировании ими.

Knowledge system - система основанная на знаниях.

СОЗ СБЗ СУБД ЭС ИС СИИ - система искусственного интеллекта.

Структура системы, основанной на знаниях.

БЗ механизм получения решения

ИНТЕРФЕЙС

БЗ - это модель, представляющая в ЭВМ знания, накопленные в определенной предметной области. Эти знания должны быть формализованы.
Знания формируются с помощью модели, а затем представляются с помощью определенного языка.

В БЗ обычно выделяются знания о конкретных объектах и правила. Эти правила исполняются как механизм получения решений, для того, чтобы из исходных фактов вывести новые.

Интерфейс обеспечивает ведение диалога на языке, близком пользователю.

Методы, основанные на использовании логических выводов, часто используется в инженерии знаний.

Понятие предметной области.

Объект – то что существует или воспринимается в качестве отдельной сущности.

Основные свойства: дискретность; различие.

При представлении знаний используется прагматический подход, т.е. выделяются те свойства объекта, которые важны для решения задач, которые будет решать создаваемая система. Поэтому система, основанная на знаниях, имеет дело с предметами, которые являются абстрактными объектами. Предмет выступает в роли носителя некоторых свойств объекта. Состояние предметной области может меняться со временем. В каждый момент времени состояние предметной области характеризуется множеством объектов и связями. Состояние предметной области характеризуется ситуацией.

Концептуальные средства описания предметной области.

Концептуальная модель отражает наиболее общие свойства. Для того, чтобы детализировать описание нужны языки. Характерными чертами концептуальных средств описания предметной области являются абстрактность и универсальность. Их можно использовать для описания любой предметной области.

Понятие класса объекта.

Понятие объекта – понятие множеств. Сходные между собой объекты объединяются в классы. В разные моменты времени одному и тому же классу могут соответствовать разные множества объектов.

К – класс объекта.

Кt – множество объектов класса К в момент времени t.

Группа (1999) = { ИА-1-99, ИА-1-98, … , ИА-1-94, ИБ-1-99,…}

Группа (1998) = { ИА-1-98, ИА-1-97, … , ИА-1-93, ИБ-1-98,…}

(t Кt = { … }

Преподавательская должность = { профессор, доцент, старший преподаватель, преподаватель, ассистент}

1 4 Геометрическая фигура, форма квадрат, цвет синий.

(К: А1 К1, А2К2, … , АnКn) имя атрибут название классов классов объектов атрибутная пара

Идентификация объектов может быть прямая и косвенная. В случае прямой используются имена объектов, порядковые номера объектов; косвенная основана на использовании свойств объектов.

Атрибут может быть компонентом. Под атрибутом понимается свойство, характеристика, название компонентов.

(Геометрическая фигура: форма Геометрическая форма цвет Цвет)

Пары имя атрибута и значение атрибута часто совпадают.

Пример ситуации:

(Лекция: лектор Фамилия_лектора, место №_аудитории, тема Название_темы, слушатель Код_группы, день День_недели, время Время_начала)

Ситуация – показана связь между «преподаватель» и «слушатель», остальные характеристики данной ситуации.

Роли участников ситуации:

Слушатель

Характеристики ситуации:

(К: А1К1,А2К2, … , АnКn) – представление знаний в виде некоторой структуры.

(дата, число, день_месяца)

(дата, месяц, название_месяца)

(дата, год, год)

(геометрическая_фигура, форма, геометрическая_форма)

(геометрическая_фигура, цвет, цвет)

Такому представлению знаний соответствует представление знаний в виде отдельных фактов.

(К: А1К1,А2К2, … , АnКn)

Представления знаний об объектах делятся на:

классы объекта (структура данных)

знания о конкретных объектах (о данных)

Классы объекта.

1. (К: А1К1,А2К2, … , АnКn)

Аi – имя атрибута

Кi – классы объекта, являются значением атрибута

К – имя класса

(преподаватели:

ФИО фамилия_с_инициалами,

Должность преподпвательская_должность)

(преподаватель, ФИО фамилия_с_инициалами, преподаватель, должность преподпвательская_должность)

3. К (К1,К2, … , Кn)

4. К (А1,А2, … , Аn)

(преподаватель (фамилия_с_инициалами, преподпвательская_должность), преподаватель (ФИО, должность))

Представление знаний для первой формы:

(К: А1К1,А2К2, … , АnКn) кi (Кi

Атрибутивное представление знаний:

(преподаватель: - представляет собой

ФИО Семенов - некоторую структуру

Должность доцент) - данных

Представление знаний для второй формы:

(К: АiКi) к (К, кi (Кi

Атрибутивное представление знаний в виде отдельных фактов:

(преподаватель1, ФИО, Семенов) - 1, 2 являются связками между

(преподаватель1, должность, доцент) - фактами

(преподаватель2, ФИО, Петров)

(преподаватель2, должность, ассистент)

Представление знаний для третьей формы:

К (К1,К2, … , Кn)

(преподаватель (Семенов, доцент) - позиционное представление знаний

Если имена атрибутов отсутствуют, а сами атрибуты записываются на определённых позициях, то – позиционноё представление знаний.

Представление знаний в виде «троек» - (объект, атрибут, значение).

Для представления неточных значений используются коэффициенты уверенности – (объект, атрибут, значение, коэффициент уверенности).

0 – соответствует неопределенности. отрицательное значение – степень уверенности в невозможности значения атрибута.

(пациент1, диагноз, гастрит, К740)

* (пациент, ФИО, Антонов, диагноз колит К760, гастрит К740)

Представление знаний о классе объекта называется минимальным, если при удалении одного из атрибутов приводит к тому, что оставшееся множество атрибутов перестает быть представлением данного класса объекта.

Аренда (объект_аренды, арендатор, арендодатель, срок_аренды, плата).

Если удалить «срок_аренды», получится купля-продажа, а если удалить
«срок_аренды» и «плата», то получиться подарок.

Представление знаний в реляционной базе данных.

Реляционная база данных – данные хранятся в позиционном формате.

Данные хранятся в виде таблицы, где название таблицы – имя класса.
Каждому классу соответствует таблица или файл БД. Имя класса - название соответствующей таблицы. Имена атрибутов – соответствующие поля таблицы
(столбец). Строки таблицы – записи БД. Записи соответствует запись в позиционном формате.
|А1 |А2 | . . .|Аn |
| | |. . | |
|К1 |К2 | . . .|Кn |
| | |. . | |

Преподаватели

Понятие атрибута в позиционной БД сохраняется.

Запись К (А1,А2, … , Аn) называется отношение между атрибутами. Такая терминология используется в реляционной БД. Идея данных в реляционной БД основана на понятие «ключ».

Ключ – набор атрибутов отношения, значение которых однозначно определяет запись в файле.

Квартира

| город |улица |дом |корпус|квартира|площадь |количество комнат|
|Москва |Тверская |2 |1 |47 |60 |2 |
|Москва |Тверская |2 |1 |54 |50 |1 |

В данном случае ключ будет состоять из нескольких полей.

Кi sup Кj является подклассом класс sup подкласс; подкласс sup класс.

Кi является подклассом Кj, если (t Ki t (Kj t

(Если в любой момент времени t класс Кi является подклассом Кj)

Npr – классификация сети.

Классификация сети представляется в виде иерархической структуры.

Студент sup учащийся.

Ki part of Kj - является частью Ki part Kj

Ki является частью Kj, если конкретный объект класса Ki является частью однозначно определенного объекта Kj.

Отношение принадлежности. k isa K - является элементом

Ki ius K - является составляющей

Означает, что объект класса К состоит из объектов класса К1, К2, … ,
Кn, причем объект класса К может включать несколько объектов класса Кi.

Лекция №4.

Свойства отношений.

Отношения частичного порядка обладают свойством транзитивности.

Ki sup Kj Kj sup Km

Ki part Kj Kj part Km

Если элемент является составляющей блока, а блок составлен…

Нет циклов в графе принадлежности.

K1 ins K2, K2 ins K3,…,Kn-1 ins Kj

Неверно, что Kn ins K1

Москва isa город

Город sup Населенный пункт

Москва isa Населенный пункт

Операции над классами объектов.

С помощью операций над классами объектов можно определить новый класс объектов

Ki множество блоков, к примеру, телевизоров

Материальные объекты делятся на три класса

Условие (Помещение (Оборудование = Материальный объект

Человек (Помещение = Человек (Оборудование = Помещение (
Оборудование =?

Размещение классов объекта

Человек (Фамилия, Имя, Отчество, Год_Рождения, пол)

Пол={мужской, женский}

Мужчина, женщина = Человекпол

K (K1, K2, K3, K4, K5)

KK5 – Разбиение класса по классу К5.

Объединение всех этих классов есть человек.

Мужчина?Женщина=Человек

Мужчина?Женщина=?

(Знание_иностранного языка

Знающий человек,

Предмет иностранный_язык)

В результате разбиения мы получаем классы людей, знающих иностранный язык.

Концептуальной схемой предметной области называется множество классов объектов, заданных на нем отношений и операциями.

Шаблонные описания состояния предметной области:

Занятия K проводит занятия по дисциплине в группе в на в.

Иванов И.И. проводит занятия по дисциплине ТОЭ в группе ИТ-1-98 в понедельник на 4 паре в Г-301.

(занятия: преподаватель Преподаватель дисциплина Название_дисциплины группа Код_группы день День_недели время Номер_пары место Аудитория)

Концептуальные модели предметной области – концептуальная схема вместе с множеством высказываний построенных по конечному набору шаблонов.

Диаграмма сущности и связи (ER – диаграмма)

Entety Relation Diagramm

Сущность

Атрибуты сущности и связи

На 1 кафедре работает N преподавателей. «*» – знак преподавателя – можно найти кафедру.

Связь глагол или дополнение

Атрибуты – прилагательное, числители, размеры, место действия

Расписание нагрузки

Логические системы (модели), на основе единственного примера поставки товара в магазин.

Логические модели представления знаний.

Описание предметной области на одном из логических языков программирования, основано на исчислении предикат.

Язык многократного исчисления предикатов 1-го порядка. Многократная логика 1-го порядка.

Для составления этого языка:

Понятие сорта соответствует понятию классов объектов.

Множество сортов S

На множестве задаются функциями. f-имя функции;

сорта аргументов;
В – сорт значения функции.
Z – сигнатура – это верхний уровень представления знаний в логических моделях.

Предикат -
Т={0;1}

ложь истина
-константа сорта В

Рассмотрим в качестве примеров обработку деталей на производстве
2-токарных;
1-фрезерный;

S={Деталь, Станок, Операция, Тип_детали, Тип_станка, Время }
1) дет: Операция Деталь; f A1 B
2) ст: Операция (Станок;
3) нач: Операция (Время
4) кон: Операция (Время
5) тип_дет: Деталь (Тип_детали
6) тип_ст: Станок (Тип_станка
7) 0: (Время

T: (Время
8) ст_вал:(Тип_детали вал_мест: (Тип_детали
9) фрез: (Тип_станка ток: (Тип_станка
10) фрез_торц:операция Т ток_обр: операция Т
11) +: Время*Время Время
12): Время*Время Т

Знания о конкретных объектах
(нижн. Уровень представления знаний) на языке многократного исчисления предикатов наз-ся структурой интегрированной сигнатурой
1) сигнатура
2) Структура интегр. Сигнатуры.
3) Для каждого имя сорта создаётся мн-во объектов этого сорта.
Деталь = {дет.1, дет.2, дет.3, дет.4}
Станок = {ст.1, ст.2, ст3}
Операция ={опер1,опер2, опер3, опер4, опер5, опер6, опер7, опер8}
Тип_детали = {ст_вал, вал_мест}
Тип_станка = {ток, фрез}
Время = {1,2,…,t}

Объединение всех множеств - универсум.
Каждой функции и предикатов из структуры в системе соответствует множество факторов.
1) дет.(опер.1)=дет1 дет.(опер.2)=дет1 дет.(опер.3)=дет2

…………………..
2) ст.(опер.1)= ст.3 ст.(опер.2)= ст.1 ст.(опер.3)= ст.3

…………………
3) нач.(опер.1)=0 нач.(опер.2)=5 нач.(опер.3)=5
…………………..
4) конц(опер.1)=5 конц(опер.2)=12 конц(опер.3)=0
…………………
5) тип_дет(дет.1)=ст_вал тип_дет(дет.2)=вал_мест тип_дет(дет.3)=ст_вал тип_дет(дет.4)=вал_мест
………………….
6) тип_ст. (ст.1)=ток тип_ст. (ст.2)=ток тип_ст. (ст.3)=фрез
………………….
10) фрез_торц(опер1) ток_обр (опер2) фрез_торц(опер3)
|операция|деталь |станок |начало |конец |фрез_торц|ток_обр|
|Опер1 |Дет.1 |Ст.3 |0 |5 |1 |0 |
|Опер2 |Дет.1 |Ст.1 |5 |12 |0 |1 |
|Опер3 |Дет.2 |Ст.3 |5 |10 |1 |0 |
|Опер4 |Дет.2 |Ст.2 |10 |17 |0 |1 |
|Опер5 |Дет.3 |Ст.3 |10 |16 |1 |0 |
|Опер6 |Дет.3 |Ст.1 |16 |26 |0 |1 |
|Опер7 |Дет.4 |Ст.3 |16 |22 |1 |0 |
|Опер8 |Дет.4 |Ст.2 |22 |32 |0 |1 |

|Станок|Тип_ст |
|Ст.1 |Ток. |
|Ст.2 |Ток. |
|Ст.3 |Фрез. |

3) Составляющая: Логические формулы

Правила построения формул: а)константа сорта А, есть терм сорта А б)переменная принимающая значение из сорта А, есть терм сорта А в)если сигнатура содержит функцию- построенные термы сортов соответственно, то
-есть терм сорта В г)если сигнатура содержит предикат-
,термы построенных сортов
, то - есть атом. д)если - термы одинакового сорта, то выражение , то есть атом е)Атом есть формула правильно построенная (ППФ)Переменная, входящая в атом, является свободной в этом атоме. ж)если построенная формула в которую свободно входит переменные х сорта А, то выражения:

Также является ППФ, переменная “x” является связанной (в новых файлах) з)если уже построенные формулы, то , также является ППФ
Примеры:
1) Представление Знания b=> опер2 выполнены на токарном станке тип_ст(ст(опер2))=nток
2) Опер2 выполн на ост.1 на ст.1 нач 5 конец 12
3)

Лекция 8 12.11.99.

Метод резолюций

Метод резолюций доказывает невыполнимость.
Для использования этого метода необходимо исходную формулу привести к ДНФ.
ДНФ:
- дизъюнкция литер рii – атом или отрицание атома.
Потом ДНФ представляют в виде множества дизъюнктов
В методе резолюций – имеется одно правило вывода
В результате из 2-х дизъюнктов получаем новую, называется руовентой
- получаем пустой дизъюнкт, который всегда ложный.
Если множество содержит пустой дизъюнкт, то оно является не выполнимым.
Получается пустой дизъюнкт, который доказывает что данное множество является невыполнимым.
Метод резолюций применяется до тех пор пока не получится пустой– дизъюнкт
m,n – const
подстановка вместо переменной константы –унификация.
В данном случае выполняем подстановку {n/y}:
Из (1)и (2) => a(x)c(x,n) (5)
Из (3) и (5) , выполняя ь подстановку {m/n}=> c(m,n) (6)
Из (4) и (6) без подстановок => 0

Принцип резолюций в Прологе
В Прологе используются хордовские дизъюнкты, т.е. дизъюнкты, содержащие одну литеру без отрицания.
На пример
=>

конъюнкция без отрицания

Могут использоваться дизъюнкты, которые вообще не содержат литер. – это целевое утверждение на прологе: ? – a a: - b,c,d. b: - e,f. c. e. f.
?-a a(1) a(2) a(3)
|№ шага |Целевой |Исходный |резольвета|
| |дизъюнкт |дизъюнкт | |
|1 |?- a. |a:-b,c,d. |-b,c,d. |
|2 |?-b,c,d |b:-e,f |-e,f,c,d |
|3 |?-e,f,c,d |e |-f,c,d |
|4 |?-f,c,d |f |-c,d |
|5 |?-c,d |c |-d |
|6 |?-d |d |0 |

Представление программы в виде графа a: - b;c b: - d,e c: - g,f. e: - i,h g: - h,j d. f. h.
?-a
«,» - и
«;» - или
Построение графа начинается с целевого дизъюнкта.
На графе видно какие и сколько решений имеет рассматриваемая задача.

Два решения задачи

Продукционная модель представления знаний.
Основа для данной модели – это продукционные правила, которые имеют следующий вид
- продукционное правило >:=
Eсли то [КД=]

Примеры:
Правило 5
Если пол=женский

И сложение=мелкое

И вес=65 лет_или_больше
То относительный_вес=изменчивый
Коэффициент доверия определяется числом 0-100

Правило 27
ЕСЛИ перспектива=отличная

И риск=высокий
ТО фактор=0 КД=10
В общем случае посылка может быть логическим выражением.
Если посылка истинна, то истинно и заключение, т.е. в заключение может быть указано какое-либо действие, которое выполняется, если посылка истинна
::[ИИ…И]
::== объект, атрибут, значение, коэфициент доверия- представление знаний в виде четвёрки
::==
:==КД=
Один и тот же объект может иметь разные значения.
Многозначные объекты – объекты, которые могут иметь несколько достоверных значений.
Если объект не объявлен, как многозначный, то он может иметь несколько значений, то они не должны быть достоверными, т.е. КД= 100

Для объектов, значение которое запрашивается у пользователя.
Какое сложение?
1. Мелкое
2. Среднее разрешённые значения
3. Крупное

Каков возраст
1. меньше 25
2. от 25 до 55
3. больше 55
Коэффициент доверия посылки=min(Кдусл)

Факта, полученного в результате выполнения правила перспектива=отличная КД=50 риск=высокий КД=70 фактор=0

Базовая структура продукционной модели представления знаний

Исходные данные

Результат

Выводы заканчиваются, когда достигается целевая вершина, либо не осталось применимых правил, а цель не достигнута.

Обратные выводы – выполняются сверху вниз (выводами ориентирующих на цель)

П 1 П2 П3 П4
П5

С 4 С5 С6 С7 С8

|№ |Цель|Конфликтное |Выполнение|Подцели|Факт|
|шага| |множество | | | |
| | |правил |правил | | |
|1 |С1 |П6,П7 |П6 |С2,С3 | |
|2 |С2 |П1,П2 |П1 |С1,С5,С| |
|3 |С3 | | |3 |F1 |
|4 |С4 | | | |F2 |
|5 |С5 |П3 |П3 | | |
|6 |С6 | | |С6,С7,С|F3 |
|7 |С7 | | |8 |F4 |
|8 |С8 | | | |F5 |
| | | | | | |

Цель – «продолжительность» –цель задаётся именем объекта.
Она сопоставляется с заключением правил и выбирается правило с заключением
, в которых есть имя объекта. Выбираем правило, которое содержит целевой объект, мы формируем гипотезу

В процессе гипотеза либо подтверждается либо опровергается. Выводы продолжаются до тех пор, пока какая либо не будет подтверждена, либо не будут исчерпаны все возможные гипотезы.
Используется меньшее количество проверок, т.к. в правиле бывает несколько условий и одно заключение.

Двунаправленные выводы.

Сначала выполняются прямые выводы, на основе небольшого количества данных, в результате формируется гипотеза для подтверждения или опровержения выполняются другие выводы.
Для проверки условий правил используется аппарат активации правил, который выделяет на каждом шаге те правила, в которых проходит проверка условий.
Должны быть использованы также условия. В условиях правил выделяются индивидуальные, а затем общие.
Общие правила – правила условий применимости. Сфера применимости.

Обобщённая структура продукционного правила.
(i); Q; P; A; =B; N
(i)– имя правила:
Q –сфера применения правила;
P – условие применимости првила (логическое условие)
A=>B – ядро правило, где А- посылка, а В- заключение;
N – поставленное условие, определяетдействия, которые выполняются в случае выполнения ядра.
Р – при истинности активизируется ядро правила.

Фрейм – структура данных для представления стереотипной ситуации
(к: А1К1, A2K2, ….,AnKn)
(к: A1k1, A2k2,….,An kn)
(имя файла: имя слота1 (значение слота1) имя слота2 (значение слота2)

……………………………….. имя слота n (значение слота n))
Протофрейм – знания о классе объектов.
Фрейм- экземпляр- получается из протофрейма при заполнении слотов конкретными значчениями.
В структуру фреймов обычно включают системные слоты. К системе слота относятся:
Слоты определим фреймродитель, слот, указываемый на прямые дочерние фрейма.

В качестве системы слотов: слоты, содержащие сведения о создателе программы, о её модификации.
В структуру входят:
- указатель наследования;
- указатель типа данных;
- демоны и т.п.

ЯЗЫК ФМС (FMS).
Указатели наследования могут быть:
U – unique – уникальный
S – same- какой-то
R – range – указатель границ;
0 –override – игнорировать

U – во фреймах разных уровней с одинаковыми именами будут различными.
S – слоты наследования значений из слотов высшего уровня с такими же именами

Значение нижнего уравнения должно лежать внутри границ определённого в верхнем уравнении.

R
Человек

Если значение не задано то оно наследуется из слота верхнего уравнения, а если оно задано, то наследование игнорируется.

Лекция 11 3.12.99

Сочетание сетевой и фреймовой модели в системе представления знаний OPS-5
В этом языке есть продукционные правила и базы данных
::=({| }+)

{}+ - Может повторятся несколько раз
::=({ значение})
::= |
(Вещество класс кислота

Имя

Цвет бесцветная)
(Порядок – задач: Источник, утечки Ограждения)
Что собой представляют правила:
::=(Р )
::={}+
::= | -
::= | |
::=({значение>}+) |

# (Порядок задач)

([{ }+])
# (Вещество)
В образце не обязательно указываются все атрибуты данного класса, т.е. мы можем записать
(Вешество класс кислота

Имя) т.е. переменная кислота –вещ получит значение
::= ({ >}+)
Значение с соответствующего атрибута элемента работой памяти должно совпадать с одним из элементов указанных в данном листе, хотя бы с одним.
Эти значения задаются конкретными словами.
# (Вещество класс кислота

Цвет)
::= ({{{}+}}+)
Список значений может задаваться и в виде ограничений
# (Двигатель мощность { 100 200})

(Двигатель мощность 160)
:={}+
::=(make | remove | (modif
{} +)

# (Р координировать _а

(цель состояние активный

Имя координировать)
Если цель находится в состоянии координировать и порядок задач не определён, то создать

(Порядок задач) –>
(make цель состояние активный

Имя упорядочить задачи)
(modif1 состояние ожидания))

Стратегия решения задач основана на явном задании цели
Выполнение
1. сопоставление с элементами памяти в результате формируется конфликтное множество правил
2. Выбор правил из конфликтного множества
3. Выполнение действий, указанных в заключении правил
Выполняется до тех пор, пока не будет достигнута цель.

Приобретение знаний

Извлечение знаний из источника, преобразование их в нужную форму, а также перенос в базу знаний интеллектуальной системы.

Знания делятся на:
- объективизированные;
- субъективные
Объективизированные – знания, представленные во внешних источниках – книгах, журналах, НИР.
- форматизированные, т.е. представлены в виде законов, формул, моделей, алгоритмов.
Субъективные – знания, которые являются экспертными и эмперическими не представлены во внешней форме.
Знания экспертом является неформализованными, представляют собой множество эвристических приёмов и правил, позволяют находить подходы к решению задач и выдвигать гипотезы, которые могут быть подтверждены или опровержены.
Знания могут быть получены в процессе наблюдения за каким-либо объектогм.
Режимы работы инженера по знаниям, консультолога в процессе приобретения знаний.
1. протокольный анализ
- записываются рассуждения вслух в процессе решения задач.
О.с. составляются протоколы, которые анализируются
2. Интервью - ведется диалог с экспериментом, направленный на приобретение знаний.
3. Игровая имитация профессиональной деятельности.

Методы интервьюирования.
1. Рубление на ступени выделяются связи, позволяющие строить иерархические структуры
2. Репертуальная рещётка предлагаются 3 понятия и требуется назвать отличие 2-х понятие 3-его. Эксперту предлагается пара понятий и требуется назвать общие свойства => сформировать классы.

Методика работы конитолога по формированию поля знания
Включает 2 этапа
1. подготовительный
1.1. Чёткая подготовка задачи, которая должна решать система
2. Знакомство конит с литовой
3. Выбор экспертов
4. Знакомство экспертов с копией
5. Знакомство эксперта с популярной методикой по искусственному интеллекту
6. Формирование с копии поля знания
2. Основной этап
1. накачка поля знания в режиме
2. командная работа косметолога – анализ протокола, определение связей между понятиями, готовит вопросы к эксперту
3. Подкачка поля знания – задача вопросов эксперту
4. Формализация концептуальной задачи.
5. Проверка полноты модели
Если модель неполная, то используется 2-ое приближение.

Лекция 12 10.12. 99.

Нечёткие множества
– толщина изделий малая средняя большая

степень принадл

10 15 40 толщина изделий
- нечёткое множество х - универсальное множество
х - образуют совокупность пар А
- называется функцией принадлежности нечёткого множества.
Значения функции принадлежности для конкретного элемента Х называется

Степенью принадлежности

Носитель нечёткого множества
Нормальным нечётким множеством называется множество для которого

Нечёткое множество
Х - универсальное множество
Х - образуют совокупность пар А
: - называется функцией принадлежности нечёткого множества.
Значение функции принадлежности для конкретного элемента Х называется степенью принадлежности
- носитель нечёткого множества
&
Нормальным нечётким множеством называется множество для каждого

Если приводить к нормальной форме => нужно поделить все её значения на
.

Пусть функция принадлежности задаётся целым числом от 10 до 40
Определить понятие малая толщина изделия.

| | | | | | | | x x

10 11 12 13 14 15 16 17 18
18

Операции над нечёткими множествами

1. Объединение нечётких множеств

2. Пересечение нечётких множеств

3. Дополнение нечёткого множества

Начало 12 и 13 лекции.

(A1,(A2,….,(An x1,x2,…,xn x1(X1 x2(X2 … xn(Xn

(A1 x(A2 x … x(An = {}

(x (x1,x2,…,xn) = min{(A1 (x1), (A2 (x2)…(An (xn) }

(A x(B = {,
, }
5. Возведение нечеткого множества в степень.

(A2 = con((A) - концентрация

(A0.5 = dil((A) – растяжение

Методы определения функции принадлежности.

Немного больше 2. От 0 до 5.
|x |0 |1 |2 |3 |4 |5 |
|n1 |- |- |- |10|8 |4 |
|n2 |10|10|10|- |2 |6 |

(A = n1 / (n1 + n2)

Метод рангирования.

Нечеткая переменная.

(- имя нечеткой переменной х – область ее определения

(А – смысл, нечеткое множество определяет семантику нечеткой переменной

Лингвистическая переменная.

(- имя лингвистической переменной

Т – базовая терм множество – образует имена нечетких переменных
{редко, иногда, часто}, являющихся лингвистическими переменными

Х – носитель лингвистических значений – область определения

G – синтаксическая процедура

М – семантическая процедура

Синтаксическая процедура в виде грамматических терминов, символы которых составляют термы из терм множеств {и, или, не}, модификаторы типов
{очень, слегка, не и т.д.}

(- частота

Т = {редко, иногда, часто}

Очень часто

Такие термины вместе с исходными образуют производную терм множества.

Семантические процедуры позволяют переписать термо-нечеткую семантику.

М((1 или (2) = (А1 ((А2

((1 , х1 , (А1)

((2 , х2 , (А2)

М((1 и (2) = (А1 ((А2

М(очень () = con ((A)

М(слегка () = dil ((A)

Сценарий.

Является классом фреймовых моделей представления знаний, где в обобщенной и структурной форме представлены знания о последовательности действий, событий типичных для предметной области. Рассмотрим стереотип каузальный сценарий – определяет последовательность действий необходимых для достижения целей, это фреймовая модель.

(kcus имя: имя слота 1(значение слота 1); имя слота 2(значение слота 2);

… имя слота n(значение слота n))

(kcus деятель цель деятеля посылка ключ следствие системное имя)

Посылка определяет действия, которые должны быть выполнены раньше ключевого действия, необходимые для его действия. Последствие – заключительное действие. Системное имя – сценарий.

(kcus «тушение пожара»: деятель (S:) цель деятеля (С: «прекращение пожара»)

П11, П12 посылки (cus: «поиск средств тушения»R1, «транспортные средства тушения»)

К1 ключ (f: «использование средств тушения для полного прекращения огня») следствие (Р: «прекращение огня») системное имя (sys: cus*1))

R1 – быть раньше

(kcus «поиск средств тушения »: деятель (S:) цель деятеля (С: «нахождение средств тушения»)

П121, П22 посылки (cus: «определение координат местонахождения средств тушения»R1, «перемещение к месту нахождения средств тушения»)

К2 ключ (f: «схватывание средств тушения») следствие (Р: «нахождение у места расположения средств тушения») системное имя (sys: cus*2))

(kcus «транспортировка средств тушения к месту пожара»: деятель (S:) цель деятеля (С: «доставка средств тушения к месту пожара»)

П31, П32 посылки (cus: «наличие средств тушения»R1, «определение координат места пожара»)

К3 ключ (f: «движение к месту пожара») следствие (Р: «нахождение на месте пожара средств тушения») системное имя (sys: cus*3))

Пополнение знаний на основе сценария.

Последовательность действий:

Д = cus: П11 R1 cus: П12 R1 K1 =

П21R1П22R1K2 П31R1П32R1K3

П21R1П22R1K2 R1 П31R1П32R1K3 R1 K1

Посылки определяют действия, которые должны быть выполнены раньше ключевого действия, необходимы для его действия. Следствие заключительное действие. Системное имя сценарий.

Пополнение знаний на основе псевдофизических логик.

Р1 – посадка самолета

Р2 – подача трапа

Р3 – выход пассажиров из самолета

Р4 – подача автобуса

Р5 – прибытие на аэровокзал

Структура текста на лингвистическом уровне представляется следующей формулой:

TS = PR4dt&P1R3 10,(P2&P2R1P3&P4R3 2,(P5 t = 15 часов 20 минут

PR4dt , P1R3 10,(P2 (P2R4 dt + 10

P1R3 10,(P2 (P1R1P2

P4R3 2,(P5 (P4R1P5

TS* = P1R1P2& P1R1P3& P2R1P3& P4R1P5

Модели и методы обобщений знаний.

Под обобщением понимается процесс получения знаний, объясняющих имеющиеся факты, а так же способных классифицировать, объяснять и предсказывать новые факты. Исходные данные представляются обучающей выборкой. Объекты могут быть разбиты на классы. В зависимости от того, заданы или нет априорные разбиения объектов на классы, модели обобщения делятся на модели обобщения по выборкам и по классам.

(+ = {01+, 02+…0nj+} – положительная выборка.

Может задаваться отрицательная выборка (- = {01-, 02-…0ьj-}

Требуется найти такое правило, которое позволяет установит, относится или нет объект к классу Kj.

В моделях обобщения по данным выборка представляется множеством объектов класса. Методы обобщения делятся на методы обобщения по признакам и структурно-логические методы обобщения.

Z = {z1, z2, …, zr}

Zi = {zi1, zi2, …, zini}

Объект характеризуется множеством значений признаков Qi = {z1j1, z2j2, …, zrjr}.

Структурно-логические методы обобщения используются для представления знаний об объектах, имеющих внутреннюю структуру среди структурно- логических методов. Можно выдвинуть два направления: индуктивные методы нормального исчисления и методы обобщения на семантических сетях.

Алгоритм обобщения понятий по признакам.

Правила определения принадлежности объектов к некоторому классу представляются в ряде логических формул элементами которых являются hij и функции ((((((((

Z = {z1, z2} {пол, возраст}

Z1 = {z11, z12} {м, ж}

Z2 = {z21, z22, z23} {молодой, средний, старый}

(j+ = {01+, 02+} (j- = {01-, 02-, 03-}

01+ = (z11, z21) 02+ = (z11, z22)

01- = (z11, z23) 02- = (z12, z21) 03- = (z12, z22)

&i hij - обобщенное конъюнктивное понятие

0 = max(xij – 1/(i), где 0 – критерий, xij – частота появления некоторого значения признака, (i – количество признаков.

0 = 3/5 – 1/2 = 0.1

(j+ = {01+, 02+} (j- = {01-}

(-1+ = 0 (-1- = {02-, 03-}

-----------------------

Ситуация

Статическая

Динамическая

Постоянные свойства и соотношения

Состояния

Устойчивые

Временные

Процессы

(пациент1, диагноз, колит, К760)
(пациент1, диагноз, гастрит, К740)

учащийся

Неопределенный объект

Определенный объект

Материальный объект

Нематериальный объект

ситуация

пространство

помещение

оборудование

учащиеся

административный персонал

преподаватели

обслуживающий персонал

аспирант

заведующий кафедрой

методист

профессор

ассистент

лаборант

пространство

губерния

населенный пункт

работает

преподаватель

Назв.каф.

замещение

дисциплина

Код группы

Классификация знаний

Знания бывают классифицированы на следующие категории:

¨ Поверхностные – знания о видимых взаимосвязях между отдельными событиями и фактами в предметной области.

¨ Глубинные – абстракции, аналогии, схемы, отображающие структуру и природу процессов, протекающих в предметной области. Эти знания могут использоваться для прогнозирования поведения объекта.

К примеру, поверхностные знания бывают описаны следующим предложением:

ʼʼВ случае если болит голова, то следует выпить аспиринʼʼ.

При этом можно также рассмотреть глубинные знания:

ʼʼЗнания физиологов и врачей высокой квалификации о причинах, видах головных болей и методах их леченияʼʼ.

Знания, которыми обладает человек, делятся на формализованные (точные) и слабо формализованные (неточные). Формализованные знания можно зафиксировать в виде определений, формул, алгоритмов, моделей и т.п. Неформализованные знания - ϶ᴛᴏ знания, для которых отсутствует алгоритм (модель, метод) их получения. Эти знания трудно сформулировать, так как они, как правило, являются результатом обобщения многолетнего опыта человека. К примеру, мы не всегда можем ответить: почему мы приняли то или иное решение, говорим, что оно пришло на интуитивном уровне.

Инженерия знаний – достаточно молодое направление искусственного интеллекта͵ появившаяся тогда, когда практические разработчики столкнулись с весьма нетривиальными проблемами трудности ʼʼдобычиʼʼ и формализации знаний. Инженерия знаний напрямую связана с проектированием баз знаний , ᴛ.ᴇ. получению и структурированию знаний специалистов для последующей разработки интеллектуальных информационных систем (ИИС).

Для БЗ характерны информационные массивы небольшого объёма (в отличие от баз данных) являющиеся исключительно дорогими. В базе знаний можно проводить выбор по запросу информации, явно не хранимой, а выводимой из имеющихся данных. Базы знаний используются для хранения знаний и построения на их базе ИИС. Для этого знания крайне важно представить в форме, понятной компьютеру.

Τᴀᴋᴎᴍ ᴏϬᴩᴀᴈᴏᴍ, идеология создания базы знаний в основном связана с формализацией знаний (или памяти человека). Модели памяти разрабатываются когнитивной психологией. Когнитивная психология (психология познания) занимается, прежде всего, изучением способов восприятия и понимания знаний человеком.

Процесс представления знаний представляет собой формализацию знаний об определенной области. В конечном итоге, знания должны быть представлены в форме, которая будет пригодна для создания интеллектуальной системы. Τᴀᴋᴎᴍ ᴏϬᴩᴀᴈᴏᴍ, крайне важно создание определенных схем, позволяющих описать знания на некотором формальном языке.

Выделяют декларативные и процедурные знания. Декларативные знания хранятся в виде фактов и утверждений об объектах и отношений между этими объектами. К моделям представления таких знаний относятся, предикаты, семантические сети, фреймы. Процедурные знания хранятся в процедурах и выводятся в виде алгоритмов. К моделям их представления относятся правила продукции.

Особенности, присущие некоторым слабоструктурированным задачам, такие, как разнородность информации, неполнота и неопределенность исходных данных и т.д. делают привлекательным использование качественных знаний. Для их формализации используются методы нечеткой математики.

Извлечение знаний - ϶ᴛᴏ процедура взаимодействия специалиста с источником знаний, в результате которой становится явным процесс рассуждений специалиста при принятии решения и структура его представления о предметной области.

Условно данный процесс включает можно разбить на три этапа:

1. Формулировка проблемы – определение целей и задачей получения знаний;

2. Сбор информации из различных источников. Следует отметить, что в качестве эксперта может выступа не только человек, но и любой другой источник информации (справочники, статьи, видеозаписи и т.д.);

3. Разработка формализма (модели) знаний о предметной области.

Рис. 2.1 – Методы получения знаний

Инженерия знаний. Инженерия знаний и получение знаний Инженерия знаний определяется как

17.2. Практические методы извлечения знаний

17.3. Структурирование знаний

После изучения главы вы должны знать:

17.1. Теоретические аспекты получения знаний

Еще по теме статьи: