Проблемы построения семантических сетей
Проблема идентификации понятий имеет место и в реальной жизни, но здесь мы мудро пользуемся «бритвой Оккама»: Не умножай сущностей сверх необходимости. Если мы общаемся в небольшой компании, достаточно имен. В студенческой группе можно идентифицировать каждого фамилией. Однофамильцы при этом удостаиваются имени, а тезки — еще и отчества. Если создается семантическая сеть, охватывающая большое… Читать ещё >
Проблемы построения семантических сетей (реферат, курсовая, диплом, контрольная)
Как показано в подразд.7.1, семантическая сеть должна хранить знания в математически точной форме. В этой связи, ее построение требует аккуратности и хорошего понимания предметной области и всех связанных с ней понятий. Проблемы представления знаний были изложены в уже упомянутой работе Дрю Макдермота [6]. На первый взгляд, построение графов подобных приведенным в подразд. 7.3. примерам может проходить легко и непринужденно. Однако это далеко не всегда так. Рассмотрим следующую конструкцию:
юо Иными словами, Ту-154 с бортовым номером 85 600 является экземпляром класса самолетов, а самолеты обладают свойством летать. Поскольку отдельный представитель класса наследует признаки класса, мы делаем вывод, что Ту-154 с бортовым номером 85 600 тоже может летать,.
и будем правы. Но если теперь мы наложим на такую же схему другие факты (очень старый и широко известный парадокс):
Сократ — один из людей.
Людей много.
Следовательно, Сократов много.
А ведь в отношении самолета это работало! Мы попали в ловушку по следующей причине. Понятия «Самолеты» и «Люди» — это множества самолетов и людей соответственно. Свойство «летать» относится не к множеству, а к его экземплярам. Свойство же «Многочисленность» относится к классу в целом и неприменимо к отдельным экземплярам данного класса. Таким образом, всегда следует четко понимать, что соответствует тому или иному понятию, единичный экземпляр или подмножество, и правильно применять предикаты.
Другая проблема связана с присвоением понятиям имен. В приведенном выше примере с самолетом не зря конкретный самолет был идентифицирован бортовым номером. В противном случае было бы непонятно, какой именно экземпляр самолета имеется в виду.
Для выявления свойства «летать» точная идентификация экземпляра не критична, чего нельзя сказать, если речь идет о необходимости устранении неисправности. Приведенная выше идентификация 85 600 также не является исчерпывающей. Во-первых, данная комбинация цифр может относиться к чему угодно, например, номеру телефона. Во-вторых, самолет может попасть в гражданскую авиацию из авиации военной, где идентификация совершенно другая, и мы не сможем ничего узнать о прошлой жизни самолета, например, о предыдущих ремонтах, а это совершенно недопустимо.
Проблема идентификации понятий имеет место и в реальной жизни, но здесь мы мудро пользуемся «бритвой Оккама»: Не умножай сущностей сверх необходимости. Если мы общаемся в небольшой компании, достаточно имен. В студенческой группе можно идентифицировать каждого фамилией. Однофамильцы при этом удостаиваются имени, а тезки — еще и отчества. Если создается семантическая сеть, охватывающая большое количество объектов, то неизбежно возникает проблема синонимии, когда одно имя указывает на различные понятия. И если в древности достаточно было сказать «Иисус из Назарета», чтобы идентифицировать человека, то сейчас даже используемая в паспортном учете триада «ФИО» — «дата рождения» — «место рождения» не гарантирует отсутствия повторяющихся идентификаторов. Кроме того, такой громоздкий ключ (выражаясь в терминах баз данных) не способствует наглядности и простоте восприятия. В этой связи для локальных семантических сетей могут использоваться принятые в практике номера зачетных книжек, табельные номера, ИНН и т. п. Другая проблема — полисемия, когда одно слово используется для обозначения различных понятий. Синонимия и полисемия могут катастрофически усложнить проблему построения больших сетей и, в частности, объединение фрагментов, написанных разными авторами.
Название вершины является всего лишь символическим именем, его осмысленность только увеличивает наглядность графа. Полностью идентифицируют вершину ее свойства, например, для человека — фамилия, имя, отчество, дата рождения и т. п.