Одной из основных особенностей конца XX столетия, определившей прогресс в третьем тысячелетии, является стремительный рост объема # информационных—ресурсов—Решающую—роль-в—этом—процессе играет сеть Интернет, и, в первую очередь, World Wide Web.
Сегодня Интернет — это конгломерат сетей, соединенных друг с другом, который обеспечивает пользователям разнообразные виды информационного сервиса: пересылку файлов и сообщений, удаленный доступ, сеансовый и интерактивный режим работы, бизнес-информацию, новости и т. д.
Количество пользователей Интернет на сегодняшний день составляет примерно 560 млн. По прогнозу исследовательской фирмы Computer Economics к 2005 г. в мире будет более 830 млн. пользователей Интернет.
Россия занимает 15-е место в мире по числу пользователей в Сети. Согласно статистическим данным, всего в России насчитывается 8 миллионов ф пользователей Интернет, из которых 4 миллиона 300 тысяч — постоянные. С 1998 по 2001 год российская аудитория сети Интернет увеличилась в пять раз, и в настоящий момент пользователями Сети хотят стать еще 36 миллионов россиян. Без преувеличения можно сказать, что сегодня информационные ресурсы Интернет используются практически во всех сферах человеческой деятельности, анализ их содержания, во многом, определяет принятие решений, как в научно-технической области, так и в бизнес-процессах.
Основная часть информационных ресурсов Интернет сосредоточена в WWW.
Компания Inktomi и NEC Research по результатам проведенного исследования Интернет выявили, что в сети содержится уже более 1 млрд. документов. В российском сегменте по исследованию Руметрики количество уникальных документов более 67 млн. ^ Web-pecypcbi представляют собой совокупность гипертекстовых документов, по сути, являясь огромной гипертекстовой базой данных. Наличие ссылок обеспечивает переход от одного документа к другому, что позволяет объединить в единую структуру большое количество связанных между собой документов.
Термин «гипертекст» был введен для описания документов, выражающих нелинейную структуру идей, в противоположность традиционной линейной структуре книг и речи, Тедом Нельсоном в 1965 году [176]. Сегодня существует множество определений этого термина [4, 29, 39, 76, 176],.
В основе гипертекстовых документов World Wide Web — язык HTML (Hyper Text Markup Language) [4], разработанный Тимом Бернерс-Ли (Tim Berners-Lee), и стал популярным благодаря броузеру Mosaik, разработанному в NCSA. В 90-е годы прошлого века он широко распространился и расширился.
Возможность встраивать в гипертекстовые документы различные объекты позволила использовать для представления информации практически любые формы и средства, что сделало информационные ресурсы Интернет разнообразными и привлекательными для пользователей.
Сегодня можно отметить следующие тенденции развития Интернет, которые определяют актуальность исследований в этой области:
— расширение сферы и интенсивности использования информации Интернет при решении различных задач, в первую очередь, задач прогнозирования, планирования и управления;
— возросшая конкуренция между ресурсами, особенно крупными, в области предоставления информации и информационного сервиса;
— усиление роли Web-pecypcoB в рекламных и маркетинговых стратегиях их владельцев;
— перемещение некоторых бизнес-процессов в виртуальную среду, что связано с развитием Интернет-технологий;
— резкое увеличение спроса на Web-проекты.
Перерождение значительной части Интернет из информационной среды в рекламно-информационную и использование при создании Web-pecypcoB методов, применяемых в рекламе, привело, наряду с резким ростом количества ресурсов и пользователей Интернет, также к ряду негативных последствий: преимущественной концентрацией внимания пользователя на визуальных эффектах, а не на информационном содержании сайтовнедостоверной или непроверенной информациейпопытками оказывать влияние на вкусы, потребности и мотивацию пользователей с целью реализации собственных бизнес-стратегий. Все это, так же как и традиционная реклама, часто вызывает реакцик5оггорженияуаудитории^Последние годы отмечены повышенным интересом к оформлению сайтов и развитием исследований по оценке их привлекательности для пользователей. Огромные объемы информации, обрушивающиеся на пользователей Интернет, в условиях невысокой релевантности, обеспечиваемой большинством поисковых систем, породили стиль взаимодействия пользователя с Интернет-ресурсами, характеризующийся беглым просмотром страниц, игнорированием долго загружающихся элементов: анкет, систем регистрации, прямой рекламы. Сайты, содержащие большие объемы текстовой информации, признаются скучными большинством исследований пользовательского поведения в Сети и не могут рассчитывать на большое количество повторных посещений.
Изучение восприятия информации человеком при просмотре Web-страниц ведется с 1994 года. Наиболее известны результаты исследований Якоба Нильсена [79, 156], руководителя компании Nielsen Norman Group (http://www.nngroup.com), а до 1998 года — ведущего инженера и специалиста по Web-usability в Sun Microsystems, а также работы П. Морвиля, JI. Розенфельда [133], Д. Нормана [180], У. Вудсона, Д. Коновера [19], рекомендации фирм Microsoft [152], Apple [118] и других. Отечественные исследования в области пользовательского восприятия сайтов начали развиваться несколько позднее, чем за рубежом. Сегодня их результаты, большей частью, представлены в Интернет — источниках, (наиболее известны работы А. Лебедева (http://www.design.ru), Я. Перевалова (http://usabilyty.ru), В. Головача (http://www.usethics.ru)). Однако имеется значительное количество исследований, посвященных пользовательскому восприятию информации, представленной на экране компьютера, которые являются теоретической базой для разработки оценок пользовательского восприятия сайтов [5, 7, 28, 31, 40,41, 83, 89, 97 и др.].
Системы персонализации и кастомизации Web-ресурсов, получившие значительное развитие в последние годы [16, 123, 131, 160, 183, 188], нацелены на устранение дискомфорта пользователя Сети, однако они, по сути, ограничивают.
Щинформационноепространство пользователя, поэтому часто сами по себе вызывают негативное отношение, как при скрытом, так и при открытом исследовании пользовательских интересов.
Согласно данным исследования аудитории мирового Интернета (The Internet Monitor), проведенного MASMI Research совместно с Pro Active International, свои персональные данные на сайтах оставляют 47% пользователей в Европе (в России этот показатель несколько выше — 52%).
Несмотря на отмеченные проблемы сегодняшней Сети, Web-pecypcbi Интернет представляют сегодня самое большое хранилище информации и являются прообразом единого информационного пространства [38].
Перед создателем информационного Web-pecypca стоит сложная задача — донести информацию до пользователя, сделав ее форму настолько привлекательной, чтобы пользователь осознал ее полезность и необходимость для себя. По сути, это задача рекламирования информационного продукта в условиях жесткой конкуренции с множеством других производителей.
В указанном аспекте дизайн большинства сайтов признается неудачным (до 90% - по высказываниям в Интернет). Повышение качества дизайна сайтов, улучшение пользовательских характеристик ресурсов связывают сегодня не с художественным оформлением, а с проработкой его информационного наполнения.
В значительной мере решение этой задачи сводится к поиску варианта декомпозиции информационного пространства создаваемого ресурса, поиску последовательности представления выделенных частей и определению формы их ¦ представления. Важность этих задач для Web-pecypcoB Интернет привела к выделению их в область самостоятельных исследований, а именно, к исследованиям информационной архитектуры Web-pecypcoB.
Термин «информационная архитектура» был введен в обращение Ричардом Вурманом [153] еще в 1976 году, им же были определены задачи информационного архитектора. Интерес к информационной архитектуре в 90-х ф щдахпрошлого^столетияЁЬ1л связан, восновном,. с интенсивным &bdquo-развитием информационных систем предприятий и организаций и информатизацией бизнес-процессов.
Сегодня имеется обширная литература по этому вопросу [45, 79, 121, 168 и др.], а также широкий спектр программных средств для автоматизации проектирования информационных систем [52, 81, 84, 121, 141,148, 151].
Концепция информационной архитектуры сайтов начала интенсивно разрабатываться несколько позднее, в конце девяностых годов двадцатого столетия, что в первую очередь связано с интенсивным ростом объема ресурсов Интернет.
Особо значительное место занимают труды Л. Розенфельда и П. Морвиля щ [133,165], Дж.Дж.Гарретта [131], P.C. Хилца и М. Турофа [132], Е. И. Рейса [142], а также членов возглавляемой Розенфельдом Argus Associates [158] и Argus Center for Information Architecture. Большое значение для развития концепции ИА, имеет подготовленный ассоциацией Argus глоссарий по информационной архитектуре [159]. Имеется большое количество публикаций в периодических и Интернет-источниках [138, 149, 160,161,163,164, 167, 171,172, 183 и др.].
Наряду с публикациями, затрагивающими вопросы, связанные с информационной архитектурой Web-pecypcoB, в отечественных и зарубежных источниках значительное место уделяется вопросам, связанным с ее проектированием и оценкой. Это работы по моделированию и автоматизированному проектированию гипертекстов, как основы сайтов, (работы В. П. Морозова, В. П. Тихомирова, Е. Ю. Хрусталева, Ф. Чудинова, Дж. Гарретта), • упоминавшиеся выше работы по изучению восприятия человеком информации Web-pecypcoB (работы А. Лебедева, Я. Перевалова, В. Головача, Я. Нильсена, П. Морвиля, Л. Розенфельда, Д. Нормана, У. Вудсона, Д. Коновера, рекомендации фирм Microsoft, Apple и других), оценке эффективности Web-pecypcoB, управлению их эксплуатацией и развитием. В Интернет существует значительное количество сайтов и дискуссионных форумов, где обсуждаются вопросы проектирования сайтов, в том числе и вопросы их информационной архитектуры. ф Сегодня задаыалроектированиялнформационной архитектуры оценивается большинством авторов и разработчиков как центральная задача процесса создания сайта.
Показательно, что в глоссарии по информационной архитектуре [159] выделены понятия «маленький информационный архитектор» и «большой информационный архитектор». Если задачей первого является руководство процессом разработки обратной информационной архитектуры, что, по сути, сводится к задаче управления контентом в сложившейся архитектуре сайта, то задачу большого информационного архитектора составляет стратегическое управление проектом Veb-pecypca. Появление больших информационных архитекторов знаменует перевод задач проектирования информационной ф архитектуры из задач второго плана (после художественного проектирования) на центральное место в проекте.
Несмотря на интенсивность работ в области информационной архитектуры сайтов, сегодня многие вопросы в ней остаются нерешенными.
В первую очередь, это касается самого определения концепции информационной архитектуры, которую разные авторы определяют по-разному. Сложность ее определения связана с тем, что современные Veb-pecypcbi уже на являются просто гипертекстом, обеспечивающим взаимодействие с пользователем за счет активных компонент. Сегодня это сложные системы, включающие базу данных, подсистему интерфейса пользователя, ряд административных и прикладных подсистем, таких как подсистема управления информационным содержанием, авторизации, поисковая, персонализации, сбора ® и анализа статистики посещений и т. д. Имеются проекты, включающие средства проектирования, позволяющие производить модернизацию структуры сайта. Поэтому первой задачей, решаемой в диссертации является определение и формальное описание информационной архитектуры Veb-pecypca, как сложной системы, и формализация задач ее проектирования.
Многообразие требований, предъявляемых к Veb-pecypcy программноаппаратнойсредой,"пользовательскойаудиторией иеговладельцами или спонсорами, часто включает противоречивые группы требований, баланс которых является практически недостижимой задачей для проектировщика сайта. Существующие методики проектирования поэтому, в основном, ориентированы на какую-либо одну группу требований, например, обеспечение комфортной работы пользователя (эргономическое проектирование) или реализацию бизнес-стратегий владельцев ресурса.
Основными этапами любой методики проектирования информационной архитектуры сайта являются те же этапы, которые выделяются в процессе создания любого программного обеспечения: это анализ, разработка и внедрение, однако, методы проведения этих этапов различаются в зависимости от требований, которые предъявляются к ресурсу на этапе анализа, так что каждый из них может включать различный набор решаемых задач.
При решении задачи проектирования информационной архитектуры можно выделить две основные задачи:
1. Декомпозиция информационного пространства ресурса на множество семантически целостных информационных элементов;
2. Разбиение множества информационных элементов на подмножества, объединенные семантическими и перцептивными связями (синтез страниц сайта).
Дополнительными задачами являются задачи, связанные с созданием удобного интерфейса пользователя: организацию поиска информации, разработку навигационных элементов. Можно отметить, что эти задачи являются вторичными, так как после решения двух первых задач определяются все связи между компонентами сайта и при решении двух других задач вопрос стоит только о способе визуализации этих связей.
Сложностью решения задач проектирования информационной архитектуры является отсутствие четких критериев и методов оценки, как проекта в целом, так и его информационной архитектуры. Большинство существующих методов оценивают завершенный проект сайта на основе эмоционального восприятия его пользовательской аудиторией [124, 130, 135, 144, 163, 167, 173], что предполагает наличие—законченного—художественного оформленияОценка незавершенного проекта, что и представляет собой информационная архитектура, вызывает значительные трудности. Существующие для этого методики в большей степени ориентированы на оценку отдельных компонентов, нежели всего проекта в целом. Важность информационной архитектуры для последующих эксплуатационных характеристик Web-pecypca делает необходимой разработку методов ее оценки, позволяющих моделировать пользовательское поведение уже на этапе разработки.
Определение методов решения указанных задач проектирования и оценки информационной архитектуры является второй задачей, решаемой в диссертационной работе.
Высокие требования к актуальности информации Web-pecypcoB. конкуренция между ресурсами, рекламные и маркетинговые составляющие ресурсов, делают их главной особенностью, как программно-информационных продуктов, необходимость частой модернизации на этапе эксплуатации. Это делает необходимым интеграцию задач проектирования и эксплуатации в используемых методах поддержки их жизненного цикла. Поэтому третьей задачей, решаемой в диссертационной работе, является исследование задач эксплуатации и модернизации Web-pecypcoB и разработка научно-методических основ управления развитием Web-pecypcoB и их модернизации на этапе эксплуатации.
Четвертой задачей диссертации является разработка и применение методов, обеспечивающих автоматизированное проектирование и модернизацию информационной архитектуры Web-pecypcoB. Необходимость решения этой задачи определяется резким увеличением спроса на Web-ресурсы и необходимостью повышения их качества, что невозможно без применения формализованных методов для анализа и обоснования принимаемых решений.
Автоматизированное проектирование Web-pecypcoB определяется рядом технологий. К ним в первую очередь, относятся:
— технологии структурного анализа информационного пространства ф предметной области-.
— технологии баз данных для хранения, как информационного содержания Web-pecypca, так и метаданных проекта;
— технологии автоматизации программирования для реализации отдельных компонент информационной архитектуры в виде программного кода на соответствующих языках, в первую очередь, HTML и языках написания скриптов.
Конкретные реализации этих методов в виде отдельных методик и САПР поддерживают методологию прямого или обратного проектирования, которым соответствуют определения прямой и обратной информационной архитектуры. Наиболее распространены и являются исторически более ранними САПР, поддерживающие обратное проектирование, «выросшие» из задач управления Ц информационным наполнением ресурса на этапе эксплуатации. Однако, большинство новых систем ориентировано на методологии прямого проектирования, позволяющие обеспечить более высокие потребительские свойства ресурса как информационного продукта и упростить его последующую структурную модернизацию и расширение.
Несмотря на большое количество систем и отдельных программ, позволяющих автоматизировать как решение отдельных задач проектирования Web-pecypcoB, так и комплексное ведение проекта, можно отметить следующие проблемы проектирования Web-сайтов, отмечаемые большинством исследователей сети:
1. Высокая степень автоматизации проектирования Web-pecypcoB достигается, в основном на поздних этапах жизненного цикла продукта, а именно, ^ на этапах реализации и сопровождения (модернизации). Начальные этапы, связанные с анализом требований и разработкой информационной архитектуры автоматизированы в очень малой степени, в основном, на уровне отдельных подзадач.
2. Отсутствуют методы оценки информационной архитектуры Veb-ресурсов, позволяющие получать комплексную оценку информационной архитектуры на основе оценок отдельных ее элементов и пригодные для использования,.как на ранних, так. и^на поздних этапах проектирования.
3. Существующие методы проектирования Veb-pecypcoB только декларативно опираются на моделирование интересов трех групп пользователей УеЬ-ресурса: потребителей, владельцев и разработчиков. Ориентация ресурсов на широкий круг потребителей делает большинство методик малоэффективными для проектирования. По сути, моделирование подменяется работой эксперта в определенной предметной области или копированием сайтов конкурентов.
4. Используемые методики моделирования проекта Х^еЬ-ресурса моделируют только взаимосвязь его структурных компонент, практически игнорируя его свойства, как информационного продукта, отображающего часть глобального информационного пространства. Это не только делает их малопригодными для проектирования информационной архитектуры, где информационная целостность превалирует над структурной, но также не обеспечивает преемственности моделей различных этапов проектирования.
5. Существует конфликт между рекламно-презентационным аспектом Veb-ресурсов и методологией прототипирования, в той или иной степени присутствующим в существующих методиках автоматизированного проектирования. Разрешением этого конфликта является создание и развитие методов, обеспечивающих поддержку проектирования оригинальных сайтов, а именно средств анализа информационного пространства Veb-pecypca, компоновки информационной архитектуры, моделирования и оценки оригинальных проектов на начальных стадиях проектирования.
6. Мало проработаны вопросы формирования предметной области Veb-ресурса, отсутствуют методики ее структурного анализа. Прямое перенесение методологии структурного анализа, используемого при проектировании информационных систем предприятий, оказывается невозможным из-за разности целей и пользовательской аудитории у Veb-pecypcoB и ИС предприятий.
7. Мало исследованы вопросы взаимосвязи и взаимовлияния информационной архитектуры и художественного оформления УеЬ-ресурсов. Существует тенденция к смещению акцентов проектирования в сторону информационной архитектуры.
8. В системах автоматизации проектирования УеЬ-ресурсов преобладают методологии обратного проектирования, что не обеспечивает возможности автоматизации проектирования оригинальных сайтов, приводит к распространению технологий прототипирования, отрицательно сказывающихся на потребительских свойствах ресурса как информационного продукта, а также создает сложности при последующей его структурной модернизации и расширении.
Целью настоящего исследования является повышение качества и эффективности отечественных электронных информационных ресурсов за счет разработки методов автоматизированного проектирования информационной Ф архитектуры УеЬ-ресурсов Интернет.
Достижение указанной цели предполагает решение следующих задач:
— анализ современного состояния проектирования УеЬ-ресурсов;
— исследование состояния и развитие концепции информационной архитектуры Veb-pecypca;
— систематизация и разработка моделей УеЬ-ресурсов и их компонент;
— исследование влияния характеристик информационной архитектуры на эксплуатационные показатели УеЬ-ресурса и обоснование критериев качества информационной архитектуры;
— разработка методов структурного анализа предметной области Veb-ресурса;
— теоретическое исследование и разработка формализованных методов ^ синтеза информационной архитектуры Web-pecypca;
— разработка алгоритмов и программных средств автоматизированного проектирования информационной архитектуры, Л^еЬ-ресурсов;
— исследование задач эксплуатации и модернизации Veb-pecypcoB и разработка научно-методических основ управления развитием Veb-pecypcoB и их модернизации на этапе эксплуатации.
Структура и объем работы Диссертация состоит и введения, шести глав, заключения.
Первая глава посвящена рассмотрению общей концепции информационной архитектуры Veb-pecypcoB Интернет, методов ее проектирования и ее влияния на эксплуатационные характеристики ресурсов.
Рассматриваются особенности Veb-pecypcoB Интернет как объектов проектирования, анализируются модели их жизненного цикла, методы разработки средств автоматизации проектирования. Показано, что УеЬ-ресурсы характеризуются коротким циклом разработки, высокой частотой изменения их информационного содержания и структуры, одновременным существованием работающей и разрабатываемой версии, что соответствует спиральной модели жизненного цикла и делает необходимым использование методов автоматизации их разработки и модернизации. Проведен анализ процессов потребления информации при взаимодействии пользователей с Интернет, на основании которого определены характеристики Veb-pecypca как информационного продукта и средства информационного сервиса, учет которых необходим при его проектировании.
Проводится анализ существующих представлений об архитектуре информации и ее компонентах, а также схем реализации этих представлений в общем процессе проектирования Veb-pecypcoB Интернет. Рассмотрены три основные аспекта описания Veb-pecypca: построение иерархии абстрактных моделей, определение уровней иерархии сложности принятия решений, и формирование организационной иерархии. Показано, что информационная архитектура отражает, в первую очередь, информационный уровень в системной декомпозиции Veb-pecypca, однако, она затрагивает и другие уровни, так как часто смысл информации определяет форму и программные средства ее представления.
Во второй главе рассматриваются принципы построения моделей Veb-.ресуреовЛнтернет и их. компонент, формализованного представления предметной области УеЬ-ресурсов и информационных требований пользователей, формализуется задача проектирования информационной архитектуры, определяются критерии ее оценки.
Предметная область Veb-pecypca определяется как совокупность информации об объектах (процессах, явлениях) и их характеристиках, которая соответствует информационным потребностям или интересам определенной группы пользователей Интернет, составляет его информационное содержание, представляется в виде специальных структур данных и используется пользователями для решения различных функциональных задач.
Формализуется описание моделей предметных областей пользователей и информационных требований пользователей. Показано, что модель предметной области представляет собой внутреннюю модель информационной архитектуры Veb-pecypca, которая используется в задачах управления его информационным содержанием. Внешняя модель, которая является представлением организационной иерархии Veb-pecypca на информационном уровне, создается на основе моделей информационных требований пользователей, которые отражают информационные потребности планируемой аудитории ресурса.
На основе проведенной формализации определяются основные компоненты организационной иерархии Veb-pecypca.
Задача проектирования внешней информационной архитектуры представляется как задача определения отображения модели предметной области на внешнюю модель при заданных ограничениях.
На основе общей задачи проектирования информационной архитектуры определены составляющие ее частные задачи.
Третья глава посвящена разработке модели предметной области проектируемого Veb-pecypca на основе анализа электронных документов и.
Интернет-ресурсов, представляющих его содержание и назначение. Такими документами являются различные электронные тексты, Veb-pecypcbi, а также модели информационных процессов пользователей предполагаемой целевой Ш аудитории и информационных процессов владельцев ресурса, связанных с продвижением продукции, услуг или идей.
Показано, что центральной задачей определения предметной области для Veb-pecypcoB является определение множества объектов и отношений на этом множестве. Задача выделения множества объектов интерпретируется как задача выделения терминов на множестве документов, отобранных для описания предметной области. Для решения этой задачи в работе используются методы автоматизированного лингвистического анализа документов. Наряду с выделением множества объектов выделяется и множество связанной с ними входной и выходной информации.
Проведен анализ методов и средств автоматизированного лингвистического Щ анализа документов, лингвистических моделей документов, методов выделения терминов и установления связей между ними и показана возможность их использования для формирования формального описания предметной области Veb-pecypcoB. Рассмотрены особенности применения этих методов к документам, используемым в составе набора документов, характеризующих информационное пространство.
Предложены методы отбора терминов из множества терминоподобных слов, методы формирования многословных терминов на основе итерационной процедуры, использующей шаблоны терминоподобных словосочетаний с последующей проверкой их информационной ценности. Предложены методы оценки информативности терминов для описания семантики информационного назначения ресурса на основе определения их частотных и вероятностных ^ характеристик.
На основе разработанных методов, правил и оценок предложена методика автоматизированного формирования терминологической семантической модели набора документов и формирования на ее основе множеств объектов и связанной с ними информации модели предметной области Veb-pecypca.
В четвертой главе рассматриваются вопросы автоматизированного формирования. внешне1^модели1ресурсанаоснове модели^предметной области и моделей информационных требований пользователей.
Предложена методика формирования множества информационных элементов на основе использования терминов семантической модели и выделенных документальных описаний этих терминов.
Методика основана на формировании информационного элемента как совокупности терминов семантической модели и связанных с ними документальных описаний. Показано, что информационный элемент, как правило, объединяет в себе документальное описание не отдельного термина, а группы тесно связанных терминов.
В зависимости от особенностей структуры связей между терминами семантической модели предложено два подхода к формированию групп терминов, представляющих информационные элементы, и соответствующих им текстовых фрагментов документальных источников:
— кластеризация терминов семантической модели в соответствии с объединяющими их связями с последующим использованием терминов каждого информационного элемента как категорий для целевого аннотирования документов семантической модели ресурса с целью сбора информации, связанной с терминами информационного элемента;
— формирование информационных элементов на основе классификации выделенных на множестве терминов семантической модели структурных единиц документов.
Рассмотрены вопросы разделения множества информационных элементов на подмножества, соответствующие отдельным страницам сайта. Проведен анализ вариантов формирования страниц в соответствии с особенностями структуры связей между информационными элементами. Сформулирована задача декомпозиции множества информационных элементов на группы страниц сайта.
Приведена общая схема решения задачи формирования внешней модели Veb-ресурса и предложены методы ее реализации с использованием ЭВМ.
В пятой главе рассмотрены принципы и методы размещения информации Ф настраницахЖе1ьресурса. Показано, нто задачаразмещения информации на страницах Veb-pecypcoB в контексте проектирования информационной архитектуры не предполагает создания окончательного проекта страницы с учетом его художественного оформления, включая композиционные и цветовые решения. Она состоит в определении последовательности представления информационных элементов на странице ресурса, их расположения относительно верхней части страницы и друг друга в соответствии с задачами представления информации.
Рассмотрены различные подходы, используемые к размещению информации на экране дисплея при создании программного обеспечения интерфейсов. Показано, что при создании УеЬ-интерфейсов наиболее важно обеспечить два ф аспекта: удобство пользователей определенной целевой аудитории, и активизацию интереса, желания работать с УеЬ-ресурсом, воспринимать его информацию, так как посещение пользователем ресурса является добровольным, а не обязательным.
Рассмотрены различные способы визуального представления и размещения информации в поле экрана. На основании их анализа выработаны рекомендации по созданию визуального отображения ресурса с точки зрения его информативности.
Проведена классификация информационных элементов архитектуры сайта по функциональному назначению, информативности и способу обработки электронной информации. Рассмотрено влияние на компоновку страниц сайта технических ограничений. Показано, что конкретная реализация компоновки и Ж художественного оформления требует учета соотношения объема информации к возможному времени ожидания загрузки страницы.
Рассмотрено соотношение информационного и художественного проектирования в общей структуре проектирования УеЬ-ресурсов.
Формализована задача создания информационной компоновки страницы ДУеЬ-ресурса, предложен метод и алгоритм ее решения.
Рассмотрены методы оценки визуального варианта размещения информации на^страшще^ипертекстаПредложена методикаоценки, лспользующая оценки эмоционального значения выводимой информации на базе психосемантических шкал.
В шестой главе рассматриваются принципы и методы автоматизации модернизации информационной архитектуры Veb-pecypcoB на этапе эксплуатации. Рассмотрены особенности сопровождения Veb-pecypcoB на этапе эксплуатации, задачи модернизации и реинжиниринга информационной архитектуры Veb-pecypcoB, типовые функции программных средств управления информационным содержанием Veb-pecypcoB. На основе анализа и классификации систем управления информационным содержанием УеЬ-ресурсов выделена типовая структура и определены основные компоненты систем управления информационным содержанием, показана возможность реализации задач модернизации и реинжиниринга информационной архитектуры в составе систем управления информационным содержанием.
Рассмотрены принципы информационного обеспечения принятия решений по модернизации информационной архитектуры Veb-pecypca на основе разработанной семантической модели предметной области Veb-pecypca.
Приведены данные о системе автоматизированного проектирования и управления информационным содержанием УеЬ-ресурсов, разработанной в рамках диссертационной работы, а также о? еЬ-проектах, выполненных с ее использованием, показывающие эффективность разработанных методов и программных средств.
Научная новизна работы состоит в следующем:
1. Развита концепция и разработана формализованная модель информационной архитектуры Veb-pecypca и основных ее компонент с позиций проектирования.
2. Разработано формализованное описание предметной области Veb-pecypca и информационных требований пользователей.
3. Разработана методика структурного анализа и декомпозиции предметной.
Щ ^области^еЬ-ресурса и^интеза на этой основе его информационной архитектуры.
4. Разработан формализованный метод компоновки основной структурной единицы гипертекста — страницы, использующий критерии эргономического проектирования Veb-pecypcoB, что позволяет учесть взаимное влияние информационной архитектуры и ее визуального отображения средствами информационного дизайна.
5. Предложены методы оценки, обеспечивающие методическое единство оценки информационной архитектуры Veb-pecypca на всех этапах его жизненного цикла.
6. Предложена методика развития и модернизации Veb-pecypca на основе разработанных моделей информационной архитектуры и методов.
4} автоматизированного поиска информации.
7. Предложена инфологическая модель Veb-pecypca, обеспечивающая преемственность результатов проектирования информационной архитектуры на всех этапах его жизненного цикла, и ее реализация в составе хранилища данных.
8. Разработан комплекс методик автоматизированного проектирования информационной архитектуры Veb-pecypcoB Интернет, обеспечивающий использование ЭВМ на ранних этапах разработки.
Практическая ценность работы заключается в том, что:
— разработаны программные средства, реализующие методику автоматизированного проектирования информационной архитектуры Veb-ресурсов Интернет.
Ж — на основе проведенных исследований современного состояния проектирования Veb-pecypcoB Интернет, отобраны показатели, характеризующие качество ресурсов как информационных продуктов, и выработаны практические рекомендации по их использованию в процессе проектирования;
— на основе разработанной инфологической модели Veb-pecypca создано программное обеспечение хранилища данных для хранения промежуточных и окончательных результатов проектирования информационной архитектуры;
41предложеныметодикаипрограммныесредствадляпроведения структурного анализа предметной области Veb-pecypcoB Интернет:
— разработаны программные средства компоновки страниц гипертекста на основе эргономических критериев;
Основным научным результатом диссертации является создание научно-методических основ автоматизированного проектирования Veb-pecypcoB Интернет на основе структурно-аналитического исследования информационного пространства. Полученный результат имеет важное значение для формирования национальных информационных ресурсов, повышения их качества и востребованности отечественной и зарубежной аудиторией Интернет. Разработанная методика нашла применение в практическом проектировании Интернет-ресурсов, научных исследованиях и учебном процессе.
Обобщение и развитие концепции информационной архитектуры Veb-ресурса, как его основной составляющей, реализующей связь между конкретной областью глобального информационного пространства и информационными интересами потребителей и владельцев ресурса, позволило создать формализованное представление информационной архитектуры Veb-pecypca, обеспечивающее ее структурно ¿-^методологически однородное информационное представление для разных этапов проектирования.
Разработана методика структурно-логического проектирования информационной архитектуры, основанная на автоматизированных процедурах анализа и декомпозиции предметной области Veb-pecypca и синтеза ^ структурных компонент ресурса.
Разработана формализованная модель предметной области Veb-pecypca, использующая его представление в виде семантической сети понятий, что позволило разработать методику и алгоритмы анализа информационного пространства Veb-pecypca и его декомпозиции на множество взаимосвязанных информационных элементов, основанные на методах автоматизированного лингвистического анализа электронных документов, методах автоматической Щ классификации и технологиях интеллектуальной обработки информации.
На основе разработанного формализованного описания информационной архитектуры разработана методика оценки пользовательских характеристик проектируемого Veb-pecypca, позволяющая проводить оценку показателей работы ресурса на ранних стадиях проектирования, что позволяет существенно улучшить качество пользовательского взаимодействия с информацией ресурса.
На основе анализа типовых схем распределения информации по страницам ресурсов и пользовательских характеристик ресурсов формализованы задачи и разработаны алгоритмы формирования информационного содержания страниц гипертекстовой структуры ресурса и информационной компоновки страниц гипертекста.
Л Разработаны методические принципы развития и модернизации информационной архитектуры ресурса на этапе его эксплуатации.
Основным практическим результатом работы является расширение и систематизация знаний о процессах информационного взаимодействия пользователей с сетью Интернет и объединение на единой методической основе широкого спектра отдельных работ, существующих в области автоматизации проектирования, сопровождения, эксплуатации и оценки УеЬ-ресурсов.
Разработан комплекс методических, программных и информационных средств для автоматизированного проектирования, сопровождения и модернизации информационной архитектуры Veb-pecypcoB Интернет, реализующий методику структурно-логического проектирования и ^ обеспечивающий создание эффективных, легко модернизируемых Veb-pecypcoB, что является важным условием их востребованности аудиторией Интернет и конкурентоспособности в глобальном информационном пространстве.
Использование разработанных в диссертации научно-методических принципов и программных средств в составе системы автоматизированного проектирования? еЬ-ресурсов Интернет позволило сократить сроки их.
Ф проектирования^ атакже улучшить пользовательские. характеристики спроектированных ресурсов, повысить вероятность обнаружения ресурса поисковыми системами и улучшить значения формальной релевантности, присваиваемой ими ресурсам, что выражается в занимаемой ресурсом позиции в списке выдачи.
Результаты диссертационной работы внедрены и продолжают внедряться в компании «Е.бой» в рамках системы автоматизированного проектирования ресурсов, а также при выполнении отдельных частных проектов. В настоящее время разработанная методика проектирования информационной архитектуры использована при проектировании и используется при сопровождении ряда проектов.
Ц Частные результаты, полученные в диссертационной работе, использованы при выполнении НИР по договорам с Минпромнаукой для реализации задач проектирования? еЬ-интерфейсов, анализа предметной области проектов, исследования и тематически ориентированного отбора Интернет-ресурсов.
В учебном процессе результаты работы реализованы в рамках программы переподготовки специалистов с высшим образованием по дистанционной форме обучения по программе «Дизайн и реклама в компьютерных сетях» в Центре дистанционного обучения МГИЭМ (http://dlc.miem.edu.ru). Также результаты, полученные в диссертации, используются при подготовке специалистов по вычислительной технике и Интернет-технологиям в МГИЭМ в виде конспекта лекций по курсу «Информационные системы». По результатам работы подготовлено учебное пособие для студентов специальностей «Прикладная ^ информатика» и «Информационные системы» Института информационных технологий МГУ С.
На защиту выносятся:
Формализованная модель предметной области Veb-pecypca Интернет,.
Формализованное представление информационной архитектуры Veb-ресурса Интернет, методы и алгоритмы ее построения и использования по этапам жизненного цикла Veb-pecypca.
Методы и алгоритмы автоматизированного проектирования информационной архитектуры УеЬ-ресурсов Интернет.
Методика оценки характеристик проектов Veb-pecypcoB на основе формализованного представления информационной архитектуры.
Принципы и методы информационного сопровождения и модернизации Veb-pecypcoB Интернет на основе формализованных и информационных моделей.
Выводы к главе 6.
1. Анализ задач, связанных с сопровождением Veb-pecypca на этапе эксплуатации, показал, что изменение информационных процессов владельцев и потребителей ресурсов, а также изменения глобального информационного пространства делают необходимым периодическую модернизацию ресурса, а в некоторых случаях его реинжиниринг.
2. Для сопровождения Veb-pecypca необходимо осуществлять информационный мониторинг и аудит ресурса.
3. Разработанные методы и средства информационного моделирования информационной архитектуры Veb-pecypca позволяют интегрировать программные средства информационного мониторинга с программным обеспечением Veb-pecypca, что позволяет заложить в него возможности саморазвития собственного информационного пространства.
4. В составе задач сопровождения Veb-pecypca особое значение приобретает информационное сопровождение, связанное с обновлением, расширением и изменением содержания включенных в состав ресурса баз данных, а также информационных элементов страниц на основе информации, извлекаемой из внешних по отношению к ресурсу источников. Реализация информационного сопровождения требует интеграции с ресурсом программного обеспечения управления его информационным содержанием, а также привлечения к сопровождению ресурса информационного менеджера, осуществляющего переработку-исходной информации ллзвлечение из нее необходимых для внесения в ресурс данных.
5. Изменения ресурса, вызываемые его информационным сопровождением, накапливаясь с течением времени, могут приводить к изменениям информационного пространства ресурса, что выражается в изменении его семантической модели, и, соответственно к необходимости его модернизации или реинжиниринга.
6. В состав программного обеспечения проектирования и сопровождения Veb-pecypcoB необходимо включение средств управления, позволяющих поддерживать одновременное существование нескольких версий, а также работать с несколькими проектами.
7. Значительную часть ПО современных Veb-pecypcoB составляют типовые компоненты, что связано с общностью процессов потребления информации и рекламных стратегий ее представления, поэтому в состав программного обеспечения систем автоматизированного проектирования информационной архитектуры УеЬ-ресурсов необходимо включать средства управления проектами, позволяющие поддерживать одновременное проектирование и сопровождение нескольких версий проекта, а также работать с несколькими проектами на основе единой базы типовых компонент.
8. Анализ результатов разработанных методов и средств автоматизированного проектирования информационной архитектуры на примере разработки конкретных Veb-pecypcoB показал их пригодность и эффективность, в особенности для больших проектов.
Заключение
.
Основным научным результатом работы является теоретическая разработка, обобщение" «и решение важной проблемы в области автоматизированного проектирования — создание методических основ автоматизации проектирования информационной архитектуры УеЬ-ресурсов Интернет, что будет способствовать развитию и повышению качества отечественных электронных информационных ресурсов, повышению их конкурентоспособности в глобальном информационном пространстве, а также их востребованности отечественной и зарубежной аудиторией Интернет.
В диссертационной работе получены следующие основные результаты.
1. Обобщена и развита концепция информационной архитектуры УеЬ-ресурса, проведена системная декомпозиция УеЬ-ресурсов как класса сложных систем, на основании которой разработана формализованная модель информационной архитектуры и ее компонент, определены критерии их выбора.
2. Разработана формализованная модель предметной области УеЬ-ресурса, использующая его представление в виде семантической сети понятий, формируемых на основе анализа информационных задач владельцев ресурса, его целевой аудитории, конкурирующих ресурсов, информационных источников, релевантных тематике ресурса.
4. Разработана методика и алгоритмы анализа предметной области Veb-ресурса и его декомпозиции на множество взаимосвязанных информационных элементов, основанные на методах автоматизированного лингвистического анализа электронных документов и методах автоматической классификации, используемых в технологиях интеллектуальной обработки информации.
5. Разработана методология структурно-логического проектирования информационной архитектуры, основанная на автоматизированных процедурах анализа и декомпозиции предметной области Veb-pecypca, синтеза основных структурных компонент ресурса и инфологическом моделировании Veb-pecypca на всех этапах его жизненного цикла, включая этап эксплуатации.
5. Разработана методика и алгоритмы формирования информационного содержания страниц гипертекстовой структуры ресурса и системы навигации.
6. Формализована задача размещения информационных элементов на Ф страницегиперхекста, разрабатаны. метод и алгоритм решения этой задачи и метод оценки качества размещения.
7. Разработана методика оценки пользовательских характеристик проектируемого Veb-pecypca на основе предложенных в работе формализованных моделей, позволяющая проводить оценку показателей работы ресурса на ранних стадиях проектирования, что позволяет существенно улучшить качество пользовательского взаимодействия с информацией ресурса.
8. Разработаны методические принципы автоматизации модернизации информационной архитектуры ресурса на этапе его эксплуатации.
9. Разработан комплекс методических, программных и информационных средств для автоматизированного проектирования, сопровождения и модернизации информационной архитектуры Veb-pecypcoB Интернет, реализующий методологию структурно-логического проектирования.
10. Использование разработанных в диссертации научно-методических принципов и программных средств в составе системы автоматизированного проектирования УеЬ-ресурсов Интернет позволило сократить сроки их проектирования и улучшить пользовательские характеристики спроектированных ресурсов.