Работа с программой «PagePromoter»
Точки входа — отображает информацию по страницам вашего сайта, через которые пользователи попадают на ваш сайт чаще всего. Отчет по точкам входа позволяет вам получить представление о том, что видят ваши посетители первым, попадая на ваш сайт. Имея информацию об этом, вы можете понять, какое первое впечатление получают ваши посетители, находят ли они нужную информацию сразу. Во многих случаях… Читать ещё >
Работа с программой «PagePromoter» (реферат, курсовая, диплом, контрольная)
World Wide Web (Web) — это сеть информационных ресурсов. Для того, чтобы сделать эти ресурсы доступными наиболее широкой аудитории, в Web используются три механизма:
Единая схема наименования для поиска ресурсов в Web (например, URI).
Протоколы для доступа к именованным ресурсам через Web (например, HTTP).
Гипертекст для простого перемещения по ресурсам (например, HTML).
Связи между этими тремя механизмами становятся очевидными по прочтении этой спецификации.
Каждый ресурс в Web — документ HTML, изображение, видеоклип, программа и т. д. — имеет адрес, который может быть закодирован с помощью универсального идентификатора ресурсов (Universal Resource Identifier), или URI.
WEB-страницы создаются с помощью средств языка HTML (Hyper Text Markup Language). HTML — это язык разметки гипертекстового документа. Он появился одновременно со службой World Wide Web и развивается вместе с ней. С помощью языка HTML можно создавать как простые, так и сложные динамические WEB — страниц.
Гипертекстовой документ — это документ, в котором встроены специальные коды, управляющие дополнительными элементами, такими как форматирование, иллюстрации, мультимедийные вставки и гиперссылки на другие документы. Большинство WEB-страниц содержит гиперссылки. При наведении на гиперссылку указатель мыши принимает форму кисти руки с вытянутым указательным пальцем. После щелчка на гиперссылку, программа обозреватель загрузит новую WEB-страницу, находящуюся по адресу указанному в гиперссылке.
Документ в Интернете ищется по универсальному указателю ресурсов URL (Uniform Resourse Locator). WEB-страницы публикуются в Интернете путем размещения HTML файлов на WEB-серверах. Для передачи HTML документа используется протокол HTTP (Hyper Text Transfer Protocol).
Для просмотра WEB-страниц предназначены программы обозреватели (браузеры), например, Internet Explorer или Netscape Navigator. Причем WEB-страницы можно только читать, а редактировать их может только тот, кто их создал.
Для просмотра HTML-документа на локальном компьютере достаточно запустить файл с расширением HTML, или открыть его через программу Internet Explorer.
1. Основы работы с WEB-документами
1.1 Язык разметки гипертекстов
URI обычно состоят из трех частей:
Схема наименования механизма, используемого для доступа к ресурсу.
Имя машины, на которой располагается ресурс.
Имя собственно ресурса, заданное в виде пути.
Этот URI может читаться следующим образом: этот документ можно получить по протоколу HTTP, он располагается на машине www. w3.org, путь к этому документу — «/TR/PR-html4/cover.html». Кроме того, в документах в формате HTML Вы можете увидеть схемы «mailto» для электронной почты и «ftp» для протокола FTP.
Вот еще один пример URI. Он относится к почтовому ящику пользователя:
…текст…
Комментарии отправляйте Джо Кулу.
Примечание. Большинство читателей уже знакомо с термином «URL», но не знает термина «URI». URL образуют подмножество более общей схемы наименования URI.
Некоторые URI указывают на местоположение внутри ресурса. Этот тип URI заканчивается символом «#», за которым следует указатель (идентификатор фрагмента). Например, следующий URI указывает на фрагмент с именем section2:
http://somesite.com/html/top.html#section2
Относительный URI не содержит информации о схеме наименования. Путь в нем указывает на ресурс на машине, на которой находится текущий документ. Относительные URI могут содержать компоненты относительного пути (например,". «означает один уровень выше в иерархии) и идентификаторы фрагментов.
Относительные URI приводятся к полным URI с помощью базового URI. В качестве примера приведения относительного URI предположим, что у нас имеется базовый URI «http://www.acme.com/support/intro.html». Относительный URI в следующей ссылке:
будет преобразован в полный URI «http://www.acme.com/support/suppliers.html», а относительный URI в следующем фрагменте
будет преобразован в полный URI «http://www.acme.com/icons/logo.gif».
В HTML URI используются для:
ссылки на другие документы или ресурсы (см. элементы A и LINK).
ссылки на внешние таблицы стилей или скрипты (см. элементы LINK и SCRIPT).
включения в страницу изображений, объектов или апплетов (см. элементы IMG, OBJECT, APPLET и INPUT).
создания изображений-карт (см. элементы MAP и AREA).
отправки форм (см. FORM).
создания документов с использованием кадров (см. элементы FRAME и IFRAME).
ссылок на внешние источники (см. элементы Q, BLOCKQUOTE, INS и DEL).
ссылок на соглашения о метаданных, описывающих документ (см. элемент HEAD).
Подробнее об URI см. в разделе о типах URI.
Чтобы представить информацию для глобального использования, нужен универсальный язык, который понимали бы все компьютеры. Языком публикации, используемым в World Wide Web, является HTML (HyperText Markup Language — язык разметки гипертекстов).
HTML дает авторам средства для: публикации электронных документов с заголовками, текстом, таблицами, списками, фотографиями и т. д., загрузки электронной информации с помощью щелчка мыши на гипертекстовой ссылке, разработки форм для выполнения транзакций с удаленными службами, для использования в поиске информации, резервировании, заказе продуктов и т. д., включения электронных таблиц, видеоклипов, звуковых фрагментов и других приложений непосредственно в документы.
Язык HTML был разработан Тимом Бернерс-Ли во время его работы в CERN и распространен браузером Mosaic, разработанным в NCSA. В 1990;х годах он добился особенных успехов благодаря быстрому росту Web. В это время HTML был расширен и дополнен. В Web очень важно использование одних и тех же соглашений HTML авторами Web-страниц и производителями. Это явилось причиной совместной работы над спецификациями языка HTML.
HTML 2.0 (ноябрь 1995, см. [RFC1866]) был разработан под эгидой Internet Engineering Task Force (IETF) для упорядочения общепринятых положений в конце 1994 года. HTML+ (1993) и HTML 3.0 (1995, см. [HTML30]) — это более богатые версии языка HTML. Несмотря на то, что в обычных дискуссиях согласие никогда не было достигнуто, эти черновики привели к принятию ряда новых свойств. Усилия Рабочей группы World Wide Web Consortium по HTML в упорядочении общепринятых положений в 1996 привели к версии HTML 3.2 (январь 1997, см. [HTML32]). Изменения по отношению к HTML 3.2 перечислены в Приложении, А Большинство людей признают, что документы HTML должны работать в различных браузерах и на разных платформах. Достижение совместимости снижает расходы авторов, поскольку они могут разрабатывать только одну версию документа. В противном случае возникает еще больший риск, что Web будет представлять собой смесь личных несовместимых форматов, что в конечном счете приведет к снижению коммерческого потенциала Web для всех участников.
В каждой версии HTML предпринималась попытка отразить все большее число соглашений между работниками и пользователями этой индустрии, чтобы усилия авторов не были потрачены впустую, а их документы не стали бы нечитаемыми в короткий срок.
Язык HTML разрабатывался с той точки зрения, что все типы устройств должны иметь возможность использовать информацию в Web: персональные компьютеры с графическими дисплеями с различным разрешением и числом цветов, сотовые телефоны, переносные устройства, устройства для вывода и ввода речи, компьютеры с высокой и низкой частотой и т. д.
В HTML 4.0 вводятся механизмы таблиц стилей, скриптов, кадров, внедрения объектов, улучшенная поддержка разных направлений письма и направления справа налево, таблицы с большим количеством возможностей и новые свойства форм, обеспечивая лучшие возможности доступа для людей с физическими недостатками.
Эта версия HTML разработана с помощью экспертов в области интернационализации, так что документы можно писать на любом языке и легко передавать их по всему миру. Это достигается за счет использования [RFC2070], относящегося к интернационализации HTML.
Важным шагом стало принятие стандарта ISO/IEC:10 646 (см. [ISO10646]) в качестве набора символов для документов HTML. Это наиболее содержательный стандарт в мире, в котором решены вопросы представления национальных символов, направления письма, пунктуации и других языковых вопросов.
HTML теперь предоставляет лучшую поддержку различных языков в одном документе. Это обеспечивает более эффективное индексирование документов для поисковых машин, типографию высшего качества, преобразование текста в речь, более удобные переносы и т. д.
Поскольку сообщество Web растет, и возможности и умения его членов различаются, очень важно, чтобы основные технологии соответствовали потребностям. Язык HTML разработан так, чтобы сделать Web-страницы более доступными для пользователей с физическими недостатками. В HTML 4.0 имеются следующие дополнения, продиктованные соображениями доступности:
усилено разделение структуры и представления документа, что побуждает использовать таблицы стилей вместо элементов и атрибутов представления языка HTML.
улучшены формы, включена возможность назначения клавиш доступа, возможность семантической группировки управляющих элементов формы, семантической группировки вариантов в тэге SELECT и активные метки.
добавлена возможность разметки текстового описания включенного объекта (с помощью элемента OBJECT).
введен новый механизм действия изображений-карт на стороне клиента (элемент MAP), который позволяет авторам интегрировать изображения и текстовые ссылки.
альтернативный текст для изображений, включаемых с помощью элемента IMG, обязателен.
добавлена поддержка атрибутов title и lang во всех элементах.
добавлена поддержка элементов ABBR и ACRONYM.
более широкий диапазон целевых устройств (телетайп, шрифт Бройля и т. д.) для использования в таблицах стилей.
улучшены таблицы, включена поддержка заголовков, групп столбцов и механизмов для упрощения невизуального представления документа.
добавлены длинные описания таблиц, изображений, кадров и т. д.
Авторы, разрабатывающие страницы с учетом доступности, получат не только эту возможность, но также и некоторые другие: хорошо разработанные документы HTML с разделенными структурой и представлением будут легче адаптироваться к новым технологиям.
Примечание. Подробнее о разработке доступных документов HTML Вы можете прочесть в [WAIGUIDE].
Новая модель таблиц в HTML основана на [RFC1942]. Теперь авторы имеют большую власть над структурой и компоновкой таблицы (например, группы столбцов). Возможность дизайнеров рекомендовать ширину столбцов позволяет агентам пользователей отображать данные таблицы постепенно (по мере получения) и не ждать всю таблицу до создания изображения.
Примечание. Во время написания этого документа некоторые средства разработки документов в формате HTML широко использовали для форматирования страниц таблицы, что вызывало проблемы совместимости.
В HTML теперь имеется стандартный механизм для внедрения объектов и приложений в документы HTML. Элемент OBJECT (а также более специфичные элементы, его преемники, IMG и APPLET) обеспечивает механизм включения в документ изображений, видеофайлов, звуковых файлов, математических выражений, специализированных приложений и других объектов. Он также позволяет авторам указывать иерархию или альтернативный способ создания изображения для агентов пользователей, не поддерживающих указанный способ создания изображения.
Таблицы стилей упрощают разметку HTML и существенно снижают участие языка HTML в представлении документа. Они предоставляют как авторам, так и пользователям возможность управлять представлением документов — шрифтами, выравниванием, цветами и т. д.
Информацию о стиле можно указать для отдельных элементов или групп элементов, в документе HTML или во внешних таблицах стилей.
Механизмы связи таблиц стилей с документами не зависят от языка таблиц стилей.
До появления таблиц стилей возможности управления созданием изображения у авторов были ограничены. В HTML 3.2 был включен ряд атрибутов и элементов для управления выравниванием, размером шрифта и цветом текста. Авторы также использовали для компоновки страниц таблицы и изображения. Поскольку на обновление браузеров у пользователей уйдет довольно долгое время, эти средства еще будут использоваться в течение какого-то времени. Однако поскольку таблицы стилей обеспечивают более мощные механизмы представления, World Wide Web Consortium существенно сократит число элементов и атрибутов представления в HTML. В этой спецификации элементы и атрибуты, которые могут быть впоследствии исключены, помечены как «нежелательные». Они сопровождаются примерами полдостижения того же эффекта с помощью других элементов или таблиц стилей.
С помощью скриптов авторы могут создавать динамичные Web-страницы (например, «интеллектуальные формы», изменяющиеся по мере заполнения их пользователем) и использовать HTML как средство построения сетевых приложений.
Механизмы, обеспечивающие включение скриптов в документы HTML, не зависят от языка скриптов.
Иногда авторы хотят упростить для пользователей печать текущего документа. Если документ является частью другого документа, отношения между ними можно описать с помощью элемента HTML LINK или языка описания ресурсов (Resource Description Language — RDF) W3C (см. [RDF]).
Авторам и разработчикам для работы с HTML 4.0 рекомендуется ознакомиться со следующими общими принципами.
1.2 Разделение структуры и представления
HTML происходит из SGML, который всегда был языком определения структурной разметки. По мере развития HTML все большее количество его элементов и атрибутов для представления заменяется другими механизмами, в частности, таблицами стилей. Опыт показывает, что отделение структуры документа от аспектов его представления снижает стоимость обслуживания широкого диапазона платформ, носителей и т. д. и упрощает изменение документов.
Чтобы сделать свой Web-сервер доступным для всех пользователей, особенно для пользователей с физическими недостатками, авторы должны предполагать, как их документы могут отображаться на различных платформах: речевых браузерах, программах чтения азбуки Бройля и т. д. Мы не рекомендуем авторам ограничивать творческий процесс, но рекомендуем предусматривать альтернативные методы подачи информации. HTML предлагает ряд таких механизмов (например, атрибут alt, атрибут accesskey и т. д.)
Авторам также следует иметь в виду, что к их документам могут обращаться пользователи с другой конфигурацией компьютеров. Для корректной интерпретации документов авторам следует включать в свои документы информацию о языке и направлении письма в тексте, о кодировке документа и прочую подобную информацию.
При тщательной разработке таблиц и использовании новых возможностей HTML 4.0 авторы могут ускорить отображение документов агентами пользователей. Авторы могут прочесть здесь о том, как создавать таблицы для последовательного представления (см. элемент TABLE). Разработчики могут получить информацию об алгоритмах последовательного представления в замечаниях о таблицах в приложении.
1.3 Представление документа в формате HTML
Раздел набор символов документа относится к вопросу об абстрактных символах, которые могут входить в состав документа в формате HTML. В число этих символов входят латинская буква «A», кириллическая буква «I», китайский иероглиф «вода» и т. д.
Раздел кодировки символов относится к вопросу о том, как эти символы могут быть представлены в файле или во время передачи по Интернет. Поскольку некоторые кодировки могут прямо не представлять все символы, которые автор захочет включить в документ, HTML предлагает другие механизмы, называемые ссылками на символы, для ссылки на любой символ.
Поскольку в человеческих языках имеется огромное количество символов и множество способов их представления, следует позаботиться о том, чтобы эти документы могли понимать агенты пользователей во всем мире.
Для обеспечения возможность взаимодействия сетей SGML требует от каждого приложения (включая HTML) указания набора символов документа. Документ включает:
ѕ Репертуар: Набор абстрактных символов, таких как латинская буква «A», кириллическая буква «I», китайский иероглиф «вода» и т. д.
ѕ Коды: Набор целочисленных ссылок на символы репертуара.
Каждый документ SGML (включая каждый документ HTML) — это последовательность символов из репертуара. Компьютерные системы идентифицируют каждый символ по его коду; например, в наборе символов ASCII коды 65, 66 и 67 означают символы 'A', 'B' и 'C' соответственно.
Набора символов ASCII недостаточно для такой глобальной информационной системы, как Web, поэтому HTML использует более полный набор символов, называемый Универсальным набором символов (Universal Character Set — UCS), и определенный в [ISO10646]. Этот стандарт определяет репертуар тысяч символов, используемых во всем мире.
Набор символов, определенный в [ISO10646] - это посимвольный эквивалент Unicode 2.0 ([UNICODE]). Оба эти стандарта время от времени обновляются, пополняются новыми символами, об изменениях следует узнавать на соответствующих серверах Web. В этой спецификации ISO/IEC-10 646 или Unicode означают этот самый набор символов. Однако в спецификации HTML Unicode также упоминается при обсуждении других вопросов, таких как алгоритм двунаправленного текста.
Набора символов документа, однако, недостаточно, чтобы агенты пользователей могли корректно интерпретировать документы HTML при типичном обмене — закодированные как последовательность байт в файле или во время передачи по сети. Агенты пользователя должны также знать кодировки символов, которые использовались для преобразования потока символов документа в поток байт.
Кодировки символов в этой спецификации имеют другие названия в других спецификациях (что может вызвать некоторую путаницу). Однако это понятие в Интернет означает примерно одно и то же. Одно и то же имя — «charset — набор символов» — используется в заголовках протоколов, атрибутах и параметрах, ссылающихся на символы и использующих одни и те же значения из [IANA] реестра (полный список см. в разделе [CHARSETS]).
Параметр «charset» идентифицирует кодировку символов, которая является способом преобразования последовательности байт в последовательность символов. Это преобразование естественно вписывается в схему деятельности Web: серверы отправляют документы HTML агентам пользователей в виде потока байт; агенты пользователей интерпретируют их как последовательность символов. Способы преобразования могут меняться от простого соответствия один к одному до сложных схем или алгоритмов переключения.
Простой техники кодировки «один байт — один символ» недостаточно для текстовых строк с таким широким репертуаром символов, как [ISO10646]. Кроме кодировок всего набора символов (например, UCS-4), имеются некоторые другие кодировки частей [ISO10646].
Средства разработки (например, текстовые редакторы) могут кодировать документы HTML в кодировках по своему выбору, и этот выбор существенно зависит от соглашений, используемых системным программным обеспечением. Эти средства могут использовать любую удобную кодировку, включающую большинство символов в документе, при условии, что кодировка корректно помечена. Некоторые символы, не включенные в эту кодировку, можно представить с помощью ссылок на символы. Это всегда относится к набору символов документа, а не к кодировке символов.
Серверы и прокси могут изменять кодировку символов (что называется транскодированием) на лету для выполнения запросов агентов пользователей (см. раздел 14.2 [RFC2068], заголовок запроса HTTP «Accept-Charset»). Серверы и прокси не должны обслуживать документ в кодировке, включающей весь набор символов документа.
Широко используемые в Web кодировки — ISO-8859−1 (также называется «Latin-1»; используется для большинства западноевропейских языков), ISO-8859−5 (с поддержкой кириллицы), SHIFT_JIS (японская кодировка), EUC-JP (еще одна японская кодировка) и UTF-8 (вариант кодировки ISO 10 646, использующий разное число байт для разных символов). Названия кодировок символов не учитывают регистр, так что, например, «SHIFT_JIS», «Shift_JIS» и «shift_jis» эквивалентны.
Эта спецификация не определяет, какие кодировки символов должен поддерживать агент пользователя.
Соответствующие агенты пользователей должны корректно отображать в Unicode все символы в любых кодировках, которые они могут распознавать.
Когда текст HTML передается в UTF-16 (charset=UTF-16), текстовые данные должны передаваться в сетевом порядке байт («big-endian», байт высшего порядка — первый) в соответствии с [ISO10646], раздел 6.3 и [UNICODE], положение C3, страница 3−1.
Более того, чтобы повысить вероятность правильной интерпретации, рекомендуется передавать документы UTF-16, всегда начиная с символа НЕ РАЗДЕЛЯЮЩИЙ ПРОБЕЛ НУЛЕВОЙ ШИРИНЫ (шестнадцатеричный код FEFF, также называется Меткой порядка байтов (Byte Order Mark — BOM)), который при обращении байт становится шестнадцатеричным FFFE, никогда не назначаемым символом. Таким образом, агент пользователя, получивший шестнадцатеричный код FFFE в качестве первых байтов текста будет знать, что в остальном тексте байты нужно обратить.
Не следует использовать формат трансформации UTF-1 [ISO10646] (зарегистрированный IANA как ISO-10 646-UTF-1). Информацию об ISO 8859−8 и двунаправленном алгоритме см. в разделе двунаправленности и кодировки символов.
Как сервер определяет, какая кодировка символов применяется в документе? Некоторые серверы проверяют первые несколько байт документа или сверяются с базой данных известных файлов и кодировок. Многие современные серверы Web предоставляют администраторам больше возможностей управления конфигурацией набора символов, чем старые серверы. Администраторы серверов Web должны при возможности использовать следующие механизмы для отправки параметра «charset», но должны позаботиться о том, чтобы не установить для документов ошибочное значение параметра «charset».
Как агент пользователя узнает, какая использовалась кодировка символов? Эту информацию предоставляет сервер. Лучшим способом проинформировать агента пользователя о кодировке символов документа — использовать параметр «charset» в поле заголовка «Content-Type» протокола HTTP ([RFC2068], разделы 3.4 и 14.18) Например, следующий заголовок HTTP объявляет, что используется кодировка EUC-JP:
Content-Type: text/html; charset=EUC-JP
Определение text/html см. в разделе соответствие.
Протокол HTTP ([RFC2068], раздел 3.7.1) считает ISO-8859−1 кодировкой символов по умолчанию, если параметр «charset» в поле заголовка «Content-Type» отсутствует. На практике эта рекомендация бесполезна, поскольку некоторые серверы не позволяют отправлять параметр «charset», а некоторые могут не быть сконфигурированы для отправки этого параметр. Поэтому агенты пользователей не должны предполагать никакого значения параметра «charset».
Для указания ограничений сервера или конфигурации документы HTML могут включать явную информацию о кодировке символов документа; для предоставления такой информации агентам пользователя может использоваться элемент META.
Например, чтобы указать, что кодировкой символов в текущем документе является «EUC-JP», включите следующее объявление META:
Объявление META должно использоваться, только если кодировка символов упорядочена так, что символы ASCII стоят на своем месте (по крайней мере, при разборе элемента META). Объявления META должны быть в тексте как можно раньше в элементе HEAD.
В случаях, когда ни протокол HTTP, ни элемент META не предоставляют информации о кодировке документа, HTML предоставляет атрибут charset для некоторых элементов. Объединив все эти механизмы, автор может существенно повысить шансы на то, что, когда пользователь загружает ресурс, агент пользователя распознает кодировку символов.
Подводя итоги, соответствующие агенты пользователей при определении кодировки символов документа (от высшего приоритета к низшему) должны руководствоваться следующими источниками в соответствии с приоритетом:
Параметр «charset» протокола HTTP в поле «Content-Type».
Объявление META, в котором для «http-equiv» установлено «Content-Type» и установлено значение для «charset».
Атрибут charset устанавливается на элемент, обозначающий внешний ресурс.
Кроме этого списка приоритетов, агент пользователя может использовать эвристические установки и установки пользователя. Например, многие агенты пользователей используют эвристику для распознавания различных кодировок, используемых для японского языка. Агенты пользователей обычно имеют определяемую пользователем локальную кодировку по умолчанию, которую они используют, если нет указаний кодировки.
Агенты пользователей могут обеспечивать механизм, позволяющий пользователям изменять некорректную информацию о наборе символов. Однако если агент пользователя предлагает такой механизм, он должен предлагать его только для просмотра, а не для изменения, во избежание создания Web-страниц с некорректным параметром «charset».
Примечание. Если в каком-то приложении нужно использовать символы, не входящие в кодировку [ISO10646], этим символам должна быть назначена персональная зона во избежание конфликтов с настоящей или будущими версиями стандарта. Однако это не рекомендуется из соображений переносимости.
Данная кодировка символов может не содержать все символы из набора символов документа. Для таких кодировок или для таких конфигураций оборудования и программного обеспечения, не позволяющих пользователям вводить определенные символы, авторы могут использовать ссылки на символы SGML. Ссылки на символы — это независимый от кодировки механизм ввода любых символов.
Ссылки на символы в HTML могут принимать две формы:
Числовые ссылки на символы (десятичные или шестнадцатеричные).
Ссылки на комбинации символов.
Ссылки на символы в комментариях не имеют значения; они являются только данными комментариев.
Примечание. HTML обеспечивает другие способы представления символов, в частности, встроенные изображения.
Примечание. В SGML можно в некоторых случаях не использовать заключительный символ"; «после ссылки на символы (например, в символе переноса строки или непосредственно перед тэгом). В других обстоятельствах их нельзя удалять (например, в середине слова). Мы предлагаем использовать»; «всегда во избежание проблем с агентами пользователей, для которых этот символ обязателен.
Числовые ссылки на символы указывают код символа в наборе символов документа. Числовые ссылки на символы могут также принимать две формы:
Синтаксис «D;», где D — десятичное число, указывает символ Unicode с десятичным номером D.
Синтаксис «H;» или «H;», где H — шестнадцатеричное число, указывает на символ Unicode с шестнадцатеричным номером H. Шестнадцатеричные числовые ссылки учитывают регистр.
Вот некоторые примеры числовых ссылок на символы:
å (десятичное) представляет букву «a» с кружком сверху (используемую, например, в норвежском языке).
å (шестнадцатеричное) представляет тот же символ.
å (шестнадцатеричное) представляет тот же символ.
И (десятичное) представляет кириллическую заглавную букву «I».
水 (шестнадцатеричное) представляет китайский иероглиф «вода».
Примечание. Хотя шестнадцатеричное представление не определено в [ISO8879], оно ожидается в новой версии, как описано в [WEBSGML]. Это соглашение особенно полезно, поскольку стандарты символов обычно используют шестнадцатеричные представления.
Чтобы дать авторам более инициативный способ использования символов, HTML предлагает набор character entity references. Комбинации ссылок на символы используют символические имена, так что авторам не придется запоминать коды. Например, комбинация å обозначает символ «a» нижнего регистра с кружком сверху; «å» легче запомнить, чем å.
HTML 4.0 не определяет character entity reference для каждого символа. Например, для кириллической буквы «I» нет character entity reference. См. полный список ссылок на символы, определенные в HTML 4.0.
Комбинации ссылок на символы учитывают регистр. Так, Å указывает на другой символ (A с кружком верхнего регистра), а не на å (a с кружком нижнего регистра).
Авторы, которые хотят поместить в текст символ «<�», должны использовать ссылку «<» (десятичный код ASCII 60) во избежание возможной путаницы с началом тэга (открывающий разделитель начального тэга). Точно так же следует использовать «>» (десятичный код ASCII 62) вместо «>», чтобы избежать проблем со старыми версиями агентов пользователей, некорректно принимающих их за окончание тэга (закрывающий разделитель тэга).
Авторам следует использовать «&» (десятичный код ASCII 38) вместо «&» во избежание путаницы со ссылками на символы (открывающий разделитель entity reference). Авторам также следует использовать «&» в значениях атрибутов, поскольку ссылки на символы внутри значений атрибута CDATA разрешены.
Некоторые авторы используют character entity reference «» «для кодирования экземпляров двойных кавычек («), поскольку этот символ может использоваться для разделения значений атрибутов.
Возможно, агент пользователя не сможет отобразить все символы в документе, например, из-за отсутствия соответствующего шрифта или если символ имеет значение, которое не может быть выражено во внутренней кодировке агента пользователя и т. д.
Поскольку в этом случае есть несколько вариантов, этот документ не предписывает определенной тактики. В зависимости от применения непечатные символы могут также обрабатываться дополнительной системой отображения, а не самим приложением. В случае более сложного поведения, например, настроенного для определенного сценария или языка, рекомендуем следующее поведение для агентов пользователей:
Примите явно видимый, но незаметный механизм для предупреждения пользователя об отсутствующих ресурсах.
Если отсутствующие символы представляются в другом числовом представлении, используйте шестнадцатеричную (не десятичную) форму, поскольку эта форма используется в стандартах наборов символов.
2. Разработка программного обеспечения
2.1 Предварительные установки
Подавляющее большинство сайтов создаются и поддерживаются для того, чтобы люди и организации, как потенциальные клиенты, увидели их и ознакомились с товарами и услугами, предлагаемыми через эти сайты. Цель таких сайтов — привлечь как больше людей с тем, чтобы они (посетители) оставались как можно дольше и узнавали о владельце и о том, что он предлагает через сайт, как можно больше. В случае бизнес-сайтов, онлайн-магазинов, высоко посещаемый сайт значительно увеличивает продажи и денежный оборот компании.
Но отслеживание маркетинговых кампаний в Интернете немыслимо без точных инструментов анализа. Еще перед тем, как начинать какую-либо рекламную кампанию в Сети, нужно детально ознакомиться с текущей ситуацией сайта, определить все сильные и слабые места, тенденции роста посещаемости, рассчитать процент конвертации посетителей в покупателей, и обработать еще множество статистической информации. В идеале кто-либо в компании должен заниматься только статистикой сайта.
Статистика сайта не должна ограничиваться только информацией по посещаемости сайта, есть еще много других факторов. Для того, чтобы анализировать посещаемость сайта, сначала надо добиться, чтобы она, посещаемость, была. Программа содержит ряд модулей, которые помогают отслеживать рейтинг вашего сайта на поисковых машинах, сравнивать страницы вашего сайта с сайтами конкурентов и выводить общие тенденции достижения высокого рейтинга на них — все это полноценные компоненты статистики и без них вряд ли можно получить полную картину состояния вашего сайта.
Чем больше поисковых машин и ключевых слов выбрано для поиска, тем больше оперативной памяти потребуется для обработки.
Будет запущен Мастер установки программы Site Statistics Setup, который установит программу на вашем компьютере.
На первом шаге программа предупреждает о необходимости закрытия всех других приложений Windows перед началом инсталляции. Нажмите Next > для перехода на следующий шаг.
На втором шаге Вам предлагается ознакомиться с лицензионным соглашением NetPromoter. Нажмите Yes, если Вы согласны с условиями соглашения, и программа продолжит инсталляцию. Если же Вы не согласны с условиями соглашения, нажмите No, и инсталляция программы, после подтверждающего диалога, будет прервана.
На третьем шаге выберите папку, в которую будет инсталлирована программа. По умолчанию программа устанавливается по следующему адресу: C: Program FilesNetPromoterSite Statistics. Если вы желаете изменить путь к папке, где будет установлена программа, нажмите Browse… и укажите путь вручную. Нажмите Next > для перехода на следующий шаг.
На четвертом шаге вам предоставляется возможность изменения названия группы программы в подменю Программы меню Пуск. По умолчанию группа называется NetPromoter/Site Statistics. Нажмите Next > для завершения инсталляции.
Установочная программа выведет сообщение о том, что если у вас нет прав администратора, программа будет работать некорректно. То есть, если у вас заблокирован доступ к системным папкам, некоторые модули программы не смогут работать, вы не сможете зарегистрировать программу и установить MySQL. Если вы уверены, что у вас есть права администратора, нажмите ОК. В противном случае нажмите Cancel и установка будет прервана.
При нажатии ОК программа начнет установку, которая может занять от нескольких секунд до нескольких минут, в зависимости от быстродействия вашего компьютера.
После установки вы получите сообщение о том, что программа была установлена успешно. Нажмите Finish для закрытия Мастера установки.
Установка MySQL
Программа работает только при наличии MySQL сервера на вашем компьютере. Мы рекомендуем устанавливать программу после установки MySQL. Если MySQL не установлен, вы не сможете создать новый профиль или открыть существующий.
Вы можете скачать инсталляционный пакет MySQL Server 4.1.9 с сайта производителя по адресу: http://downloads.mysql.com/
Выберите одну из опций установки MySQL:
Typical — будет установлена наиболее типичная конфигурация (рекомендовано)
Complete — будет установлена полная конфигурация
Custom — вы сами сможете выбрать компоненты, которые будут установлены (для опытных пользователей) При появлении окна с просьбой регистрации или логина в аккаунт MySQL выберите опцию Skip Sign-Up (Пропустить регистрацию).
Проверьте правильность выбранной информации и нажмите Install для начала установки. Подождите пока программа инсталляции установит MySQL.
Конфигурирование MySQL 4.1
После установки MySQL 4.1 вам будет предложено указать конфигурацию MySQL.
После сообщения об успешном создании файла конфигурации нажмите Finish для закрытия мастера настройки.
Профиль — это набор данных в программе, позволяющий работать с одним отдельным сайтом, который определен как сайт по умолчанию для данного профиля. Все модули программы могут работать с одним профилем, и каждый модуль использует данные, заданные при его создании.
Рисунок 2.1 — Установка MySQL
Рисунок 2.2 — Конфигурации MySQL сервера Рисунок 2.3 — Завершение настроек конфигурации MySQL сервера Рисунок 2.4 — Создание нового профиля
2.2 Работа с программой
Задайте название для профиля в поле Имя профиля. В названии профиля можно использовать только латинские буквы и цифры. Использование пробелов и других символов недопустимо. Задайте адрес стартовой страницы вашего сайта в поле Адрес вашего сайта. Задайте адрес вашей электронной почты в поле Электронная почта. Данный адрес будет использоваться программой для отсылки электронных сообщений Планировщика. Укажите имя, которое будет использоваться при отсылке электронных сообщений на ваш адрес в поле Ваше имя.
Рисунок 2.5 — Начало работы с программой После того, как указаны все необходимые для создания профиля данные, нажмите ОК. Теперь вы можете приступать непосредственно к работе над сайтом.
Данная закладка позволяет генерацию и просмотр пяти типов отчетов для модуля Анализатор топ 10.
Позволяет сравнивать статистику вашего сайта со статистикой сайта любого из ваших конкурентов. Выберите сайты, которые вы бы хотели сравнить с вашим ресурсом (главным сайтом профиля) и нажмите кнопку Генерировать. Программа отобразит отчет по распределению ключевого слова на странице сайта профиля и сайта, который вы выбрали для сравнения. Вы можете менять ключевое слово по которому страницы проанализированы, выбрав соответствующий пункт из выпадающего меню Ключевое слово над окном отчета. В самом отчете отобразится следующая информация:
Рисунок 2.6 — Анализ сайта Гистограмма распределения ключевого слова. Всего генерируется две гистограммы — по одной для каждого сравниваемого сайта. См также: Гистограмма распределения ключевых слов.
В Title, В Meta Keywords, В Meta Description — информация о количестве вхождений выбранного ключевого в тэги, находящиеся в секции Head анализируемых страниц.
Всего в Body — информация о количестве вхождений выбранного ключевого слова в секцию Body анализируемых страниц.
В H1 — В Img Alt — информация по вхождению ключевого слова или фразы в основные тэги секции Body анализируемых страниц.
Другие — информация о вхождении ключевого слова или фразы во все остальные тэги, более детальная информация о которых не вошла в отчет.
Отчет содержит две закладки: Статистика и Код. Закладка статистика открывается по умолчанию и предоставляет всю сравнительную статистическую информацию. Переключившись на закладку Код вы можете также просмотреть коды сравниваемых страниц.
Генерирует расширенный отчет по страницам, извлеченным и проанализированным с помощью модуля Экстрактор.
На панели выбора отчета выберите элементы HTML-кода страницы, которые будут проанализированы в отчете.
В поле Поисковые машины выберите поисковые ресурсы, из числа тех, которые были использованы вами при поиске первой десятки результатов по релевантным вашему сайту ключевым словам.
В поле Ключевые слова выберите слова и фразы, по которым вы искали конкурентов.
Программа сгенерирует расширенный отчет в формате HTML, информация в котором будет сгруппирована по поисковой машине, и в который войдут следующие составные:
Отчет для поисковой машины. Отчет предоставляется в форме таблицы, состоящей из следующих столбцов:
№ - номер строки отчета. Каждая строка предоставляет информацию по одному поисковому термину (слову или фразе) Отчет по ключевым словам — список ключевых слов, по которым производился поиск Ваш сайт — позиция, на которой был найден ваш сайт на поисковой машине по данному слову Конкурент (ы) — позиции, на которых был найден сайт ваших конкурентов на поисковой машине по данному слову Количество проанализированных ресурсов — количество проанализированных по заданному слову позиций Анализ топ 10 по ключевому слову. Предоставляет список адресов, найденных по данному ключевому слову.
Позиция сайта на поисковой машине — позиция каждого адреса, найденного на поисковой машине по заданному ключевому слову
URL сайта — полный адрес найденной по данному ключевому слову страницы Категория ресурса — категория найденного сайта. Категория ресурса задается при проверке Цитируемости. Возможны следующие категории: Ваш сайт, Конкурент, или х (для сайтов, для которых категория не была задана).
TITLE — H6 — детальная информация о вхождениях данного ключевого слова в отдельные HTML-тэги на проанализированных страницах. По каждому элементу выводится следующая информация:
Количество вхождений ключевого термина в каждую страницу, найденную по данному термину, среднее значение по анализируемой поисковой машине (только для страниц, которые были проанализированы программой) и стандартное отклонение от нормы по данной машине Частота — процентное соотношение ключевого слова к общему количеству слов на страницы.
Значимость — значимость данного слова в тэге. Если слово находится первым в данном тэге, его значимость — 100%, последним — 0%. Для тэгов, состоящих из не более, чем трех слов, адекватная картина значимости ключевого слова возможна только при анализе всего текста как единой фразы.
Всего — количество всех слов в данном тэге каждой страницы.
Подобным образом будет проанализирован каждое выбранное ключевое слово и каждый выбранный тэг.
Отчет по распределению ключевых слов предоставляет информацию по проанализированным на закладке Статистика страницам, отображенную в форме гистограмм распределения ключевых слов. Отчет генерируется по всем страницам, которые были извлечены модулем Анализатор топ 10 на закладке Экстрактор. Для того, чтобы сгенерировать данный отчет, вам следует предварительно просмотреть отчеты по распределению ключевых слов на закладке Статистика.
В выпадающем меню Ключевое слово вы можете менять слово или фразу, по которой генерируется отчет.
Отчет по цитируемости Данный отчет предоставляет информацию по ссылающимся на ваш сайт или сайты конкурентов / партнеров страницам.
Тип — внешняя или внутренняя для вашего сайта. Показывает, находится ли ссылка на ваш сайт на каком-либо другом сайте, или же это внутренняя страница вашего сайта.
Ссылка — адрес ссылающейся страницы, с которой посетитель перешел на ваш сайт Поисковая машина — машина, на которой данный сайт был найден Статус ссылки — информация о том, на какой сайт данная страница ссылается На закладке Общие вы можете выбрать тип отчета, который вы желаете просмотреть. Вы можете развернуть или свернуть отдельные ветки дерева. кликнув по значку '+' напротив названия ветки. Щелчок правой клавишей мыши по Панели навигации вызывает контекстное меню, с помощью которого вы можете развернуть или свернуть все ветки дерева отчетов.
На закладке Общие доступны следующие отчеты:
Общий отчет — открывает таблицу с общей информацией по анализируемому периоду: дата генерации отчета, количество анализируемых дней, общее количество хитов за анализируемый период, среднее количество хитов за день, общее количество посетителей, среднее количество посетителей за день, количество уникальных посетителей, количество просмотренных страниц, среднее количество просмотренных страниц за день, суммарный объем скачанной информации и средний объем за день.
Общая статистика трафика — предоставляет детальную информацию по посещаемости сайта. В данной ветке отчета вы можете просмотреть статистику посетителей, просмотренных страниц, хитов по периодам:
Визиты за сегодня — предоставляет отчет по текущему дню (дню генерации отчета). Если вы не проанализировали лог файлы или файлы статистики за текущий день, во всех полях таблицы будут нули.
Рисунок 2.6 — Оптимизация страниц. Создание отчетов Последняя неделя — отображает информацию по последней неделе анализируемого периода По дням — отображает статистику по проанализированным дням (хиты, посетители, страницы, объем) По часам — показывает среднюю статистику посещаемости по часам (хиты, посетители, страницы, объем) По дням недели — показывает среднюю статистику посещаемости по дням недели в виде таблицы и графика (среднее количество хитов, посетителей, страницы, и переданный объем) По месяцам — показывает среднюю статистику посещаемости по месяцам (хиты, посетители, страницы, объем) Реферер — чрезвычайно важный для понимания поведения посетителей момент при ведении маркетинговой кампании в Интернете, поскольку он показывает что именно привлекает посетителей, почему они проходят по той или иной ссылке. Если вы платите за размещение вашей ссылки на той или иной площадке, естественно, вы бы хотели иметь точную информацию о активности переходов по данной ссылке на ваш сайт.
Внешние рефереры (страницы) — данный отчет отображает информацию о переходах на ваш сайт со страниц на других сайтах. Отчет содержит следующие колонки:
Реферер (ы) — адреса ссылающихся страниц. Адреса активны, и вы можете открыть страницу в браузере, кликнув по ссылке.
Хиты — отображает количество и процент переходов с данной страницы Посетители — отображает количество уникальных посетителей, перешедших по данной ссылке Страницы — количество запрошенных с данного адреса уникальных страниц Объем — количество загруженной информации (в Kb). См. определение Трафика.
Внутренние рефереры (страницы). Информация реферера передается как при переходе со внешней страницы, так и внутренней. Данный отчет показывает информацию о переходах внутри сайта. Поля таблицы здесь такие же, как и в предыдущем отчете.
Внешние рефереры (хосты). Данный отчет отображает информацию о заходах с других сайтов. Информация здесь сгруппирована по сайту (хосту), с которого были осуществлены заходы вне зависимости от конкретной страницы на сайте. Вы можете просмотреть отдельно все страницы одного сайта, с которых пользователи переходили на ваш сайт. Для этого кликните по ссылке в отчете и программа откроет отдельный отчет по страницам данного ссылающегося сайта.
Внутренние рефереры (хосты). Данный отчет содержит информацию по ссылающимся поддоменам вашего сайта. Например, в доменном имени office.microsoft.com, «office» это поддомен домена microsoft.com. Программа также разделяет ссылающиеся домены с префиксом «www» и без него.
Домены верхнего уровня — отображает статистику заходов с других сайтов, рассортированных по доменам верхнего уровня. См. определение Домен верхнего уровня.
Поисковые машина. Отображает информацию о посетителях, перешедшим на ваш сайт с поисковых машин, ключевым словам и фразам, по которым они нашли ваш сайт, а также информацию о роботах, индексирующим ваш сайт.
Такие сайты, как Yandex, Rambler и Aport позволяют людям находить нужную информацию в Интернете. Ваши потенциальные посетители, а затем, возможно, клиенты также будут искать услуги, предоставляемые вами или вашими конкурентами на этих поисковых сайтах. Это и является основной причиной, по которой вам следует серьезно заняться продвижением вашего сайта на поисковых машинах для достижения успеха в вашем онлайн-бизнесе. Обладая информацией по словам, по которым вас находят посетители, и которые важны для вашего бизнеса, то есть, релевантны, вы можете изменять ваш сайт таким образом, чтобы он поднимался на первые позиции по этим словам. Это положит основу для стабильного приплыва все новых и новых посетителей. Когда пользователь задает поиск по какому-либо слову или фразе на такой поисковой машине, как, например, Яндекс, вся информация о данном слове или фразе передается через URL страницы результатов. Эта информация фиксируется в ваших лог файлах, при условии, что посетитель перешел по ссылке на странице результатов на ваш сайт. Эта бесценная информация и поможет вам сделать заключения по тому, достаточно ли вы используете потенциал, предоставляемый сайту поисковыми машинами и вносить в страницы сайта необходимые изменения, то есть, заниматься его оптимизацией.
Статистика поисковых машин — отображает информацию о поисковой машине, с которой был осуществлен заход, количество хитов с данной машины, количество уникальных посетителей, страниц, и объем скачанной информации. Отчет предоставлен в виде таблицы со статистической информации и круговой диаграммы.
Статистика ключевых слов — отображает информацию о ключевых словах, по которым ваш сайт был найден посетителями на поисковых машинах.
Статистика ключевых фраз — отображает информацию о ключевых фразах, по которым ваш сайт был найден посетителями на поисковых машинах.
Визиты спайдеров — отображает информацию о визитах спайдеров, индексирующих ваш сайт.
Статистика страниц. Данный отчет показывает информацию по успешно запрошенным страницам сайта. Данный отчет предоставляет информацию только по страницам, запросы к изображениям, мультимедийным файлам не отображаются. Данная ветка отчетов содержит отчеты по запрошенным страницам, точкам входа и выхода, страниц с единичным доступом (страниц, которые были запрошены пользователем один раз, после чего он покинул сайт), и путям пользователей по сайту.
Запрошенные страницы — отображает статистику по запрошенным пользователями страницам.
Точки входа — отображает информацию по страницам вашего сайта, через которые пользователи попадают на ваш сайт чаще всего. Отчет по точкам входа позволяет вам получить представление о том, что видят ваши посетители первым, попадая на ваш сайт. Имея информацию об этом, вы можете понять, какое первое впечатление получают ваши посетители, находят ли они нужную информацию сразу. Во многих случаях вы заметите, что стартовая страница вашего сайта не всегда является основной точкой входа для посетителей. Так, пользователи, переходящие на ваш сайт с поисковых машин, скорее всего попадут не на стартовую страницу, а на страницу, наиболее оптимизированную под конкретный запрос.
Обладая такими данными вы сможете, отталкиваясь от них правильно спланировать и оптимизировать эти страницы таким образом, чтобы пользователь был не более, чем в двух щелчках от любой другой страницы сайта (например, разместив прямую ссылку на карту сайта), расставить нужные для достижения цели сайта акценты на наиболее заметных участках. Как показывает опыт, хорошо оптимизированный сайт должен иметь ограниченное количество хорошо спланированных точек входа, содержащих доступные инструкции для пользователей и ссылки на страницы с более детальным описанием предоставляемых товаров и услуг.
Точки выхода — страницы, после просмотра которых пользователь покидает ваш сайт. Точки входа как правило, свидетельствуют о том, что пользователь ищет на сайте.
Если фактические точки выхода не совпадают со страницами, которыми пользователи должны завершать навигацию по сайту (например, страница загрузок, покупок), очевидно вам следует задуматься о редизайне сайта, сделать ссылки на такие страницы более заметными, акцентированными.
Страницы с единичным доступом — данный отчет предоставляет информацию по страницам, на которые пользователи заходят и не продолжают навигацию по сайту, покидают его. Некоторые посетители просматривают только одну страницу сайта, после чего, не заинтересовавшись ничем из предложенного на сайте, или не найдя нужной информации, уходят. Это может свидетельствовать о том, что навигация на сайте спланирована неудачно, и ее стоит переделать.
Пути по сайту — отображает информацию о поведении пользователей на вашем сайте. Информация из этого отчета может быть полезной при анализе планировки сайта, навигации. Также, если вы обнаружите, что большинство пользователей посещают определенную страницу во время визитов на сайт, вы можете разместить на ней баннеры или ссылки на другие, более важные страницы сайта.