Помощь в написании студенческих работ
Антистрессовый сервис

Основные тенденции и проблемы в области разработки и применения информационных технологий

Курс лекцийПомощь в написанииУзнать стоимостьмоей работы

В сети с пакетной коммутацией данные перед передачей разбиваются на части. В результате получается множество отдельных пакетов, или датаграмм, которые доставляются по отдельности через сеть к месту назначения. По прибытии к получателю пакеты повторно собираются в нужном порядке и создают исходное сообщение. В теории пакеты никогда не сбиваются с пути и путешествуют по наикратчайшему маршруту… Читать ещё >

Основные тенденции и проблемы в области разработки и применения информационных технологий (реферат, курсовая, диплом, контрольная)

1.МирОвые информационные ресурсы: классификация и характеристики Информация, также как материя и энергия, — одно из фундаментальных понятий современной науки. В последние десятилетия существенно возросло значение информации и информационных технологий. Информатизация стала явлением глобальным. Автоматизированные системы делопроизводства, телекоммуникации и обработки данных интегрируются в информационные ресурсы, занимающие все более значимое положение в ряду с другими ресурсами предприятия, отрасли, национальной экономики в целом. Управление информационными ресурсами включает организацию данных и управление процессами их обработки. Управленческая функция здесь включает анализ целей и тенденций организации, планирование капиталовложений в информацию, персонал и системы, анализ окупаемости информации, организацию доступа к ней.

Информационный ресурс (ИР) с наиболее общих позиций может быть определен как совокупность накопленной информации, зафиксированной на материальных носителях в любой форме, обеспечивающей ее передачу во времени и пространстве для решения научных, производственных, управленческих и других задач.

В соответствии со сложившимися представлениями под информационными ресурсами в дальнейшем будем подразумевать информационные массивы и базы данных (документов) в машиночитаемой (электронной) форме, рассматриваемые совместно с информационными технологиями или сервисами, придающими им необходимую мобильность.

Собственно документ содержит текст и сведения о его структуре и стиле, а именно:

­ структуру документа — заглавие, параграфы, оглавление и т. п. (логическая структура), а также абзацы, расположение текста, шрифты (физическая структура);

­ архитектуру содержания — набор графических элементов, выделение определенных слоев, строк и т. п.;

­ коммуникативный формат — способы кодирования объектов, признаков и содержания документов.

2. Мировые информационные сети.

2.1 Типы сетей и принципы их работы Сеть — это объединение компьютеров, связанных друг с другом каким-либо способом (например, проводами или по радио), благодаря чему имеется возможность передавать данные между компьютерами, или узлами сети.

Чаще всего с сетями мы сталкиваемся в офисе. Там мы имеем дело с локальной сетью, объединяющей компьютеры, расположенные в одном или соседних зданиях. При переходе от сети небольшого офиса (локальной) к более крупным сетям (глобальным), покрывающим более обширную территорию получают интерсеть — это две и более сетей, объединенных вместе (обычно с помощью маршрутизатора) в одну большую «сеть сетей». Интернет является глобальной сетью, объединяющей множество разнородных локальных компьютерных сетей. Узловые компьютеры этой сети, на которых и хранится в различном виде информация, называются серверами.

Зачем люди создают сети, в частности локальные? Наиболее очевидные причины таковы:

­ Связь (например, электронная почта).

­ Общее использование информации (например, баз данных).

­ Общее использование ресурсов (например, сетевых принтеров) Различают следующие типы сетей: сеть коммутации каналов и сеть с пакетной коммутацией.

Сеть коммутации каналов используется в телефонных системах. Телефонная сеть создаёт канал связи от одной точки к другой, так что можно проследить путь, по которому голос путешествует из одной точки мира в другую. Такие сети имеют ограниченную пропускную способность и очень чувствительны к разрыву линий. Достоинством же такой системы является то, что при осуществлении звонка линия целиком принадлежит только вам, никто другой не может её у вас отнять.

В сети с пакетной коммутацией данные перед передачей разбиваются на части. В результате получается множество отдельных пакетов, или датаграмм, которые доставляются по отдельности через сеть к месту назначения. По прибытии к получателю пакеты повторно собираются в нужном порядке и создают исходное сообщение. В теории пакеты никогда не сбиваются с пути и путешествуют по наикратчайшему маршруту в обход заторов и обрывов. Кроме того, сеть пакетной коммутации может быть очень большой. Большее число пакетов лишь замедлит работу сети, но вы никогда не услышите в ней коротких гудков или сообщения «все каналы заняты». В таких сетях много времени уходит на нумерацию и сортировку пакетов, а также на ожидание подтверждений о получении. Здесь не гарантируется быстрая доставка данных, но сети с коммутацией пакетов устойчивы, просто расширяются и достаточно дешевы. Интернет — это сеть с пакетной коммутацией. Ее отличительной особенностью является высокая надежность. Если выходят из строя некоторые линии связи или компьютеры, то сообщения могут быть переданы по другим каналам, поскольку всегда имеется несколько путей передачи информации.

Правила доступа, представления и передачи данных в сети регламентируются специальными протоколами связи. Протокол — это просто согласованный набор правил выполнения чего-либо. В связи протоколом называют набор правил передачи данных между компьютерными системами. Существуют протоколы транспортного, прикладного, сетевого уровней (каждую функцию выполняет соответствующее программное обеспечение).

2.2 Сетевые протоколы связи Сетевым протоколом называется набор правил, которыми пользуются компьютеры в сети для связи друг с другом. Наиболее распространенными протоколами являются IPX (Internet Packet Exchange компании Novell), AppleTalk компании Apple и протокол TCP/IP (Transmission Control Protocol / Internet Protocol — протокол управления передачей / межсетевой протокол). В Интернете используется протокол TCP/IP.

Таким образом, Интернетом называется объединение сетей всего мира, в котором все компьютеры «разговаривают» на сетевом протоколе TCP/IP, а также основанные на нём и доступные для использования службы (электронная почта, Web и проч.).

Так как Интернет — это сеть с пакетной коммутацией, данные к пользователю могут прийти в любом порядке, могут потеряться по пути и т. д. Протокол TCP/IP занимается решением этих проблем. TCP/IP — это на самом деле группа протоколов, главными из которых являются TCP (Transmission Control Protocol — протокол управления передачей) и IP (Internet Protocol — межсетевой протокол). TCP делает именно то, что обозначает его имя, — управляет передачей данных: отвечает за сборку сообщения, отправку ответов и повторную пересылку данных. Протокол IP отвечает за адрес в Интернете. На его основании определяется, куда надо отправлять пакеты.

2.3 Глобальные сети: калейдоскоп возможностей Как было справедливо замечено еще очень давно, не стоит и пытаться объять необъятное. Это более чем справедливо в отношении компьютерных сетей, масштаб которых уже сейчас трудновообразим. Нигде в мире нет ни единого центра Сети, ни даже списка всех её пользователей и вообще всего, что в ней есть. Сеть — живой организм, она растет и расширяется почти неуправляемо, новообразования в ней возникают (и умирают) явочным порядком, и уследить за всем этим просто невозможно. Посмотрим, какие основные возможности дают нам глобальные сети:

· Электронная почта — это то, ради чего многие и становятся пользователями сети. Быстрая доставка (чтобы достичь даже самого отдаленного адресата, письму обычно требуется не более 5−10 минут), возможность рассылки одного письма многим адресатам, все преимущества компьютерной подготовки и обработки писем, низкая цена и высокая надежность — все эти преимущества превратили электронную почту в нечто большее, чем просто заменитель почты «бумажной». Единственный недостаток — то, что пока еще не у каждого жителя Земли есть свой электронный адрес.

· Телеконференции — замечательный способ общаться с людьми, быть в курсе новостей, распространять рекламу, собирать информацию, отдыхать и развлекаться. Телеконференции представляют собой своеобразную всепланетную стенгазету, куда каждый может вывесить своё собственное обращение, размышление, вопрос, реплику и т. д., равно как и ознакомиться с мнениями других людей (живущих на разных континентах). Существует огромное количество телеконференций на самые разнообразные темы — бизнес, спорт, искусство, развлечения, программирование и многое др.; масштабы варьируются от компании в несколько человек до многотысячных шумных аудиторий, где не так-то просто отфильтровать нужную информацию.

Участие в телеконференции для пользователя с online-доступом сводится к визиту на особый сервер, где он может просматривать списки заголовков свежих статей, читать их и отвечать на заинтересовавшие его сообщения. Удобнее и экономичнее при этом пользоваться специальными программами, позволяющими быстро скачивать с сервера все сообщения из выбранных групп, а просматривать и отвечать на них уже после отключения от сети. Пользователи с почтовым доступом обычно получают сообщения из телеконференций вместе с остальной почтой, хотя для них существует также возможность получать лишь списки заголовков сообщений, заказывая затем отдельно выбранные статьи.

· Списки рассылки. Это еще один способ организовать общение единомышленников в сети, у которого есть важное преимущество: список рассылки может завести любой пользователь самостоятельно, для этого ему не нужно договариваться с узлами, распространяющими телеконференции. Достаточно установить на своем компьютере специальную программу, которая хранит список адресов заинтересованных пользователей — подписчиков — и автоматически рассылает им всем поступающие сообщения.

Организовав (с помощью той же сети) рекламу нового списка рассылки, его хозяин может почивать на лаврах — дальше система функционирует самостоятельно. Заинтересованный пользователь, послав на компьютер, обслуживающий список, письмо со специальной командой становится подписчиком. После этого он будет получать все сообщения, поступающие на адрес списка, и сможет сам публиковать свои статьи, посылая их на этот адрес. Простота создания списков рассылки привела к тому, что их количество очень велико, а число подписчиков в среднем в списке весьма незначительно (редко превышает 100 человек). Зато темы, которым посвящены списки рассылки, поражают своим разнообразием, а подчас и экзотичностью.

· WWW (World Wide Web — «Всемирная паутина», часто называемая просто Web) — пожалуй, самое интересное и многообещающее средство организации сетевых информационных ресурсов. Эта система объединяет все Web-серверы сети. Хранящиеся на Web-узлах документы называются Web-страницами. В настоящее время они являются основным и наиболее распространенным типом информационных ресурсов в Интернет. Для многих сам термин «WWW» (или «Web») уже является синонимом слова «Интернет».

WWW строится на основе гипертекстового представления информации. Стандарты, на которых строится WWW, состоят из двух основных частей: одна часть устанавливает особый протокол, по которому Web-серверы выдают хранящиеся на них Web-страницы пользователям, а вторая заведует оформлением этих документов, позволяя связывать их с иллюстрациями и друг с другом с помощью гипертекстовых ссылок. WWW-документ может содержать ссылки (как бы «протягивать ниточки" — отсюда и «паутина» в названии) на любые ресурсы, доступные в сети, — чаще всего на другие Web-страницы, которые физически могут располагаться в любой точке планеты.

Пользователь работает с WWW, как правило, в графической операционной системе с помощью особой программы-браузера (англ. browser). Получив WWW-документ с сервера, браузер выводит его на экран в готовом оформленном виде, расставляет по своим местам иллюстрации, по желанию пользователя воспроизводит звуковые и видеофрагменты, а главное — оживляет гипертекстовые ссылки в этом документе, сводя процедуру запроса новой страницы с сервера к щелчку мышью по соответствующей ссылке (которая может быть представлена в документе как словом или фразой, так и изображением).

Дружественный и интуитивно ясный интерфейс WWW, его захватывающая интерактивность и богатые изобразительные возможности WWW-документов произвели настоящий переворот в Интернете, превратив его из средства общения ученых и развлечения студентов в один из основных инструментов современного бизнеса и в средство массовой информации, образования и развлечения.

· Файловые серверы и базы данных.

Многие крупные узлы сети являются в то же время и файловыми серверами, т. е. хранилищами разнообразных файлов (программ, текстов, графики), дающими возможность любому желающему искать, просматривать и получать эти файлы через сеть. Кроме того, многие организации — коммерческие фирмы, библиотеки, университеты, государственные учреждения — устраивают на своих узлах сети общедоступные базы данных по соответствующей тематике. Чаще всего эта информация предоставляется в режиме online через интерфейс WWW (для пользователей с почтовым подключением существуют обходные пути получения такой информации — «ftpmail-серверы»). Информационный взрыв в самом WWW привел к появлению особых поисковых серверов — автоматических программ, которые скачивают и заносят в одну большую базу данных содержимое всех документов, до которых они могут добраться на WWW, а затем позволяют всем желающим осуществлять поиск в этой базе по ключевым словам. Поскольку сейчас практически любые ресурсы обязательно имеют WWW-интерфейс, такие поисковые системы являются, безусловно, самым эффективным инструментом для нахождения практически любой информации.

· Выход на другие средства связи. Многие из связанных друг с другом сетей предоставляют доступ и к другим средствам связи: телефаксу, телексу, телеграфу, пейджинговой связи и даже обычной (бумажной) почте — и всё это не вставая из-за компьютера!

Конечно, послать факс напрямую часто быстрее, но если ваш адресат находится на другом конце планеты, следует воспользоваться услугами особых «шлюзов» — узлов сети, принимающих письма по электронной почте и отправляющих их факсом на заказанный номер. На этом же шлюзе вы можете завести свой почтовый ящик, и приходящие на ваше имя факсы также будут переправляться вам по электронной почте. Фирма берет на себя все заботы по дозвону, качеству связи и т. п. Точно так же, с помощью особых шлюзов, можно отправлять из сети телеграммы и обычные письма.

Технологии Интернета вторгаются и в такие традиционные области, как телефония и телевидение. Пропускная способность модемов уже позволяет передавать приличного качества звук, закодированный потоком байтов. Достаточно написать программу, которая будет кодировать и отправлять по каналам Интернета ваш голос с подключенного к компьютеру микрофона — и вы получите полный аналог обычного телефона, позволяющий переговариваться с пользователем Интернета в любой точке мира, платя не больше, чем вы обычно платите за свой online-доступ (что во много десятков раз дешевле любого международного разговора). Появились компании, обеспечивающие связь по этой технологии с жителями крупных городов — причем даже с теми, кто не имеет никакого отношения к Интернету, а имеет лишь телефонный номер. При этом «международная» часть маршрута звонка идет через Интернет, а достигнув узла сети в городе назначения, звук с помощью специального устройства транслируется на нужный номер уже по местной телефонной сети. Этой же технологией пользуются Интернет-радиостанции, чьи передачи может слушать любой пользователь с достаточно скоростным подключением к сети.

Те, кто подключен к Интернету не через модем, а через каналы с большей пропускной способностью, могут обмениваться в реальном времени не только звуком, но и изображением (видеотелефон, видеоконференции). Иной вариант объединения возможностей WWW и телевидения — устройство, получившее название «WebTV». Эта приставка к телевизору состоит из модема, микропроцессора и небольшого количества памяти, в которой записана программа-браузер. Подключив это устройство к телефонной розетке и договорившись с фирмой-провайдером о доступе к Интернету, вы получите возможность читать Web-страницы прямо на экране своего телевизора, выбирая гипертекстовые ссылки с помощью пульта дистанционного управления.

3. Как устроен интернет.

3.1 Классификация информационных ресурсов, доступных пользователю Интернета Огромное количество разнообразных информационных ресурсов, доступных пользователю Интернета, можно подразделить на следующие классы:

­ «Всемирная паутина» WWW.

­ Электронная почта.

­ Система телеконференций (в Интернете она называется Usenet).

­ Хранилища файлов, расположенные на узлах сети (практически все они бесплатны).

­ Различные базы данных и системы поиска информации, такие как Archie и полнотекстовые поисковые системы по содержимому WWW и Usenet.

­ Инструменты выхода на другие средства связи — факсовые, телеграфные, «бумажные» и прочие шлюзы. Весьма практичная (и потому чаще всего платная) возможность.

К сожалению, равноправия всех пользователей Интернета по отношению к этим возможностям нет. Если электронная почта и система телеконференций доступны практически каждому, имеющему лишь почтовый адрес в сети, то для работы с библиотеками файлов и поисковыми системами желательно более сложное и дорогое прямое подключение.

3.2 Службы поиска и передачи информации в Интернет: FTP, Gopher, Web.

Все файлы на всех компьютерах в Интернете представляют вместе некое пространство документов. Как же в нем найти нужную информацию и заполучить её? В Интернете с помощью специальных инструментов или служб ведется поиск, а затем — извлечение информации из какой-либо удаленной системы.

Для извлечения информации вы пользуетесь программой, которая находится на вашем локальном компьютере и называется клиентом. Для того, чтобы получить информацию, программа-клиент связывается с удаленной системой, называемой сервером. Программа-клиент запрашивает документ у удаленного сервера, который в ответ выдает клиенту запрашиваемый документ, а тот, в свою очередь, выводит его на экран. Это взаимодействие называется технологией клиент — сервер. Она является основой большинства, если не всех, служб, работающих в Интернете.

Преимущество архитектуры клиент-сервер в том, что вычислительная нагрузка распределяется между клиентской машиной — вашим компьютером — и удаленным сервером. Это разделение так важно потому, что позволяет серверу общаться с множеством различных типов клиентов. Например, сервер на основе ОС Windows с легкостью может выдавать информацию программе-клиенту, работающей на Macintosh (и наоборот). Кроме того, архитектура клиент-сервер очень легко масштабируется, т.к. пользователи не связаны с какой-либо одной неизменной системой. (Для сравнения: в более ранней хостовой модели вычислений несколько терминалов подключались к одному суперкомпьютеру).

На протяжении нескольких лет сменилось несколько схем извлечения информации из Интернета.

Первое поколение: FTP (File Transfer Protocol — протокол передачи файлов). FTP — программа позволяет пользователю подключиться к удаленной системе, а затем обменяться с ней файлами. Несмотря на свою эффективность, FTP-программа требовала от пользователей знать в точности, какой именно файл им был нужен. С течением времени появились более удобные FTP-клиенты с графическими простыми интерфейсами, но сам протокол по-прежнему не позволял вести просмотр информации. В связи с тем, что с помощью FTP-программ не так-то просто найти нужный файл, была изобретена служба под названием Archi, позволяющая по ключевым словам найти нужный файл, который затем можно было забрать с помощью FTP. В теории все файлы, которые можно переписать с помощью FTP называются ftp-пространством.

Второе поколение: Gopher связано с появлением системы просмотра информации в виде иерархических меню, которая называлась Gopher. Она была разработана в университете штата Минессота как информационная система для студенческого городка. А названа она была в честь университетского талисмана («gopher» с английского «суслик»). В 1991;93 гг. наступил расцвет Gopher. В этой системе используется интерфейс в виде меню, с помощью которого можно получить доступ к огромному количеству преимущественно текстовой информации. Перемещение по gopher-пространству осуществлялось путём выбора нужного пункта меню.

Gopher преодолел многие недостатки FTP, предоставив пользователям возможность просматривать большие архивы информации. Но по мере увеличения содержимого в Интернете работа с меню становилась всё труднее. В связи с этим была изобретена программа поиска по gopher-системам, которую в шутку над системой Archie назвали Veronica. Система Veronica позволяет вести поиск gopher-документов по названию или ключевым словам. Доступ к ней осуществляется через то же меню Gopher, которое в отличие от Archie, представляет совершенно независимую от FTP систему. Простая линейная (иерархическая) природа Gopher и отсутствие удовлетворительной поддержки мультимедиа обрекло данную систему на сравнительно короткий период существования.

Третье поколение: Web появилась примерно в то же время, что и Gopher. Здесь был реализован метод организации информации в Интернет в виде собрания связанных друг с другом документов, названных гипертекстом или гипермедиа. С помощью Web-браузера, например Mosaic, Netscape Navigator или Internet Explorer пользователи Интернета могли просматривать большие объёмы гипертекста и другой информации нелинейным способом. Web и его интерфейс обладали большей простотой и богатством средств выражения. Популярность Web росла с неимоверной быстротой. В отличие от FTP и Gopher, в Web есть множество каталогов и средств поиска. В их число входят службы Lycos, HotBot, AltaVista, Yahoo и десятки других. Что же отличает Web от других информационных систем Интернета? Ответ: гипермедиа.

3.3 Гипертекст и гипермедиа. Сборник документов WWW.

Традиционное представление текста в виде книги обычно называется последовательным, или линейным, потому что существует порядок, в котором надо читать текст: вторая страница идет после первой. В данном методе представления информации есть множество преимуществ. Он строится на логической упорядоченности материала. Тем не менее, для работы с большими объёмами информации этот метод не подходит.

Существуют различные механизмы, которые могут ускорить поиск нужных сведений в документах. Например, в книге для быстрого перехода к нужной информации используются указатели, содержание и заголовки разделов. Указатель прокладывает путь от идеи к конкретной странице в документе, где она излагается. Ссылки и сноски в тексте могут указывать на другие части документа, имеющие отношение к данному контексту. Непоследовательный способ доступа к информации посредством ссылок, сносок и указателей используется для работы с большими объёмами информации и для её организации. Именно здесь и приходит на помощь гипертекст.

Гипертекстовый документ-это электронный документ, содержащий ссылки на другие документы, которые выступают как бы в роли сносок. Например, гипертекстовый документ о коровах может содержать ссылку в слове «молоко», которая, если последовать за ней, приведет вас к другому документу, рассказывающему о типах молока. Гипертекст — это нелинейный метод доступа к информации. Многие находят, что данный способ чем-то похож на то, как люди решают свои проблемы.

Гипермедиа — это то же, что и гипертекст, только с более широкими мультимедийными возможностями, например использованием звука и графики. Гипермедиа-документ о коровах, скажем, содержал бы рисунки коров, кнопки, нажав которые можно было бы услышать мычание, а также обычные ссылки, ведущие к другим документам о коровах. Большинство людей знакомы с гипермедиа по компакт-дискам, на которых распространяются электронные энциклопедии. Хотя здесь и есть сходство с Web, но пользователь, путешествуя по ссылкам, ограничен рамками компакт-диска. У Web есть главное преимущество: объём содержащегося в нем материала практически безграничен.

Определение: World Wide Web — это сборник гипертекстовых / гипермедиа-документов, которые расположены на серверах по всему Интернету. Документы, расположенные на этих Web-серверах, содержат указатели, которые связывают данные документы друг с другом. Все эти документы вместе образуют единое Web-пространство.

3.4 Язык разметки HTML, его роль в Web.

HTML (Hypertext Mackup Language) — язык разметки гипертекста, который используется для создания Web-страниц. HTML — всего лишь инструмент, с помощью которого выполняется главная задача — публикация и распространение информации в электронном виде через Интернет Информацией может быть любое сообщение, которое вы желаете передать другому человеку, и оно не обязательно должно быть в форме текста, но и в виде изображений, звуков, видеоролика или в любой другой форме.

HTML — лишь часть огромной системы, используемой для передачи Web-страниц. Web включает в себя страницы, созданные с помощью специальных технологий, например HTML, программы, аппаратное обеспечение, Интернет и всё с ним связанное, а также броузеры, которые выводят страницы на экран. Власть создателя Web-документов распространяется только на структуру его страницы. То, с какой скоростью она будет загружаться и как выглядеть на экране компьютера конечного пользователя, зависит от времени и от используемого броузера. В этом заключается самая большая трудность издательского дела в Web.

3.5 Браузеры-программы просмотра WWW-документов Для доступа к Web необходим Web-браузер. Это клиентская программа, с помощью которой просматриваются Web-страницы. В настоящее время существует много различных браузеров под десятки операционных систем. Несмотря на это, на рынке доминируют Internet Explorer компании Microsoft и Navigator/Communicator компании Netscape.(последние новости о браузерах находятся по адресу www.browserwatch.com или www.browsers.com).

Принцип работы Web-браузера очень прост. Вспомните принцип клиент-сервер. Web-браузер — это клиентская программа, которая расположена на компьютере пользователя. Web-сервер — это система, которая отвечает на запросы клиента и выдает ему различные страницы с информацией.

На первом этапе пользователь запрашивает документы у Web-сервера путем ввода адреса документа в виде унифицированного указателя ресурса (uniform resource locator-URL). URL — это адрес объекта. Он указывает, где расположен объект, как его надо передавать и каким образом задействовать. После того, как было указано, какой документ нужно получить, необходимо определить, где он находится. Для этого браузер обращается к списку доменных имён. Доменным именем называется символьное имя компьютера-узла сети. В то время как символьные имена компьютеров предназначены для облегчения пользователем запоминания адресов и задания ссылок на них, истинным адресом Web-сервера является числовой IP-адрес. Каждый сервер, доступный в сети Интернет, имеет свой уникальный IP-адрес, по которому к нему можно подключиться с помощью протокола TCP/IP. IP-адрес представляет собой последовательность из четырех чисел в диапазоне от 0 до 255, разделенных точками (например, 213.6.17.34). IP-адрес имеют все серверы, а вот символьное имя есть не у всех. Перевод имени в цифровое значение или цифрового значения в имя называется трансляцией адреса.

При наборе адреса в браузере за преобразование имени в цифровое значение отвечает сервер доменных имен. На выполнение этой операции уходит некоторое время. Она вообще может закончиться неудачей, если машина вышла из строя, программа преобразования зависла или в наборе адреса была допущена ошибка. Если всё пройдет успешно, будет найдена машина, к которой направится запрос о документе.

После того, как нужная машина обнаружена, ей направляется запрос. Общение между Web-браузером и сервером идет с помощью протокола HTTP (HyperText Transfer Protocol). Протоколом передачи гипертекста (HTTP) называется язык, на котором пользовательская программа разговаривает с сервером, а также формат ответов, которые выдает сервер. Протокол HTTP — протокол уровня приложений. Он определяет, как клиент должен запрашивать данные у Web-сервера и как сервер должен их выдавать. Протокол HTTP не определяет, как данные должны передаваться по сети; это относится к ведению низкоуровневых транспортных протоколов типа TCP. HTTP — очень простой протокол. Запрос (например, http://www.ucsd.edu), набранный в окне браузера, преобразовывается в запрос HTTP, который выглядит так: «GET /HTTP/1.0» Это означает следующее: «Выдать документ из корневого каталога с помощью протокола HTTP версии 1.0». В результате будет выдан определённый по умолчанию документ из указанного места на сервере. Если у сервера запрашивается документ первого уровня, то в результате будет получена так называемая «домашняя страница» узла.

После того как запрос в формате HTTP будет передан Web-серверу, тот разбирает запрос и определяет, правильно ли он составлен. В отношении запроса могут действовать некоторые ограничения. Поступил ли запрос от адреса, с которым серверу «разрешено» разговаривать? Правильно ли оформлен запрос? Существует ли вообще запрашиваемый файл? Если что-то не так, сервер выводит сообщение об ошибке. Если запрос прошел все проверки, сервер пытается выполнить его и ищет требуемый файл, а затем отправляет результат обратно. К результату добавляется заголовок, описывающий характер передаваемых данных. Сервер отправляет браузеру не только запрошенную информацию. Кроме неё он добавляет информацию о статусе запроса, время его обработки, тип возвращаемых данных и так далее. Самое важное в этой дополнительной информации — заголовок. Он оформляется в виде MIME-заголовка и указывает тип данных, содержащихся в документе. Например, когда Web-сервер отправляет клиенту HTML-данные, в MIME-заголовке прописывается тип text/html. Браузер видит MIME-заголовок подобного типа и рассматривает полученные данные как HTML — файл. Браузер просматривает MIME-заголовок в поступающих данных и определяет, что с ними нужно делать, при помощи своей таблицы, где перечислены MIME-типы и соответствующие им действия.

В случае с Web-страницей, написанной на языке HTML, браузер читает полученную информацию, а затем выводит страницу на экран. При получении других данных, например видеофайла, для просмотра запускается вспомогательная программа либо подключаемый модуль plug-in. После прочтения полученных данных браузер может обнаружить, что ему требуется запросить у Web-сервера дополнительную информацию, например изображения. В таком случае процесс повторяется, хотя первые его этапы будут выполняться уже быстрее, так как местоположение сервера уже было определено раньше.

Если коротко описать этот процесс, то в Web используется модель клиент-сервер. Браузер (клиент) запрашивает страницы у Web-сервера по сети. Обработка запроса ведется с помощью протокола HTTP, сама передача данных выполняется с помощью протокола TCP/IP. Указатели на запрашиваемые объекты пишутся в форме унифицированных указателей ресурсов (URL), которые в значительной степени используют службу доменных имен. После обработки запроса требуемая информация передаётся вместе с индикатором MIME-типа, чтобы браузер знал, как ему обработать полученные данные. Большинство страниц создаются с помощью языка разметки HTML, а MIME позволяет использовать для этого и другие технологии.

3.6 Система адресации в сети Интернет Чтобы отыскать какой-либо объект в Интернете, необходимо знать его адрес, а затем подключиться к тому компьютеру, где этот объект находится. Пользователь запрашивает документы у Web-сервера путем ввода адреса документа в виде URL. URL — унифицированный способ обозначения объекта или услуги в Интернете. Основная структура URL показана ниже:

Протокол://адрес узла/каталог/имя файла Рассмотрим каждую часть URL в отдельности.

Адрес узла. Каждый компьютер в Интернете имеет уникальный цифровой адрес, который называется адрес IP. Адрес IP может выглядеть, например, так: 192.102.249.3. Он принадлежит мощной машине, стоящей у крупного провайдера в г. Сан-Диего. Адрес IP присваивается машине для того, чтобы к ней можно было направить информацию. Компьютерам и маршрутизаторам, конечно, проще оперировать цифровыми значениями, в том числе адресами IP, а вот людям запомнить эти числа значительно труднее. В связи с этим компьютерам присваиваются буквенно-цифровые адреса, которые называются доменными именами. Доменное имя может выглядеть, например, так: www.ucsd.edu. Запомнить доменное имя проще, чем адреса IP, и оно всегда несет какой-то смысл. В данном случае www — это название машины, которая предоставляет услуги Web, UCSD — университет в г. Сан-Диего, а edu обозначает, что это образовательное учреждение.

В Интернете полное доменное имя состоит из имени машины и имени домена. Имя машины может быть любым. Имена серверов с Web-документами обычно начинаются с префикса www. Тем не менее в локальных сетях часто встречаются машины с именами их владельцев или вообще с экзотическими названиями (например dell-p6−200-a12).

Другая часть адреса узла — имя домена — составляется достаточно просто. В США имя домена состоит из названия домена или организации и типа домена, разделенных точкой. Например, sun.com. Домен «sun» принадлежит компании Sun Microsystem. Он существует в зоне коммерческих узлов, т.к. Sun-коммерческая фирма. Поэтому имя заканчивается типом «com». В США большинство доменов обозначаются тремя буквами и характеризуют, к какому виду относится организация, владеющая сервером (см. табл.5).

Доменное пространство за пределами США организовано несколько сложнее. Полное доменное имя, включая код страны, пишется следующим образом:

Имя машины. доменное имя. тип домена. код страны Табл. 5. Типы доменов, используемые в США на момент 1997 года.

Тип домена.

Описание домена.

Пример

Com.

Коммерческие структуры и предприниматели.

apple.com.

Net.

Сети и сетевые провайдеры.

cerf.net.

Org.

Некоммерческие и прочие организации.

greenpeace.org.

Edu.

Колледжи и университеты.

ucla.edu.

Gov.

Правительственные учреждения США.

whitehouse.gov.

Mil.

Военные учреждения федерального правительства США.

nosc.mil.

us.

Используется различными организациями и лицами, включая школы, библиотеки, городские и окружные правительства.

co.san-diego.ca.us.

Идентификаторы зон, расположенных за пределами США, состоят из двухбуквенного кода, обозначающего страну, в которой находится сервер. Некоторые из них приведены в таблице 6. Внутри каждой страны организации, выдающие имена, сами решают, какие типы доменов создавать. Эти типы могут не совпадать с используемыми в США. Например, имя www.sony.co.jp -указывает на Web-сервер компании Sony, расположенной в коммерческой зоне (co) Японии (jp). В данном случае для обозначения коммерческой структуры вместо com используется co. В Великобритании образовательные учреждения помещаются в домен ac. Например, адрес Web-серверов Оксфордского университета выглядит так: www.oх.ac.uk, где для обозначения образовательного учреждения используется ac, а не edu, как в США. Один из доменов самого верхнего уровня, int, зарезервирован для организаций, созданных международными соглашениями между правительствами различных государств, например Европейский Союз (eu.int).

Табл.6 Национальные домены.

Зона.

Обозначение.

uk.

Великобритания.

de.

Германия.

ca.

Канада.

ru.

Россия.

su.

Страны бывшего СССР.

us.

США.

jp.

Япония.

По буквенным именам людям легче обращаться к серверам Интернета. Настоящим адресом сервера является цифровой IP-адрес. Преобразованием буквенного имени сервера в его IP-адрес занимается служба, которая называется системой доменных имен (Domain Name System-DNS). Она выполняет преобразование автоматически. От доменных имен и от надежности службы доменных имен зависит работоспособность Web. Если сервер доменных имен недоступен, вы не получите доступ и к Web-серверу. Более подробная информация о машинах и доменных именах расположена на Web-узлах http://www.iahc.org/; http://rs.internic.net/ rs.internic.html или http://www.isi.edu/div7/iana/ .

После того, как машина была найдена по доменному имени или по адресу IP, необходимо указать точно каталог на машине, где находится нужный ресурс.

Имя файла. Оно, как правило, состоит из двух частей — имени и стандартного расширения, разделяемых точкой. Файлам могут присваиваться любые имена, главное, чтобы они соответствовали правилам операционной системы, на которой работает сервер. Специальные символы типа пробелов, двоеточий и черт могут сослужить плохую службу, если их использовать в именах файлов, доступных через Web. Файл с именем test:1.htm может вызвать проблемы у систем Macintosh, а test/1.htm — вообще недопустимое имя для Macintosh, и вызовет проблемы у PC и UNIX-машин. Для Web очень важно расширение файла, так как порой только по нему можно определить тип информации, хранящейся в файле. Например, файл с исходным кодом HTML имеет расширение html или htm, а изображения в формате JPEG имеют расширение jpg. Web-сервер считывает расширение и на основании его определяет, какой заголовок надо отправить вместе с файлом браузеру. Если расширение отсутствует или поставлено неправильно, файл может быть неправильно интерпретирован. Когда браузеры читают файлы напрямую, они также обращают внимание на его расширение, определяя по нему, что нужно делать с файлом. Если расширение отсутствует или поставлено неправильно, файл наверняка не будет выведен в Web-браузере. В целях обеспечения большей совместимости следует избегать использования в именах файлов пробелов, заглавных букв и специальных символов. Авторы и пользователи должны обращать особое внимание на регистр букв в именах файлов и каталогов.

Протокол. Казалось бы, для того, чтобы открыть документ на сервере, ничего не нужно, кроме имени сервера, каталога и имени файла. Но отсутствует один компонент — протокол. В Интернете имеется стандартный набор ресурсов, каждый из которых связан с определенным протоколом. Например, протокол, на котором основан Web, называется протокол передачи гипертекста (hypertext transfer protocol — HTTP). После того, как вы щелкнете по гиперссылке в Web-документе, браузер с помощью протокола HTTP связывается с Web-сервером и забирает у него указанный документ. Следует отметить, что протокол HTTP лишь определяет, как должны вестись переговоры между сервером и браузером для получения файла. Сама передача файлов обычно выполняется сетевым протоколом более низкого уровня, например TCP.

Для авторов HTML-страниц могут также быть полезными другие важные, но реже используемые протоколы. Они также могут вызываться с помощью гиперссылок. Вот некоторые из них:

File.

Позволяет с помощью гиперссылки получить доступ к файлу в локальной файловой системе.

ftp.

Позволяет с помощью ссылки переписать файлы с удаленной системы.

Gopher.

Позволяет с помощью гиперссылки получить доступ к gopher-cерверу.

mailto.

Вызывает протокол SMTP (simple mail transport protocol — простой протокол передачи почты). Этот протокол Интернета позволяет с помощью гиперссылки отправлять электронное сообщение.

nntp.

Позволяет с помощью ссылки получать доступ к сообщению групп новостей USENET.

News.

Позволяет с помощью ссылки получать доступ к группе новостей USENET.

telnet.

Позволяет с помощью ссылки открывать сеанс программы telnet и связываться с удаленным компьютером.

Кроме протокола, названия сервера, каталога и имени файла, в URL часто включают имя пользователя и пароль, а также номер порта и иногда указатель на фрагмент. Некоторые URL, например mailto, могут выглядеть совершенно по-другому: вместо названия сервера или имени файла в нем указывается адрес электронной почты.

Теперь рассмотрим формулу создания URL и несколько примеров.

ФОРМУЛА URL. Все URL строятся с использованием следующего синтаксиса: <�имя протокола>:<�описание ресурса>. При этом каждый протокол накладывает свою специфику в описание ресурса.

Протокол HTTP. Минимальный URL для протокола HTTP указывает только имя сервера. Минимальная формула используется в качестве адреса фирмы для помещения в рекламе.

Формула: http://<�сервер>/.

Пример: http://www.company.com/.

Минимальный URL обращается к корневому каталогу Web-узла. Даже если завершающая косая черта не используется, она предполагается и добавляется либо программой-клиентом, либо самим Web-сервером. По умолчанию при обращении к каталогу сервер выдает файл, называемый индексным. Подобный файл имеет имя index. htm или default.htm. Это всего лишь традиция. Администраторы Web-серверов могут менять имя индексного файла по своему усмотрению.

Приведенная ниже формула URL служит для запроса определенного HTML-файла, который, как предполагается, находится в корневом каталоге Web-сервера.

Формула: http://<�сервер>/<�файл>

Пример: http://www.company.com/hello.htm.

В следующем примере добавляется еще один каталог без указания конкретного файла. В конце адреса должна стоять косая черта, несмотря на то, что Web-сервер будет подразумевать ее. В данном примере Web-сервер обратится к указанному каталогу и выведет индексный файл, расположенный в нем.

Формула: http://<�сервер>/<�каталог>/.

Пример: http://www.company.com/products/.

URL с указанием и каталога и файла:

Формула: http://<�сервер>/<�каталог>/<�файл>

Пример: http://www.company.com/products/profile.htm.

В некоторых системах, например в UNIX, Web-сервер может поддерживать несколько каталогов, каждый из которых принадлежит определенному пользователю. Вместо того, чтобы набирать полный путь к корневому каталогу пользователя, достаточно набрать символ ~, имя пользователя в системе и косую черту. Любой каталог или файл, следующий далее, будет искаться относительно корневого каталога пользователя.

Формула: http://<�сервер>/~<�пользователь>/.

Пример: http://www.company.com/~jsmith/.

URL может ссылаться на помеченный фрагмент, расположенный внутри HTML-документа. Он называется меткой или поименованной ссылкой. Для обращения к ней нужно после имени документа поставить знак «#», а затем ввести имя метки.

Формула: http://<�сервер>/<�каталог>/<�файл>#метка Пример: http://www.company.com/products/profile.htm#enter1.

С помощью URL протокола HTTP можно сформировать запрос на получение файлов других типов. Например, на запрос http://www.company.com/images/logo.gif сервером будет выдан файл изображения в формате GIF, а не HTML-файл. Гибкость Web-серверов и URL часто недооценивается. Многие считают, что все документы в Web должны быть в HTML-формате, чтобы их можно было друг с другом связывать.

URL протокола HTTP может даже ссылаться на программы на сервере и выполнять их. Эти программы, выполняемые на сервере, называются, как правило, CGI-программами (Common Gateway Iinterface — общий шлюзовой интерфейс). Они получили такое название по стандарту интерфейса, определяющему, как данные передаются в программу и принимаются из нее. Очень часто программы на сервере используются для доступа к базам данных. В ответ на запрос пользователя после обработки данных генерируется HTML-документ, являющийся результатом обработки запроса. Параметры, передаваемые таким программам, можно непосредственно указывать в URL: после URL ставится знак вопроса и далее строки с параметрами. Так как в запросе пользователя могут встречаться специальные символы, они при генерировании URL кодируются. Формула кода для специального символа выглядит так: знак %, и следом две шестнадцатиричные цифры, соответствующие символу в таблице ASCII. Например, символ пробела заменяется на код %20.

Формула: http://<�сервер>/<�каталог>/<�файл>?<�параметры>

Пример: http://www.company.com/products/search.cgi?cost=400.00.

Создание сложных URL с кодами и строками запроса реально редко выполняется в ручную. Обычно броузер автоматически генерирует строку запроса, основываясь на данных, введенных в форму. Более подробно о формах и о связи HTML с программами мы поговорим в модуле 2.

Наконец, запрос протокола HTTP может быть направлен в порт, отличный от принятого по умолчанию (порт 80). В таком случае после имени сервера ставится двоеточие и номер порта.

Формула: http://<�сервер>:<�номер порта>/<�каталог>/<�файл>

Пример: http://www.bigcompany.com:8080/products/greetings.htm.

В проведенном выше примере URL ссылается на Web-сервер, который работает с портом 8080. Администраторы могут перевести Web-сервер на любой не зарезервированный стандартами порт. Тем не менее, назначение нестандартных номеров портов на серверах не рекомендуется, т.к. если номер порта не будет указан пользователем в URL, доступ к серверу будет невозможен.

Есть еще одна разновидность протокола HTTP, которая предназначена для безопасной передачи информации с помощью функции SSL (Secure Sockets Layer). В данном случае протокол будет называться HTTPS, а номер порта — 443. Пример формулы URL безопасного HTTP представлен ниже. Отличия заключаются в дополнительной букве «s» и другом номере порта.

Формула: https://<�сервер>:<�номер порта>/<�каталог>/<�файл>

Пример: https://www.wellsfargo.com.

URL для протокола HTTP, указывающие на Web-страницы, распространены гораздо больше, чем все остальные URL. Но пользователи могут встретиться и с другими формулами URL для других протоколов обмена данными.

Протокол File. Этот протокол указывает на файл, расположенный на удаленном или локальном компьютере. Он не указывает протокол доступа к файлу, и его возможности ограничены, за исключением одного важного случая. С его помощью браузером можно просматривать файлы, расположенные на локальном компьютере пользователя — это важная возможность для разработчиков Web-страниц. Имя сервера в данном случае опускается или заменяется на служебное слово localhost. Далее указывается имя локального каталога и имя файла. (Третья наклонная косая черта добавляется, если ссылка делается на файл, расположенный на локальном диске).

Формула: file://<�сервер>/<�каталог>/<�файл>

Пример: file:///dev/web/testpage.htm.

В некоторых случаях явно указывается имя текущего диска и путь к файлу. Так на PC URL выглядит так: file://\pc1CNetlog.txt — открывается файл на диске С в локальной сети pc1.

Протокол FTP. Этот протокол служит для получения файла с сервера, и он предшествовал протоколу HTTP. В общем, он не предназначен для того, чтобы переданный файл был сразу выведен на экран. Он служит просто для переноса файла с удаленной системы на локальную. Однако с помощью броузера такие файлы могут быть сразу просмотрены. В настоящее время протокол FTP из-за своей эффективности наиболее широко используется для передачи файлов больших размеров, например программ. URL протокола FTP выглядит так же, как и URL протокола HTTP:

Формула: ftp://<�сервер>:<�номер порта>/<�каталог>/<�файл>

В минимальном варианте записи URL для протокола FTP указывается только имя сервера, в результате чего выдается список файлов в корневом каталоге: ftp://ftp.company.com. Однако чаще всего URL для протокола FTP используется для доступа к конкретному файлу в архиве с указанием его имени и имени каталога, как показано ниже:

Формула: ftp://<�сервер>/<�каталог>/<�файл>

Пример: ftp://ftp.company.com/info/somefile.exe.

Протокол FTP использует службы идентификации. Каждый корректный FTP-запрос требует определенной регистрации пользователя на сервере, откуда будет передаваться файл. На практике многие FTP-ресурсы предназначены для общего доступа, поэтому было бы непрактично создавать для каждого пользователя уникальную учетную запись. В правилах протокола FTP для этого случая существует учетная запись anonymous. Любой пользователь, набрав имя «anonymous» или «ftp» получает доступ к любому общему ресурсу на сервере. Имя «anonymous» подразумевается по умолчанию в любом URL для протокола FTP, если оно не указано явно.

В URL для протокола FTP можно явно указать имя пользователя и пароль доступа к серверу. В таком случае данная информация записывается перед именем сервера по приведенной ниже формуле:

Формула: ftp://<�пользователь>:<�пароль>@<�сервер>/<�каталог>/<�файл>

Пример: ftp://jsmith:harmony@ftp.company.com/products/list.

В данной формуле пароль вставлен прямо в URL. Это опасный вариант, так как этот пароль передается простым текстом через сеть и его можно увидеть, либо просмотрев исходный текст файла в браузере, либо прямо в его адресной строке. В URL следует указывать только пароли для общего доступа. Если пароль требуется, но не указан в URL, программа доступа к серверу выведет приглашение с просьбой ввести его в отдельном окне. Поэтому лучше всего делать ссылку на службу, которая сама запросит пароль, либо достаточно указать только имя пользователя, а при попытке доступа к серверу, браузер попросит ввести пароль.

Формула: ftp://<�имя пользователя>@<�сервер>/ <�каталог>/<�файл>

Пример: ftp://jsmith@ftp.company.com/products/sales.

Протокол Mailto. Он в отличие от других не предназначен для определения места нахождения и передачи какого-либо ресурса в сети Интернет. Вместо этого, он просто открывает окно, в котором можно создать и отправить почтовое сообщение по указанному адресу.

Формула: mailto:<�имя пользователя>@<�сервер>

Пример: mailto: president@whitehouse.gov.

Эта довольно простая формула использует стандартный способ адресации почты в сети Интернет. Существуют также и другие, более сложные способы адресации. URL для протокола mailto очень часто можно встретить на Web-сайтах, так как он служит одним из средств обратной связи посетителей с владельцами сайта. Однако имейте в виду, что если браузер пользователя не настроен правильно на отправку почты, при щелчке по этому URL у пользователя появится на экране сообщение об ошибке, а также просьба настроить работу браузера с почтовой программой.

Прочие формы URL. Существует большое количество других протоколов, которые могут быть использованы. Однако не всегда браузер может поддерживать работу с ними. Например, протокол WAIS интересен лишь по историческим причинам. Сейчас он мало используется в Web. С каждым днем появляются все новые и новые протоколы. Если вас интересует информация о других URL, посетите сайты http://www.w3.org/pub/WWW/ Addressing/schemes или http://www.ics.uci.edu/pub/ietf/uri/.

Относительные URL. Абсолютные URL в явном виде задают протокол, имена сервера, каталога и файла. В некоторых ситуациях указание такой информации может быть неудобным и излишним. Именно тут и применяется сокращенная форма записи URL, называемая относительным URL. В относительном URL различные отсутствующие части адреса — сервер, каталог или протокол — могут быть определены из текущего документа, либо с помощью элемента. Продемонстрируем идею относительных URL на примере.

Показать весь текст
Заполнить форму текущей работой