Интернет и его составляющие
WWW работает по принципу клиент-сервер, точнее, клиент-серверы: существует множество серверов, которые по запросу клиента возвращают ему гипертекстовый документ — документ, состоящий из частей с разнообразным представлением информации (текст, звук, графика, трехмерные объекты и т. д.), в котором каждый элемент может являться ссылкой на другой документ или его часть. Ссылки WWW указывают не только… Читать ещё >
Интернет и его составляющие (реферат, курсовая, диплом, контрольная)
Федеральное агентство по образованию ГОУ ВПО «Пермский Государственный Университет» экономический факультет Реферат по дисциплине «Информатика» на тему «Интернет и его составляющие»
Пермь 2008
- Содержание
- Интернет
- История Интернет
- Устройство Интернет
- Доступ к информации
- Интернет-сервер
- Маршрутизаторы
- Службы Интернета
- Понятие о протоколах Интернета
- Формат HTML
- Браузер
- Адреса URL
- Список используемой литературы
Интернет
Интернет — глобальная информационная сеть, части которой логически взаимосвязаны друг с другом посредством единого адресного пространства, основанного на протоколе TCP/IP. Интернет состоит из множества взаимосвязанных компьютерных сетей и обеспечивает удаленный доступ к компьютерам, электронной почте, доскам объявлений, базам данных и дискуссионным группам.
История Интернет
Считается, что Глобальная сеть возникла на средства Управления перспективных разработок Министерства обороны США около 40 лет назад. Пентагоном двигало благое желание связать между собой научно-исследовательские центры и крупнейшие университеты, чтобы ученые, занимающиеся важными проблемами, могли оперативно обмениваться документацией и информацией.
На самом деле в министерстве и не собирались создавать и финансировать данный проект. Можно сказать, Интернет возник случайно как побочное действие борьбы между США и СССР. Минобороны же занималось лишь контролем за внедрением компьютерных сетей в гражданской сфере, которое к концу 60-х годов стало уже неотвратимым.
Впервые военное руководство США заговорило о необходимости разработки системы защиты от ядерного оружия в 1956 году, после того как в 49-м СССР успешно испытал первую атомную бомбу, а в 52-м — водородную. Когда же в 57-м Советы вывели на орбиту первый искусственный спутник, стало ясно, что отныне у них есть идеальная система наведения ракет.
Первая глобальная сеть раннего оповещения о пусках ракет появилась в США только в 1958 году. Спасти в случае ядерного удара она не могла, но давала дополнительные 15 минут на эвакуацию в убежище. А так как основную массу ракет Америка ожидала со стороны Северного Ледовитого океана, то именно здесь и начались разработки системы NORAD, которая протянулась от Аляски до Гренландии через весь север Канады. Поскольку человеческий ресурс уже на тот момент уступал по быстроте принятия решений компьютерному, было решено систему компьютеризовать, а ЭВМ объединить в единую разветвленную сеть.
На помощь пришли университетские компьютеры и вычислительные центры научных организаций. Так родилась сеть ARPANET. К 1983 году, как только проблема устойчивости и выживания Сети при выходе из строя ее узлов была решена, Пентагон тихо удалился от разработок, а ARPANET передали местной Академии наук, переименовав сеть в NSFNET. После чего к ней началось подключение зарубежных узлов.
Прототип Всемирной паутины состоял из компьютеров, связанных прямыми соединениями, что было не слишком безопасно. Революционным решением стало внедрение в 1983 году протокола TCP/IP, с появлением которого, собственно, и связано понятие «интернет».
Долгое время Интернет оставался уделом специалистов. Обмен технической документацией и сообщениями электронной почты — это все-таки не совеем то, что нужно рядовому потребителю. Революционное развитие Интернета началось только после 1993 г. с увеличением в геометрической прогрессии числа узлов и пользователей. Поводом для революции стало появление службы World Wide Web (WWW), основанной на пользовательском протоколе передачи данных HTTP и на особом формате представления данных — HTML. Документы, выполненные в этом формате, получили название Web-страниц.
Одновременно с введением концепции WWW была представлена программа Mosaic, обеспечивающая отправку запросов и прием сообщений в формате HTML. Эта программа стала первым в мире Web-броузером, то есть программой для просмотра Web-страниц. После этого работа в Интернете перестала быть уделом профессионалов. Интернет превратился в распределенную по миллионам серверов единую базу данных, навигация в которой не сложнее, чем просмотр обычной мультимедийной энциклопедии.
Интернет превратился в единое информационное пространство, распределенное по миллионам серверов. Чем он, собственно, и является до сих пор.
Устройство Интернет
Как устроен Интернет? Все мы пользуемся Интернетом, для многих он уже стал частью жизни, но как он устроен, знают немногие. Рассматривая такой глобальный вопрос, разделим все повествование на три части: 1) компьютер пользователя плюс его модем, 2) провайдер, 3) множество серверов во всем мире — со всеми соединениями и сетевыми устройствами, которые образуют Всемирную Сеть Интернет.
Схема, на которую будут делаться ссылки далее: 1 — компьютер пользователя с модемом, 2 — модемы провайдера, 3 — маршрутизатор, 4 — локальная сеть сервера провайдера, 5 — сервер провайдера, 1a — локальная сеть пользователей, 6 — концентратор для обмена трафиком между локальной сетью и провайдером.
Что происходит после того, как пользователь нажимает кнопку «Установить связь»? После набора номера, модем соединится с провайдерским. К маршрутизатору подцеплен модемный пул (набор некоторого количества модемов), маршрутизатор настраивает их на автоответ. После поступления звонка и успешного прохождения handshaking (т.е. настройки обоих модемов, когда они «договариваются» о скорости и протоколе обмена), оба модема, вместе с линией между ними, начинают представлять уже просто транспорт для связи. О модемах с этого момента уже можно не вспоминать. Связь установлена.
Теперь маршрутизатор должен договориться с операционной системой об авторизации подключения. Для этого существует несколько специальных протоколов. Windows использует протокол CHAP. После того, как маршрутизатор это сделает, он посылает пакет с именем и паролем на авторизующий сервер. Как только авторизация пройдет успешно (если нет — соединение закрывается со стороны провайдера), маршрутизатор должен договориться с компьютером о протоколе, посредством которого система будет общаться с Интернетом в дальнейшем. Конкретно для ОС Windows этот протокол называется PPP (point-to-point protocol) — это можно увидеть в настройках.
После получения положительного ответа с сервера маршрутизатор должен назначить очередной IP-адрес из числа свободных на данный момент, но только из определенного, назначенного данному провайдеру диапазона.
Каждый компьютер должен иметь свой адрес в сети, чтобы сеть знала, куда ей отправлять информацию, предназначенную для этого компьютера.
Например, к маршрутизатору подключено 16 телефонных линий. Внутри маршрутизатора прописывается диапазон адресов, среди которых он и может выбирать. Например: с 195.146.60.10 по 195.146.60.25 — как раз 16 адресов. Вот в этом ранге адрес и будет назначен.
С корпоративными сетями [1a] дела обстоят проще — они просто напрямую (или через концентратор [6]) включены в маршрутизатор, и адрес их сети уже заранее прописан.
Маршрутизатор берет на себя достаточно большую часть работы вкупе с тем, что занимается еще и собственно, маршрутизацией. По сути дела, это — отдельный компьютер. У него даже есть свой IP-адрес. На него можно зайти, как на сервер, запрограммировать его, как надо.
У провайдера есть сервер [5], который содержит в себе базу пользователей, занимается обработкой почты, ftp, http и т. п. Провайдер для предоставления просто услуг по подключению в Интернет способен обойтись только одним компьютером, который будет заниматься авторизацией. Остальное будет делать маршрутизатор.
После того как связь установлена, браузер запущен и ожидает ввода сетевого адреса. В браузере набирают, к примеру, www.irk.ru в строке URL (без добавки http:// - она сама добавится браузером). Полное имя (www.irk.ru) уходит в пакете запроса на DNS (Domain Name Service), который должен вернуть нормальный IP-адрес браузеру, чтобы работать дальше.
Рассмотрим более подробно понятия DNS и «IP-адрес». Привычные имена, обозначающие адреса в Интернете, на самом деле предназначены только для человека — чтобы было удобнее запоминать имена. Компьютер же оперирует цифровыми адресами в виде четырех групп чисел, разделенных точками. Например, 195.160.40.12 — это одно из представлений IP-адреса. В принципе, имя ресурса в строке браузера можно набирать и таким образом, но это неудобно. Следовательно, должна существовать система, которая будет сопоставлять привычные для пользователя имена с числовым представлением. [pagebreak]
Этим как раз и занимается служба DNS (domain name service). Преобразования типа cooler.irk.ru -> 195.206.40.164. называются прямым преобразованием. А 195.206.40.164 -> cooler.irk.ru называется обратным преобразованием. То есть, существует два типа сервиса преобразования. У каждого провайдера должен быть свой DNS, который преобразовывает запросы, чтобы пользователь не лазил далеко за простыми и часто используемыми именами и чтобы другие DNS могли у него спрашивать о его собственных доменах. Но всех имен в Интернете он знать не может. На самом деле, DNS — это распределенная база данных. При «незнании» какого-либо адреса DNS провайдер начинает запрашивать его по частям у других DNS-серверов. Начинает с главного (или корневого, root) DNS-сервера, вернее, с нескольких главных, так как root-сервер не один.
После того как браузер получит пакет с настоящим (цифровым) IP-адресом, он будет запрашивать ресурс по уже реальному IP-адресу и будет подставлять порт 80 к своим запросам. Это делается для того, чтобы разграничить типы ресурсов. Ведь FTP-сервер может находиться на том же IP-адресе, что и WWW. Протоколу http соответствует по стандарту порт 80 и браузер по умолчанию работает с www, т. е. с 80 портом, ведь написав, например, www.microsoft.com, пользователь попадает на WWW, а не на FTP. Кроме того, браузер пытается определить порт по первому слову в URL. Если пишется www.microsoft.com, значит нужно подставить 80 порт, а если ftp.microsoft.com, то 21 — порт для работы с FTP. Сам пользователь этот порт не пишет, он подставляется автоматически.
Существует такая вещь, как alias — виртуальный хост. IP-адреса у разных хостов могут быть одинаковы. Например, IP-адреса www.irk.ru и www.dsi.ru — это одно и то же, и набирая в строке URL «чистый» IP-адрес, попадать вы будете только на какой-то один.
Виртуальный хост делается для того, чтобы пользователю не пришлось запоминать длинное название директории, где бы мог лежать нужный файл,
Наиболее популярной из программ www-серверов является программа Apache, (есть и одноименный проект для русской версии apache.lexa.ru), которая работает под операционной системой UNIX. Названа программа по аббревиатуре «A PAtCHy sErver» т. е. «сервер, собираемый из patch-файлов» (из модулей). Apache занимается непосредственно тем, что отвечает на запросы и по требованию выполняет скрипты (script) CGI, отдает файлы, картинки и сам html-код документа. Apache — это HTTPd — hypertext transfer protocol daemon, т. е. по русски — www-сервер.
HTTP, воспринимая IP-адрес с нормальным именем ресурса, сравнивает в конфигурационных, какой именно ресурс отдать пользователю — с www.irk.ru или www.dsi.ru, так как имя получено вместе с IP-адресом, предварительно увидев адрес своего сервера. А если сервер будет не его, то он такой пакет и не получит, так как маршрутизатор отправит его дальше.
Итак, Apache начинает выдавать ресурс с директории, содержащей файлы www.irk.ru по порту 80. Что он должен выдать? Ведь пользователь явно не указывал, что именно он хочет найти, а просто написал название сайта. В Apache прописано, что по умолчанию для 80 порта с такой-то директории всегда выдается файл index.html. Для каждого типа файлов существует свой заголовок, который посылается браузеру перед посылкой самого файла (используя протокол HTTP). Делается это для того, чтобы браузер понимал, что именно нужно делать с этим файлом — показать его в окне или предложить запись на диск (например, something. zip — не надо показывать в окне, а надо сохранить). Существуют и другие указания от сервера браузеру, что ему делать с файлами, находящимися на сервере.
Доступ к информации
Доступ к информации — в широком смысле — операционный тип взаимодействия между субъектом и объектом, в результате которого создается поток информации от одного к другому.
Доступ к информации — в узком смысле — операция записи, модификации, передачи или чтения данных.
В Интернет можно найти любую информацию из той, которая в ней имеется. Интернет — гигантская библиотека. Как и во всякой библиотеке, здесь надо уметь пользоваться поисковым аппаратом. Как искать? Каталог информации и услуг, доступных в Интернет с помощью WWW, уже сегодня занял бы не один десяток томов печатного текста. Поэтому на первый план выходит проблема поиска нужной информации, которую помогают решить специализированные поисковые системы.
Пожалуй, самой полезной чертой Интернет является наличие в нем поисковых серверов. Это выделенные компьютеры, которые автоматически просматривают все ресурсы Интернет, которые могут найти, и индексируют их содержание. Затем Вы можете передать такому серверу фразу или набор ключевых слов, описывающих интересующую Вас тему, и сервер возвратит Вам список ресурсов, соответствующих Вашему запросу.
Сегодняшние поисковые системы поддерживают индексы, включающие весьма значительную часть ресурсов Интернет. Таких серверов существует довольно-таки много, и вкупе они охватывают практически все доступные ресурсы. Если в Интернет есть информация, которая Вас интересует, то ее можно найти при помощи поисковых серверов. Это самое мощное средство нахождения ресурсов в сети.
В каталогах Интернет хранятся тематически систематизированные коллекции ссылок на различные сетевые ресурсы, в первую очередь на документы World Wide Web. Ссылки в такие каталоги заносятся не автоматически, а с помощью администраторов. Более того, занимающиеся этим люди стараются сделать свои коллекции наиболее полными, включающими все доступные ресурсы на каждую тему. В результате пользователю не нужно самому собирать все ссылки по интересующему его вопросу, но достаточно найти этот вопрос в каталоге.
Как правило, хорошие каталоги Интернет обеспечивают разнообразный дополнительный сервис: поиск по ключевым словам в своей базе данных, списки последних поступлений, списки наиболее интересных из них, выдачу случайной ссылки, автоматическое оповещение по электронной почте о свежих поступлениях. Все это делает использование таких коллекций весьма удобным.
Поисковые системы индексируют документы автоматически, не оценивая его завершенности или полезности. Поэтому они могут находить информацию в самых «глухих» углах Интернет. С другой стороны, если неудачно сформулировать запрос, сервер может и не возвратить ссылки на нужный документ.
В случае если пользователь определенно знает, что собой представляет искомый ресурс, и он наверняка хорошо известен, разумно обратиться к каталогам Интернет. Это решение также является адекватным в случае, когда требуется составить наиболее полный список ресурсов по некоторому вопросу.
Если же нужна хотя бы одна ссылка, то использовать поисковый сервер гораздо быстрее. Последний разумно также применять в случае, когда точно неизвестно, что собой представляет искомый предмет.
Допустим, Вы прочитали в газете, что акции компании XYZ выросли в три раза за день. Но что из себя представляет компания XYZ? Сервера www.xyz.com не оказалось, а искать компанию в каталоге, не зная, чем она занимается, неразумно. Тут как раз и приходит на помощь поисковый сервис, который если и не найдет сервера самой компании (которого может и не существовать), то найдет места, где она упоминается в других документах. Когда же Вас заинтересует, какие изданы книги по языку Постскрипт, то ничего не надо искать — достаточно обратиться к одному из каталогов.
Условно можно сказать, что каталог — средство сфокусированного поиска информации, а поисковые серверы — рассеянного.
С другой стороны, никогда не бывает достаточно одного поискового сервера. Во-первых, разные серверы охватывают различные области информации в Интернет, частично перекрывающиеся. Они используют различающиеся методы индексирования документов и способы оценки значимости слов в них. Если Вы не нашли искомую информацию при помощи одного из серверов, то достаточно велики шансы найти при помощи другого. Во-вторых, существуют специализированные серверы поиска по отдельным типам ресурсов Интернет (как, например, система поиска в сетевых новостях DejaNews), а существуют универсальные, охватывающие все виды сервисов. Каталоги и поисковые серверы — две стороны поиска информации в Интернет. Они разные по методам, но едины в целях. Научившись быстро использовать один, наиболее подходящий для Вас, каталог и несколько хороших поисковых серверов, Вы получите средство быстрого и эффективного нахождения информации в глобальной сети.
Наиболее популярные каталоги информации и поисковые системы Интернет
Alta Vista — http://altavista.com/
What’s New Too! — http://newtoo.manifest.com/
TradeWave Galaxy — http://galaxy.einet.net/
Yahoo — http://www.yahoo.com/
Starting Point — http://www.stpt.com/
Lycos — http://www.lycos.com/
WebCrawler — http://webcrawler.com/
Infoseek Guide — http://www.infoseek.com/
В последнее время появилось и все появляются новые русскоязычные каталоги и поисковые сервера:
Rambler — http://www.rambler.ru/
Yandex — http://www.yandex.ru/
Ay! — http://www.au.ru/
Aport — http://www.aport.ru/
LIST.RU — http://www.list.ru/
Russia on the Net — http://www.ru/
Данный список содержит лишь названия и адреса наиболее популярных поисковых систем Интернет. Любая система поиска представляет из себя более или менее сложную базу данных, поиск в которой производится путем посылки в базу данных запроса на информацию, причем, чем корректнее сформулирован запрос, тем больше вероятность получить ссылку на искомую информацию. Ответ из базы данных приходит в виде стандартного HTML документа.
Обычно для грубого поиска достаточно набрать подряд несколько ключевых слов, разделенных пробелами, без запятых. При этом ищутся документы, связанные хотя бы с одним из этих слов. Знак «+» обычно помещают непосредственно перед тем словом, присутствие которого в искомом материале считают обязательным. Hапример, «+russia +business» заказывает поиск материалов о российском бизнесе. Знаком «-» обычно отмечают слова, которых не должно быть в искомом документе, например, «+russia +businessusa»).
Если поисковый сервер ничего не нашел, то, прежде всего, стоит проверить, правильно ли написаны ключевые слова. Если всё написано правильно, стоит попытаться расширить сферу поиска, убрав некоторые слова, помеченные плюсом. Если поисковый сервер нашел необозримо много документов (иногда это десятки и даже сотни тысяч), то следует постараться повторить поиск, добавив уточняющие ключевые слова. Не стоит особенно удивляться, когда найденные материалы оказываются совершенно не относящимися к теме поиска или даже вовсе не содержат указанных ключевых слов — поисковые машины часто удовлетворяются не только точным, но и частичным совпадением слов (например, совпадением их корней). Вполне разумный способ начать содержательное путешествие по Интернету — указать поисковому серверу, скажем, Alta Vista несколько ключевых слов, характеризующих Ваш интерес, получить исходные Интернет-адреса, и начать их исследовать, запоминая наиболее интересное на своем компьютере в виде закладок и файлов с ссылками.
Интернет-сервер
Интернет-сервер — компьютер, подключенный к сети, или выполняющаяся на нем программа, предоставляющие клиентам доступ к общим ресурсам и управляющие этими ресурсами.
Наиболее важными типами серверов являются:
— веб-серверы;
— серверы электронной почты;
— серверы FTP, предназначенные для обмена файлами;
— серверы общения в реальном времени (чаты);
— серверы, обеспечивающие работу Интернет-телефонии;
— системы трансляции радио и видео через Интернет.
Маршрутизаторы
Маршрутизатор — устройство, обеспечивающее трафик между локальными сетями, имеющими разные сетевые адреса. Маршрутизатор функционирует на сетевом уровне модели OSI и отвечает за выбор маршрута передачи пакетов между узлами.
Выбор маршрута осуществляется на основе протоколов маршрутизации, содержащих информацию о топологии сети и алгоритмов маршрутизации, базирующихся на определенных критериях выбора.
Маршрутизатор (router) позволяет организовывать в сети избыточные связи, образующие петли. Он справляется с этой задачей за счет того, что принимает решение о передаче пакетов на основании более полной информации о графе связей в сети, чем мост или коммутатор. Маршрутизатор имеет в своем распоряжении базу топологической информации, которая говорит ему, например, о том, между какими подсетями общей сети имеются связи и в каком состоянии (работоспособном или нет) они находятся. Имея такую карту сети, маршрутизатор может выбрать один из нескольких возможных маршрутов доставки пакета адресату. В данном случае под маршрутом понимают последовательность прохождения пакетом маршрутизаторов. Например, на рисунке для связи станций L2 сети LAN1 и L1 сети LAN6 имеется два маршрута: М1-М5-М7 и М1-М6-М7.
интернет информационная сеть Структура интерсети, построенной на основе маршрутизаторов
L1, L2,… — локальные номера узлов (дублируются, разный формат)
M1, M2,…, M7 — маршрутизаторы
LAN1, LAN2, LAN3, WAN4, WAN5, LAN6 — уникальные номера сетей в едином формате В отличии от моста/коммутатора, который не знает, как связаны сегменты друг с другом за пределами его портов, маршрутизатор видит всю картину связей подсетей друг с другом, поэтому он может выбрать правильный маршрут и при наличии нескольких альтернативных маршрутов. Решение о выборе того или иного маршрута принимается каждым маршрутизатором, через который проходит сообщение.
Для того, чтобы составить карту связей в сети, маршрутизаторы обмениваются специальными служебными сообщениями, в которых содержится информация о тех связях между подсетями, о которых они знают (эти подсети подключены к ним непосредственно или же они узнали эту информацию от других маршрутизаторов).
Построение графа связей между подсетями и выбор оптимального по какому-либо критерию маршрута на этом графе представляют собой сложную задачу. При этом могут использоваться разные критерии выбора маршрута — наименьшее количество промежуточных узлов, время, стоимость или надежность передачи данных.
Маршрутизаторы позволяют объединять сети с различными принципами организации в единую сеть, которая в этом случае часто называется интерсеть (internet). Название интерсеть подчеркивает ту особенность, что образованное с помощью маршрутизаторов объединение компьютеров представляет собой совокупность нескольких сетей, сохраняющих большую степень автономности, чем несколько логических сегментов одной сети. В каждой из сетей, образующих интерсеть, сохраняются присущие им принципы адресации узлов и протоколы обмена информацией. Поэтому маршрутизаторы могут объединять не только локальные сети с различной технологией, но и локальные сети с глобальными.
Маршрутизаторы не только объединяют сети, но и надежно защищают их друг от друга. Причем эта изоляция осуществляется гораздо проще и надежнее, чем с помощью мостов/коммутаторов. Например, при поступлении кадра с неправильным адресом мост/коммутатор обязан повторить его на всех своих портах, что делает сеть незащищенной от некорректно работающего узла. Маршрутизатор же в таком случае просто отказывается передавать «неправильный» пакет дальше, изолируя дефектный узел от остальной сети.
Кроме того, маршрутизатор предоставляет администратору удобные средства фильтрации потока сообщений за счет того, что сам распознает многие поля служебной информации в пакете и позволяет их именовать понятным администратору образом. Нужно заметить, что некоторые мосты/коммутаторы также способны выполнять функции гибкой фильтрации, но задавать условия фильтрации администратор сети должен сам в двоичном формате, что достаточно сложно.
Кроме фильтрации, маршрутизатор может обеспечивать приоритетный порядок обслуживания буферизованных пакетов, когда на основании некоторых признаков пакетам предоставляются преимущества при выборе из очереди.
В результате, маршрутизатор оказывается сложным интеллектуальным устройством, построенным на базе одного, а иногда и нескольких мощных процессоров. Такой специализированный мультипроцессор работает, как правило, под управлением специализированной операционной системы.
Службы Интернета
Разные службы Интернета реализуют разные функции обмена информацией.
Интернет с самого начала обладал открытой архитектурой. Это означает, что новые службы могут возникать по мере необходимости. Некоторые из них становятся популярными и процветают, некоторые отвечают потребностям ограниченного круга пользователей, некоторые вытесняются более совершенными конкурирующими службами. Все зависит от потребностей людей в данном способе обмена информацией и, в какой-то степени, от моды и от привычки.
В телефонии каждая новая служба означает новое устройство, как, например, факсимильный аппарат. Однако компьютеры — это универсальные устройства, и TCP/IP предоставляет им универсальное средство связи. Поэтому в Интернете новая служба — это просто другая программа.
Наиболее широко используются следующие службы Интернета:
· telnet — позволяет соединиться с удаленным компьютером и работать с ним так, как будто пользователь сидит перед ним, в текстовом режиме. Это то, для чего предназначался Интернет в момент его зарождения. Теперь эта служба используется, прежде всего, теми, кто следит за бесперебойной работой сети, — системными администраторами. Однако сейчас чаще используют для этих целей другую службу, которая шифрует передаваемую информацию, — ssh.
ftp — передача файлов через Интернет. Одна из старейших служб, используется для копирования файлов с компьютера на компьютер.
Расшифровывается эта аббревиатура как протокол передачи файлов, но при рассмотрении FTP как сервиса Интернет имеется в виду не просто протокол, но именно сервис — доступ к файлам в файловых архивах.
Вообще говоря, FTP — стандартная программа, работающая по протоколу TCP, практически всегда поставляющаяся с операционной системой. Ее исходное предназначение — передача файлов между разными компьютерами, работающими в сетях TCP/IP: на одном из компьютеров работает программа-сервер, на втором пользователь запускает программу-клиента, которая соединяется с сервером и передает или получает по протоколу FTP файлы. Предполагается, что пользователь зарегистрирован на обоих компьютерах и соединяется с сервером под своим именем и со своим паролем на этом компьютере (login/password).
Протокол FTP оптимизирован для передачи файлов. Данная черта и послужила причиной того, что программы FTP стали частью отдельного сервиса Интернет. Сервер FTP можно настроить таким образом, что соединиться с ним можно будет не только под своим именем, но и под условным именем anonymous — анонимный пользователь. Тогда становится доступной не вся файловая система компьютера, но некоторый набор файлов на сервере, которые составляют содержимое сервера Anonymous FTP — общедоступного (public) файлового архива. На таких серверах сегодня доступно огромное количество информации и программного обеспечения. Практически все, что может быть предоставлено публике в виде файлов, доступно с серверов Anonymous FTP. Это и программы — свободно распространяемые и демонстрационные версии, это и мультимедиа, это и просто тексты — законы, книги, статьи, отчеты.
Если пользователь хочет найти последнюю версию свободно распространяющейся программы, то искать ее нужно именно на серверах FTP.
Несмотря на распространенность, у FTP есть и множество недостатков. Программы-клиенты ftp могут быть не всегда удобны и просты в использовании. Не всегда можно понять, а что это за файл — тот ли это файл, что ищете пользователь, или нет. Нет простого и универсального средства поиска на серверах Anonymous FTP. Описания файлов на сервере выдаются в формате операционной системы сервера, а список файлов операционной системы UNIX может привести в недоумение пользователя DOS. Проблема в том, что со списком файлов выдается лишняя информация.
Серверы FTP нецентрализованы, и это несет свои проблемы. Несмотря на все это, серверы Anonymous FTP сегодня — стандартный путь организации общедоступных файловых архивов в Интернет.
· e-mail (электронная почта) — первая, наиболее распространенная и эффективная из служб Интернет. E-mail очень похожа на обычную бумажную почту, обладая теми же достоинствами и недостатками. Обычное письмо состоит из конверта, на котором написан адрес получателя и стоят штампы почтовых отделений пути следования, и содержимого — собственно письма. Электронное письмо также состоит из заголовков, содержащих служебную информацию (об авторе письма, получателе, пути прохождения по сети и т. д.), играющих роль конверта, и собственно содержимого письма. Можно вложить в обычное письмо что-нибудь, например фотографию; аналогично, можно послать файл с данными электронным письмом. Можно подписать электронное письмо. Электронная почта самый дешевый вид связи.
Скорость доставки электронных писем гораздо выше, чем бумажных, и минимальное время их прохождения составляет считанные минуты, а иногда и секунды. E-mail универсальна — пользователи множества сетей во всем мире, построенных на совершенно разных принципах и протоколах, могут обмениваться друг с другом электронными письмами.
Напрямую с компьютером получателя письма компьютер отправителя не общается. Это и правильно, так как другой компьютер может быть выключен или у него нет в это время доступа в Интернет. Посылая электронное письмо оно просто загружается на сервер электронной почты, который затем перешлет его дальше в Интернет почтовому серверу, с которым связан он. Существует много путей по которым может пройти электронное письмо. Как правило скорость электронной почты мало зависит от того где находится компьютер адресата и, если не происходит никаких накладок, то письмо доходит куда угодно за время от 1 часа до суток.
Чтобы эффективно использовать электронную почту необязательно знать как работают программы на почтовом сервере. Достаточно изучить какую-нибудь программу-клиент (какой более понравится и будет более удобен Вам). При настройке программы-клиента понадобятся следующие данные:
Сервер POP3 — адрес почтового сервера, с которого принимается почта (у нас mail.rsm.ru)
Сервер SMTP — адрес почтового сервера, на который посылается Ваша почта. Обычно совпадает с Сервером POP3, но не всегда (наш — mail.rsm.ru)
Почтовый адрес: Ваш адрес электронной почты (например, petrov@rsm.ru).
Имя входа на POP3-сервер: уникальное на почтовом сервере имя для вашей идентификации на нем (например, petrov) К нему прилагается Password: пароль для получения Вашей почты (лучше никому не говорите) Все эти сведения Вы можете получить у Вашего провайдера Интернета, у которого Вы купили e-mail.
Теперь рассмотрим поля обыкновенного письма электронной почты:
To: Здесь необходимо указать адрес электронной почты адресата. Нельзя допускать ошибки при написании адреса. В противном случае абонент не получит письмо.
Subject: В это поле вписывают тему письма. Получатель увидит ее при просмотре списка новой почты. Далее, в большом поле без названия следует написать сам текст письма.
К письмам можно прицеплять файлы, содержащие любую информацию, например, вашу фотографию. В разных почтовых программах это делается по-разному.
· news (новости) — это тематические тусовки, или газеты, где каждый подписчик одновременно может быть автором. Эта служба, так же как и веб-форумы или списки рассылки (похожие по функциям, но отличающиеся техническими деталями), предназначена для обмена сообщениями в пределах группы людей, связанных общими интересами.
· WWW (веб) — World Wide Web — всемирная паутина Интернет. Самый популярный и интересный сервис Интернет сегодня, самое популярное и удобное средство работы с информацией. Очень часто понятия WWW и Интернет даже считают тождественными. Чтобы понять как работает эта система надо определить понятие гипертекста (hypertext). Гипертекст — по определению, формат текстового документа, который кроме, собственно текста, может содержать ссылки на другие гипертекстовые документы. В WWW понятие гипертекста еще более расширено. Гипертекстовый документ WWW может также включать в себя текст, оформленный разными шрифтами, цветом и т. д., картинки, музыку, ссылки файлы и так далее. Вся система WWW основана на двух «китах» — Протокол Передачи Гипертекста — Hypertext Transport Protocol (HTTP), который служит для передачи гипертекстовых документов, и Язык Создания Гипертекста — Hypertext Markup Language (HTML), использующий гипертекстовые связи для определения объектов внутри документов и для ссылки на другие гипертекстовые документы. WWW — информационная система, которой весьма непросто дать корректное определение.
WWW работает по принципу клиент-сервер, точнее, клиент-серверы: существует множество серверов, которые по запросу клиента возвращают ему гипертекстовый документ — документ, состоящий из частей с разнообразным представлением информации (текст, звук, графика, трехмерные объекты и т. д.), в котором каждый элемент может являться ссылкой на другой документ или его часть. Ссылки WWW указывают не только на документы, специфичные для самой WWW, но и на прочие сервисы и информационные ресурсы Интернет. Большинство программ-клиентов WWW (browsers, навигаторы или «браузеры») понимают ссылки и являются программами-клиентами соответствующих сервисов: FTP, сетевых новостей Usenet, электронной почты и т. д. Таким образом, программные средства WWW (браузеры) являются универсальными для различных сервисов Интернет, а сама информационная система WWW играет интегрирующую роль.
Некоторые термины, использующиеся в WWW.
— html (hypertext markup language, язык разметки гипертекста). Это формат гипертекстовых документов, использующихся в WWW для предоставления информации. Формат этот не описывает то, как документ должен выглядеть, но его структуру и связи. Внешний вид документа на экране пользователя определяется программой просмотра WWW — если Вы работаете за графическим или текстовым терминалом, то в каждом случае документ будет выглядеть по-своему, но структура его останется неизменной, поскольку она задана форматом html. Имена файлов в формате html обычно оканчиваются на html (или имеют расширение htm в случае, если сервер работает под MS-DOS или Windows 3.11).
— URL (uniform resource locator, универсальный указатель на ресурс). Так называются те самые ссылки на информационные ресурсы Интернет. Именно с него и начинается обычно работа с программой-браузером. Во всех браузерах есть строка для ввода URL нужного Вам ресурса Интернет. Общий вид URL такой: протокол://адрес сервера[/местонахождение на сервере]
Технология Web, разработанная в 1989 г. в Женеве, в Лаборатории физики элементарных частиц Европейского центра ядерных исследований (CERN) Тимом Бернерс-Ли (Tim Berners-Lee) и его коллегами-программистами, сначала была направлена на создание единой сети для научных сотрудников, занимающихся физикой высоких энергий. Однако вскоре эта технология нашла гораздо более широкое применение. Первые программы, демонстрирующие работу системы, были закончены в 1992 году и с тех пор WWW — наиболее динамичная и быстро развивающаяся часть Интернет.
· DNS — это особая служба Интернета, потому что она используется всеми остальными службами, от telnet до www. Перевод имен DNS в IP-адреса происходит автоматически. Для этого надо только указать компьютеру IP-адрес сервера DNS — того компьютера, которому будут направляться соответствующие запросы. Такая структура службы DNS обеспечивает, с одной стороны, уникальность имен компьютеров в пределах всего Интернета, а с другой стороны, четкое разделение административной ответственности. Большие и маленькие буквы в именах компьютеров не различаются, fadr.msu.ru — это то же самое, что FADR.MSU.RU
· IRCобщение в Интернете К интерактивным сервисам, служащим общению людей через Интернет, относится IRC — Internet Relay Chat, или разговоры через Интернет.
В Интернет существует сеть серверов IRC, а у пользователя соответственно должна быть программа — клиент IRC. Пользователи присоединяются к одному из каналов — тематических групп и участвуют в разговоре, который ведется не голосом, а текстом.
Узлы IRС синхронизованы между собой, так что, подключившись к ближайшему серверу, Вы подключаетесь ко всей сети IRC.
Используется IRC в основном для развлечения, однако существует множество каналов с компьютерной и прочей узконаправленной тематикой, и возможность пообщаться в реальном времени с профессионалами со всего мира не стоит недооценивать, хотя люди не компьютеры, могут и не ответить.
Понятие о протоколах Интернета
Протокол — система правил, описывающая процедуру связи между двумя устройствами.
TCP/IP (Transport Control Protocol/Internet Protocol) — протокол транспортного уровня/ протокол Интернет. Наборы протоколов, предназначенных для передачи данных в локальной сети и сети Интернет
Internet Protocol (IP) — используется для управления инфраструктурой и присвоения компьютерам адресов, уникальным образом идентифицирующих каждый узел числом, состоящим из идентификаторов сети и узла. IP-адрес может выглядеть так: 192.168.222.101
Internet Control Message Protocol (ICMP) — Обеспечивает механизм передачи сообщений об ошибках в протоколе IP на узел, сгенерировавший IP-пакет; используется для уведомления об ошибках, возникших при передаче данных.
Dynamic Host Control Protocol (DHCP) — Разрешает динамическое присвоение IP-адресов узлам в контролируемой подсети для устранения поддержки фиксированного IP-адреса каждого узла.
Transmission Control Protocol (TCP) — Управляет коммуникационными действиями между процессами в объединенных узлах, работающих независимо от инфраструктуры, управляемой протоколом IP.
User Datagram Protocol (UDP) — является альтернативой TCP, используется для передачи данных между процессами, не требующими надежной доставки по причине того, что процессы самостоятельно исправляют ошибки.
File Transfer Protocol (FTP) — простой и надежный протокол для обмена файлами между узлами.
Point-to-Point Protocol (PPP) — обеспечивает надежную связь и набор опций для автоматизации процессов входа в систему и настройки удаленных узлов.
Simple Mail Transfer Protocol (SMTP) — Используется для передачи исходящих сообщений электронной почты с одного узла на другой.
Post Office Protocol (POP) — Используется для передачи входящих сообщений электронной почты с одного узла на другой.
Simple Network Management Protocol (SNMP) — Используется в процессе управления сетью при сборе данных для анализа и составления отчета о производительности сетей.
Hypertext Transfer Protocol (HTTP) — Используется веб-браузерами и веб-серверами для осуществления запросов и отправки содержимого в формате HTML.
Приведенные протоколы TCP/IP определяют набор стандартов, используемых разработчиками программного обеспечения для обмена данными между двумя компьютерами. Это позволяет программным приложениям правильно осуществлять доставку данных. Каждый протокол играет свою собственную роль при обмене информацией.
Формат HTML
HTML — это специальный язык форматирования электронных документов — Web-страниц (Web-публикаций), предназначенных для просмотра на экране компьютера.
Язык HTML появился одновременно со службой World Wide Web и развивался вместе с ней, постепенно вбирая в себя новые черты, которые позволяли создавать все более и более впечатляющие Web-страницы. Он является основой World Wide Web и одновременно причиной ее широчайшей популярности.
Смысл и назначение языка HTML можно понять, исходя из его названия. Web-страницы — это комплексные документы, которые могут содержать любые виды данных: текст, графику (форматы.gif,.jpg), звук (формат.mp3), видео и анимацию. Создание документа на языке HTML аналогично программированию. Автор документа в обычный текст вставляет специальные коды — теги. При просмотре теги выполняют роль команд. Среди многочисленных тегов есть специальная группа тегов, предназначенных для создания гипертекстовых ссылок. Гипертекстовая ссылка — это выделенный фрагмент текста (или иллюстрация), с которым связан сетевой адрес другой Web-страницы. Обычно гипертекстовые ссылки выделены подчёркиванием или другим цветом. (Гиперссылка — это объект Web-страницы, содержащий информацию об адресе другой Web-страницы. В качестве такого объекта обычно выступает фрагмент текста, выделенный цветом и подчеркиванием, или графическая иллюстрация, выделенная цветной рамкой.) Если на гипертекстовую ссылку навести указатель мыши, то он изменит форму. Указатель мыши принимает форму кисти руки с вытянутым указательным пальцем.
Браузер
Веб-обозреватель или брамузер (от англ. Web browser) — это программное обеспечение для поиска, просмотра веб-сайтов, то есть для запроса веб-страниц (преимущественно из Паутины), для их обработки, вывода и перехода от одной страницы к другой.
Большинство браузеров также наделены способностями к просмотру оглавления FTP-серверов.
Браузеры постоянно развивались со времён зарождения Всемирной паутины, и с её ростом становились всё более важной программой типичного персонального компьютера. Нынче браузер — комплексное приложение для обработки и вывода разных составляющих веб-страницы, и для предоставления интерфейса между веб-сайтом и его посетителем. Практически все популярные браузеры распространяются бесплатно или «в комплекте» с другим приложением: Internet Explorer (как неотъемлемая часть Microsoft Windows), Mozilla Firefox (свободное ПО), Opera (бесплатно, начиная с версии 8.50), Safari (совместно с Mac OS — доступна пользователям Windows начиная с 3 версии).
Первым распространённым браузером с графическим интерфейсом был NCSA Mosaic. Затем на долгое время рынок монополизировал Netscape Navigator. В 1995 году компания Microsoft выпустила Windows 95, включавшую Internet Explorer 3.0, и этот момент можно считать началом войны браузеров, закончившейся полным падением Netscape и триумфом Internet Explorer, занявшего в итоге более 95% рынка. Уже принадлежа AOL, Netscape выпустила исходный код своего браузера под свободной лицензией MPL (Mozilla Public License). Однако этот код решили не использовать, и написали с нуля Netscape 6, на основе кода которого (с кодовым названием «Mozilla») позже были созданы новые браузеры Mozilla и Mozilla Firefox. Последний постепенно набирает популярность (на 2007 год). В 2005 году браузер Opera также стал распространяться бесплатно.
Война браузеров была бы исключительно коммерческим делом корпораций, если бы основным приёмом в борьбе не стало добавление специфических, нестандартных возможностей к браузеру. Наибольшие различия возникали в поддержке Javascript — языка сценариев, придающего интерактивность документам. В результате многие документы были «оптимизированы» для конкретного браузера и совершенно не читались в другом. WWW-Консорциум принимает множество тщательно обсуждаемых стандартов (различных версий HTML, Javascript, CSS и др.), но соблюдение этих стандартов полностью ложится на разработчиков браузеров. В последние годы уровень поддержки стандартов значительно вырос, и из современных браузеров только Internet Explorer (предпоследняя, шестая, версия которого вышла в 2001 году) имеет серьёзные недостатки в их поддержке (а последняя — седьмая, вышедшая 18 октября 2006 года, ещё не достаточно исследована на предмет соответствия стандартам).
В локализованных версиях операционных систем семейства Microsoft Windows браузеры именуются обозревателями, обозревателями сети или веб-обозревателями.
Популярные браузеры
Internet Explorer
Mozilla Firefox
Opera
Flock
Менее популярные браузеры
Netscape Navigator
Konqueror
Galeon
Epiphany
Charon
Arachne
Адреса URL
Так же как каждый компьютер имеет свое уникальное имя, уникальное имя имеет и каждый документ в Интернете (точнее, говоря архивным языком, каждая единица хранения, — это может быть и компьютерная программа, и компьютерная запись песни — звуковой файл, и все, что угодно).
Это уникальное имя называется URL — Универсальный Указатель Ресурса (Universal Resource Locator). URL имеет следующую форму:
служба://имя компьютера/директория/поддиректория/…/имя файла Например, http://fadr.msu.ru/ecocoop/index.html.
Адрес URL состоит из трех основных элементов:
Протокол + Домен + Путь/Файл Большинство Internet-адресов, которые вы встречали, содержат вышеуказанные элементы, однако иногда они подаются в сокращенном виде. В результате отбрасывания доменного компонента адреса можно получить относительный адрес.
Протокол определяет используемый для связи с данным объектом способ обмена информацией, например, http или ftp.
Домен — это имя целевого сервера. Имена серверов WWW часто начинаются именно с этих трех букв: www (от словосочетания Word Wide Web), так, например, сервер агентства CNN: www.cnn.com. Некоторые протоколы (например http) допускают указание номер порта за именем сервера.
Компоненты путь/файл позволяет разыскать нужный объект в иерархической файловой структуре домена. Если имя файла не указано, то, как правило, проводится поиск файла index. html, стандартного файла в среде UNIX.
URL-адреса изображаются в стандартной ASCII-кодировке, поэтому используемые специальные символы подлежат замене шестнадцатеричными ASCII-кодами. Это касается даже таких тривиальных символов, как пробел или кавычка.
URL был изобретён Тимом Бернерсом-Ли в 1990 году в стенах Европейского совета по ядерным исследованиям (фр. Conseil Europeen pour la Recherche Nucleaire, CERN) в Женеве, Швейцария.
URL стал фундаментальной инновацией в Интернете. Изначально URL предназначался для обозначения мест расположения ресурсов (чаще всего файлов) во Всемирной паутине. Сейчас URL применяется для обозначения адресов почти всех ресурсов Интернета. Стандарт URL закреплён в документе RFC 1738, прежняя версия была определена в RFC 1630. Сейчас URL позиционируется как часть более общей системы идентификации ресурсов URI, сам термин URL постепенно уступает место более широкому термину URI. Cтандарт URL регулируется организацией IETF и её подразделениями.
Изначально локатор URL был разработан как система для максимально естественного указания на местонахождения ресурсов в сети. Локатор должен был быть легко расширяемым и использовать лишь ограниченный набор ASCII-символов (к примеру, пробел никогда не применяется в URL). В связи с этим, возникла следующая традиционная форма записи URL:
<�схема>://<�логин>:<�пароль>@<�хост>:<�порт>/
В этой записи:
схема — схема обращения к ресурсу, в большинстве случаев имеется в виду сетевой протокол
логин — имя пользователя, используемое для доступа к ресурсу
пароль — пароль, ассоциированный с указанным именем пользователя
хост — полностью прописанное доменное имя хоста в системе DNS или IP-адрес хоста в форме четырёх десятичных чисел, разделённых точками. Числа находятся в интервале от 0 до 255.
порт — порт хоста для подключения
URL-путь — уточняющая информация о месте нахождения ресурса (зависит от протокола)
Общепринятые схемы (протоколы) URL включают:
ftp — Протокол передачи файлов FTP
http — Протокол передачи гипертекста HTTP
https — Специальная реализация протокола HTTP, использующая шифрование (как правило, SSL или TLS)
gopher — Протокол Gopher
mailto — Адрес электронной почты
news — Новости Usenet
nntp — Новости Usenet через протокол NNTP
irc — Протокол IRC
prospero — Служба каталогов Prospero Directory Service
telnet — Ссылка на интерактивную сессию Telnet
wais — База данных системы WAIS
xmpp — Протокол XMPP (часть Jabber)
file — Имя локального файла
data — Непосредственные данные (Data: URL)
Экзотические схемы URL:
afs — Глобальное имя файла в файловой системе Andrew File System
cid — Идентификатор содержимого для частей MIME
mid — Идентификатор сообщений для электронной почты
mailserver — Доступ к данным с почтовых серверов
nfs — Имя файла в сетевой файловой системе NFS
tn3270 — Эмуляция интерактивной сессии Telnet 3270
z39.50 — Доступ к службам ANSI Z39.50
skype — Протокол Skype
smsto — Открытие редактора SMS в некоторых мобильных телефонах
Появление адресов URL стало существенным нововведением в Интернете. Однако, с момента его изобретения и по сей день, стандарт URL обладает серьёзным недостатком — в нём можно использовать только ограниченный набор символов, даже меньший, нежели в ASCII: латинские буквы, цифры и лишь некоторые знаки препинания. Если использовать в URL символы кириллицы, или иероглифы, или, скажем, специфические символы французcкого языка, то нужные символы должны быть перекодированы особым образом.
Ещё один кардинальный недостаток URL состоит в отсутствии гибкости. Ресурсы во Всемирной паутине и Интернете перемещаются, а ссылки в виде URL остаются, указывая на уже отсутствующие ресурсы. Это особенно болезненно для электронных библиотек, каталогов и энциклопедий.
Для решения этой проблемы были предложены постоянные локаторы PURL (англ. Persistent Uniform Resource Locator). В сущности это те же URL, но они указывают не на конкретное место расположения ресурса, а на запись в базе данных PURL, где, в свою очередь, записан уже конкретный URL-адрес ресурса. При обращении к PURL, сервер находит нужную запись в этой базе данных и перенаправляет запрос уже на конкретное местоположение ресурса. Если адрес ресурса меняется, то нет нужды исправлять все бесчисленные ссылки на него — достаточно лишь изменить запись в БД. В настоящий момент эта идея не стандартизирована и не имеет широкого распространения.
Примеры URL
http://ru.wikipedia.org/wiki/URL
http://en.wikipedia.org:80/wiki/Special:Search?search=train&go=Go
ftp://myname:mypass@myhost.com:21/etc/motd
prospero://myhost.dom//pros/somename
file://vms.myhost.edu/disk$user/my/notes/note123.txt
Список используемой литературы
1. Бройдо В. Л. Вычислительные сети, сети и телекоммуникации, СПб: Питер, 2003.
2. Олифер В. Г., Олифер Н. А. Компьютерные сети. Принципы, технологии, протоколы: Учебник для вузов. 2-е изд., СПб.: Питер, 2004.