Почему в URL-адресе иногда появляются странные символы? Используемые в интернете адреса являются лишь буквенным отображением адреса
6. Адресация в Интернете
В Интернете используются два основных понятия: адрес и протокол. Каждому компьютеру, подключенному к Интернету, назначается уникальный сетевой IP-адрес. Хотя нет центра управления Интернетом, есть организации ,занимающиеся проверкой и выдачей адресов.
Адрес в Интернете однозначно определяет местонахождение компьютера в сети. При пересылке информации протоколами TCP/IP используются присвоенные адреса. Адреса в Интернете могут быть представлены как последовательностью цифр, так и именем, построенным по специальным правилам. Для того чтобы серверам было легко ориентироваться в направлении пересылки пакетов, предусмотрен специальный способ адресации. Каждый компьютер, и каждый сервер сети имеют собственное имя-адрес, состоящее из четырех целых чисел от 0 до 255, разделенных точкой. Это числовой IP-адрес, например: 217.89.14.35.
Начало адреса определяет часть Интернета, к которой подключен компьютер, а окончание определяет адрес компьютера в этой части сети.
Компьютеры при пересылке информации используют цифровые адреса ,а пользователи в работе с Интернетом используют в основном имена, то есть доменную систему имен.
7. Доменная адресация в сети Интернет .
Служба имен доменов DNS
Для пользователей числовой IP-адрес неудобен, поэтому используется доменная система обозначения компьютеров. Компьютеры обозначаются словами (именами), при этом сеть оказалась поделенной на части, называемые доменами (лат. dominium — владение). Домены даются во "владение" различным организациям, которые отвечают за их поддержку. Домены могут быть вложены друг в друга, т.е. организация, отвечающая за более крупный домен, имеет право назначать более мелкие в пределах этого домена.
Например, в адресе kvant.vnov.ru, домен высшего уровня ru означает, что компьютер с этим именем находится в Российской Федерации, затем идет домен второго уровня vnov, что означает в В. Новгороде, и лишь домен третьего уровня kvant - соответствует организации, за которой числится данный доменный адрес.
В Интернете используется доменная система имен компьютеров, которая включает в себя принцип последовательных уточнений(уровни). Каждый уровень в такой системе называется доменом. Домены отделяются друг от друга точками. Домен верхнего уровня располагается в имени правее, а домен нижнего уровня левее .В имени может быть любое число доменов, но чаще всего используются имена с количеством доменов от трех до пяти. Например.
www.tltsu.ru
В этом примере домен верхнего уровня ru указывает на то, адрес относится к российской части Интернета. Следующий уровень определяет организацию ,которой принадлежит данный адрес. В данном случае это Тольяттинский Государственный университет. Интернет-адрес ТГУ соответственно tltsu. Все компьютеры, подключенные к Интернету в ТГУ объединяются в группу ,имеющую такой адрес. Кафедре информатики университета допустим выделен свой домен с именем inf ..В результате полный Интернет-адрес этого компьютера будет
www.inf.tltsu.ru
Ранее отмечалось, что каждый компьютер имеет числовой IP-адрес, состоящий из четырех целых чисел от 0 до 255. Пользователю сети неудобно работать с числовым представлением IP-адреса, зато доменное имя запоминается легко. С другой стороны автоматическая работа серверов сети организована с использованием четырехзначного числового адреса. Благодаря ему промежуточные серверы могут осуществлять передачу запросов и ответов в нужном направлении ,не зная, где находится отправитель и получатель. Поэтому необходимо преобразование доменных имен в цифровую форму IP-адреса. Этим занимаются серверы службы имен доменов DNS(Domain NameServise). Создана база данных DNS, с помощью которой по имени компьютера можно определить его местонахождение в сети.
Запрос на получение одной из страниц сервера www.xyz.com сначала обрабатывается сервером DNS,и далее направляется по IP-адресу, а не по доменному имени. Таким образом существуют две разные формы записи адреса одного и того же сетевого компьютера.
URL — Викиреальность
(перенаправлено с «Url») Я вам кину ссылочкуURL (англ. Uniform Resource Locator, рус. Единый указатель ресурсов, ранее англ. Universal Resource Locator, рус. Универсальный указатель ресурсов) — единообразный локатор (определитель местонахождения) ресурса и стандартизированный способ записи адреса ресурса в сети Интернет. Самый используемый локатор в мире.
URL был изобретён Тимом Бернерсом-Ли в 1990 году в стенах Европейского совета по ядерным исследованиям (фр. Conseil Européen pour la Recherche Nucléaire, CERN) в Женеве, Швейцария. URL стал фундаментальной инновацией в Интернете. Изначально URL предназначался для обозначения мест расположения ресурсов (чаще всего файлов) во Всемирной паутине. Сейчас URL применяется для обозначения адресов почти всех ресурсов Интернета. Стандарт URL закреплён в документе RFC 1738, прежняя версия была определена в RFC 1630. Сейчас URL позиционируется как часть более общей системы идентификации ресурсов URI (англ. Uniform Resource Identification), сам термин URL постепенно уступает место более широкому термину URI. Стандарт URL регулируется организацией IETF и её подразделениями.
В целом, URL имеет схожую структуру, для всех схем, хотя для каждой отдельно взятой схемы, структура может отличаться от общего шаблона.
Графически она выражается так:[1]
Изначально локатор URL был разработан как система для максимально естественного указания на местонахождения ресурсов в сети. Локатор должен был быть легко расширяемым и использовать лишь ограниченный набор ASCII‐символов (к примеру, пробел никогда не применяется в URL). В связи с этим, возникла следующая традиционная форма записи URL:
<схема>://<логин>:<пароль>@<хост>:<порт>/<URL‐путь>?<параметры>#<якорь>
Где:
- схема — схема обращения к ресурсу; в большинстве случаев имеется в виду сетевой протокол (обычно http(s), mailto, irc, ftp)
- логин — имя пользователя, используемое для доступа к ресурсу
- пароль — пароль указанного пользователя
- хост — полностью прописанное доменное имя хоста в системе DNS или IP-адрес хоста в форме четырёх групп десятичных чисел, разделённых точками; числа — целые в интервале от 0 до 255. порт порт хоста для подключения URL-путь уточняющая информация о месте нахождения ресурса; зависит от протокола. параметры строка запроса с передаваемыми на сервер (методом GET) параметрами. Разделитель параметров — знак &. Пример: ?параметр_1=значение_1&параметр_2=значение_2&параметр3=значение_3
- якорь — идентификатор «якоря», ссылающегося на некоторую часть (раздел) открываемого документа. С развитием AJAX в этой части стали размещать параметры для JavaScript на странице, и страница в зависимости от указанного якоря может в браузере выглядеть по-разному. Для обеспечения возможности индексирования подобных страниц поисковыми системами компания Google предложила подход, предполагающий использование знака ! в начале якоря и некоторую поддержку на сервере сайта[2].
На сегодняшний день Тим Бернес-Ли признаёт, что символ двойной косой черты в структуре URL является избыточным[3].
[править] Схемы (протоколы)
Общепринятые схемы (протоколы) URL включают:
- ftp — Протокол передачи файлов FTP
- http — Протокол передачи гипертекста HTTP
- rtmp — Real Time Messaging Protocol проприетарный протокол потоковой передачи данных, в основном используется для передачи потокового видео и аудиопотоков с веб-камер через интернет.
- rtsp — Потоковый протокол реального времени.
- https — Специальная реализация протокола HTTP, использующая шифрование (как правило, SSL или TLS)
- gopher — Протокол Gopher
- mailto — Адрес электронной почты
- news — Новости Usenet
- nntp — Новости Usenet через протокол NNTP
- irc — Протокол IRC
- prospero — Служба каталогов Prospero Directory Service
- telnet — Ссылка на интерактивную сессию Telnet
- wais — База данных системы WAIS
- xmpp — Протокол XMPP (часть Jabber)
- file — Имя локального файла
- data — Непосредственные данные (Data: URL)
- tel — звонок по указаному телефону
Экзотические схемы URL:
- afs — Глобальное имя файла в файловой системе Andrew File System
- cid — Идентификатор содержимого для частей MIME
- mid — Идентификатор сообщений для электронной почты
- mailserver — Доступ к данным с почтовых серверов
- nfs — Имя файла в сетевой файловой системе NFS
- tn3270 — Эмуляция интерактивной сессии Telnet 3270
- z39.50 — Доступ к службам ANSI Z39.50
- skype — Протокол Skype
- smsto — Открытие редактора SMS в некоторых мобильных телефонах
- ed2k — Файлообменная сеть eDonkey, построенная по принципу P2P
- market — Android Маркет
[править] Кодирование URL
Появление адресов URL стало существенным нововведением в Интернете. Однако с момента его изобретения и по сей день стандарт URL обладает серьёзным недостатком — в нём можно использовать только ограниченный набор символов, даже меньший, нежели в ASCII: латинские буквы, цифры и лишь некоторые знаки препинания. Если мы захотим использовать в URL символы кириллицы, или иероглифы, или, скажем, специфические символы французского языка, то нужные нам символы должны быть перекодированы особым образом.
Поскольку такому преобразованию подвергаются буквы всех алфавитов, кроме базовой латиницы, то URL со словами на подавляющем большинстве языков (кроме английского, итальянского, латинского) может утратить способность восприниматься людьми.
Это всё входит в противоречие с принципом интернационализма, провозглашаемого всеми ведущими организациями Интернета, включая W3C и ISOC. Эту проблему призван решить стандарт IRI (англ. International Resource Identifier) — международных идентификаторов ресурсов, в которых можно было бы без проблем использовать символы Юникода, и которые поэтому не ущемляли бы права других языков. Хотя заранее сложно сказать, смогут ли когда-либо идентификаторы IRI заменить столь широко используемые URL (и URI в целом).
Ещё один кардинальный недостаток URL состоит в отсутствии гибкости. Ресурсы во Всемирной паутине и Интернете перемещаются, а ссылки в виде URL остаются, указывая на уже отсутствующие ресурсы. Это особенно болезненно для электронных библиотек, каталогов и энциклопедий. Для решения этой проблемы были предложены постоянные локаторы PURL (англ. Persistent Uniform Resource Locator). В сущности это те же URL, но они указывают не на конкретное место расположения ресурса, а на запись в базе данных PURL, где, в свою очередь, записан уже конкретный URL-адрес ресурса. При обращении к PURL сервер находит нужную запись в этой базе данных и перенаправляет запрос уже на конкретное местоположение ресурса. Если адрес ресурса меняется, то нет нужды исправлять все бесчисленные ссылки на него — достаточно лишь изменить запись в БД. В настоящий момент эта идея не стандартизирована и не имеет широкого распространения.
www.wikireality.ru
Что такое URL адрес сайта? Параметры, допустимые символы URL
Параметры и допустимые символы URL адреса сайта
В одной из предыдущих статей я описывал человеко-понятные урл — ЧПУ URL и разное отношение поисковиков к ним. В данной статье хотелось бы рассмотреть само понятие УРЛ, так как оно является основополагающим для всего Интернета.
URL (Uniform Resource Locator) — переводится с английского как Унифицированный указатель ресурса, или Единообразный (универсальный) локатор ресурса, т.е. это путь, по которому можно найти любой файл и каталог в сети Интернет.
URL адрес страницы сайта состоит из следующих элементов: протокол://полное доменное имя/(папка(и))/имя ресурса (файла). В расширенном варианте УРЛ может выглядеть так:
схема://логин:пароль@хост:порт/(папка(и))/имя ресурса (файла)?параметры#якорь
Основные параметры Урл:
- в качестве схемы выступает обычно какой-нибудь протокол, обычно это http(s), ftp и множество других (skype, nfs)
- логин-пароль нужны для прохождения одного из способов авторизации пользователя на сервере. Если авторизации не требуется, эти параметры не указываются
- хост — полное доменное имя или IP-адрес компьютера в сети. Например, для Яндекса — это Yandex.ru
- порт — на каком порту сервера будет производиться подключение к нему. В большинстве случаев, данный параметр не указывается, т.к. по умолчанию подразумевается порт 80, которым обычно пользуются браузеры. Попробуйте к любому URL адресу сайта подставить «:80», ничего нового не произойдёт — будет совершён переход на адрес «без порта». Например http://www.google.ru:80 перекинет на http://www.google.ru.
- далее идёт или сразу имя файла (например, page.php), или сначала 1 и более каталогов, а потом имя файла. Если имя файла отсутствует, то открывается т.н. индексный файл — index.php (index.html, index.jsp и множество других расширений).
- после имени файла могут указываться дополнительные параметры — после знака вопроса (?). Между параметрами ставится знак амперсанда (&). К примеру, выглядеть это может так: http://www.bing.com/account/web?sh=5&ru=%2f. Самих параметров может быть много, они имеют вид переменная=значение и обрабатываются на сервере с помощью языков серверного программирования
- якорь в URL подставляется после решётки (#) и указывает на элемент открываемой страницы, причём браузер обычно автоматически производит прокрутку до того html-элемента, id которого равно якорю. Например, на созданных на WordPress сайтах при клике на «Читать далее»как раз это и происходит:
Пример из WordPress’а
Допустимые символы URL
В URL адресе допустимы только латинские буквы, арабские цифры и ограниченный набор знаков препинания:
- дефис (-),
- подчёркивание (_)
- точка (.)
Также возможны запятые (,) и точки с запятой (;), но используются они редко и обычно кодируются, как и все остальные символы (русские буквы, пробелы и т.п.). Яркий пример закодированных урл’ов — статьи Википедии — http://ru.wikipedia.org/wiki/%D0%95%D0%B6.
Правила кодирования нелатинских букв (в т.ч. кириллицы) и прочих не допустимых символов URL: сначала буква кодируется в UTF-8 (кодировку Unicode) — получается 2 байта из каждого символа. Затем каждый из этих байтов преобразуется в шестнадцатиричную систему счисления и перед ним ставится знак процента (%), получается что-нибудь такое: %D0%95%D0%B6 (по-русски будет «еж»). Недопустимые знаки препинания кодируются так:
Кодирование символов в адресах. Справка из Википедии (кликабельно)
Среди УРЛ выделяют относительные и абсолютные, а также статические и динамические URL адреса страниц сайта. Об этом будет рассказано в следующих статьях.
Loading...web-ru.net
Почему в URL-адресе иногда появляются странные символы?
Любой пользователь не раз и не два копировал адрес для вставки в адресную строку браузера (URL-адрес), но иногда короткие и понятные адреса после копирования оказываются заполненными разными непонятными символами. Посмотрим, почему это происходит.
Единый указатель ресурсов (Uniform Resource Locator, URL) – это стандартизованный и уникальный адрес информационного ресурса в сети Интернет (веб-страницы или ее части), единообразный локатор (определитель местонахождения) ресурса. Иногда ее называют универсальным указателем ресурса. Первоначально старались сделать его вполне понятным человеку, подобно библиографической ссылке на страницу в книге. Однако сейчас адреса иногда становятся длинными и непонятными.
Для примера возьмем адрес одной из первых публикации нашего сайта и посмотрим на составляющие его части:
Перевод на лету. Skype Translator
Фрагмент «http://» определяет протокол, которым должен воспользоваться брузер для обращения на наш сайт. В данном случае, это протокол HTTP или HyperText Transfer Protocol (протокол пересылки гипертекста), который как раз и предназначен для веб-страниц (они являются гипертекстовыми документами в формате HTML, стандарт языка гипертекстовой разметки). Такой обмен данными предполагает наличие потребителей информации (клиентов), которые инициируют соединение и посылают запрос, и поставщиков информации (серверов), которые ожидают соединения для получения запроса, производят необходимые действия и возвращают обратно сообщение с результатом, т.е. возвращают браузеру содержимое запрошенной по адресу веб-страницы.
Часть «www.funtecs.ru» или просто «funtecs.ru», когда www добавляет браузер, определяет имя сервера, к которому нужно обратиться. Занято, что вначале, в первые дни существования Интернета этого было достаточно, поскольку все HTML-документы содержали прямые ссылки друг на друга на уровне имен серверов. Шон О’Коннор (Sean O’Connor), ведущий прикладной инженер сайта аббревиатур для длинных URL-адресов (Bit.ly), вспоминает:
«В этом достаточно простом мире подобной информации было вполне достаточно для ссылок между страницами: нужно было указать протокол (http://), сервер (www.example.com) и запрашиваемый документ на этом сервере (например, /articles/cool-info.html).
Однако веб-служба Интернета (использующая протокол HTTP) развивалась стремительно, поэтому вскоре пользователей перестали удовлетворять простые статические веб-страницы – потребовалась динамика, чтобы угнаться за постоянно меняющейся информацией. Именно поэтому в URL-адресах появились дополнительные части.
Например, всё, что указано в URL после символа «?», называется параметрами запроса «query parameters». Согласно указанным в браузере параметрам один сервер может выдавать разные страницы разным браузерам. Именно это свойство используется поисковыми системами для вывода пользователю динамической веб-страницы со списком информационных ресурсов, согласно ключевым словам поиска (параметрам запроса).
Продолжим обсуждения составных частей (синтаксиса нашего примера со страницей на сайте Фантекс).
После .ru находится символ «слэш – прямой косой черты /» и указано имя веб-страницы на сайте Фантекс. Таких слэшей может быть несколько и все они определяют так называемый путь (path) в файловой системе сервера, как и на любом другом компьютере.
Чтобы показать другие свойства URL-адреса, перейдем на сайт Google.ru и введем поисковый запрос «I like Funtecs (мне нравится Фантекс)», но в адресной строке появится:
https://www.google.ru/search?q=I+like+Funtecs
Если выполнен вход в учетную запись Google, то в конце будет еще длинная строка с описанием ваших реквизитов, чтобы поисковая система Google смогла подобрать список ссылок лично для пользователя. Проще говоря, разным пользователям по одному и тому же запросу выводится как разный список ссылок, так и разная реклама.
Иногда такой запрос будет выглядеть так:
https://www.google.ru/search?q=I%20like%20Funtecs
Этот процесс называется escaping (отмена неоднозначности). Дело в том, что один и тот же служебный символ может использоваться в запросе пользователя, но одновременно определять некоторую операцию/команду в адресной строке. Когда возникает неоднозначность такого рода, опасные символы заменяются альтернативным представление и в нашем примере символ «полюс» стал %20 (или %3F для вопросительного знака, например). Альтернативная запись есть у всех специальных символов, а принцип подстановки позволяет переправить их на сервер, даже если они совпадают с некоторыми командами (точнее с модификаторами команды).
Далее могут следовать пары ключ-значение (key-value), которые задают дополнительные параметры, например page=5 задает поиск на пятой странице сайта.
В любом случае запрос заканчивается знаком # (диез, знак фунта или хэш-тег в зависимости от национальности и возраста пользователя), который определяет раздел секция-результат (section-result). Всё это не отправляется на сервер и используется только самим браузером. Первоначально так задавали раздел в веб-документе, но сейчас эта часть URL-адреса используется по-разному.
Статические и динамические URL-адреса легко различить по используемым в них специальным символам. В адресе статической страницы, в дополнение к буквам и цифрам, могут быть только символы: точка, косая черта, тире и подчеркивание. Если же в адресе появляются знак вопроса, амперсанд, знак равенства, восклицательный знак, «звездочка» и т.д., значит мы видим динамическую веб-страницу, которая будет загружаться медленнее статической и не предполагает запоминания человеком, поскольку такой адрес вполне может измениться даже при следующем щелчке мышью. Обычно это таргетированная рекламная ссылка, используемая во время рекламных кампаний.
Есть еще два момента, на которые следует обратить внимание.
Во-первых, из-за непомерной длины некоторых URL появились средства для короткой записи адресов. Исходный длинный адрес заменяется коротким псевдонимом, ведущим на специальный сайт, в специальной таблице которого хранится настоящая полная ссылка. В этой связи можно отметить Bitly, TinyURL, Google URL Shortener или Ow.ly, но не следует забывать о небольшой задержке, которая возникает при замене одной операции двумя.
Во-вторых, использование русского языка в запросах и адресной части ведет к специальной записи букв кириллицы. Дело в том, что первоначально стандарт URL предполагал использование только латинских букв (в объеме, меньшем таблицы ASCII), поэтому для кириллицы, китайских иероглифов или специфических символов французского языка применяются подстановочные символы методом уже рассмотренным выше.
Например, мы можем назвать на компьютере файл или папку «Микрокредит», но адрес «http://funtecs.com /Микрокредит» будет выглядеть так:
«http://funtecs.com/%D0%9C%D0%B8%D0%BA%D1%80%D0%BE%D0%BA%D1%80%D0%B5%D0%B4%D0%B8%D1%82»
Такое преобразование происходит в два этапа: сначала каждый символ кириллицы кодируется в Юникоде (UTF-8) в последовательность из двух байтов, а затем каждый байт этой последовательности записывается в шестнадцатеричном представлении:
М → D0 и 9C → %D0%9Cи → D0 и B8 → %D0%B8к → D0 и BA → %D0%BAр → D1 и 80 → %D1%80 и т. д
Перед каждым таким шестнадцатеричным кодом байта, согласно стандарту URL, ставится знак процента.
Источник:https://tools.ietf.org/html/rfc3986http://gizmodo.com/why-are-urls-full-of-garbage-characters-1719538363
Интересные записи
funtecs.com
СЕТЕВЫЕ АДРЕСА (IP, URL) - Компьютерные секреты - Каталог файлов
СЕТЕВЫЕ АДРЕСА (IP, URL)
Я работаю в техподдержке одной крупной фирмы.
История приключилась с одним из моих коллег.
Он полдня настраивал сеть на тачках,
к обеду вернулся на свое место.
И понадобилось ему позвонить одному из клиентов.
Он недолго думая берет телефон и начинает набирать
IP-шник этого человека (что-то типа 10.20.5.37).
Прямо на телефоне!!! Как вы думаете, что его остановило?
Правильно! Точку не нашел... :)
Чтобы понять, каким же чудесным образом устроена Сеть, попробуем сравнить ее, скажем, с сетями кабельного телевидения, водопроводом или электросетью. Похоже? На первый взгляд — да (особенно сегодня, когда доступ к Интернету можно получить даже через электросеть, а сетевые розетки расположены порой бок о бок с электрическими).
Присмотреться поближе — не совсем. Ведь и ток по проводам, и вода по трубам текут во всех направлениях одинаково. Информация же в Сети должна доходить только до того, кому она предназначена.
Как это возможно?
Мы знаем, что Интернет состоит из великого множества отдельных компьютеров. Одни из них подключаются к Интернету лишь на короткое время, другие проживают в нем постоянно. Но независимо от того, каким статусом обладает тот или иной гость Сети, у него обязательно должен быть свой адрес — сочетание цифр, которое помогает найти этот компьютер в любом участке Сети. Называется эта кучка чисел IP-адресом. Выглядит он так:
212.176.20.1
Информация по сети передается отдельными порциями — пакетами. Каждый пакет несет в себе не только частичку какого-либо документа, фaйла-архива и т. д., но и содержит специальный заголовок, вроде почтового адреса на конверте. По этому заголовку можно понять и то, частью какого файла является пакет, и то, какому именно компьютеру в сети он предназначен. Специальные устройства-маршрутизаторы считывают эти заголовки — и перебрасывают пакеты к нужному компьютеру по цепочке. А уже на месте из пакетов собирается готовый документ.
Удобно. Но попробуйте-ка запомнить с первого раза эту комбинацию цифр! Поэтому когда мы, пользователи, ищем в сети какую-то страничку или сайт, мы набираем другой адрес — не цифровой, который далеко не всякий пользователь способен запомнить, а буквенный (он называется доменным именем). Термин "доменное имя” иногда заменяют английской аббревиатурой URL (Uniform Resource Locator).
http://www.olmamedia.ru — сайт издательства "ОЛМА Медиа Групп”
Здесь доменное имя — www.olmamedia.ru — соответствует IP-адресу 62.5.144.4.
Вместо доменного имени можно использовать и IP-адрес. Наберите его в адресной строке вашего браузера — и вы обязательно попадете на нужную страничку. Кстати, "буквенных адресов” у каждого сайта может быть несколько, в отличие от IP.
Удобен URL и для создателей сайтов — еще и потому, что этот условный адрес возможно привязать к любому компьютеру на планете. И вы можете "перекинуть” свой сайт физически, скажем, с компьютера в Москве на компьютер в Антарктиде, в то время как его "логический” адрес в Сети останется неизменным. Происходит это потому, что сами компьютеры этот буквенный адрес просто… не понимают! Еще бы — они привыкли иметь дело исключительно с цифрами, а потому IP-адрес остается для них единственным и неповторимым идентификатором компьютера в Сети. Потому и пришлось разработчикам Сети создать специальные "серверы доменных имен” (DNS), автоматически переводящие буквенные адреса (URL) (доменные имена) в цифровые (IP). DNS хранят в себе таблицы соответствия этих адресов, изменить которые — дело лишь нескольких минут. Кстати, именно на несанкционированном изменении таблиц основан популярный метод хакерских "атак” на сайт, при которых его официальная титульная "страничка” заменяется на "левую”, наскоро слепленную взломщиком. Жертвами подобного "взлома” в последние годы стали тысячи крупнейших сайтов, включая официальные представительства Microsoft, ФБР и Белого дома.
Как вы уже заметили, адреса сайтов состоят из нескольких важных элементов:
http:// — этот префикс, обозначающий протокол передачи гипертекстовых документов (Hypertext Transfer Protocol), подтверждает, что нам придется
иметь дело с элементом Всемирной Паутины, состоящим из гипертекстовых документов. Существуют и другие протоколы — например, ftp (File Transfer Protocol), который используется не для просмотра страниц, а для выкачки из Сети файлов.
http://www.microsoft.com
ftp://ftp.microsoft.com
Эти адреса очень похожи, но ведут на совершенно разные ресурсы. В первом случае — на сайт корпорации Microsoft. А во втором — в его "подвал”, обширное хранилище полезных программ.
При просмотре страниц Сети префикс http:// в адресах можно опустить.
www.olmamedia.ru
www — еще один "сигнальный флажок”, обозначающий принадлежность ресурса к системе www.
Существуют и сайты, по тем или иным причинам предпочитающие обходиться без "www”. Например, известный хакерский поисковый сервер Astalavista проживает по странному адресу: http://astalavista.box.sk
После префикса www располагается, наверное, самый важный элемент имени адреса — собственное имя сайта… Разумеется, каждый сайтостроитель, вытесав из сетевого "полена” собственного Буратино, стремится присвоить своему детищу имя покороче да позвучнее. А еще лучше — говорящее, чтобы любому было понятно, какую "начинку” содержит тот или иной элемент Сети. И вот тут-то начинаются проблемы. Слов-то в английском языке не так уж много — всего лишь пара сотен тысяч — и далеко не все из них подходят для "вывески” сайта. А самих сайтов — многие миллионы…
Именно поэтому из-за выгодных имен в Интернете часто разгораются целые "виртуальные войны”, которым в реальной жизни сопутствуют громкие судебные процессы. Буквально через год после рождения WWW предприимчивые пользователи обнаружили, что самые простые словечки, зарегистрированные в качестве адресов Интернета, могут принести им миллионы долларов! И это не преувеличение: в 2000 году редкая газета не написала о битве за адрес http://www.sex.com, стоимость которого оценивалась уже в сотни миллионов долларов! Еще бы — именно по этому адресу отправится большинство любителей "клубнички”, впервые зашедших в Сеть. А значит, вместе с потоком посетителей хозяина данного адреса ждет и немалая прибыль в виде доходов от рекламы… Так что перед нами — как раз тот случай, когда вывеска важнее содержания.
Конечно, все более-менее популярные "знаковые” слова уже давно заняты. Однако остаются еще торговые марки, названия организаций, имена раскрученных "звезд” кино и музыкального мира. Казалось бы, какие проблемы: регистрируй свою торговую марку в качестве имени сайта — и дело в шляпе! Так чаще всего и происходит. И потому на сайт крупной фирмы или корпорации можно попасть, навскидку составив адрес самостоятельно по формуле
www.названиефирмы.com
Но и здесь бывают забавные недоразумения. Так, несколько лет назад с нешуточными трудностями столкнулась корпорация McDonalds — возжелав зарегистрировать собственный сайт, она с удивлением обнаружила, что заветный адрес уже занят неким господином Мак-Дональдом, разместившим по этому адресу собственную персональную страничку. Крупнейший производитель мультимедиа-"железа”, корпорация Creative, несколько лет была вынуждена ютиться по невнятному адресу http://www.creaf.com, а всемирно известная поисковая машина AltaVista — по адресу http://www.altavista.tella.com
В 1999 году притчей во языцех стал казус с корпорацией Microsoft: к моменту выпуска новой операционной системы Windows 2000 оказалось, что адрес http://www.windows2000.com вполне законно зарегистрировал владелец маленькой фирмы по производству… окон.
И недоразумений этих с каждым годом становилось все больше — до тех пор, пока "захват” выгодных имен для последующей перепродажи не превратился в распространенный и выгодный вид бизнеса, названный "кибер-сквоттингом”. Жертвами сквоттеров, уводящих адреса сайтов прямо из-под носа их потенциальных обладателей, пали уже тысячи компаний, не говоря уже о неисчислимых "индивидуалах”. И теперь, к примеру, будущей эстрадной звезде приходится регистрировать адрес для своего сайта едва ли не раньше, чем будет записана первая песня…
…Да, хорошо иметь собственное доменное имя. Короткое и красивое. Однако такое удовольствие по карману далеко не всем. И часто случается так, что хозяин небольшого сайта (как правило — "домашней странички”) вынужден арендовать "жилое пространство” у серьезного и важного сервера (им может стать, например, сервер вашего провайдера). Но вот на то, чтобы заодно зарегистрировать для своего сайта полноценное имя, силенок может уже не хватить… И в этом случае его адрес будет выглядеть например так:
http://www.dataforce.net/~tantra/
Сразу становится понятно, что перед нами — небольшая домашняя страничка, расположенная на сервере компании Dataforce в папке, принадлежащей пользователю с логином tantra. Значок ~ (его еще называют "тильда”) указывает нам, что речь идет именно об отдельном сайте, проживающем на арендованном у Dataforce пространстве, а не об отдельном разделе самого сайта Dataforce. Наличие тильды, впрочем, далеко не всегда является обязательным. Вот как выглядит адрес "домашней странички”, расположенной в "виртуальном городе” на сервере Geocities:
http://www.geocities.com/Broadway/2989/
Кстати, закрывающая косая скобка ("слэш”) — весьма важный элемент адреса сайта. Она показывает, что нужный сайт расположен в отдельной папке на сервере. И если вы забудете набрать эту скобочку, то не попадете на нужную вам титульную страничку, вместо этого браузер начнет искать документ с именем 2989 в папке /Broadway/…
Последним элементом любого адреса является домен первого уровня. Принято считать, что все серверы Сети равноправны. И совершенно неважно, на каком компьютере и в какой стране они установлены. Однако для удобства серверы объединяют в некие логические группы, которые называются "доменными зонами”. Зоны эти могут быть как географическими, так и "тематическими”. Как вы догадались, принадлежность сервера к той или иной доменной зоне можно легко угадать по его адресу:
http://www.microsoft.com ftp://ftp.narod.ru
Географическая доменная зона выделяется каждому государству, подключенному через посредство своих компьютеров к Сети. Обозначается она, как правило, двумя буквами:
Домен
Страна
ch
Китай
fr
Франция
de
Германия
jp
Япония
ru
Россия
tw
Тайвань
ua
Украина
uk
Великобритания
"Тематическая” доменная зона, в отличие от географической, не привязана к какому-либо определенному региону: она может объединять компьютеры, физически находящиеся не только в разных странах, но и на разных континентах! Здесь компьютеры группируются уже по типу учреждений, которые ими владеют. А доменный индекс обозначается уже тремя и более буквами:
Домен
Тематическая зона
gov
правительственное учреждение
com
любая коммерческая организация
net
организация, имеющая отношение к сетевым услугам
mil
военное учреждение
int
международное учреждение
edu
образовательное учреждение
shop
сетевой магазин
pro
"профессиональное” учреждение
museum
музей
coop
объединение, корпорация
biz
любой бизнес-проект
info
любой ресурс информационной направленности
aero
организация, относящаяся к авиаиндустрии
name
персональная страничка
Регистрацией и поддержкой доменных зон ведает специальная организация — ICANN (The Internet Corporation for Assigned Names and Numbers), сайт которой расположен по адресу http://www.icann.org.
Кстати, на этом сайте есть полный список доменных зон первого уровня. Справочник, включающий более 300 TLD (Top Level Domains) вы найдете и в Приложениях книги "Новейшая энциклопедия Интернета”. Последние дополнения к этому списку были сделаны совсем недавно — всего лишь пару лет назад ICANN утвердила перечень новых доменов, часть из которых уже вступила в строй.
Далеко не все домены одинаково популярны в мире. Около 70 процентов всех сайтов расположено на "территории” .com. Правильный выбор домена первого уровня часто помогает смягчить ситуацию с нехваткой свободных имен. Допустим имя уже зарегистрировано в зоне .com. Однако не стоит забывать про другие домены — ведь это же имя может оказаться свободным в домене .net! Или, например, в региональном домене.
Таким образом, под казалось бы одним и тем же именем могут скрываться несколько различных сайтов! Например:
http://www.software.com
http://www.software.net
http://www.software.ru
Крупные компании, как правило, предпочитают регистрировать свои сайты сразу в нескольких доменных зонах, создавая своеобразные "региональные представительства”. Например, базовый сайт корпорации Intel находится по адресу http://www.intel.com, а его русскоязычное "зеркало” проживает на http://www.intel.ru.
Каждый сайт, зарегистрированный в доменной зоне первого уровня, сам становится доменом второго уровня, получая при этом адрес типа www.имясайта.домен. Например — http://www.da.ru. Дальше начинается самое интересное: новоиспеченный хозяин домена второго уровня получает возможность… самостоятельно раздавать домены, привлекая под свою "крышу” независимые мелкие сайты. Которым, правда, достается всего лишь домен третьего уровня — то есть, в их адресе будет содержаться уже два доменных идентификатора! А сам адрес при этом будет выглядеть так:
http://www.tantra.da.ru
http://www.leontiev.narod.ru
http://www.user.chat.ru
Как нетрудно догадаться, эти домены третьего уровня принадлежат сайтам, находящимся "под крышей” популярных "виртуальных городов” Da.Ru, Narod.Ru и Chat.Ru.
Адрес сайта мы с вами можем набирать и большими, и маленькими буквами:
www.tantra.da.ru
www.TANTRA.da.ru
www.Tantra.Da.Ru
Все эти адреса выведут вас на один и тот же сайт.
У страниц тоже есть свой собственный адрес! Являясь частью сайта, каждая страничка в то же время способна функционировать самостоятельно. Выглядеть адрес страницы может примерно так:
http://www.olma-press.ru/index.html
*.htm и *.html — два основных типа файла (или "расширения” его имени), соответствующие гипертекстовым документам, страничкам. В нашем примере — главной, титульной страничке сайта издательства "ОЛМА Медиа Групп”, выпустившего в свет эту книгу. Однако документы Сети могут иметь и другое расширение — например, asp.
Главная, титульная страничка на любом сайте открывается автоматически — достаточно просто набрать его, сайта, адрес (http://www.olmamedia.ru). А вот если вы захотите сразу открыть любую другую страничку сайта, вам придется указать ее полный адрес.
При наборе адреса странички обращайте внимание на регистр букв в той его части, которая указывает на конкретный документ. Вот простой пример:
http://omen.ru/love.htm
http://omen.ru/LOVE.HTM
Первая ссылка приведет вас в никуда, а вторая — на популярный сайт знакомств, расположенный на сервере Omen.ru
dad36383.ucoz.ru
- Главная
- Поисковые системы
- Сетевые протоколы
- Адресация в Интернет
- Законодательство - Конспекты - Тесты |
Адресация в Интернет IP - адрес IP - адрес состоит из четырех блоков цифр, разделенных точками. Он может иметь такой вид: 148.32.253.1 Каждый блок может содержать число от 0 до 255. Благодаря такой организации можно получить свыше четырех миллиардов возможных адресов. Но так как некоторые адреса зарезервированы для специальных целей, а блоки конфигурируются в зависимости от типа сети, то фактическое количество возможных адресов немного меньше. И тем ни менее, его более чем достаточно для будущего расширения Интернет. С понятием IP - адреса тесно связано понятие "хост". Под хостом понимается любое устройство, использующее протокол TCP/IP для общения с другим оборудованием. Это может быть не только к омпьютер, но и маршрутизатор, концентратор и т.п. Все эти устройства, подключенные в сеть, обязаны иметь свой уникальный IP - адрес. Пример записи IP-адреса: 128.105.0.45Подробнее DNS - адрес IP - адрес имеет числовой вид, так как его используют в своей работе компьютеры. Но он весьма сложен для запоминания, поэтому была разработана доменная система имен: DNS. DNS - адрес включает более удобные для пользователя буквенные сокращения, которые также разделяются точками на отдельные информационные блоки (домены). Например: www.site.net Если Вы вводите DNS - адрес, то он сначала направляется в так называемый сервер имен, который преобразует его в 32 - битный IP - адрес для машинного считывания.Основой DNS является представление об иерархической структуре доменного имени и зонах. Каждый сервер, отвечающий за имя, может делегировать ответственность за дальнейшую часть домена другому серверу (с административной точки зрения — другой организации или человеку), что позволяет возложить ответственность за актуальность информации на серверы различных организаций (людей), отвечающих только за «свою» часть доменного имени. Пример: Предположим, мы набрали в браузере адрес ru.wikipedia.org. Браузер спрашивает у сервера DNS: «какой IP-адрес у ru.wikipedia.org»? Однако, сервер DNS может ничего не знать не только о запрошенном имени, но даже обо всём домене wikipedia.org. В этом случае сервер обращается к корневому серверу — например, 198.41.0.4. Этот сервер сообщает — «У меня нет информации о данном адресе, но я знаю, что 204.74.112.1 является ответственным за зону org.» Тогда сервер DNS направляет свой запрос к 204.74.112.1, но тот отвечает «У меня нет информации о данном сервере, но я знаю, что 207.142.131.234 является ответственным за зону wikipedia.org.» Наконец, тот же запрос отправляется к третьему DNS-серверу и получает ответ — IP-адрес, который и передаётся клиенту — браузеру. Доменные имена DNS - адрес обычно имеет три составляющие (хотя их может быть сколько угодно). Первая - имя компьютера, подключенного к сети Интернет (или как его еще называют, узловое имя). Имя дает организация, владеющая данным компьютером. В приведенном выше примере компьютер имеет имя www, так как он работает как Web - сервер. Можно использовать или уже существующие в Интернет узловые имена, или придумать свои. Вторая часть - домен компании. Продолжая рассматривать приведенный пример, можно сказать, что компания "Технологические системы" имеет в Интернет доменное имя "tsua". Последняя составляющая доменного имени говорит либо о типе организации, владеющей компьютером, либо о стране, где размещен компьютер. В нашем примере домен "net" означает, что это сетевая организация. Пример записи доменного имени: wikipedia.org URL Uniform Resource Locator — единообразный локатор (определитель местонахождения) ресурса. Resource Locator — универсальный локатор ресурса. URL — это стандартизированный способ записи адреса ресурса в сети Интернет. URL был изобретён Тимом Бернерсом-Ли в 1990 году в стенах Европейского совета по ядерным исследованиям (фр. Conseil Europeen pour la Recherche Nucleaire, CERN) в Женеве, Швейцария. URL стал фундаментальной инновацией в Интернете. Изначально URL предназначался для обозначения мест расположения ресурсов (чаще всего файлов) во Всемирной паутине. Сейчас URL применяется для обозначения адресов почти всех ресурсов Интернета. Стандарт URL закреплён в документе RFC 1738, прежняя версия была определена в RFC 1630. Сейчас URL позиционируется как часть более общей системы идентификации ресурсов URI, сам термин URL постепенно уступает место более широкому термину URI. Стандарт URL регулируется организацией IETF и её подразделениями. Структура URL. Изначально локатор URL был разработан как система для максимально естественного указания на местонахождения ресурсов в сети. Локатор должен был быть легко расширяемым и использовать лишь ограниченный набор ASCII символов (к примеру, пробел никогда не применяется в URL). Пример записи URL-адреса: http://wikipedia.org IP - адрес |
appolovich.narod.ru
Сетевые технологии обработки информации | Адресация в Интернете
Чтобы можно было однозначно обозначить любой компьютер в Интернете, применяется специальная система адресов, называемая IP-адресами. Каждый компьютер получает свой уникальный адрес, который используется при пересылке информации. Адреса в Интернете могут быть представлены как последовательностью цифр, так и именем, построенным по определенным правилам. Компьютеры при пересылке информации используют цифровые адреса, а пользователи в работе с Интернетом используют, в основном, имена.
Хотя нет центра управления Интернетом, но есть организации, занимающиеся проверкой и выдачей адресов. Так что вы не можете самостоятельно, ни с кем не посоветовавшись, присвоить себе любой адрес.
Цифровые адреса в Интернете состоят из четырех чисел, каждое из которых не превышает двухсот пятидесяти шести. При записи числа отделяются точками, например: 192.84.93.10 или 187.5.78.175. Адрес состоит из нескольких частей. Начало адреса определяет часть Интернета, к которой подключен компьютер, а окончание - адрес компьютера в этой части сети. Цифровыми адресами пользуются только при настройке программ для работы с Интернетом, а дальше пользуются именами.
В Интернете используется так называемая доменная система имен. В доменной системе имена назначаются путем возложения на различные группы пользователей ответственности за подмножество имен. Каждый уровень в такой системе называется доменом. Домены отделяются друг от друга точками, например: www.microsoft.com. Рассмотрим принцип образования адреса на примере доменного имени home.managers.company.ru.
В обычных почтовых адресах используется последовательное уточнение страны, города, улицы и дома, в который следует доставить письмо. Также в Интернете доменная система имен использует принцип последовательных уточнений. Домен верхнего уровня располагается в имени правее, а домен нижнего уровня - левее. В нашем примере домен верхнего уровня ru указывает на то, что речь идет о российской части Интернета. Но в России множество пользователей Интернета, и следующий уровень определяет организацию, которой принадлежит данный адрес.
В нашем случае это фирма company. Интернет-адрес этой фирмы будет company.ru. Все компьютеры, подключенные к Интернету в этой фирме, объединяются в группу, имеющую такой адрес. Подразделению менеджеров в компании выделен свой домен с именем manager. Его полное имя будет, соответственно, manager.company.ru. Одному из компьютеров в данном подразделении присвоено имя home. В результате полный Интернет-адрес этого компьютера будет home.manager.company.ru.
Доменная система образования адресов гарантирует, что во всем Интернете больше не найдется другого компьютера с таким же адресом.
В имени может быть любое число доменов, но чаще всего используются имена с количеством доменов от трех до пяти.
Для доменов нижних уровней можно использовать любые адреса, но для доменов самого верхнего уровня существует соглашение. В системе адресов Интернета приняты домены, представленные географическими регионами. Они имеют имя, состоящее из двух букв.
Пример географических доменов некоторых стран:
Франция - fr;
Канада - са;
США - us;
Россия - ru.
Существуют и домены, разделенные по тематическим признакам. Такие домены имеют трехбуквенное сокращенное название. Например:
Учебные заведения - edu.
Правительственные учреждения - gov.
Коммерческие организации - com.
При работе в Интернете чаще всего используются не просто доменные адреса, а универсальные указатели ресурсов, называемые URL (Ю Эр Эль) - Universal Resource Locator. URL - это адрес любого ресурса в Интернете вместе с указанием того, с помощью какого протокола следует к нему обращаться, какую программу следует запустить на сервере и к какому конкретному файлу следует обратиться на сервере.
Общий вид URL:
протокол://хост-компьютер/имя файла.
Начальная часть URL, заканчивающаяся двоеточием, задает метод доступа (протокол) к ресурсу. Например: http, ftp и т.д. В большинстве случаев используется протокол http - Hyper Text Transfer Protocol (протокол передачи гипертекста). Две наклонные черты после двоеточия указывают, что далее следует адрес хост-компьютера. Далее указывается полный путь к файлу (директория и имя файла).
Примером указателя может быть http://www.microsoft.com/ie.
Название протокола http в начале указывает, что далее следует адрес WEB-страницы, а название ie в конце указателя описывает каталог с именем ie на сервере www.microsoft.com.
Или ftp://ftp.funet.fi/
Протокол ftp, имя хост-компьютера ftp.funet.fi
Подавляющее большинство крупных фирм имеют свои страницы в Интернете. Даже не зная точного адреса, часто его можно угадать. В большинстве случаев адрес состоит из имени www, указывающего на тип информации, собственного имени компании и имени com. Например, если вы хотите найти в Интернете фирму Philips, то скорее всего, ее адрес будет www.philips.com.
3ys.ru