Глава 1. Что такое интернет? Для начала приведу несколько популярных определений гло бальной сети интернет, наиболее, н...
20 downloads
368 Views
14MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
Глава 1. Что такое интернет? Для начала приведу несколько популярных определений гло бальной сети интернет, наиболее, на мой взгляд, отвечающих сущ ности предмета. Интернет (от international (международный) и net (сеть)) — это всемирная, кооперативно управляемая совокупность компьютерных сетей разного уровня и подчиненности, равноправ но обменивающихся информацией посредством базовых протоко лов TCP/IP. Интернет включает локальные сети, шлюзы, серверы и компьютеры, расположенные по всему миру. Структура интернета напоминает паутину, в узлах которой находятся серверы, объединенные между собой различными лини ями связи. Эти узлы, соединенные высокоскоростными информа ционными каналами, и составляют базис интернета. Принимая это определение, мы сталкиваемся с массой встречных вопросов: а что такое локальная сеть? Как выглядят шлюзы? Что представляют со бой серверы? Как работают протоколы? и т.д. и т.п. Ответы на эти и другие подобные вопросы будут даны на страницах данной книги, причем без нагромождения технических подробностей, которые, по правде сказать, важны понастоящему только специалистам. Начиная разговор про интернет, хотелось бы обязательно отме тить, что интернет — это еще и особая информационная среда, не только расширяющая и дополняющая возможности человеческого мировосприятия, но и порой диктующая свои законы и правила. Среда переменчивая, неуловимая, подчас неконтролируемая и постоянно ставящая человека перед выбором. Д авно не секрет, что в глобаль ной сети можно реализовать практически любой интерес, любую страсть. Не стоит только боготворить и ниспровергать по этому по воду сам интернет, искать в нем всеобщую панацею или всемирного козла отпущения. В интернете содержится только то, что создается живыми людьми для живых людей, совсеми их достоинствами и не достатками, со всеми мечтами и пороками. Интернет — это ведь еще и зеркало. Вопрос только в том, кто в него заглядывает и что хочет там увидеть. Игорь Пащенко
3
И еще. Не забывайте, что интернет весьма и весьма многолик и совсем не ограничивается привычными и известными для вас вида ми сервисов, а постоянно открывается своими неожиданными и не предсказуемыми гранями. Так что, общаясь с мировой сетью, не останавливайтесь в своих знаниях о ней, узнавайте новые ее секреты, постигайте интернет постоянно — двигайтесь дальше!
Как Internet стал интернетом? Начиная разговор про всемирную сеть, невозможно обойти еще один, казалось бы, чисто лингвистический вопрос: а как правильно употреблять этот термин? Если открыть любую газету или журнал или попытаться отыс кать ответ в самой глобальной сети, то среди первых же найденных упоминаний интернета, к вашему удивлению, выяснится, что спо собов «обозвать» всемирную сеть накопилось огромное множество: это и internal network и internetwork, а также INTERNET или internet (со строчной буквы), еще InterNet, Inter Net, а порусски – ИНТЕРНЕТ, Интернет, интернет… и т.д., и т.п. Слово то склоняется, то – нет. То оно мужского рода, то – жен ского (в основе ведь слово net — «сеть»). Так как все же правильно употреблять этот термин? Ответ при всей запутанности проблемы, мне кажется, очеви ден. В постепенной трансформации названия всемирной сети характерна одна закономерная особенность: чем дальше от момен та ее возникновения, тем меньше официальности наблюдается в употреблении этого термина — от застывшей торжественности «INTERNET» в 1980–1990е годы до совершенно обыденного — ин тернет, интернетом, в интернете и т.д. — ныне. На наших глазах уже произошло естественное вливание оче редного импортного термина в стихию русского языка. И, мне ду мается, как нет различия при написании и употреблении слов «те леграф», «телефон», «компьютер», так и слово «интернет» вовсе не нуждается в особом к себе отношении только потому, что это поня тие возникло совсем недавно и так много значит в нашей современ ной жизни (как будто все остальные перечисленные термины уже ничего не значат!). Так что смело, не оглядываясь на древние сетевые и компью терные авторитеты, пишите слово «интернет» со строчной буквы без ненужного пафоса и склоняйте его на здоровье, учитывая, ко нечно же, правила русского языка.
4
Интернет. Шаг за шагом
И на страницах этой книги всемирная сеть будет обозначаться наиболее приемлемым для русского языка, на мой взгляд, терми ном, а именно — интернет.
Что лежит в основе интернета? Когда вы слышите такие выражения, как «глобальная сеть», «всемирное информационное пространство», «сеть сетей» или все вышеперечисленные ранее термины, — то речь, как вы уже дога дались, идет об одном и том же, а именно — об интернете. Всемирную сеть с чем только не сравнивают — и с лабиринтом Минотавра, и с бескрайним океаном, и с информационным полем, и даже с неким всеобщим информационным облаком (!). Мне же близок образ интернета как бескрайнего городамега полиса, который состоит из конгломерата отдельных домов, райо нов и кварталов, соединенных в одно целое магистралями, улица ми и переулками. Каждый такой отдельный дом — это самостоятельная автоном ная сеть, общность которых посредством соединения каналами свя зи и порождает интернет (рис. 1.1). А цементирует основы интернета протокол TCP/IP — такой свое образный всесетевой языкэсперанто этого многоголосого города.
Рис. 1.1. Общая схема глобальной сети
Игорь Пащенко
5
Тема протоколов TCP/IP — это повод для отдельной и боль шой книги, насыщенной техническими данными и цифрами, ну а в нашем же случае мы разберем (немного позже) только общие осно вополагающие принципы, вполне достаточные для первоначального понимания и общения с интернетом на уровне пользователя. Становой хребет интернета составляют его опорные сети (Core Backbone Network) провайдеров высшего уровня, наиболее крупны ми из которых в мире являются UUNet, AT&T и т.д. Эти сети напо минают основные русла крупных многоводных рек, в которые на раз ных этапах вливаются рекипритоки — информационные каналы ме стных провайдеров. Все опорные сети без ограничений обменивают ся между собой интернеттрафиком. Весь же остальной мир получа ет доступ к хребту интернета уже через провайдеров первого (транс национального) уровня, имеющих выход в различные страны. Следом за провайдерами первого уровня расположены сетевые провайдеры уже второго уровня — национальные и третьего — ре гиональные, соединенные между собой высокоскоростными канала ми передачи данных, которые, в свою очередь, предоставляют дос туп к интернету местным провайдерам — Internet Service Provider. Провайдер (от англ. provider «снабжающий») — компания, ко торая обеспечивает выход в интернет, то есть «снабжающая» вас этой услугой. Именно провайдер на локальном уровне (город, посе лок и т.д.) и обеспечивает выход в интернет индивидуальных пользо вателей. Каждый провайдер на своем уровне решает все организа ционные, технические и финансовые вопросы, представляя в сво ем лице перед вами всю всемирную сеть. Благодаря такой распре деленной структуре сеть интернет сравнительно легко наращива ется и масштабируется, приспосабливаясь к постоянно изменяю щимся техническим, информационным и политическим условиям, что наглядно и демонстрируется все годы ее существования. Интернеттрафик — количество передаваемой информации, измеряемое в байтах (а учитывая ее огромный объем — скорее в гигабайтах и терабайтах). Шлюз (gateway) — это компьютер или система компьютеров со специальным программным обеспечением, позволяющим связывать ся двум сетям с разными протоколами. Чаще всего шлюзы связыва ют локальные вычислительные сети LAN (Local Area Network) с гло бальной сетью WAN (Wide Area Network) или две разнородные WAN. Маршрутизатор (router) – устройство, которое связывает сети с одинаковыми протоколами, но разными типами сетевого оборудова ния. Маршрутизаторы уменьшают трафик, пропуская в присоединен ную LAN только те данные, которые предназначены именно для нее.
6
Интернет. Шаг за шагом
Протокол передачи данных – специальные наборы правил, обеспечивающие обмен информацией как между отдельными уст ройствами, так и между целыми сетями.
Что такое протоколы TCP/IP? Компьютеры, включенные в мировую сеть, имеют, естествен но, абсолютно разную архитектуру и различное программное обес печение. И вот, чтобы осуществить их совместимость, и были созданы протоколы – специальные наборы правил, обеспечива ющие обмен информацией как между отдельными устройствами и процессами, так и между целыми сетями. Как уже было сказано выше, весь интернет цементируют прото колы семейства TCP/IP. В этой паре TCP (Transmission Control Protocol – протокол управления передачей) отвечает за то, как бу дет проходить информация по всемирной сети. Он обеспечивает установление надежного соединения между компьютерами и непо средственную пересылку данных, контролируя оптимальный раз мер пакета данных, возобновляя повторную передачу при сбое и т.д. В свою очередь, IP (Internet Protocol – межсетевой прото кол) отвечает за то, куда будет посылаться по сети информация, то есть он заведует адресацией пакетов. Согласно протоколу TCP проис ходит нарезка пересылаемых файлов на пакеты, каждый со своим точ ным адресом размещения в структуре файла. По месту прибытия полученные фрагменты собираются в единое целое. Такой пакет назы вается дейтаграммой. При этом если какойлибо фрагмент не дошел до места назначения, то по нему посылается встречный повторный запрос до тех пор, пока фрагмент не будет получен. При нарезке файлов на дейтаграммы TCP создает для каждой части информации конверт, со держащий сопутствующую информацию. Получившийся TCPпакет, в свою очередь, помещается в отдельный IPконверт, и получается окончательный IPпакет, с которым сеть вполне умеет обращаться. Хотя в реальности пакеты не только теряются, но и искажают ся при передаче изза помех и сбоев на линиях связи, TCP призван решать и эту проблему. В простейшем случае к каждому пакету добавляется код с контрольной суммой. При помещении фрагмен та в TCPконверт вычисляется его контрольная сумма, которая отображается в заголовке конверта. Если при получении вычисленная сумма не совпадает с той, что указана на конверте, значит, гдето в пути были или искажения, или частичная потеря, или несанкционированное вмешательство и надо переслать этот пакет заново, что и делается автоматически. Игорь Пащенко
7
Если дейтаграмма по какойлибо причине не может быть достав лена в пункт назначения, то она уничтожается. При этом компьюте руисточнику этого IPпакета отправляется уведомление об ошибке. У межсетевого протокола (IP) свои задачи: – адресация; – маршрутизация; – фрагментация дейтаграмм; – передача данных. При этом служебная часть каждой дейтаграммы содержит: – IPадрес получателя; – IPадрес отправителя; – общую длину пакета; – идентификатор пакета, который используется для распозна вания пакетов, образовавшихся путем деления исходного пакета; – время жизни пакета; – идентификатор протокола верхнего уровня, который указы вает, к какому протоколу верхнего уровня принадлежит данный пакет (например, TCP, UDP); – другую служебную информацию. Главные особенности протоколов TCP/IP: – открытость стандартов, разрабатываемых независимо от про граммного и аппаратного обеспечения сети; – независимость от непосредственной физической среды пере дачи; – уникальность адресации; – стандартизованность протоколов высокого уровня, использу емых в сервисах. TCP/IP делится на четыре уровня: 1) прикладной – взаимодействие непосредственно с сервисами разного назначения; 2) транспортный – основной уровень для передачи потока данных; 3) межсетевой – взаимодействие с сетями различного уровня (локальных сетей, территориальных сетей, линий специальной свя зи и т.п.); 4) физический и канальный – подбор определенных протоко лов уровня доступа к физической среде передачи данных (напри мер, локальных сетей Ethernet). Если рассмотреть принцип работы транспортного протокола более детально, то необходимо отметить, что он выполняет достав ку информации не между двумя компьютерами вообще, а только между прикладными процессами, например запущенной на вашем
8
Интернет. Шаг за шагом
компьютере почтовой программой и почтовым сервером. А для того чтобы информация нашла нужную программу (ведь на компьюте ре одновременно работает множество различных программ разно го назначения) и существует система портов. Порт – специальный номер, который присваивается каждому процессу на компьютере и который выполняет роль адреса отпра вителя и адреса получателя на транспортном уровне. При этом не которые номера портов присваиваются определенным процессам постоянно. Например, вебсервер работает через порт 80.
Игорь Пащенко
9
Глава 2. Как попасть в интернет? Многообразию определений интернета вполне соответствует и множество способов, с помощью которых можно оказаться во всемир ной сети. Каждый из этих методов имеет свои особенности, достоин ства и недостатки, а выбор того или иного пути в интернет часто зави сит от множества причин – как технических, так и финансовых.
1. Интернет-кафе Пожалуй, одна из самых популярных, особенно среди молоде жи, возможностей очутиться в сети – это воспользоваться услуга ми многочисленных интернеткафе, в которых довольно удачно сочетается идея побродить по всемирной паутине с возможностью выпить чашечку кофе. Услуги интернеткафе не требуют больших материальных затрат для пользователя — покупки компьютера, модема, подклю чения к сети и т.д. Интернеткафе легко доступны практически круг лосуточно и сравнительно недороги — не могу назвать точные циф ры, так как цены в различных регионах нашей страны довольно сильно разнятся. От пользователя не требуется заботиться о безо пасности работы в сети, о программах и настройках соединения и т.п. В последнее время получают распространение уже даже не про сто интернеткафе, а целые интернетрестораны, где доступ к сети осуществляется бесплатно по протоколу Wire Fire (WiFi). Wire Fire – это современная беспроводная технология соедине ния компьютеров в сеть или подключения их к интернету. Именно эта технология дает возможность перемещения (правда, в пределах действия сигнала) и делает интернет понастоящему мобильным. Уже многие портативные устройства (ноутбуки, наладонники, поддерживающие стандарт IEEE 802.11) имеют встроенный интер фейс WiFi. Если же встроенного интерфейса в устройстве не наблюдается, то можно использовать специальные WiFiадаптеры. Они выпускаются либо в виде карточек, вставляемых в PCMCIA слот ноутбука, либо в виде внешних устройств, подключаемых к USBпорту компьютера. При этом необходимо установить и при лагаемое к адаптеру программное обеспечение.
2. Коммутируемое соединение (dial-up) Это самый используемый способ вырваться на просторы интер нета у владельцев собственных компьютеров. В отличие от интернеткафе для организации собственного вы хода в интернет надо хорошенько оснаститься, а именно (рис. 2.1):
10
Интернет. Шаг за шагом
Рис. 2.1. Схема коммутируемого соединения (dialup)
– персональный компьютер; – модем; – канал связи (например, домашняя телефонная линия); – наличие провайдера в данном населенном пункте; – специальные программы дозвона, позволяющие соединять компьютер с телефоном провайдера. Коммутируемое соединение имеет следующие достоинства: – интернет только ваш и всегда у вас под рукой; – при удачно подобранном тарифном плане оплаты интернет бу дет обходиться сравнительно недорого (например, в ночное время); – свободная возможность настраивать компьютер и остальные необходимые технические средства по своему усмотрению; – возможность работы с нужным программным обеспечением; – большая самостоятельность и приватность работы в сети. Но имеется и целый ряд недостатков: – значительные первоначальные финансовые вложения в обу стройство своего выхода в интернет; – привязанность к одному месту выхода в интернет; – большая уязвимость к вирусам и хакерским атакам, а следова тельно – необходимость самостоятельно заботиться о безопасности; – низкая (как правило) скорость передачи данных при исполь зовании обычных телефонных модемов. Модуляция – процесс преобразования данных в сигнал опре деленной частоты, предназначенный для передачи по абонент ской линии, по специальному кабелю или, для беспроводных сис тем, по радиоволнам. Процесс обратного преобразования модули рованного сигнала называется демодуляцией. Игорь Пащенко
11
Модем (сокращение от МОДуляторДЕМодулятор) – устройство для преобразования информации из цифрового вида на компьютере в аналоговый сигнал в телефонной сети (и наоборот). Преобразова ние цифровых сигналов в аналоговые и наоборот выполняется в со ответствии с утвержденными международными стандартами,кото рые называются модемными протоколами (например, V.92). Пропускная способность модема (бит/с) – скорость, с которой модемы передают данные. Аналоговый сигнал – непрерывный колебательный сигнал, ха рактеризующийся такими понятиями, как частота и амплитуда. Ана логовые сигналы с оговоренными частотами служат для управления телефонными соединениями, например, сигнал «занято». Простой телефонный разговор является разновидностью аналогового сигна ла с постоянно меняющимися параметрами частоты и амплитуды. Цифровой сигнал – в отличие от аналогового прерывистый, то есть дискретный, и значение сигнала изменяется от минимального к максимальному без переходных состояний. Минимальному значению цифрового сигнала соответствует состояние «0», максимальному – «1». Цифровой сигнал, в отличие от аналогового, невозможно иска зить даже в условиях сильных шумов и помех на линии. В худшем случае сигнал просто не дойдет до конечного пользователя, но сис тема коррекции ошибок, которая присутствует в подавляющем боль шинстве цифровой аппаратуры связи, выявит отсутствующий бит и пошлет запрос на повторную пересылку испорченной порции инфор мации и таким образом восстановит сигнал в полном объеме.
3. Выделенная линия Это, безусловно, один из наилучших вариантов подключения к интернету, когда ваш компьютер с модемом постоянно связан с мо демом на сервере вашего провайдера. Тогда для вас не существует понятий – «невозможно дозвониться до провайдера», «разрыв со единения» и т.п. Преимущества работы по выделенной линии очевидны: – гарантированная круглосуточная высокоскоростная связь с интернетом; – надежность и устойчивость соединения; – высвобожденная телефонная линия; – оперативное получение почтовых сообщений в реальном вре мени; – защищенность от несанкционированного доступа; – возможность работы в интернете одновременно всех пользо вателей вашей локальной сети.
12
Интернет. Шаг за шагом
Прежде всего, постоянное подключение необходимо для обес печения потребности в скоростном и надежном доступе к сети ин тернет. Выделенный канал будет необходим тем, кто перерос обычное модемное подключение с его повременной оплатой, невысокой ско ростью доступа (как правило) и не всегда надежной связью с про вайдером, диктуемой качеством наших телефонных каналов, а так же тем, кто может потратить на организацию выделенной линии определенные средства (опять же в зависимости от места вашего проживания и многих технических проблем). Далее даны основные характеристики нескольких основных способов организации выделенных линий. ISDN ISDN (Integrated Services Digital Network) – интегрированная цифровая сеть, при которой устанавливается цифровое соедине ние между компьютером и модемом провайдера. При этом инфор мация передается без предварительного преобразования в анало говую форму с помощью модема, что значительно увеличивает ско рость обмена. Используется открытая цифровая телефонная сеть, но меньшее число каналов. Основные каналы ISDN – это обычные телефонные линии. Прав да, в них поддерживается большее напряжение, а именно 90 В. Несу щая частота сигналов при этом составляет 80 кГц. Качественная рабо та возможна только при длине телефонного провода не более 4,5 км. ISDN во многом аналогично технологии dialup, только необхо димо подсоединить к компьютеру не обычный, а специальный циф ровой модем. Затем все происходит по той же схеме – дозвон к про вайдеру, установка соединения и т.д., но при этом достигаются го раздо большая скорость передачи данных, более устойчивая связь и мгновенная установка соединения. ADSL ADSL (Asymmetric Digital Subscriber Line, асимметричная циф ровая абонентская линия) – высокоскоростная коммуникационная технология, разработанная специально для использования обыч ных телефонных линий. ADSL является наиболее популярной тех нологией из целого семейства xDSL. хDSL представляет собой целое семейство технологий, позво ляющих значительно расширить пропускную способность обычной телефонной сети путем использования эффективных линейных кодов и методов цифровой обработки сигнала. Игорь Пащенко
13
Технологии хDSL позволяют передавать данные со скоростя ми, значительно превышающими те скорости, которые доступны даже самым лучшим аналоговым и цифровым модемам. Эти техно логии поддерживают передачу голоса, высокоскоростную переда чу данных и видеосигналов, создавая при этом значительные пре имущества как для пользователей, так и для провайдеров. xDSL использует более широкую полосу частот телефонной линии, чем обычная телефонная связь, – 300–3400 Гц. Это позво ляет достичь значительно более высокой скорости передачи дан ных, чем это возможно при использовании существующей ограни ченной полосы частот. Скорость передачи к пользователю и скорость передачи от пользователя по ADSL неодинаковы (именно поэтому данная циф ровая абонентская линия и называется асимметричной). При этом скорость передачи к пользователю значительно превышает скорость передачи от пользователя, что легко объяснимо общим направлени ем трафика в сети – пользователь получает больше информации, чем отсылает в сеть. Для создания соединения ADSL требуются два ADSLмодема: один – у провайдера и один – у пользователя. Между двумя этими модемами — обычный телефонный провод. Скорость соединения зависит от длины «последней мили» – чем дальше о т модема провайдера расположен модем пользователя, тем слабее сигнал и меньше максимальная скорость пересылки данных.
4. Мобильный интернет GPRS GPRS (General Packet Radio Service) – система пакетной пере дачи данных по сети сотовой связи GSM. Одна из новейших технологий высокоскоростной передачи дан ных в мобильных сетях. Включает в себя аппаратное и программ ное обеспечение. Для эффективной передачи неравномерного трафика техноло гия GPRS использует пакетную технологию. Она поддерживает скорость передачи от 9,6 Кб/с до более чем 150 Кб/с. Для работы с GPRS необходимо, чтобы оператор сотовой связи поддерживал GPRS в вашем регионе (что на практике еще проис ходит не везде), предоставлял для всех желающих коммерческий доступ к своей GPRSсети. Ну и, конечно же, необходим сам теле фонный аппарат с поддержкой GPRS. Кроме того, нужен канал передачи информации от телефона к компьютеру (как правило, специальный кабель, который часто вхо дит в комплект телефона).
14
Интернет. Шаг за шагом
5. Спутниковый интернет При организации выхода в интернет с использованием спутни кового канала передача информации от пользователя в интернет осуществляется по привычным наземным каналам (через модем ное соединение или же по выделенной линии), а вот передача ин формации пользователю из сети – уже по спутниковому каналу. Работа системы организована так, что из интернета все ответы на запросы пользователей системы идут через его сервер, а сервер, в свою очередь, направляет ответы через спутниковый канал свя зи к пользователям. Для использования интернета со спутника необходимо (рис. 2.2): – компьютер; – спутниковая антенна (тарелка) диаметром не менее 90 см; – стандартный конвертор; – DVBкарта (с помощью данной карты можно также смотреть спутниковое телевидение на компьютере); – оплаченный доступ к интернету любого провайдера. С помощью DVBкарты принимается поток данных из интерне та через спутник в то время, как запросы вашей системы отправля ются по обычным наземным линиям связи с использованием модема.
Рис. 2.2. Схема спутникового интернета
Игорь Пащенко
15
Глава 3. World Wide Web Что такое WWW? В истории науки и техники уже не раз уже случалось, когда одно удачное название или торговая марка становились популяр ными настолько, что постепенно вытесняли из обихода имена сво их конкурентов и вскоре делались символами всего явления. Ти пичный пример подобного превращения – название фирмы Xerox, чье имя стало синонимом всей копировальной техники и самого про цесса снятия копий с документов. Подобное на наших глазах случилось и с аббревиатурой WWW, когда, по мере развития мировой сети и ее сервисов, для многих но вых пользователей понятие «интернет» и «WWW» (World Wide Web – всемирная паутина) прочно стали словамисинонимами и полнос тью взаимозаменяемыми понятиями. Произошло это в силу различ ных причин, одной из которых было совпадение бурного роста числа пользователей компьютеров с рождением и расцветом технологии WWW, которая изза своей наглядности и сравнительной простоты, а также изза универсальности при общении с другими сервисами стала олицетворять собой весь интернет в целом. А программы про смотра WWW стали соответственно самыми главными, а порой и единственными программами для общения с интернетом. О том, что интернет гораздо шире и разнообразнее сервиса WWW, многие начинающие пользователи и не догадываются.
Когда появилась WWW? Итак, прежде всего, WWW (the Web, или – 3W) – это далеко не весь интернет, а только распределенная информационная система мультимедиа, основанная на гипертексте, которая является состав ной частью более емкого понятия интернет. WWW – информационный сервис, которому достаточно труд но дать краткое и корректное определение. Вот только некоторые из эпитетов, которыми он может быть отмечен: гипертекстовый, гипермедийный, распределенный, интегрирующий и глобальный. Система World Wide Web предназначена для гипертекстового объ единения документов из разных сетей и установления легкодоступ ных и независимых от физического размещения информации уни версальных гипермедийнных связей между этими документами. Основа всемирной паутины – это WWWсерверы, которые раз бросаны по всему миру и доступны пользователям, имеющим выход в интернет, при помощи программклиентов – браузеров.
16
Интернет. Шаг за шагом
Браузер (от англ. browse – «просматривать») – программа, ото бражающая вебстраницы, написанные кодом HTML, JavaScript, PHP и др. Термин появился еще при становлении языков програм мирования (таких, как FORTRAN и Pascal), но стал понастоящему популярным только с развитием сервиса WWW. Во многих доку ментах используется написание «броузер», в принципе, оба эти на писания считаются вполне равноправными. Идея всемирной паутины – World Wide Web – была впервые высказана Тимом БернерсЛи (Tim BernersLee) в служебной за писке «World Wide Web: Proposal for HyperText Project», адресо ванной коллегамфизикам CERN (Europeen pour la Recherche Nucleaire – Европейский центр ядерных исследований, Женева, Швейцария), еще в марте 1989 года. Но только 17 мая 1991 года стандарт WWW, включающий воз можность просмотра сайтов и обмена сообщениями электронной почты, был утвержден консорциумом разработчиков. Этот день можно считать датой рождения сервиса WWW. В это же время Тим БернерсЛи разработал и первый интер нетбраузер – программу для просмотра и редактирования элект ронных документов, называемых вебстраницами, а также разра ботал и первый интернетсервер как основу будущей паутины. Вебстраница (webpage, home page, WWWpage) – это файл гипертекстового документа, созданный при помощи языка HTML и расположенный на сервере для просмотра с помощью браузера. Как правило, он имеет расширение .htm или .html. Это – основная еди ница хранения информации в WWW cо своим уникальным адре сом. Обычно вебстраничка создается частным лицом или неболь шой компанией гденибудь на бесплатном сервере с использовани ем многочисленных шаблонов оформления, имеет при этом неболь шие размеры и скромную посещаемость. Вебсайт (Website, site) – совокупность логически связанных между собой вебстраниц, размещенных на одном сервере со всем массивом информации. Портал (от англ. portal – «главный вход») — конгломерат свя занных между собой различных сервисов (электронная почта, фо румы, чаты, интернетмагазины, голосования, рассылка и т.д., и т.п., собственная поисковая система), расположенный на одном сайте. Как правило, портал – это большой и часто посещаемый сайт. В большинстве случаев порталы строятся вокруг поисковых машин и каталогов, например, Yandex.ru, Rambler.ru. Часто вебстраницу или вебсайт называют вебузлом. Игорь Пащенко
17
Интернетсервер – компьютер, предоставляющий свои ресур сы (услуги, информацию, файлы, диски, принтеры и т.д.) для со вместного использования в сети. Один компьютер может выполнять одновременно функции нескольких серверов, например, Webсер вера, FTPсервера, DNSсервера. Другие типы серверов: файлсер вер, сервер печати, факссервер, почтовый сервер и т.д. В 1994 году Тим БернерсЛи возглавил созданный им же The World Wide Web Consortium (3WC) (Международный вебконсор циум), которым и руководит до сих пор. В декабре 2003 года Тим БернерсЛи, «отец» WWW, удостоен титула «Рыцарь Британской империи». А в 2004м он получил самую главную премию в своей жизни, став лауреатом премии «Millennium Technology Prize». Эта премия ценится на уровне Нобелевской, но только в области инфор мационных технологий (к сожалению, среди номинации настоящей Нобелевской премии подобной нет). К концу 1992го в CERN были уже вовсю запущены первые веб браузеры и сеть протянулась к многочисленным физическим лабо раториям всего мира, объединяя научные ресурсы. В 1994 году она вышла за пределы научного мира, успешно завоевав весь мир. И сейчас, спустя многие годы после тех знаменательных событий, лаборатория в Женеве остается в авангарде сетевых исследований благодаря разработке новой Gridтехнологии, с помощью которой предполагается объединить мощнейшие мировые вычислительные ресурсы. Не исключено, что мы становимся свидетелями становле ния новой мировой паутины, которую уже все чаще называют «Ин тернет2». В этом эксперименте участвуют 12 стран (Великобрита ния, США, Швейцария, Чехия, Франция, Германия, Венгрия, Ита лия, Япония, Россия, Испания и Тайвань).
Что лежит в основе WWW? Обычно гипертекстовые системы имеют специальные про граммные средства построения гипертекстовых связей, при этом сами гипертекстовые ссылки хранятся в специальных форматах или даже составляют специальные файлы. Такой подход был хо рош для небольшой локальной системы, но не для сети, распреде ленной на множестве различных компьютеров. И вот, согласно раз работкам Т. БернерсаЛи гипертекстовые ссылки стали встраивать ся в само тело документа и храниться как его часть. В WWW все документы – это самые обычные ASCIIфайлы, которые можно подготовить в любом текстовом редакторе. ASCIIфайлы – текстовые файлы в однобайтной кодировке ASCII (American Standard Code for Information Interchange – Аме
18
Интернет. Шаг за шагом
риканский стандартный код для обмена информацией). Семи или восьмибитная кодовая таблица ASCII позволяет закодировать 128 или 256 разных знаков. Стандартная кодировка ASCII использует 7 битов для представления всех прописных и строчных букв, чисел от 0 до 9, знаков препинания и специальных управляющих симво лов, применяемых в английской раскладке для США. Расширен ная кодировка использует восьмой бит каждого кода для представ ления 128 дополнительных специальных символов, букв различных национальных алфавитов и графических знаков. Главная идея Т. БернерсаЛи состояла в том, чтобы перенести уже существовавшую на тот момент гипертекстовую модель на информационные ресурсы, распределенные уже не в локальной, а во всемирной сети, причем самым простым, нетрудоемким и нагляд ным способом. Что, надо отметить, и было с честью им выполнено. Своими разработками Т. БернерсЛи заложил фундамент сис темы WWW, создав ее самые главные составляющие и предопре делив вид всемирной сети и ее развитие на годы вперед. Итак, перечислим фундаментальные основы WWW: – язык гипертекстовой разметки документов – HTML (HyperText Markup Language) – главный программный инструмент для создания вебстраниц; – универсальный способ адресации ресурсов в сети – URL (Universal Resource Locator) – способ уникальной адресации веб страниц в просторах интернета; – протокол обмена гипертекстовой информацией – HTTP (HyperText Transfer Protocol) – способ передачи запросов и отве тов от программклиентов к серверам. Несколько позже к этим основополагающим разработкам, ко мандой NCSA (National Centre for Supercomputing Applications – Национальный центр суперкомпьютерных приложений) была до бавлена четвертая, немаловажная основа WWW: — универсальный интерфейс шлюзов CGI (Common Gateway Interface) – способ рас ширения программного обеспечения WWW, использующийся для создания вебсервисов (вебмагазины и т.п). Подводя итоги, можно вкратце сказать, что вебстраницы пи шутся на языке HTML, определяются по адресу в сети с помощью URL и доступны по протоколу HTTP, а дополнительные возможно сти вебресурсов согласовываются с помощью CGI. Теперь же рассмотрим немного подробнее эти принципы WWW.
Игорь Пащенко
19
Что собой представляет язык HTML? HyperText Markup Language – язык гипертекстовой разметки документов. Это основной язык для создания вебстраниц. Важной составляющей языка является описание встроенных и ассоцииро ванных гипертекстовых ссылок, внедренной графики и обеспече ние возможности поиска по ключевым словам. Гипертекст – специальным образом организованная связь с помощью ссылок между различными частями одного документа или разными документами на разных компьютерах. Документ, написанный на языке HTML, представляет собой простой текстовый файл, содержащий непосредственно текст ин формации, а также специальные флажки разметки – теги, разбро санные по документу. Теги (tag) – встроенные символыуказания, которые разброса ны по документу и выполняют роль инструкций для программы просмотра. При этом текст самих тегов браузером при просмотре страницы не отображается. Именно согласно инструкциям тегов браузер и отображает текст на экране, включает в него рисунки (как правило, хранящиеся в отдельных папках в виде графических фай лов), таблицы и формирует гиперсвязи с другими документами или ресурсами интернета. Таким образом, файл, созданный на языке HTML, приобретает вид законченной WWWстраницы только тогда, когда он просмат ривается браузером (например, Internet Explorer’ом). Язык HTML на сегодняшний день существует в нескольких ва риантах, продолжая развиваться дальше и оставаясь основой почти всего программного обеспечения, которое имеет отношение к WWW. Все теги, вставленные в документ, отделяются от обычного текста специальными значками: начинаются символом «<» и заканчиваются символом «>». Как правило, теги существуют единой парой – откры вающий тег и закрывающий тег. Завершающий тег отличатся от стар тового тем, что у него перед текстом в скобках <> стоит символ «/» (слеш), между которыми и помещается информация страницы. В каждом HTMLдокументе должны присутствовать три глав ные части: 1) объявление HTML; 2) заголовочная часть; 3) тело документа. Объявление HTML и – эта пара тегов сообщает браузеру, что они заключают внутри себя документ именно в формате HTML, при
20
Интернет. Шаг за шагом
этом первым тегом выступает тег (в самом начале доку мента), а последним – (в самом конце документа). Заголовочная часть и Внутри этих тегов располагается техническая информация о документе (его заголовок, ключевые слова для его индексации по исковыми сайтами, описание и т.д.). В этой части самым важным является название вебстраницы, которое и отображается затем в верхней строке окна браузера, а также в меню «Избранное». Про граммы поисковых сайтов используют это название страницы для построения своих баз данных. Для того чтобы дать название непосредственно HTMLдокумен ту, необходимый текст помещается между другими тегами <TITLE> и . Тело документа Третьей главнейшей частью документа является его тело. Оно располагается непосредственно за заголовком и ограничивается тегами (располагается сразу же после ) и