Всемирная паутина ( WWW или просто Веб ) — это информационная система , которая позволяет обмениваться контентом через Интернет удобными для пользователя способами, рассчитанными на пользователей, не являющихся специалистами в области ИТ и любителями. [1] Она позволяет получать доступ к документам и другим веб-ресурсам через Интернет в соответствии с определенными правилами протокола передачи гипертекста (HTTP). [2]
Веб был изобретен английским ученым-компьютерщиком Тимом Бернерсом-Ли во время работы в ЦЕРНе в 1989 году и открыт для публики в 1991 году. Он был задуман как «универсальная связанная информационная система». [3] [4] Документы и другой медиаконтент предоставляются в сети через веб-серверы и могут быть доступны с помощью таких программ, как веб-браузеры . Серверы и ресурсы во Всемирной паутине идентифицируются и располагаются с помощью строк символов, называемых унифицированными указателями ресурсов (URL).
Первоначальный и по-прежнему очень распространенный тип документа — это веб-страница , отформатированная на языке гипертекстовой разметки (HTML). Этот язык разметки поддерживает простой текст , изображения , встроенное видео- и аудиосодержимое и скрипты (короткие программы), реализующие сложное взаимодействие с пользователем. Язык HTML также поддерживает гиперссылки (встроенные URL-адреса), которые обеспечивают немедленный доступ к другим веб-ресурсам. Веб-навигация или веб-серфинг — это обычная практика перехода по таким гиперссылкам на нескольких веб-сайтах. Веб-приложения — это веб-страницы, которые функционируют как прикладное программное обеспечение . Информация в Интернете передается через Интернет с помощью HTTP. Несколько веб-ресурсов с общей темой и обычно общим доменным именем составляют веб-сайт . Один веб-сервер может предоставлять несколько веб-сайтов, в то время как некоторые веб-сайты, особенно самые популярные, могут предоставляться несколькими серверами. Содержимое веб-сайта предоставляется множеством компаний, организаций, государственных учреждений и отдельных пользователей ; и включает в себя огромное количество образовательной, развлекательной, коммерческой и правительственной информации.
Интернет стал доминирующей в мире платформой информационных систем . [5] [6] [7] [8] Это основной инструмент, который миллиарды людей по всему миру используют для взаимодействия с Интернетом. [2]
Веб был изобретен английским ученым-компьютерщиком Тимом Бернерсом-Ли во время работы в ЦЕРНе . [9] [10] Его мотивировала проблема хранения, обновления и поиска документов и файлов данных в этой большой и постоянно меняющейся организации, а также их распространения среди сотрудников за пределами ЦЕРНа. В своем проекте Бернерс-Ли отклонил общий подход к древовидной структуре , используемый, например, в существующей системе документации CERNDOC и в файловой системе Unix , а также подходы, которые полагались на маркировку файлов ключевыми словами , как в системе VAX/NOTES. Вместо этого он принял концепции, которые он применил на практике с помощью своей частной системы ENQUIRE (1980), созданной в ЦЕРНе. Когда он узнал о гипертекстовой модели Теда Нельсона ( 1965), в которой документы могут быть связаны неограниченными способами с помощью гиперссылок, связанных с «горячими точками», встроенными в текст, это помогло подтвердить обоснованность его концепции. [11] [12]
Модель была позже популяризирована системой HyperCard компании Apple . В отличие от Hypercard, новая система Бернерса-Ли с самого начала была предназначена для поддержки связей между несколькими базами данных на независимых компьютерах и для обеспечения одновременного доступа многих пользователей с любого компьютера в Интернете. Он также указал, что система должна в конечном итоге обрабатывать другие медиа, помимо текста, такие как графика, речь и видео. Ссылки могли ссылаться на изменяемые файлы данных или даже запускать программы на их сервере. Он также задумал «шлюзы», которые позволяли бы получать доступ через новую систему к документам, организованным другими способами (например, традиционные компьютерные файловые системы или Usenet ). Наконец, он настоял на том, что система должна быть децентрализованной, без какого-либо центрального контроля или координации создания ссылок. [3] [13] [9] [10]
Бернерс-Ли представил предложение в ЦЕРН в мае 1989 года, не дав системе названия. [3] Он получил работающую систему, реализованную к концу 1990 года, включая браузер под названием WorldWideWeb (который стал названием проекта и сети) и HTTP-сервер, работающий в ЦЕРН. В рамках этой разработки он определил первую версию протокола HTTP, базовый синтаксис URL и неявно сделал HTML основным форматом документа. [14] Технология была выпущена за пределы ЦЕРН для других исследовательских институтов, начиная с января 1991 года, а затем для всего Интернета 23 августа 1991 года. Веб имел успех в ЦЕРН и начал распространяться на другие научные и академические институты. В течение следующих двух лет было создано 50 веб-сайтов . [15] [16]
В 1993 году ЦЕРН сделал протокол и код веб-сайта доступными без уплаты роялти, что позволило широко использовать их. [17] [18] После того, как NCSA выпустила веб-браузер Mosaic в том же году, популярность Интернета быстро росла , и тысячи веб-сайтов появились менее чем за год. [19] [20] Mosaic был графическим браузером, который мог отображать встроенные изображения и отправлять формы , которые обрабатывались HTTPd-сервером . [21] [22] Марк Андрессен и Джим Кларк основали Netscape в следующем году и выпустили браузер Navigator , который представил Java и JavaScript в Интернете. Он быстро стал доминирующим браузером. Netscape стала публичной компанией в 1995 году, что вызвало ажиотаж вокруг Интернета и начало пузыря доткомов . [23] Microsoft ответила разработкой собственного браузера Internet Explorer , положив начало войнам браузеров . Объединив его с Windows, он стал доминирующим браузером на 14 лет. [24]
Бернерс-Ли основал Консорциум Всемирной паутины (W3C), который создал XML в 1996 году и рекомендовал заменить HTML на более строгий XHTML . [25] Тем временем разработчики начали использовать функцию IE под названием XMLHttpRequest для создания приложений Ajax и запустили революцию Web 2.0 . Mozilla , Opera и Apple отвергли XHTML и создали WHATWG , которая разработала HTML5 . [26] В 2009 году W3C уступил и отказался от XHTML. [27] В 2019 году он передал контроль над спецификацией HTML WHATWG. [28]
Всемирная паутина сыграла центральную роль в развитии информационного века и является основным инструментом, который миллиарды людей используют для взаимодействия в Интернете . [29] [30] [31] [8]
Тим Бернерс-Ли утверждает, что World Wide Web официально пишется как три отдельных слова, каждое с заглавной буквы, без промежуточных дефисов. [32] Тем не менее, его часто называют просто Web , а также web ; см. Capitalization of Internet для получения подробной информации. На мандаринском китайском языке World Wide Web обычно переводится с помощью фоносемантического соответствия как wàn wéi wǎng (万维网), что удовлетворяет www и буквально означает «10 000-мерная сеть», перевод, который отражает концепцию дизайна и распространение World Wide Web.
Использование префикса www снижается, особенно когда веб-приложения стремятся брендировать свои доменные имена и сделать их легкопроизносимыми. По мере роста популярности мобильного Интернета [ требуется цитата ] такие сервисы, как Gmail .com, Outlook.com , Myspace .com, Facebook .com и Twitter .com, чаще всего упоминаются без добавления «www.» (или, действительно, «.com») к домену. [33]
В английском языке www обычно читается как дабл-у дабл-у дабл-у . [34] Некоторые пользователи произносят его как даб-даб-даб , особенно в Новой Зеландии. [35] Стивен Фрай в своей серии подкастов «Podgrams» произносит его как ву ву ву . [36] Английский писатель Дуглас Адамс однажды пошутил в The Independent on Sunday (1999): «Всемирная паутина — единственное известное мне явление, чьё сокращённое название занимает в три раза больше времени, чем то, что оно обозначает». [37]
Термины Интернет и Всемирная паутина часто используются без особого различия. Однако эти два термина не означают одно и то же. Интернет — это глобальная система компьютерных сетей, связанных между собой посредством телекоммуникаций и оптических сетей . В отличие от этого, Всемирная паутина — это глобальная коллекция документов и других ресурсов , связанных гиперссылками и URI . Доступ к веб-ресурсам осуществляется с помощью HTTP или HTTPS , которые являются протоколами Интернета прикладного уровня, использующими транспортные протоколы Интернета. [2]
Просмотр веб-страницы во Всемирной паутине обычно начинается либо с ввода URL-адреса страницы в веб-браузер, либо с перехода по гиперссылке на эту страницу или ресурс. Затем веб-браузер инициирует серию фоновых коммуникационных сообщений для извлечения и отображения запрошенной страницы. В 1990-х годах использование браузера для просмотра веб-страниц и перехода с одной веб-страницы на другую с помощью гиперссылок стало известно как «просмотр», «веб-серфинг» (после серфинга каналов ) или «навигация по Сети». Ранние исследования этого нового поведения изучали пользовательские шаблоны использования веб-браузеров. Например, одно исследование обнаружило пять пользовательских шаблонов: исследовательский серфинг, серфинг окон, развитый серфинг, ограниченная навигация и целевая навигация. [38]
Следующий пример демонстрирует работу веб-браузера при доступе к странице по URL-адресуhttp://example.org/home.html. Браузер разрешает имя сервера URL (пример.org) в адрес интернет-протокола с использованием глобально распределенной системы доменных имен (DNS). Этот поиск возвращает IP-адрес, такой как 203.0.113.4 или 2001:db8:2e::7334 . Затем браузер запрашивает ресурс, отправляя HTTP- запрос через Интернет на компьютер по этому адресу. Он запрашивает обслуживание с определенного номера порта TCP, который хорошо известен для службы HTTP, чтобы принимающий хост мог отличить HTTP-запрос от других сетевых протоколов, которые он может обслуживать. HTTP обычно использует порт номер 80 , а для HTTPS он обычно использует порт номер 443 . Содержимое HTTP-запроса может быть таким же простым, как две строки текста:
GET /home.html HTTP / 1.1 Хост : example.org
Компьютер, получающий HTTP-запрос, доставляет его программному обеспечению веб-сервера, прослушивающему запросы на порту 80. Если веб-сервер может выполнить запрос, он отправляет HTTP-ответ обратно в браузер, указывая на успешное выполнение:
HTTP / 1.1 200 OK Тип содержимого : text/html; набор символов=UTF-8
за которым следует содержимое запрашиваемой страницы. Язык гипертекстовой разметки ( HTML ) для базовой веб-страницы может выглядеть следующим образом:
< html > < head > < title > Example.org – Всемирная паутина </ title > </ head > < body > < p > Всемирная паутина, сокращенно WWW и широко известная ... </ p > </ body > </ html >
Веб-браузер анализирует HTML и интерпретирует разметку ( , для абзаца и т. д.), которая окружает слова, чтобы отформатировать текст на экране. Многие веб-страницы используют HTML для ссылки на URL-адреса других ресурсов, таких как изображения, другие встроенные медиа, скрипты , которые влияют на поведение страницы, и каскадные таблицы стилей , которые влияют на макет страницы. Браузер делает дополнительные HTTP-запросы к веб-серверу для этих других типов интернет-медиа . По мере получения их содержимого с веб-сервера браузер постепенно отображает страницу на экране, как указано в ее HTML и этих дополнительных ресурсах.<title>
<p>
Язык гипертекстовой разметки (HTML) — стандартный язык разметки для создания веб-страниц и веб-приложений . Вместе с каскадными таблицами стилей (CSS) и JavaScript он образует триаду краеугольных технологий для Всемирной паутины. [39]
Веб-браузеры получают HTML-документы с веб-сервера или из локального хранилища и преобразуют документы в мультимедийные веб-страницы. HTML описывает структуру веб-страницы семантически и изначально включал подсказки для внешнего вида документа.
HTML-элементы являются строительными блоками HTML-страниц. С помощью HTML-конструкций изображения и другие объекты, такие как интерактивные формы, могут быть встроены в визуализированную страницу. HTML предоставляет средства для создания структурированных документов , обозначая структурную семантику для текста, такого как заголовки, абзацы, списки, ссылки , цитаты и другие элементы. HTML-элементы разграничиваются тегами , записанными с использованием угловых скобок . Теги, такие как и , напрямую вводят содержимое на страницу. Другие теги, такие как окружают и предоставляют информацию о тексте документа и могут включать другие теги в качестве подэлементов. Браузеры не отображают HTML-теги, но используют их для интерпретации содержимого страницы.<img />
<input />
<p>
HTML может встраивать программы, написанные на языке сценариев , таком как JavaScript , который влияет на поведение и содержание веб-страниц. Включение CSS определяет внешний вид и макет контента. Консорциум Всемирной паутины (W3C), поддерживающий стандарты HTML и CSS, поощряет использование CSS вместо явного презентационного HTML с 1997 года. [40][update]
Большинство веб-страниц содержат гиперссылки на другие связанные страницы и, возможно, на загружаемые файлы, исходные документы, определения и другие веб-ресурсы. В базовом HTML гиперссылка выглядит следующим образом:<a href="http://example.org/home.html">Example.org Homepage</a>.
Такая коллекция полезных, связанных между собой ресурсов, связанных между собой гипертекстовыми ссылками, называется сетью информации. Публикация в Интернете создала то, что Тим Бернерс-Ли впервые назвал WorldWideWeb (в его первоначальном CamelCase , который впоследствии был отброшен) в ноябре 1990 года. [41]
Структура гиперссылок в Интернете описывается веб -графом : узлы веб-графа соответствуют веб-страницам (или URL-адресам), направленные ребра между ними — гиперссылкам. Со временем многие веб-ресурсы, на которые указывают гиперссылки, исчезают, перемещаются или заменяются другим контентом. Это делает гиперссылки устаревшими, явление, называемое в некоторых кругах гнилью ссылок, а гиперссылки, затронутые этим, часто называют «мертвыми» ссылками . Эфемерная природа Интернета побудила множество усилий по архивированию веб-сайтов. Архив Интернета , действующий с 1996 года, является наиболее известным из таких усилий.
Многие имена хостов, используемые для Всемирной паутины, начинаются с www из-за давней практики именования хостов Интернета в соответствии с предоставляемыми ими услугами. Имя хоста веб-сервера часто www , так же как это может быть ftp для FTP-сервера и news или nntp для сервера новостей Usenet . Эти имена хостов появляются как имена системы доменных имен (DNS) или имена поддоменов , как в www.example.com . Использование www не требуется никакими техническими или политическими стандартами, и многие веб-сайты не используют его; первым веб-сервером был nxoc01.cern.ch . [42] По словам Паоло Палацци, который работал в ЦЕРНе вместе с Тимом Бернерсом-Ли, популярное использование www в качестве поддомена было случайным; страница проекта Всемирной паутины должна была быть опубликована на www.cern.ch, в то время как info.cern.ch должна была стать домашней страницей ЦЕРНа; Однако записи DNS никогда не переключались, и практика добавления www к доменному имени веб-сайта учреждения была впоследствии скопирована. [43] [ требуется лучший источник ] Многие известные веб-сайты все еще используют префикс или используют другие имена поддоменов, такие как www2 , secure или en для специальных целей. Многие такие веб-серверы настроены так, что и основное доменное имя (например, example.com), и поддомен www (например, www.example.com) ссылаются на один и тот же сайт; другие требуют одну или другую форму, или они могут отображаться на разных веб-сайтах. Использование имени поддомена полезно для балансировки нагрузки входящего веб-трафика путем создания записи CNAME , которая указывает на кластер веб-серверов. Поскольку в настоящее время [ по состоянию на? ] в CNAME можно использовать только поддомен, того же результата нельзя достичь, используя голый корень домена. [44] [ сомнительно – обсудить ]
Когда пользователь отправляет неполное доменное имя в веб-браузер в поле ввода адресной строки, некоторые веб-браузеры автоматически пытаются добавить префикс «www» в начало и, возможно, «.com», «.org» и «.net» в конец, в зависимости от того, что может отсутствовать. Например, ввод «microsoft» может быть преобразован в http://www.microsoft.com/ , а «openoffice» в http://www.openoffice.org . Эта функция начала появляться в ранних версиях Firefox , когда он еще имел рабочее название «Firebird» в начале 2003 года, из более ранней практики в браузерах, таких как Lynx . [45] [ ненадежный источник? ] Сообщается, что Microsoft получила патент США на ту же идею в 2008 году, но только для мобильных устройств. [46]
Спецификаторы схемы http://
и https://
в начале веб -URI ссылаются на Hypertext Transfer Protocol или HTTP Secure соответственно. Они указывают протокол связи, который следует использовать для запроса и ответа. Протокол HTTP является основополагающим для работы Всемирной паутины, а добавленный уровень шифрования в HTTPS необходим, когда браузеры отправляют или получают конфиденциальные данные, такие как пароли или банковская информация. Веб-браузеры обычно автоматически добавляют http:// к введенным пользователем URI, если он пропущен.
Веб -страница (также пишется как веб-страница ) — это документ, который подходит для Всемирной паутины и веб-браузеров . Веб-браузер отображает веб-страницу на мониторе или мобильном устройстве .
Термин веб-страница обычно относится к тому, что видимо, но может также относиться к содержимому самого компьютерного файла , который обычно является текстовым файлом, содержащим гипертекст, написанный на HTML или сопоставимом языке разметки . Типичные веб-страницы предоставляют гипертекст для просмотра других веб-страниц с помощью гиперссылок , часто называемых ссылками . Веб-браузеры часто должны будут получать доступ к нескольким элементам веб-ресурсов , таким как чтение таблиц стилей , скриптов и изображений, при представлении каждой веб-страницы.
В сети веб-браузер может получить веб-страницу с удаленного веб-сервера . Веб-сервер может ограничить доступ к частной сети, такой как корпоративная интрасеть. Веб-браузер использует протокол передачи гипертекста (HTTP) для выполнения таких запросов к веб-серверу .
Статическая веб-страница доставляется точно так же, как хранится, как веб-контент в файловой системе веб-сервера . Напротив, динамическая веб-страница генерируется веб-приложением , обычно управляемым серверным программным обеспечением . Динамические веб-страницы используются, когда каждому пользователю может потребоваться совершенно разная информация, например, банковские веб-сайты, веб-почта и т. д.
Статическая веб-страница (иногда называемая плоской страницей/стационарной страницей ) — это веб-страница , которая доставляется пользователю точно в том виде, в котором она хранится, в отличие от динамических веб-страниц , которые генерируются веб-приложением .
Следовательно, статическая веб-страница отображает одну и ту же информацию для всех пользователей из всех контекстов, с учетом современных возможностей веб -сервера по согласованию типа содержимого или языка документа, если такие версии доступны и сервер настроен на это.
Серверная динамическая веб-страница — это веб-страница , создание которой контролируется сервером приложений, обрабатывающим серверные скрипты. В серверных скриптах параметры определяют, как происходит сборка каждой новой веб-страницы, включая настройку дополнительной клиентской обработки.
Клиентская динамическая веб-страница обрабатывает веб-страницу с помощью JavaScript, запущенного в браузере. Программы JavaScript могут взаимодействовать с документом через Document Object Model (DOM), чтобы запрашивать состояние страницы и изменять его. Те же самые клиентские методы затем могут динамически обновлять или изменять DOM таким же образом.
Затем пользователь или компьютерная программа перезагружает динамическую веб-страницу , чтобы изменить некоторый переменный контент. Информация об обновлении может поступать с сервера или из изменений, внесенных в DOM этой страницы. Это может или не может обрезать историю просмотров или создать сохраненную версию для возврата, но динамическое обновление веб-страницы с использованием технологий Ajax не создаст страницу для возврата и не обрежет историю просмотров перед отображаемой страницей. Используя технологии Ajax, конечный пользователь получает одну динамическую страницу, управляемую как единая страница в веб-браузере, в то время как фактическое веб-содержимое, отображаемое на этой странице, может меняться. Движок Ajax находится только в браузере, запрашивая части своего DOM, DOM , для своего клиента, с сервера приложений.
Динамический HTML, или DHTML, — это общий термин для технологий и методов, используемых для создания веб-страниц, которые не являются статическими веб-страницами , хотя он вышел из употребления с появлением AJAX , термина, который в настоящее время сам по себе используется редко. [ необходима ссылка ] Клиентские скрипты, серверные скрипты или их комбинация обеспечивают динамический веб-опыт в браузере.
JavaScript — это язык сценариев , который был первоначально разработан в 1995 году Бренданом Эйхом , тогда работавшим в Netscape , для использования на веб-страницах. [47] Стандартизированная версия — ECMAScript . [47] Чтобы сделать веб-страницы более интерактивными, некоторые веб-приложения также используют методы JavaScript, такие как Ajax ( асинхронный JavaScript и XML ). Клиентский скрипт поставляется со страницей, которая может выполнять дополнительные HTTP-запросы к серверу либо в ответ на действия пользователя, такие как движения мыши или щелчки, либо на основе прошедшего времени. Ответы сервера используются для изменения текущей страницы, а не для создания новой страницы с каждым ответом, поэтому серверу нужно только предоставить ограниченную, инкрементную информацию. Несколько запросов Ajax могут обрабатываться одновременно, и пользователи могут взаимодействовать со страницей, пока извлекаются данные. Веб-страницы также могут регулярно опрашивать сервер, чтобы проверить, доступна ли новая информация. [48]
Веб -сайт [49] представляет собой набор связанных веб-ресурсов, включая веб-страницы , мультимедийный контент, обычно идентифицируемый с общим доменным именем и опубликованный по крайней мере на одном веб-сервере . Известными примерами являются wikipedia .org, google .com и amazon.com .
Доступ к веб-сайту может осуществляться через общедоступную сеть Интернет-протокола (IP), такую как Интернет , или через частную локальную сеть (LAN), ссылаясь на унифицированный указатель ресурса (URL), который идентифицирует сайт.
Веб-сайты могут иметь множество функций и использоваться различными способами; веб-сайт может быть персональным веб-сайтом , корпоративным веб-сайтом для компании, правительственным веб-сайтом, веб-сайтом организации и т. д. Веб-сайты обычно посвящены определенной теме или цели, от развлечений и социальных сетей до предоставления новостей и образования. Все общедоступные веб-сайты в совокупности составляют Всемирную паутину, в то время как частные веб-сайты, такие как веб-сайт компании для ее сотрудников, обычно являются частью интрасети .
Веб-страницы, которые являются строительными блоками веб-сайтов, представляют собой документы , обычно составляемые в виде простого текста , перемежаемого инструкциями по форматированию языка гипертекстовой разметки ( HTML , XHTML ). Они могут включать элементы с других веб-сайтов с подходящими якорями разметки . Доступ к веб-страницам и их передача осуществляются с помощью протокола передачи гипертекста (HTTP), который может опционально использовать шифрование ( HTTP Secure , HTTPS) для обеспечения безопасности и конфиденциальности пользователя. Приложение пользователя, часто веб-браузер , отображает содержимое страницы в соответствии с инструкциями по его HTML-разметке на дисплейном терминале .
Гиперссылки между веб-страницами передают читателю структуру сайта и направляют навигацию по сайту, который часто начинается с домашней страницы, содержащей каталог веб-контента сайта . Некоторые веб-сайты требуют регистрации пользователя или подписки для доступа к контенту. Примерами подписных веб-сайтов являются многие бизнес-сайты, новостные веб-сайты, веб-сайты академических журналов , игровые веб-сайты, веб-сайты обмена файлами, доски объявлений , веб- электронная почта , веб-сайты социальных сетей , веб-сайты, предоставляющие котировки цен в реальном времени для различных типов рынков, а также сайты, предоставляющие различные другие услуги. Конечные пользователи могут получать доступ к веб-сайтам с различных устройств, включая настольные и портативные компьютеры , планшетные компьютеры , смартфоны и смарт-телевизоры .
Веб -браузер (обычно называемый браузером ) — это программный пользовательский агент для доступа к информации во Всемирной паутине. Чтобы подключиться к серверу веб-сайта и отобразить его страницы, пользователю необходимо иметь программу веб-браузера. Это программа, которую пользователь запускает для загрузки, форматирования и отображения веб-страницы на своем компьютере.
Помимо предоставления пользователям возможности находить, отображать и перемещаться между веб-страницами, веб-браузер обычно имеет такие функции, как сохранение закладок, запись истории, управление файлами cookie (см. ниже) и домашними страницами, а также может иметь средства для записи паролей для входа на веб-сайты.
Наиболее популярными браузерами являются Chrome , Firefox , Safari , Internet Explorer и Edge .
Веб -сервер — это серверное программное обеспечение или аппаратное обеспечение, предназначенное для работы указанного программного обеспечения, которое может удовлетворять запросы клиентов Всемирной паутины. Веб-сервер может, как правило, содержать один или несколько веб-сайтов. Веб-сервер обрабатывает входящие сетевые запросы по HTTP и нескольким другим связанным протоколам.
Основная функция веб-сервера — хранить, обрабатывать и доставлять веб - страницы клиентам . [50] Связь между клиентом и сервером осуществляется с использованием протокола передачи гипертекста (HTTP) . Доставляемые страницы чаще всего представляют собой HTML-документы , которые могут включать изображения , таблицы стилей и скрипты в дополнение к текстовому содержимому.
Пользовательский агент , обычно веб-браузер или веб-сканер , инициирует связь, делая запрос на определенный ресурс с использованием HTTP, и сервер отвечает содержимым этого ресурса или сообщением об ошибке, если не может этого сделать. Ресурс обычно является реальным файлом на вторичном хранилище сервера , но это не обязательно так и зависит от того, как реализован веб-сервер .
Хотя основная функция заключается в обслуживании контента, полная реализация HTTP также включает способы получения контента от клиентов. Эта функция используется для отправки веб-форм , включая загрузку файлов.
Многие универсальные веб-серверы также поддерживают серверные скрипты с использованием Active Server Pages (ASP), PHP (Hypertext Preprocessor) или других языков сценариев . Это означает, что поведение веб-сервера может быть описано в отдельных файлах, в то время как фактическое серверное программное обеспечение остается неизменным. Обычно эта функция используется для динамической генерации HTML-документов («на лету»), а не для возврата статических документов . Первый вариант в основном используется для извлечения или изменения информации из баз данных . Последний вариант обычно намного быстрее и легче кэшируется , но не может доставлять динамический контент .
Веб-серверы также часто можно обнаружить встроенными в такие устройства, как принтеры , маршрутизаторы , веб-камеры и обслуживающими только локальную сеть . Веб-сервер может затем использоваться как часть системы для мониторинга или администрирования рассматриваемого устройства. Обычно это означает, что на клиентском компьютере не нужно устанавливать дополнительное программное обеспечение, поскольку требуется только веб-браузер (который теперь включен в большинство операционных систем ).
Файл cookie HTTP (также называемый веб-куки , интернет-куки , браузерный куки или просто куки ) — это небольшой фрагмент данных, отправляемый с веб-сайта и сохраняемый на компьютере пользователя веб-браузером пользователя во время просмотра. Файлы cookie были разработаны как надежный механизм для веб-сайтов, позволяющий запоминать информацию о состоянии (например, товары, добавленные в корзину в интернет-магазине) или регистрировать действия пользователя при просмотре (включая нажатие определенных кнопок, вход в систему или запись посещенных страниц в прошлом). Их также можно использовать для запоминания произвольных фрагментов информации, которые пользователь ранее вводил в поля форм, например, имена, адреса, пароли и номера кредитных карт.
Файлы cookie выполняют важные функции в современном Интернете. Возможно, самое важное, файлы cookie аутентификации являются наиболее распространенным методом, используемым веб-серверами для определения того, вошел ли пользователь в систему или нет, и с какой учетной записью он вошел в систему. Без такого механизма сайт не знал бы, отправлять ли страницу, содержащую конфиденциальную информацию, или требовать от пользователя пройти аутентификацию, войдя в систему. Безопасность файла cookie аутентификации, как правило, зависит от безопасности веб-сайта-эмитента и веб-браузера пользователя, а также от того, зашифрованы ли данные файла cookie. Уязвимости безопасности могут позволить хакеру прочитать данные файла cookie , использовать их для получения доступа к данным пользователя или использовать для получения доступа (с учетными данными пользователя) к веб-сайту, которому принадлежит файл cookie (см. примеры межсайтового скриптинга и подделки межсайтовых запросов ). [51]
Отслеживающие файлы cookie, и особенно сторонние отслеживающие файлы cookie, обычно используются как способ составления долгосрочных записей истории просмотров отдельных лиц — потенциальная проблема конфиденциальности , которая побудила европейских [52] и американских законодателей принять меры в 2011 году. [53] [54] Европейское законодательство требует, чтобы все веб-сайты, ориентированные на государства-члены Европейского Союза, получали «осознанное согласие» пользователей перед сохранением необязательных файлов cookie на их устройствах.
Исследователь Google Project Zero Ян Хорн описывает способы, которыми файлы cookie могут быть прочитаны посредниками , такими как поставщики точек доступа Wi-Fi . В таких обстоятельствах он рекомендует использовать браузер в режиме приватного просмотра (широко известный как режим инкогнито в Google Chrome). [55]
Поисковая система в Интернете или поисковая система в Интернете — это программная система , предназначенная для выполнения поиска в Интернете ( поиска в Интернете ), что означает поиск во Всемирной паутине систематическим образом определенной информации, указанной в поисковом запросе в Интернете . Результаты поиска, как правило, представлены в строке результатов, часто называемых страницами результатов поисковой системы (SERP). Информация может представлять собой смесь веб-страниц , изображений, видео, инфографики, статей, исследовательских работ и других типов файлов. Некоторые поисковые системы также извлекают данные, доступные в базах данных или открытых каталогах . В отличие от веб-каталогов , которые поддерживаются только редакторами-людьми, поисковые системы также поддерживают информацию в реальном времени , запуская алгоритм на веб-краулере . Интернет-контент, который не может быть найден поисковой системой в Интернете, обычно описывается как глубокая паутина .
Глубокая паутина, [56] невидимая паутина , [57] или скрытая паутина [58] — это части Всемирной паутины, содержимое которых не индексируется стандартными поисковыми системами . Противоположный термин глубокой паутине — поверхностная паутина , которая доступна любому пользователю Интернета. [59] Ученый-компьютерщик Майкл К. Бергман приписывает создание термина « глубокая паутина» в 2001 году в качестве термина поисковой индексации. [60]
Содержимое глубокой паутины скрыто за HTTP- формами [61] [62] и включает в себя множество очень распространенных применений, таких как веб-почта , онлайн-банкинг и услуги, за которые пользователи должны платить и которые защищены платным доступом , например, видео по запросу , некоторые онлайн-журналы и газеты и т. д.
Содержимое глубокой паутины можно найти и получить к нему доступ по прямому URL-адресу или IP-адресу , и для доступа за пределы общедоступной страницы веб-сайта может потребоваться пароль или другие меры безопасности.
Веб -кэш — это серверный компьютер, расположенный либо в общедоступном Интернете, либо на предприятии, который хранит недавно посещенные веб-страницы для улучшения времени отклика для пользователей, когда тот же контент запрашивается в течение определенного времени после исходного запроса. Большинство веб-браузеров также реализуют кэш браузера , записывая недавно полученные данные на локальное устройство хранения данных. HTTP-запросы браузера могут запрашивать только данные, которые изменились с момента последнего доступа. Веб-страницы и ресурсы могут содержать информацию об истечении срока действия для управления кэшированием с целью защиты конфиденциальных данных, например, в онлайн-банкинге , или для упрощения часто обновляемых сайтов, например, новостных СМИ. Даже сайты с очень динамичным контентом могут разрешать обновление основных ресурсов только изредка. Разработчики веб-сайтов считают целесообразным объединять ресурсы, такие как данные CSS и JavaScript, в несколько общесайтовых файлов, чтобы их можно было эффективно кэшировать. Корпоративные брандмауэры часто кэшируют веб-ресурсы, запрашиваемые одним пользователем, в интересах многих пользователей. Некоторые поисковые системы хранят кэшированное содержимое часто посещаемых веб-сайтов.
Для преступников Интернет стал местом распространения вредоносного ПО и совершения различных киберпреступлений , включая (но не ограничиваясь) кражу личных данных , мошенничество , шпионаж и сбор разведывательной информации . [63] Уязвимости в Интернете теперь превышают по количеству традиционные проблемы компьютерной безопасности, [64] [65] и, по оценкам Google , примерно одна из десяти веб-страниц может содержать вредоносный код. [66] Большинство веб- атак происходят на легитимных веб-сайтах, и большинство из них, по оценкам Sophos , размещены в Соединенных Штатах, Китае и России. [67] Наиболее распространенной из всех угроз вредоносного ПО являются атаки на веб-сайты с использованием SQL-инъекций . [68] Через HTML и URI Интернет был уязвим для атак, таких как межсайтовый скриптинг (XSS), которые появились с появлением JavaScript [69] и были в некоторой степени усугублены веб-дизайном Web 2.0 и Ajax , который благоприятствует использованию скриптов. [70] По одной из оценок 2007 года, 70% всех веб-сайтов открыты для атак XSS на своих пользователей. [71] Фишинг — еще одна распространенная угроза для Интернета. В феврале 2013 года RSA (подразделение безопасности EMC) оценило глобальные потери от фишинга в 1,5 миллиарда долларов в 2012 году. [72] Два из наиболее известных методов фишинга — это скрытый редирект и открытый редирект.
Предлагаемые решения различаются. Крупные компании по безопасности, такие как McAfee, уже разрабатывают пакеты управления и соответствия для соответствия правилам после 11 сентября, [73] а некоторые, такие как Finjan, рекомендовали активную проверку программного кода и всего контента в реальном времени независимо от его источника. [63] Некоторые утверждают, что предприятиям следует рассматривать веб-безопасность как бизнес-возможность, а не как центр затрат , [74] в то время как другие призывают к «повсеместному, постоянному управлению цифровыми правами », внедренному в инфраструктуру, чтобы заменить сотни компаний, которые защищают данные и сети. [75] Джонатан Зиттрейн сказал, что разделение ответственности пользователей за безопасность вычислений гораздо предпочтительнее, чем блокировка Интернета. [76]
Каждый раз, когда клиент запрашивает веб-страницу, сервер может определить IP-адрес запроса . Веб-серверы обычно регистрируют IP-адреса в файле журнала . Кроме того, если не установлено иное, большинство веб-браузеров регистрируют запрошенные веб-страницы в просматриваемой истории и обычно кэшируют большую часть контента локально. Если только связь между сервером и браузером не использует шифрование HTTPS, веб-запросы и ответы передаются в виде обычного текста по Интернету и могут просматриваться, записываться и кэшироваться промежуточными системами. Еще один способ скрыть личную идентифицируемую информацию — использовать виртуальную частную сеть . VPN шифрует трафик между клиентом и VPN-сервером и маскирует исходный IP-адрес, снижая вероятность идентификации пользователя.
Когда веб-страница запрашивает, а пользователь предоставляет персональную идентификационную информацию, такую как его настоящее имя, адрес, адрес электронной почты и т. д., веб-сущности могут связывать текущий веб-трафик с этим человеком. Если веб-сайт использует HTTP-куки , имя пользователя и аутентификацию по паролю или другие методы отслеживания, он может связать другие веб-посещения, до и после, с предоставленной идентифицируемой информацией. Таким образом, веб-организация может разработать и создать профиль отдельных людей, которые используют ее сайт или сайты. Она может создать запись для человека, которая включает информацию об их досуге, их покупательских интересах, их профессии и других аспектах их демографического профиля . Эти профили представляют потенциальный интерес для маркетологов, рекламодателей и других лиц. В зависимости от положений и условий веб-сайта и местных законов, которые применяются, информация из этих профилей может быть продана, передана или распространена другим организациям без уведомления пользователя. Для многих обычных людей это означает не более чем несколько неожиданных электронных писем в их почтовом ящике или какую-то необычайно релевантную рекламу на будущей веб-странице. Для других это может означать, что время, потраченное на удовлетворение необычного интереса, может привести к потоку дальнейшего целевого маркетинга, который может быть нежелательным. Правоохранительные органы, антитеррористические и шпионские агентства также могут идентифицировать, нацеливать и отслеживать людей на основе их интересов или склонностей в Интернете.
Сайты социальных сетей обычно пытаются заставить пользователей использовать свои настоящие имена, интересы и местоположения, а не псевдонимы, поскольку их руководители считают, что это делает опыт общения в социальных сетях более привлекательным для пользователей. С другой стороны, загруженные фотографии или неосторожные заявления могут быть идентифицированы для человека, который может пожалеть об этом раскрытии. Работодатели, школы, родители и другие родственники могут оказаться под влиянием аспектов профилей в социальных сетях, таких как текстовые сообщения или цифровые фотографии, которые публикующий человек не предназначал для этой аудитории. Онлайн-хулиганы могут использовать личную информацию, чтобы преследовать или преследовать пользователей. Современные сайты социальных сетей позволяют осуществлять детальный контроль настроек конфиденциальности для каждого сообщения, но они могут быть сложными и их нелегко найти или использовать, особенно для новичков. [77] Фотографии и видео, размещенные на сайтах, вызвали особые проблемы, поскольку они могут добавить лицо человека в онлайн-профиль. С современной и потенциальной технологией распознавания лиц , возможно, будет возможно связать это лицо с другими, ранее анонимными, изображениями, событиями и сценариями, которые были отображены в другом месте. Из-за кэширования изображений, зеркалирования и копирования, трудно удалить изображение из Всемирной паутины.
Веб-стандарты включают в себя множество взаимозависимых стандартов и спецификаций, некоторые из которых регулируют аспекты Интернета , а не только Всемирной паутины. Даже если они не ориентированы на веб, такие стандарты напрямую или косвенно влияют на разработку и администрирование веб-сайтов и веб-сервисов . Соображения включают совместимость , доступность и удобство использования веб-страниц и веб-сайтов.
Веб-стандарты в более широком смысле включают в себя следующее:
Веб-стандарты — это не фиксированные наборы правил, а постоянно развивающиеся наборы завершенных технических спецификаций веб-технологий. [84] Веб-стандарты разрабатываются организациями по стандартизации — группами заинтересованных и часто конкурирующих сторон, уполномоченных на стандартизацию, — а не технологиями, разработанными и объявленными стандартом одним человеком или компанией. Крайне важно отличать спецификации, находящиеся в стадии разработки, от тех, которые уже достигли окончательного статуса разработки (в случае спецификаций W3C — наивысшего уровня зрелости).
Существуют методы доступа к Интернету в альтернативных средах и форматах, облегчающие использование людьми с ограниченными возможностями . Эти ограничения могут быть зрительными, слуховыми, физическими, речевыми, когнитивными, неврологическими или их комбинацией. Функции доступности также помогают людям с временными ограничениями, такими как сломанная рука, или стареющим пользователям по мере изменения их возможностей. [85] Интернет получает информацию, а также предоставляет информацию и взаимодействует с обществом. Консорциум Всемирной паутины утверждает, что крайне важно, чтобы Интернет был доступным, чтобы он мог предоставлять равный доступ и равные возможности людям с ограниченными возможностями. [86] Тим Бернерс-Ли однажды заметил: «Сила Интернета в его универсальности. Доступ для всех, независимо от инвалидности, является существенным аспектом». [85] Многие страны регулируют доступность Интернета как требование к веб-сайтам. [87] Международное сотрудничество в рамках Инициативы по обеспечению доступности Интернета W3C привело к простым рекомендациям, которые авторы веб-контента, а также разработчики программного обеспечения могут использовать, чтобы сделать Интернет доступным для людей, которые могут или не могут использовать вспомогательные технологии . [85] [88]
W3C Internationalisation Activity гарантирует, что веб-технологии работают на всех языках, в любой письменности и культуре. [89] Начиная с 2004 или 2005 года, Unicode набирал силу и в конечном итоге в декабре 2007 года превзошел как ASCII , так и западноевропейскую таблицу символов в качестве наиболее часто используемой таблицы символов в Интернете . [90] Первоначально RFC 3986 позволял идентифицировать ресурсы по URI в подмножестве US-ASCII. RFC 3987 допускает больше символов — любой символ из универсального набора символов — и теперь ресурс может быть идентифицирован по IRI на любом языке. [91]
соткал Всемирную паутину и создал средство массовой информации для 21-го века. Всемирная паутина принадлежит только Бернерсу-Ли. Он ее спроектировал. Он выпустил ее в мир. И он больше, чем кто-либо другой, боролся за то, чтобы она оставалась открытой, непатентованной и свободной.[ нужна страница ]
JavaScript является частью триады технологий, которые должны изучить все веб-разработчики: HTML для указания содержимого веб-страниц, CSS для указания представления веб-страниц и JavaScript для указания поведения веб-страниц.
{{cite book}}
: CS1 maint: multiple names: authors list (link)