В 1989 году гипертекст представлял новую многообещающую технологию, которая имела
относительно большое число реализаций, с одной стороны, а с другой стороны,
делались попытки построить формальные модели гипертекстовых систем, которые
носили скорее описательный характер и были навеяны успехом реляционного подхода
описания данных. Идея создания системы WWW заключалась в том, чтобы применить
гипертекстовую модель к информационным ресурсам, распределенным в сети, и
сделать это максимально простым способом. Он заложил три краеугольных камня
системы из четырех существующих ныне, разработав:
язык гипертекстовой
разметки документов HTML (HyperText Markup Language);
универсальный способ
адресации ресурсов в сети URL (Universal Resource Locator);
протокол обмена
гипертекстовой информацией HTTP (HyperText Transfer Protocol).
Позже команда
NCSA добавила к этим трем компонентам четвертый: универсальный интерфейс шлюзов
CGI (Common Gateway Interface).
Язык программирования Java не включается в
этот список намеренно, так как область применения этого языка гораздо шире, чем
простое "оживление" World Wide Web.
Идея HTML - пример чрезвычайно удачного
решения проблемы построения гипертекстовой системы при помощи специального
средства управления отображением. На разработку языка гипертекстовой разметки
существенное влияние оказали два фактора: исследования в области интерфейсов
гипертекстовых систем и желание обеспечить простой и быстрый способ создания
гипертекстовой базы данных, распределенной в сети.
В 1989 году активно
обсуждалась проблема интерфейса гипертекстовых систем, то есть способов
отображения гипертекстовой информации и навигации в гипертекстовой сети.
Значение гипертекстовой технологии сравнивали со значением книгопечатания.
Утверждалось, что лист бумаги и компьютерные средства
отображения/воспроизведения серьезно отличаются друг от друга, и поэтому форма
представления информации тоже должна отличаться. Наиболее эффективной формой
организации гипертекста были признаны контекстные гипертекстовые ссылки, а кроме
того, было признано деление на ссылки, ассоциированные со всем документом в
целом и с отдельными его частями.
Обычно гипертекстовые системы имеют
специальные программные средства построения гипертекстовых связей. Сами
гипертекстовые ссылки хранятся в специальных форматах или даже составляют
специальные файлы. Такой подход хорош для локальной системы, но не для
распределенной на множестве различных компьютерных платформ. В HTML
гипертекстовые ссылки встроены в тело документа и хранятся как его часть. Часто
в системах применяют специальные форматы хранения данных для повышения
эффективности доступа. В WWW-документах это обычные ASCII-файлы, которые можно
подготовить в любом текстовом редакторе. Таким образом, проблема создания
гипертекстовой базы данных была решена чрезвычайно просто.
Рис. 11.1. Финансовые индикаторы и новости финансового рынка на сервере
информационного агентства Bloomberg
С момента разработки первой версии языка (HTML 1.0) прошло уже пять лет. За
это время произошло довольно серьезное развитие языка. Почти вдвое увеличилось
число элементов разметки, оформление документов все больше приближается к
оформлению качественных печатных изданий, развиваются средства описания
нетекстовых информационных ресурсов и способы взаимодействия с прикладным
программным обеспечением. Совершенствуется механизм разработки типовых стилей.
Фактически, в настоящее время HTML развивается в сторону создания стандартного
языка разработки интерфейсов как локальных, так и распределенных систем. Вторым
краеугольным камнем WWW стала универсальная форма адресации информационных
ресурсов (Universal Resource Identification, URI), представляющая собой довольно
стройную систему, учитывающую опыт адресации и идентификации E-mail, Gopher,
WAIS, Telnet, FTP и т. п. Но реально из всего, что описано в URI, для
организации баз данных в WWW требуется только Universal Resource Locator (URL).
Без наличия этой спецификации вся мощь HTML оказалась бы бесполезной. URL
используется в гипертекстовых ссылках и обеспечивает доступ к распределенным
ресурсам сети. В URL можно адресовать как другие гипертекстовые документы
формата HTML, так и ресурсы E-mail, Telnet, FTP, Gopher, WAIS. Различные
программы различным образом осуществляют доступ к этим ресурсам. Следует
отметить, что программы обработки электронной почты в формате MIME также имеют
возможность отображать документы, представленные в формате HTML. Для этой цели в
MIME зарезервирован тип text/html.
Третьим в нашем списке стоит протокол
обмена данными в World Wide Web - HTTP (HyperText Transfer Protocol). Данный
протокол предназначен для обмена гипертекстовыми документами и учитывает
специфику такого обмена. Так, в процессе взаимодействия клиент может получить
новый адрес ресурса сети, запросить встроенную графику, принять и передать
параметры и т. п. Управление в HTTP реализовано в виде ASCII-команд. Реально
разработчик гипертекстовой базы данных сталкивается с элементами протокола
только при использовании внешних программ или при доступе к внешним относительно
WWW информационным ресурсам, например базам данных.
Последняя составляющая
технологии WWW - это спецификация CGI (Common Gateway Interface). CGI была
специально разработана для расширения возможностей WWW за счет подключения
внешнего программного обеспечения. Эта технология соответствовала принципам
простоты разработки, доступности и наращивания возможностей WWW. Предложенный и
описанный в CGI способ подключения не требовал дополнительных библиотек и
буквально ошеломлял своей простотой. Сервер взаимодействовал с программами через
стандартные потоки ввода/вывода, что упрощает программирование до предела. При
реализации CGI чрезвычайно важное место заняли методы доступа, описанные в HTTP.
И хотя реально используются только два из них (GET и POST), опыт развития HTML
показывает, что сообщество WWW ждет развития и CGI по мере усложнения задач, в
которых будет использоваться WWW-технология.