Структура документа

Рассмотрим простой HTML-документ:

Описание документа начинается открывающим тегом (меткой) <HTML> и заканчивается закрывающим тегом </HTML> Содержимое документа обычно состоит из двух частей: раздела заголовка, представляющего собой контейнер <HEAD> и раздела содержательной части документа (тело документа) — контейнера <BODY>. Контейнер <HEAD> содержит внутри себя контейнер заголовка <TITLE> и метатеги.

Элемент <!DOCTYPE> предназначен для указания типа текущего документа. Это необходимо, чтобы браузер понимал, как следует интерпретировать текущую веб-страницу, поскольку HTML существует в нескольких версиях, кроме того, имеется XHTML (eXtensible HyperText Markup Language, расширенный язык разметки гипертекста), похожий на HTML, но различающийся с ним по синтаксису.

Существует несколько видов <!DOCTYPE>, они различаются в зависимости от версии языка.

DOCTYPE Описание
HTML 4.01
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">
В HTML4 синтаксис проще, закрывать надо не все теги, имена тегов и атрибутов можно писать в любом регистре, кавычки не обязательны.
HTML 5
<!DOCTYPE html>
HTML5 ещё либеральнее, в этой версии соблюдаются правила HTML4, но учтено и некоторое влияние XHTML. Так, одиночные теги можно как закрывать, так и оставлять незакрытыми, убраны обязательные атрибуты вроде type="text/css".
XHTML 1.0
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
В XHTML строгий синтаксис: все теги, включая одиночные, требуется закрывать, атрибуты и теги писать только в нижнем регистре, все значения заключать в кавычки.

<META> определяет метатеги, которые используются для хранения информации предназначенной для браузеров и поисковых систем. Поисковая система обращаются к метатегам для получения описания сайта, ключевых слов и других данных.

Атрибуты метатега

charset Задает кодировку документа.
content Устанавливает значение атрибута, заданного с помощью name или http-equiv.
http-equiv Предназначен для конвертирования метатега в заголовок HTTP.

Значение content-Type определяет тип кодировки документа для правильного отображения символов браузером. Значение expires устанавливает дату и время, после которой информация в документе будет считаться устаревшей. Используется для того, чтобы в нужное время браузер при просмотре документа брал не версию, хранящуюся в кэше, а свежую версию прямо с сайта.
Значение refresh используется для того, чтобы браузер автоматически переключался на новый адрес через заданное количество секунд.

name Имя метатега, также косвенно устанавливает его предназначение.

Значение description задает краткое описание сайта, используемое поисковым сервером для индексирования, и, как правило, вставляемое в текст страницы найденных совпадений в качестве описания сайта. Значение name задает список терминов и ключевых слов. Это то, что является самым главным при индексировании сайта поисковой машиной!

Рассматриваемый документ помимо вышеупомянутых тегов содержит тег <H1>, выделяющий заключенный внутри него текст стилем заголовка. В общем случае тег вида <Hi>, i=1, 2, 3, 4, 5, 6, описывает заголовки шести различных уровней (заголовок первого уровня H1 самый крупный, заголовок H6 — самый мелкий).

Символы <!-- Комментарий --> определяют комментарий.

Валидация

Валидацией называется проверка документа на соответствие веб-стандартам и выявление существующих ошибок. Соответственно, валидным является такой веб-документ, который прошел подобную процедуру и не имеет замечаний по коду. Код веб-страницы должен подчиняться определенным правилам, которые называются спецификацией, ее разрабатывает W3C при поддержке разработчиков браузеров.

Markup Validation Service — инструмент для проверки HTML-кода отдельных страниц на валидность. С помощью сервиса CSS Validation Service можно выполнить проверку CSS-кода. Эти сайты предлагают три способа проверки: по адресу, локального файла и введенного в форму кода.

домой назад далее