Спецификация HTML 4.01, рекомендации W3C от 24 декабря 1999 года
19 Справочная информация SGML для HTML
Содержание
Этот раздел содержит формальное SGML-определение HTML 4. Оно включает SGML-объявление, Определение Типа Данных (ОТД) и символьные ссылки-мнемоники, а также каталог образцов SGML.
Эти файлы доступны также в формате ASCII :
- ОТД по умолчанию:
- strict.dtd
- Переходное ОТД/Transitional Dtd:
- loose.dtd
- ОТД набора фрэймов/Frameset Dtd:
- frameset.dtd
- SGML-объявление:
- HTML4.decl
- Файлы определений мнемоник:
- HTMLspecial.ent
HTMLsymbol.ent
HTMLlat1.ent - Каталог образцов:
- HTML4.cat
19.1 Проверка документов
Многие авторы используют ограниченное
число браузеров для проверки создаваемых
документов, предполагая, что если документы
нормально просматриваются в этих браузерах,
то они корректны.
К сожалению, это не очень надежный способ
проверки документов, поскольку браузеры
сделаны так, чтобы "справляться" с
некорректными документами, отображая их по
возможности корректно.
Более надежно тестировать документы в разборщиках SGML, таких как nsgmls (см. [SP]), для проверки соответствия документов HTML определению типа данных (ОТД) HTML 4. Если объявление типа документа в Вашем документе включает URI, и Ваш разборщик SGML поддерживает этот тип системного идентификатора, то разборщик будет получать ОТД напрямую. В ином случае, Вы можете использовать предлагаемый каталог образцов SGML. ОТД в нем сохранено в файле "strict.dtd", а мнемоники - в файлах "HTMLlat1.ent", "HTMLsymbol.ent" и "HTMLspecial.ent". В других случаях, удостоверьтесь, что Ваш разборщик SGML способен обрабатывать документы [ISO10646]. См. документацию на утилиты проверки.
Учтите, что такая проверка, широко рекомендуемая и используемая, не гарантирует полного соответствия документов спецификации HTML 4. Это потому, что разборщик SGML учитывает только данное ОТД SGML, которое не отражает все аспекты верного документа HTML 4. Конкретно, разборщик SGML проверяет, что синтаксис, структура, список элементов и их атрибуты верны. Но он, к примеру, не может отлавливать ошибки, такие как установки неверных значений атрибута width элемента IMG (т.е. "foo" или "12.5"). Хотя эта спецификация ограничивает возможные значения этого атрибута как "целое число пикселов," ОТД определяет только, что значение является CDATA, что в настоящее время допускает любые значения. Только специализированная программа может охватить всю спецификацию HTML 4.
Несмотря на это, данный тип проверки настоятельно рекомендуется, поскольку выполняется обнаружение большого количества ошибок, делающих документ некорректным.
19.2 Каталог образцов SGML
Этот каталог содержит директиву override для того, чтобы удостовериться, что программа, такая как nsgmls, использует PUBLIC-идентификаторы, а не системные. Это значит, что пользователи не должны быть соединены с Web при затребовании системных идентификаторов на базе URI.
OVERRIDE YES PUBLIC "-//W3C//Dtd HTML 4.01//EN" strict.dtd PUBLIC "-//W3C//Dtd HTML 4.01 Transitional//EN" loose.dtd PUBLIC "-//W3C//Dtd HTML 4.01 Frameset//EN" frameset.dtd PUBLIC "-//W3C//ENTITIES Latin1//EN//HTML" HTMLlat1.ent PUBLIC "-//W3C//ENTITIES Special//EN//HTML" HTMLspecial.ent PUBLIC "-//W3C//ENTITIES Symbols//EN//HTML" HTMLsymbol.ent