Xml синтаксис: Правила синтаксиса XML
Содержание
Правила синтаксиса XML
Правила синтаксиса XML крайне просты и логичны. Их легко запомнить и легко использовать.
У XML документа должен быть корневой элемент
XML документ должен содержать один элемент, который будет родительским для всех других элементов. Он называется корневым элементом.
<корневой> <потомок> <подпотомок>.....</подпотомок> </потомок> </корневой>
В следующем примере корневым является элемент <note>:
<?xml version="1.0" encoding="UTF-8"?> <note> <to>Tove</to> <from>Jani</from> <heading>Напоминание</heading> <body>Не забудь обо мне в эти выходные!</body> </note>
XML пролог
Следующая строка называется XML прологом:
<?xml version="1.0" encoding="UTF-8"?>
XML пролог необязателен. Но если он есть, то это должна быть первая строка XML документа.
В XML документе могут присутствовать международные символы, вроде русских букв, и чтобы не возникало ошибок необходимо указать кодировку, либо сохранить XML файл в формате UTF-8.
UTF-8 — кодировка XML документов по умолчанию.
UTF-8 также является кодировкой по умолчанию для HTML5, CSS, JavaScript, PHP и SQL.
Все XML элементы должны иметь закрывающий тег
В HTML некоторые элементы могут не иметь закрывающего тега:
<p>Это параграф. <br>
В XML нельзя опускать закрывающий тег. Абсолютно все элементы должны закрываться:
<p>Это параграф.</p> <br>
Возможно, вы заметили из предыдущих примеров, что у XML пролога нет закрывающего тега. Это не ошибка. Дело в том, что декларация (а XML пролог это декларация) не относится к XML документу, поэтому у нее и нет закрывающего тега.
Теги XML регистрозависимы
Теги XML являются регистрозависимыми. Так, тег <Letter> не то же самое, что тег <letter>.
Открывающий и закрывающий теги должны определяться в одном регистре:
<Message>Это неправильно</message> <message>Это правильно</message>
«Открывающий и закрывающий теги» иногда еще называют «начальный и конечный теги». Используйте то определение, которое вам более симпатично. По сути это одно и то же.
XML элементы должны соблюдать корректную вложенность
В HTML иногда можно наблюдать такую картину:
<b><i>Это жирный и курсивный текст</b></i>
и иногда это даже работает должным образом.
В XML все элементы обязаны соблюдать корректную вложенность:
<b><i>Это жирный и курсивный текст</i></b>
Понятие «корректная вложенность» по отношению к приведенным примерам просто означает, что так как элемент <i> открывается внутри элемента <b>, то и закрываться он должен внутри элемента <b>.
Значения XML атрибутов должны заключаться в кавычки
Так же, как и в HTML, у XML элементов могут быть атрибуты в виде пары имя/значение
.
В XML значения атрибутов должны заключаться в кавычки.
Посмотрите на следующие два примера XML документа. Первый с ошибкой, второй написан правильно.
Пример 1
<note date=12/11/2007> <to>Tove</to> <from>Jani</from> </note>
Пример 2
<note date="12/11/2007"> <to>Tove</to> <from>Jani</from> </note>
Ошибка в первом XML документе заключается в том, что значение атрибута date
элемента <note>
не заключено в кавычки.
Сущности
Некоторые символы в XML имеют особые значения.
Если вы поместите, например, символ «<» внутри XML элемента, то будет сгенерирована ошибка, так как парсер интерпретирует его, как начало нового элемента.
Так, к ошибке приведет следующая строка XML документа:
<message>если жалование < 1000</message>
Чтобы такая ошибка не возникала, нужно заменить символ «<» на его сущность:
<message>если жалование < 1000</message>
В XML существует 5 предопределенных сущностей:
Сущность | Символ | Значение |
---|---|---|
< | < | меньше, чем |
> | > | больше, чем |
& | & | амперсанд |
' | ‘ | апостроф |
" | « | кавычки |
Только символы «<» и «&» строго запрещены в XML. Символ «>» допустим, но лучше его всегда заменять на сущность.
Комментарии в XML
Синтаксис комментариев в XML такой же, как и в HTML.
<!-- Это комментарий -->
Использование двух символов тире в середине комментария не допустимо.
Неверно:
<!-- Это -- комментарий -->
Странно, но так можно:
<!-- Это - - комментарий -->
В XML пробелы сохраняются
В HTML несколько последовательных пробельных символов усекаются до одного. В XML документе все пробельные символы сохраняются.
В XML новая строка сохраняется как LF
В приложениях Windows новая строка хранится в следующем виде: символ перевода каретки и символ новой строки (CR+LF).
Unix и Mac OSX используют LF.
Старые Mac системы используют CR.
XML сохраняет новую строку как LF.
Синтаксически верный XML документ
Если XML документ составлен в соответствии с приведенными синтаксическими правилами, то говорят, что это «синтаксически верный» XML документ.
XML Синтаксические правила
❮ Предыдущая Следующая Глава ❯
Правила синтаксиса XML очень просто и логично. Правила просты в освоении, и простой в использовании.
XML-документы должны иметь корневой элемент
XML — документы должны содержать один корневой элемент , который является parent всех остальных элементов:
<root>
<child>
<subchild>…..</subchild>
</child>
</root>
В этом примере <Примечание> является корневым элементом:
<?xml version=»1.0″ encoding=»UTF-8 « ?>
<note>
<to>Tove</to>
<from>Jani</from>
<heading>Reminder</heading>
<body>Don’t forget me this weekend!</body>
</note>
XML Пролог
Эта линия называется XML пролог:
<?xml version=»1. 0″ encoding=»UTF-8 « ?>
XML пролог является необязательным. Если он существует, то она должна быть на первом месте в документе.
XML-документы могут содержать международные символы, такие как норвежский оа или французского ЭИ.
Чтобы избежать ошибок, вы должны указать кодировку, или сохранять файлы XML в кодировке UTF-8.
UTF-8 кодировка символов по умолчанию для XML-документов.
Кодировка символов может быть изучена в нашем Набор символов Учебное пособие .
UTF-8 также кодировку по умолчанию для HTML5, CSS, JavaScript, PHP и SQL.
Все XML-элементы должны иметь закрывающий тег
В HTML некоторые элементы могут работать хорошо, даже с отсутствующим закрывающий тег:
<p>This is a paragraph.
<br>
В XML, это незаконно, чтобы опустить закрывающий тег. Все элементы must иметь закрывающий тег:
<p>This is a paragraph.</p>
<br />
XML пролог не имеет закрывающего тега.
Это не ошибка. Пролог не является частью документа XML.
XML-теги чувствительны к регистру
XML-теги чувствительны к регистру. Тег <Letter> отличается от тега <letter> .
Открытие и закрытие теги должны быть написаны с тем же делом:
<Message>This is incorrect</message>
<message>This is correct</message>
«Открытие и закрытие тегов» часто упоминаются как «Start and end tags» . Используйте то, что вы предпочитаете. Это точно то же самое.
XML-элементы должны быть правильно вложены
В HTML, вы можете увидеть неправильно вложенные элементы:
<b><i>This text is bold and italic</b></i>
В XML все элементы must быть правильно вложены друг в друга:
<b><i>This text is bold and italic</i></b>
В приведенном выше примере, «Properly nested» просто означает , что , так как <i> элемент открыт внутри <b> элемент, он должен быть закрыт внутри <b> элемента.
XML значения атрибутов должны быть заключены в кавычки
XML элементы могут иметь атрибуты в пар имя / значение, как и в HTML.
В XML значения атрибутов всегда должны быть заключены в кавычки.
НЕПРАВИЛЬНО:
<note date=12/11/2007>
<to>Tove</to>
<from>Jani</from>
</note>
ВЕРНЫЙ:
<note date=»12/11/2007″>
<to>Tove</to>
<from>Jani</from>
</note>
Ошибка в первом документе является то , что date атрибута в элементе примечания не котируется.
Entity Ссылки
Некоторые символы имеют специальное значение в XML.
Если поместить символ , как «<» внутри элемента XML, он будет генерировать ошибку , потому что анализатор интерпретирует его как начало нового элемента.
Это вызовет ошибку XML:
<message>salary < 1000</message>
Чтобы избежать этой ошибки, замените «<» характер с entity reference на entity reference :
<message>salary < 1000</message>
Есть 5 предопределенных ссылок на сущности в XML:
< | < | less than |
> | > | greater than |
& | & | ampersand |
' | ‘ | apostrophe |
" | « | quotation mark |
Только <и & строго запрещены в XML, но это хорошая привычка, чтобы заменить> с & GT; также.
Комментарии в XML
Синтаксис для записи комментариев в XML является похож на HTML.
<! — Это комментарий ->
Два тире в середине комментария не допускается.
Не допускается:
<!— This is a — comment —>
Странно, но допускается:
<!— This is a — — comment —>
Бело-пространство Сохранилось в XML
XML не усечь несколько бело-пространства (HTML обрезает несколько бело-пространства к одному пробельных):
XML: | Hello Tove |
HTML: | Hello Tove |
XML Магазины New Line, как LF
Приложений Windows Store новую строку как: возврат каретки и перевод строки (CR+LF) .
Unix и Mac OSX использует LF.
Старый Mac системы использует CR.
XML сохраняет новую строку как LF.
Хорошо сформировавшиеся XML
XML — документы , которые соответствуют правилам синтаксиса выше , как говорят, «Well Formed» XML — документы.
❮ Предыдущая Следующая Глава ❯
XML | Синтаксис — GeeksforGeeks
Улучшить статью
Сохранить статью
Нравится Статья
Kanchan_Ray
ученый
2035 опубликованных статей
Улучшить статью
Сохранить статью
Нравится Статья
Необходимое условие: XML | Основы В этой статье мы собираемся обсудить правило синтаксиса XML, которое используется при написании документа XML или приложения XML. Это очень просто и понятно для изучения и кодирования. Ниже приведен полный документ XML для подробного обсуждения каждого компонента.
XML
|
Правила синтаксиса для объявления XML или XML Prolog:
XML
|
Ниже приводится объяснение каждого пункта.
- Эта строка называется прологом XML или объявлением XML.
- Эта строка является необязательной, т. е. она может использоваться или не использоваться в XML-документе. Тем не менее, это должна быть самая первая строка, если она используется.
- Версия = «1.0» — это версия XML, используемая в настоящее время. Доступны различные версии XML.
- Кодировка = «UTF-8» указывает кодировку символов, используемую при написании XML-документа, например, êèé для французского языка и так далее.
Его значение по умолчанию — «UTF-8». Чтобы узнать больше о кодировке символов, нажмите здесь.
- Это объявление чувствительно к регистру, например, «xml» должен быть в нижнем регистре в формате .
Правила синтаксиса для корневого элемента:
- Во избежание ошибок каждый файл XML должен иметь один или несколько корневых элементов. Например, приведенный ниже код неверен, потому что он не содержит корневого элемента.
XML
|
- В первом примере корневым элементом является
, а все остальные элементы , и т. д. являются дочерними элементами и находятся внутри корневого элемента. - С учетом регистра.
- Элемент XML должен иметь закрывающий элемент, например,
Привет — правильно, ноПривет — неверно, так как не содержит закрывающий элемент, и он выдаст ошибку, и наоборот. - Элементы в XML должны быть правильно вложены друг в друга, иначе возникнет ошибка. Например,
правильно вложен, ноGeeks неверен, потому что еслиGeeks открывается внутри элемент , то он также должен заканчиваться внутри элемента . - Он также чувствителен к регистру, т. е. начальный и закрывающий элементы должны быть в одном и том же регистре.
Например
…. правильно, но….. неверно, и это вызовет ошибку. - XML-атрибут состоит из двух частей: одна — это имя, а другая — его значение. Он находится внутри открытия элемента XML. Например:
Все учащиеся должны будут сдать задание к завтрашнему дню. Здесь категория — это имя атрибута, а сообщение — его значение, а значение атрибута должно быть либо в одной цитате, либо в двойная кавычка, иначе будет ошибка. Имя атрибута пишется без кавычек. - Атрибут XML также чувствителен к регистру.
- Элемент XML может иметь несколько атрибутов, но не может иметь одинаковые имена атрибутов в одном и том же элементе. Например:
GeeksforGeeks Вышеуказанные атрибуты верны, поскольку имеют несколько атрибутов с разными именами атрибутов.GeeksforGeeks Вышеупомянутый атрибут неверен из-за наличия одного и того же имени атрибута в одном элементе.
XML-комментарии: Правильный синтаксис для написания XML-комментариев:
Неправильный комментарий: т.е. два тире между комментариями не допускаются.
Последнее обновление:
22 фев, 2023
Нравится статья
Сохранить статью
Синтаксис XML — файлы XML
Пример XML-документа:
<примечание> |
Первая строка в документе: Объявление XML всегда должно быть включено. Он определяет XML-версию документа. В этом случае документ соответствует спецификации XML 1.0:
Следующая строка определяет первый элемент документа (корневой):
<примечание> |
Следующие строки определяют 4 дочерних элемента корня (кому, откуда, заголовок и тело
):
|
Последняя строка определяет конец корневого элемента:
примечание> |
Все элементы XML должны иметь закрывающий тег
В HTML некоторые элементы не должны иметь закрывающий тег. Следующий код допустим в HTML:
|
В XML все элементы должны иметь закрывающий тег, подобный этому:
|
XML-теги чувствительны к регистру
XML-теги чувствительны к регистру. Тег
Поэтому открывающий и закрывающий теги должны быть написаны с одинаковым регистром:
|
|
Все элементы XML должны быть правильно вложены друг в друга
В HTML некоторые элементы могут быть неправильно вложены друг в друга, например:
Этот текст выделен жирным шрифтом и курсивом
В XML все элементы должны быть правильно вложены друг в друга, как это
Этот текст выделен жирным шрифтом и курсивом |
Все документы XML должны иметь корневой тег
Все документы XML должны содержать одну пару тегов для определения корневого элемента.