Xml синтаксис: Правила синтаксиса XML

Содержание

Правила синтаксиса XML

Правила синтаксиса XML крайне просты и логичны. Их легко запомнить и легко использовать.

У XML документа должен быть корневой элемент

XML документ должен содержать один элемент, который будет родительским для всех других элементов. Он называется корневым элементом.

<корневой>
   <потомок>
      <подпотомок>.....</подпотомок>
   </потомок>
</корневой>

В следующем примере корневым является элемент <note>:

<?xml version="1.0" encoding="UTF-8"?>
<note>
   <to>Tove</to>
   <from>Jani</from>
   <heading>Напоминание</heading>
   <body>Не забудь обо мне в эти выходные!</body>
</note>

XML пролог

Следующая строка называется XML прологом:

<?xml version="1.0" encoding="UTF-8"?>

XML пролог необязателен. Но если он есть, то это должна быть первая строка XML документа.

В XML документе могут присутствовать международные символы, вроде русских букв, и чтобы не возникало ошибок необходимо указать кодировку, либо сохранить XML файл в формате UTF-8.

UTF-8 — кодировка XML документов по умолчанию.

UTF-8 также является кодировкой по умолчанию для HTML5, CSS, JavaScript, PHP и SQL.

Все XML элементы должны иметь закрывающий тег

В HTML некоторые элементы могут не иметь закрывающего тега:

<p>Это параграф.
<br>

В XML нельзя опускать закрывающий тег. Абсолютно все элементы должны закрываться:

<p>Это параграф.</p>
<br>

Возможно, вы заметили из предыдущих примеров, что у XML пролога нет закрывающего тега. Это не ошибка. Дело в том, что декларация (а XML пролог это декларация) не относится к XML документу, поэтому у нее и нет закрывающего тега.

Теги XML регистрозависимы

Теги XML являются регистрозависимыми. Так, тег <Letter> не то же самое, что тег <letter>.

Открывающий и закрывающий теги должны определяться в одном регистре:

<Message>Это неправильно</message>
<message>Это правильно</message>

«Открывающий и закрывающий теги» иногда еще называют «начальный и конечный теги». Используйте то определение, которое вам более симпатично. По сути это одно и то же.

XML элементы должны соблюдать корректную вложенность

В HTML иногда можно наблюдать такую картину:

<b><i>Это жирный и курсивный текст</b></i>

и иногда это даже работает должным образом.

В XML все элементы обязаны соблюдать корректную вложенность:

<b><i>Это жирный и курсивный текст</i></b>

Понятие «корректная вложенность» по отношению к приведенным примерам просто означает, что так как элемент <i> открывается внутри элемента <b>, то и закрываться он должен внутри элемента <b>.

Значения XML атрибутов должны заключаться в кавычки

Так же, как и в HTML, у XML элементов могут быть атрибуты в виде пары имя/значение.

В XML значения атрибутов должны заключаться в кавычки.

Посмотрите на следующие два примера XML документа. Первый с ошибкой, второй написан правильно.

Пример 1

<note date=12/11/2007>
   <to>Tove</to>
   <from>Jani</from>
</note>

Пример 2

<note date="12/11/2007">
   <to>Tove</to>
   <from>Jani</from>
</note>

Ошибка в первом XML документе заключается в том, что значение атрибута date элемента <note> не заключено в кавычки.

Сущности

Некоторые символы в XML имеют особые значения.

Если вы поместите, например, символ «<» внутри XML элемента, то будет сгенерирована ошибка, так как парсер интерпретирует его, как начало нового элемента.

Так, к ошибке приведет следующая строка XML документа:

<message>если жалование < 1000</message>

Чтобы такая ошибка не возникала, нужно заменить символ «<» на его сущность:

<message>если жалование &lt; 1000</message>

В XML существует 5 предопределенных сущностей:

СущностьСимволЗначение
&lt;<меньше, чем
&gt;>больше, чем
&amp;&амперсанд
&apos;апостроф
&quot;«кавычки

Только символы «<» и «&» строго запрещены в XML. Символ «>» допустим, но лучше его всегда заменять на сущность.

Комментарии в XML

Синтаксис комментариев в XML такой же, как и в HTML.

<!-- Это комментарий -->

Использование двух символов тире в середине комментария не допустимо.

Неверно:

<!-- Это -- комментарий -->

Странно, но так можно:

<!-- Это - - комментарий -->

В XML пробелы сохраняются

В HTML несколько последовательных пробельных символов усекаются до одного. В XML документе все пробельные символы сохраняются.

В XML новая строка сохраняется как LF

В приложениях Windows новая строка хранится в следующем виде: символ перевода каретки и символ новой строки (CR+LF).

Unix и Mac OSX используют LF.

Старые Mac системы используют CR.

XML сохраняет новую строку как LF.

Синтаксически верный XML документ

Если XML документ составлен в соответствии с приведенными синтаксическими правилами, то говорят, что это «синтаксически верный» XML документ.

XML Синтаксические правила

❮ Предыдущая Следующая Глава ❯


Правила синтаксиса XML очень просто и логично. Правила просты в освоении, и простой в использовании.


XML-документы должны иметь корневой элемент

XML — документы должны содержать один корневой элемент , который является parent всех остальных элементов:


<root>

  <child>

    <subchild>…..</subchild>

  </child>

</root>

В этом примере <Примечание> является корневым элементом:


<?xml version=»1.0″ encoding=»UTF-8 « ?>

<note>

  <to>Tove</to>

  <from>Jani</from>

  <heading>Reminder</heading>

  <body>Don’t forget me this weekend!</body>

</note>


XML Пролог

Эта линия называется XML пролог:


<?xml version=»1. 0″ encoding=»UTF-8 « ?>

XML пролог является необязательным. Если он существует, то она должна быть на первом месте в документе.

XML-документы могут содержать международные символы, такие как норвежский оа или французского ЭИ.

Чтобы избежать ошибок, вы должны указать кодировку, или сохранять файлы XML в кодировке UTF-8.

UTF-8 кодировка символов по умолчанию для XML-документов.

Кодировка символов может быть изучена в нашем Набор символов Учебное пособие .

UTF-8 также кодировку по умолчанию для HTML5, CSS, JavaScript, PHP и SQL.


Все XML-элементы должны иметь закрывающий тег

В HTML некоторые элементы могут работать хорошо, даже с отсутствующим закрывающий тег:


<p>This is a paragraph.

<br>

В XML, это незаконно, чтобы опустить закрывающий тег. Все элементы must иметь закрывающий тег:


<p>This is a paragraph.</p>

<br />

XML пролог не имеет закрывающего тега.
Это не ошибка. Пролог не является частью документа XML.


XML-теги чувствительны к регистру

XML-теги чувствительны к регистру. Тег <Letter> отличается от тега <letter> .

Открытие и закрытие теги должны быть написаны с тем же делом:


<Message>This is incorrect</message>

<message>This is correct</message>

«Открытие и закрытие тегов» часто упоминаются как «Start and end tags» . Используйте то, что вы предпочитаете. Это точно то же самое.


XML-элементы должны быть правильно вложены

В HTML, вы можете увидеть неправильно вложенные элементы:


<b><i>This text is bold and italic</b></i>

В XML все элементы must быть правильно вложены друг в друга:


<b><i>This text is bold and italic</i></b>

В приведенном выше примере, «Properly nested» просто означает , что , так как <i> элемент открыт внутри <b> элемент, он должен быть закрыт внутри <b> элемента.


XML значения атрибутов должны быть заключены в кавычки

XML элементы могут иметь атрибуты в пар имя / значение, как и в HTML.

В XML значения атрибутов всегда должны быть заключены в кавычки.

НЕПРАВИЛЬНО:


<note date=12/11/2007>

  <to>Tove</to>

  <from>Jani</from>

</note>

ВЕРНЫЙ:


<note date=»12/11/2007″>

  <to>Tove</to>

  <from>Jani</from>

</note>

Ошибка в первом документе является то , что date атрибута в элементе примечания не котируется.


Entity Ссылки

Некоторые символы имеют специальное значение в XML.

Если поместить символ , как «<» внутри элемента XML, он будет генерировать ошибку , потому что анализатор интерпретирует его как начало нового элемента.

Это вызовет ошибку XML:


<message>salary < 1000</message>

Чтобы избежать этой ошибки, замените «<» характер с entity reference на entity reference :


<message>salary &lt; 1000</message>

Есть 5 предопределенных ссылок на сущности в XML:






&lt;<less than
&gt;>greater than
&amp;&ampersand 
&apos;apostrophe
&quot;«quotation mark

Только <и & строго запрещены в XML, но это хорошая привычка, чтобы заменить> с & GT; также.


Комментарии в XML

Синтаксис для записи комментариев в XML является похож на HTML.

<! — Это комментарий ->

Два тире в середине комментария не допускается.

Не допускается:


<!— This is a — comment —>

Странно, но допускается:


<!— This is a — — comment —>


Бело-пространство Сохранилось в XML

XML не усечь несколько бело-пространства (HTML обрезает несколько бело-пространства к одному пробельных):




XML:
Hello           Tove

HTML:
Hello Tove

XML Магазины New Line, как LF

Приложений Windows Store новую строку как: возврат каретки и перевод строки (CR+LF) .

Unix и Mac OSX использует LF.

Старый Mac системы использует CR.

XML сохраняет новую строку как LF.


Хорошо сформировавшиеся XML

XML — документы , которые соответствуют правилам синтаксиса выше , как говорят, «Well Formed» XML — документы.

❮ Предыдущая Следующая Глава ❯

XML | Синтаксис — GeeksforGeeks

Улучшить статью

Сохранить статью

Нравится Статья

Kanchan_Ray

ученый

2035 опубликованных статей

  • Читать
  • Обсудить
  • Улучшить статью

    Сохранить статью

    Нравится Статья

    Необходимое условие: XML | Основы В этой статье мы собираемся обсудить правило синтаксиса XML, которое используется при написании документа XML или приложения XML. Это очень просто и понятно для изучения и кодирования. Ниже приведен полный документ XML для подробного обсуждения каждого компонента.

    XML

    xml version="1.0" encoding="UTF-8"?>

    < сообщение >

        9 0039 < до >Студенты до >

        < из >Учитель из >

        < тема >Относительно подачи заданий тема >

        < текст >Все учащиеся должны сдать задание к завтрашнему дню. text >

    сообщение >

    Правила синтаксиса для объявления XML или XML Prolog:  

    XML

    xml version="1.0" encoding="UTF-8"?>

    Ниже приводится объяснение каждого пункта.

    • Эта строка называется прологом XML или объявлением XML.
    • Эта строка является необязательной, т. е. она может использоваться или не использоваться в XML-документе. Тем не менее, это должна быть самая первая строка, если она используется.
    • Версия = «1.0» — это версия XML, используемая в настоящее время. Доступны различные версии XML.
    • Кодировка = «UTF-8» указывает кодировку символов, используемую при написании XML-документа, например, êèé для французского языка и так далее. Его значение по умолчанию — «UTF-8». Чтобы узнать больше о кодировке символов, нажмите здесь.
    • Это объявление чувствительно к регистру, например, «xml» должен быть в нижнем регистре в формате .

    Правила синтаксиса для корневого элемента:

    • Во избежание ошибок каждый файл XML должен иметь один или несколько корневых элементов. Например, приведенный ниже код неверен, потому что он не содержит корневого элемента.

    XML

    < до >Студенты до > 9003 9

    < из >Учитель из >

    < предмет >Относительно подачи задания предмет >

    < текст >Все учащиеся должны сдать задание до завтра. text >

    • В первом примере корневым элементом является , а все остальные элементы , и т. д. являются дочерними элементами и находятся внутри корневого элемента.
    • С учетом регистра.
    • Элемент XML должен иметь закрывающий элемент, например, Привет — правильно, но Привет — неверно, так как не содержит закрывающий элемент, и он выдаст ошибку, и наоборот.
    • Элементы в XML должны быть правильно вложены друг в друга, иначе возникнет ошибка. Например, Geeks правильно вложен, но Geeks неверен, потому что если открывается внутри элемент , то он также должен заканчиваться внутри элемента .
    • Он также чувствителен к регистру, т. е. начальный и закрывающий элементы должны быть в одном и том же регистре. Например …. правильно, но ….. неверно, и это вызовет ошибку.
    • XML-атрибут состоит из двух частей: одна — это имя, а другая — его значение. Он находится внутри открытия элемента XML. Например: Все учащиеся должны будут сдать задание к завтрашнему дню. Здесь категория — это имя атрибута, а сообщение — его значение, а значение атрибута должно быть либо в одной цитате, либо в двойная кавычка, иначе будет ошибка. Имя атрибута пишется без кавычек.
    • Атрибут XML также чувствителен к регистру.
    • Элемент XML может иметь несколько атрибутов, но не может иметь одинаковые имена атрибутов в одном и том же элементе. Например: GeeksforGeeks Вышеуказанные атрибуты верны, поскольку имеют несколько атрибутов с разными именами атрибутов. GeeksforGeeks Вышеупомянутый атрибут неверен из-за наличия одного и того же имени атрибута в одном элементе.

    XML-комментарии: Правильный синтаксис для написания XML-комментариев:
    Неправильный комментарий: т.е. два тире между комментариями не допускаются.

    Последнее обновление:
    22 фев, 2023

    Нравится статья

    Сохранить статью

    Синтаксис XML — файлы XML


    Пример XML-документа:

     
    <примечание>
    Туве
    Яни
    Напоминание
    Не забудьте меня в эти выходные!
     

    Первая строка в документе: Объявление XML всегда должно быть включено. Он определяет XML-версию документа. В этом случае документ соответствует спецификации XML 1.0:

      

    Следующая строка определяет первый элемент документа (корневой):

     <примечание> 

    Следующие строки определяют 4 дочерних элемента корня (кому, откуда, заголовок и тело
    ):

     Туве
    Яни
    Напоминание
    Не забывайте меня в эти выходные! 

    Последняя строка определяет конец корневого элемента:

      

     


    Все элементы XML должны иметь закрывающий тег

    В HTML некоторые элементы не должны иметь закрывающий тег. Следующий код допустим в HTML:

     

    Это абзац

    Это другой абзац

    В XML все элементы должны иметь закрывающий тег, подобный этому:

     

    Это абзац

    Это другой абзац

     


    XML-теги чувствительны к регистру

    XML-теги чувствительны к регистру. Тег отличается от тега .

    Поэтому открывающий и закрывающий теги должны быть написаны с одинаковым регистром:

     Это неверно 

     

     Это правильно 

     


    Все элементы XML должны быть правильно вложены друг в друга

    В HTML некоторые элементы могут быть неправильно вложены друг в друга, например:

     Этот текст выделен жирным шрифтом и курсивом 

    В XML все элементы должны быть правильно вложены друг в друга, как это

     Этот текст выделен жирным шрифтом и курсивом 

     


    Все документы XML должны иметь корневой тег

    Все документы XML должны содержать одну пару тегов для определения корневого элемента.