С xml: C# и .NET | Работа с XML
Содержание
C# и .NET | Работа с XML
Последнее обновление: 20.02.2022
На сегодняшний день XML является одним из распространенных стандартов документов, который позволяет в удобной форме сохранять сложные по структуре данные.
Поэтому разработчики платформы .NET включили в фреймворк широкие возможности для работы с XML.
Прежде чем перейти непосредственно к работе с XML-файлами, сначала рассмотрим, что представляет собой xml-документ и как он может хранить объекты, используемые в программе на c#.
Например, у нас есть следующий класс:
class Person { public string Name { get;} public int Age { get; set; } public string Company { get; set; } public Person(string name, int age, string company) { Name = name; Age = age; Company = company; } }
В программе на C# мы можем создать список объектов класса Person:
var employees = new List<Person> { new Person ("Tom", 37, "Microsoft"), new Person ("Bob", 41, "Google") };
Чтобы сохранить список в формате xml мы могли бы использовать следующий xml-файл:
<?xml version="1. 0" encoding="utf-8" ?> <people> <person name="Tom"> <company>Microsoft</company> <age>37</age> </person> <person name="Bob"> <company>Google</company> <age>41</age> </person> </people>
XML-документ объявляет строка <?xml version="1.0" encoding="utf-8" ?>
. Она задает версию (1.0) и кодировку (utf-8) xml. Далее идет
собственно содержимое документа.
XML-документ должен иметь один единственный корневой элемент, внутрь которого помещаются все остальные элементы. В данном случае таким элементом является
элемент <people>
. Внутри корневого элемента <people>
задан набор элементов <person>
. Вне корневого элемента
мы не можем разместить элементы person
.
Каждый элемент определяется с помощью открывающего и закрывающего тегов, например, <person>
и </person>
, внутри которых
помещается значение или содержимое элементов. Также элемент может иметь сокращенное объявление: <person />
— в конце элемента помещается слеш.
Элемент может иметь вложенные элементы и атрибуты. В данном случае каждый элемент person имеет два вложенных элемента company
и
age
и атрибут name
.
Атрибуты определяются в теле элемента и имеют следующую форму: название="значение"
. Например, <person name="Bill Gates">
,
в данном случае атрибут называется name
и имеет значение Bill Gates
Внутри простых элементов помещается их значение. Например, <company>Google</company>
— элемент company
имеет значение
Google
.
Названия элементов являются регистрозависимыми, поэтому <company>
и <COMPANY>
будут представлять разные элементы.
Таким образом, весь список Users из кода C# сопоставляется с корневым элементом <people>
, каждый объект Person — с элементом <person>
,
а каждое свойство объекта Person — с атрибутом или вложенным элементом элемента <person>
Что использовать для свойств — вложенные элементы или атрибуты? Это вопрос предпочтений — мы можем использовать как атрибуты, так и вложенные элементы.
Так, в предыдущем примере вполне можно использовать вместо атрибута вложенный элемент:
<?xml version="1.0" encoding="utf-8" ?> <people> <person> <name>Tom</name> <company>Microsoft</company> <age>37</age> </person> <person> <name>Bob</name> <company>Google</company> <age>41</age> </person> </people>
Теперь рассмотрим основные подходы для работы с XML, которые имеются в C#.
НазадСодержаниеВперед
XML для начинающих — Служба поддержки Майкрософт
Вероятно, вы слышали о языке XML и вам известно множество причин, по которым его необходимо использовать в вашей организации. Но что именно представляет собой XML? В этой статье объясняется, что такое XML и как он работает.
В этой статье
-
Пометки, разметка и теги -
Отличительные черты XML -
Правильно сформированные данные -
Схемы -
Преобразования -
XML в системе Microsoft Office
Пометки, разметка и теги
Чтобы понять XML, полезно понимать идею пометки данных. Люди создавали документы на протяжении многих лет и на протяжении всего времени они их помечали. Например, преподаватели могут постоянно пометить документы учащихся. Учащиеся могут перемещать абзацы, уточнять предложения, исправлять опечатки и так далее. Пометка документа определяет структуру, смысл и внешний вид сведений в документе. Если вы когда-либо использовали функцию «Отслеживание изменений» в Microsoft Office Word, то использовали компьютеризированную форму пометки.
В мире информационных технологий термин «пометка» превратился в термин «разметка». При разметке используются коды, называемые тегами (или иногда токенами), для определения структуры, визуального оформления и — в случае XML — смысла данных.
Текст этой статьи в формате HTML является хорошим примером применения компьютерной разметки. Если в Microsoft Internet Explorer щелкнуть эту страницу правой кнопкой мыши и выбрать команду Просмотр HTML-кода, вы увидите читаемый текст и теги HTML, например <p> и <h3>. В HTML- и XML-документах теги легко распознать, поскольку они заключены в угловые скобки. В исходном тексте этой статьи теги HTML выполняют множество функций, например определяют начало и конец каждого абзаца (<p> … </p>) и местоположение рисунков.
Отличительные черты XML
Документы в форматах HTML и XML содержат данные, заключенные в теги, но на этом сходство между двумя языками заканчивается. В формате HTML теги определяют оформление данных — расположение заголовков, начало абзаца и т. д. В формате XML теги определяют структуру и смысл данных — то, чем они являются.
При описании структуры и смысла данных становится возможным их повторное использование несколькими способами. Например, если у вас есть блок данных о продажах, каждый элемент в котором четко определен, то можно загрузить в отчет о продажах только необходимые элементы, а другие данные передать в бухгалтерскую базу данных. Иначе говоря, можно использовать одну систему для генерации данных и пометки их тегами в формате XML, а затем обрабатывать эти данные в любых других системах вне зависимости от клиентской платформы или операционной системы. Благодаря такой совместимости XML является основой одной из самых популярных технологий обмена данными.
Учитывайте при работе следующее:
-
HTML нельзя использовать вместо XML. Однако XML-данные можно заключать в HTML-теги и отображать на веб-страницах.
-
Возможности HTML ограничены предопределенным набором тегов, общим для всех пользователей.
-
Правила XML разрешают создавать любые теги, требуемые для описания данных и их структуры. Допустим, что вам необходимо хранить и совместно использовать сведения о домашних животных. Для этого можно создать следующий XML-код:
<?xml version="1.0"?> <CAT> <NAME>Izzy</NAME> <BREED>Siamese</BREED> <AGE>6</AGE> <ALTERED>yes</ALTERED> <DECLAWED>no</DECLAWED> <LICENSE>Izz138bod</LICENSE> <OWNER>Colin Wilcox</OWNER> </CAT>
Как видно, по тегам XML понятно, какие данные вы просматриваете. Например, ясно, что это данные о коте, и можно легко определить его имя, возраст и т. д. Благодаря возможности создавать теги, определяющие почти любую структуру данных, язык XML является расширяемым.
Но не путайте теги в данном примере с тегами в HTML-файле. Например, если приведенный выше текст в формате XML вставить в HTML-файл и открыть его в браузере, то результаты будут выглядеть следующим образом:
Izzy Siamese 6 yes no Izz138bod Colin Wilcox
Веб-браузер проигнорирует теги XML и отобразит только данные.
Правильно сформированные данные
Вероятно, вы слышали, как кто-то из ИТ-специалистов говорил о «правильно сформированном» XML-файле. Правильно сформированный XML-файл должен соответствовать очень строгим правилам. Если он не соответствует этим правилам, XML не работает. Например, в предыдущем примере каждый открывающий тег имеет соответствующий закрывающий тег, поэтому в данном примере соблюдено одно из правил правильно сформированного XML-файла. Если же удалить из файла какой-либо тег и попытаться открыть его в одной из программ Office, то появится сообщение об ошибке и использовать такой файл будет невозможно.
Правила создания правильно сформированного XML-файла знать необязательно (хотя понять их нетрудно), но следует помнить, что использовать в других приложениях и системах можно лишь правильно сформированные XML-данные. Если XML-файл не открывается, то он, вероятно, неправильно сформирован.
XML не зависит от платформы, и это значит, что любая программа, созданная для использования XML, может читать и обрабатывать XML-данные независимо от оборудования или операционной системы. Например, при применении правильных тегов XML можно использовать программу на настольном компьютере для открытия и обработки данных, полученных с мейнфрейма. И, независимо от того, кто создал XML-данные, с ними данными можно работать в различных приложениях Office. Благодаря своей совместимости XML стал одной из самых популярных технологий обмена данными между базами данных и пользовательскими компьютерами.
В дополнение к правильно сформированным данным с тегами XML-системы обычно используют два дополнительных компонента: схемы и преобразования. В следующих разделах описывается, как они работают.
Схемы
Не пугайтесь термина «схема». Схема — это просто XML-файл, содержащий правила для содержимого XML-файла данных. Файлы схем обычно имеют расширение XSD, тогда как для файлов данных XML используется расширение XML.
Схемы позволяют программам проверять данные. Они формируют структуру данных и обеспечивают их понятность создателю и другим людям. Например, если пользователь вводит недопустимые данные, например текст в поле даты, программа может предложить ему исправить их. Если данные в XML-файле соответствуют правилам в схеме, для их чтения, интерпретации и обработки можно использовать любую программу, поддерживающую XML. Например, как показано на приведенном ниже рисунке, Excel может проверять данные <CAT> на соответствие схеме CAT.
Схемы могут быть сложными, и в данной статье невозможно объяснить, как их создавать. (Кроме того, скорее всего, в вашей организации есть ИТ-специалисты, которые знают, как это делать.) Однако полезно знать, как выглядят схемы. Следующая схема определяет правила для набора тегов <CAT> … </CAT>:
<xsd:element name="CAT"> <xsd:complexType> <xsd:sequence> <xsd:element name="NAME" type="xsd:string"/> <xsd:element name="BREED" type="xsd:string"/> <xsd:element name="AGE" type="xsd:positiveInteger"/> <xsd:element name="ALTERED" type="xsd:boolean"/> <xsd:element name="DECLAWED" type="xsd:boolean"/> <xsd:element name="LICENSE" type="xsd:string"/> <xsd:element name="OWNER" type="xsd:string"/> </xsd:sequence> </xsd:complexType> </xsd:element>
Не беспокойтесь, если в примере не все понятно. Просто обратите внимание на следующее:
-
Строковые элементы в приведенном примере схемы называются объявлениями. Если бы требовались дополнительные сведения о животном, например его цвет или особые признаки, то специалисты отдела ИТ добавили бы к схеме соответствующие объявления. Систему XML можно изменять по мере развития потребностей бизнеса.
-
Объявления являются мощным средством управления структурой данных. Например, объявление <xsd:sequence> означает, что теги, такие как <NAME> и <BREED>, должны следовать в указанном выше порядке. С помощью объявлений можно также проверять типы данных, вводимых пользователем. Например, приведенная выше схема требует ввода положительного целого числа для возраста кота и логических значений (TRUE или FALSE) для тегов ALTERED и DECLAWED.
-
Если данные в XML-файле соответствуют правилам схемы, то такие данные называют допустимыми. Процесс контроля соответствия XML-файла данных правилам схемы называют (достаточно логично) проверкой. Большим преимуществом использования схем является возможность предотвратить с их помощью повреждение данных. Схемы также облегчают поиск поврежденных данных, поскольку при возникновении такой проблемы обработка XML-файла останавливается.
Преобразования
Как говорилось выше, XML также позволяет эффективно использовать и повторно использовать данные. Механизм повторного использования данных называется преобразованием XSLT (или просто преобразованием).
Вы (или ваш ИТ-отдел) можете также использовать преобразования для обмена данными между серверными системами, например между базами данных. Предположим, что в базе данных А данные о продажах хранятся в таблице, удобной для отдела продаж. В базе данных Б хранятся данные о доходах и расходах в таблице, специально разработанной для бухгалтерии. База данных Б может использовать преобразование, чтобы принять данные от базы данных A и поместить их в соответствующие таблицы.
Сочетание файла данных, схемы и преобразования образует базовую систему XML. На следующем рисунке показана работа подобных систем. Файл данных проверяется на соответствие правилам схемы, а затем передается любым пригодным способом для преобразования. В этом случае преобразование размещает данные в таблице на веб-странице.
В следующем примере кода показан один из способов написания преобразования. Она загружает данные <CAT> в таблицу на веб-странице. В этом примере суть не в том, чтобы показать, как написать преобразование, а в том, чтобы показать одну форму, которую может принять преобразование.
<?xml version="1.0"?> <xsl:stylesheet version="1.0"> <TABLE> <TR> <TH>Name</TH> <TH>Breed</TH> <TH>Age</TH> <TH>Altered</TH> <TH>Declawed</TH> <TH>License</TH> <TH>Owner</TH> </TR> <xsl:for-each select="CAT"> <TR ALIGN="LEFT" VALIGN="TOP"> <TD> <xsl:value-of select="NAME"/> </TD> <TD> <xsl:value-of select="BREED"/> </TD> <TD> <xsl:value-of select="AGE"/> </TD> <TD> <xsl:value-of select="ALTERED"/> </TD> <TD> <xsl:value-of select="DECLAWED"/> </TD> <TD> <xsl:value-of select="LICENSE"/> </TD> <TD> <xsl:value-of select="OWNER"/> </TD> </TR> </xsl:for-each> </TABLE>
В этом примере показано, как может выглядеть текст одного из типов преобразования, но помните, что вы можете ограничиться четким описанием того, что вам нужно от данных, и это описание может быть сделано на вашем родном языке. Например, вы можете пойти в отдел ИТ и сказать, что необходимо напечатать данные о продажах для конкретных регионов за последние два года, и что эти сведения должны выглядеть так-то и так-то. После этого специалисты отдела могут написать (или изменить) преобразование, чтобы выполнить вашу просьбу.
Корпорация Майкрософт и растущее число других компаний создают преобразования для различных задач, что делает использование XML еще более удобным. В будущем, скорее всего, можно будет скачать преобразование, отвечающее вашим потребностям без дополнительной настройки или с небольшими изменениями. Это означает, что со временем использование XML будет требовать все меньше и меньше затрат.
XML в системе Microsoft Office
Профессиональные выпуски Office обеспечивают всестороннюю поддержку XML. Начиная с Microsoft Office 2007, в Microsoft Office используются форматы файлов на основе XML, например DOCX, XLSX и PPTX. Поскольку XML-данные хранятся в текстовом формате вместо запатентованного двоичного формата, ваши клиенты могут определять собственные схемы и использовать ваши данные разными способами без лицензионных отчислений. Дополнительные сведения о новых форматах см. в сведениях о форматах Open XML и расширениях имен файлов. К другим преимуществам относятся:
-
Меньший размер файлов. Новый формат использует ZIP и другие технологии сжатия, поэтому размер файла на 75 процентов меньше, чем в двоичных форматах, применяемых в более ранних версиях Office.
-
Более простое восстановление данных и большая безопасность. Формат XML может быть легко прочитан пользователем, поэтому если файл поврежден, его можно открыть в Блокноте или другой программе для просмотра текста и восстановить хотя бы часть данных. Кроме того, новые файлы более безопасны, потому что они не могут содержать код Visual Basic для приложений (VBA). Если новый формат используется для создания шаблонов, то элементы ActiveX и макросы VBA находятся в отдельном, более безопасном разделе файла. Кроме того, можно удалять личные данные из документов с помощью таких средств, как инспектор документов. Дополнительные сведения об использовании инспектора документов см. в статье Удаление скрытых и персональных данных при проверке документов.
Пока все хорошо, но что делать, если у вас есть данные XML без схемы? У Office программ, которые поддерживают XML, есть свои подходы к работе с данными. Например, Excel выдаст схему, если вы откроете XML-файл, который еще не имеет такой схемы. Excel затем вы можете загрузить эти данные в XML-таблицу. Для сортировки, фильтрации или добавления вычислений в данные можно использовать XML-списки и таблицы.
Включение средств XML в Office
По умолчанию вкладка «Разработчик» не отображается. Ее необходимо добавить на ленту для использования команд XML в Office.
-
В Office 2016, Office 2013 или Office 2010: Отображение вкладки «Разработчик».
-
В Office 2007: Отображение вкладки разработчика или запуск в режиме разработчика.
Что такое XML? — Объяснение расширяемого языка разметки (XML)
Что такое XML?
Расширяемый язык разметки (XML) позволяет определять и хранить данные в общедоступной форме. XML поддерживает обмен информацией между компьютерными системами, такими как веб-сайты, базы данных и сторонние приложения. Предопределенные правила упрощают передачу данных в виде XML-файлов по любой сети, поскольку получатель может использовать эти правила для точного и эффективного считывания данных.
Почему XML важен?
Расширяемый язык разметки (XML) — это язык разметки, предоставляющий правила для определения любых данных. В отличие от других языков программирования, XML не может самостоятельно выполнять вычислительные операции. Вместо этого для управления структурированными данными можно использовать любой язык программирования или программное обеспечение.
Например, рассмотрим текстовый документ с комментариями к нему. В комментариях могут быть такие предложения:
- Сделать заголовок жирным
- Это предложение является заголовком
- Это слово является автором
Такие комментарии улучшают удобство использования документа, не затрагивая его содержания. Точно так же XML использует символы разметки для предоставления дополнительной информации о любых данных. Другое программное обеспечение, такое как браузеры и приложения для обработки данных, использует эту информацию для более эффективной обработки структурированных данных.
Теги XML
Для определения данных используются символы разметки, которые в XML называются тегами. Например, чтобы представить данные для книжного магазина, вы можете создать такие теги, как
Теги обеспечивают сложное кодирование данных для интеграции информационных потоков в различных системах.
Каковы преимущества использования XML?
Поддержка межфирменных транзакций
Когда компания продает товар или услугу другой компании, обе компании должны обмениваться информацией, такой как стоимость, спецификации и графики поставок. Благодаря расширяемому языку разметки (XML) они могут обмениваться всей необходимой информацией в электронном виде и автоматически заключать сложные сделки без вмешательства человека.
Поддержание целостности данных
XML позволяет передавать данные вместе с описанием данных, предотвращая потерю целостности данных. Вы можете использовать эту описательную информацию для выполнения следующих действий:
- Проверка точности данных
- Автоматически настраивать представление данных для разных пользователей
- Храните данные последовательно на нескольких платформах
Повышение эффективности поиска
Компьютерные программы, такие как поисковые системы, могут сортировать и классифицировать файлы XML более эффективно и точно, чем другие типы документов. Например, слово знак может быть как существительным, так и глаголом. Основываясь на XML-тегах, поисковые системы могут точно классифицировать пометку для релевантных результатов поиска. Таким образом, XML помогает компьютерам более эффективно интерпретировать естественный язык.
Разработка гибких приложений
С помощью XML вы можете удобно обновить или изменить дизайн вашего приложения. Многие технологии, особенно новые, имеют встроенную поддержку XML. Они могут автоматически читать и обрабатывать файлы данных XML, так что вы можете вносить изменения без переформатирования всей базы данных.
Каково применение XML?
Расширяемый язык разметки (XML) — это базовая технология для тысяч приложений, начиная от обычных средств повышения производительности, таких как обработка текста, и заканчивая программным обеспечением для публикации книг и даже системами конфигурации сложных приложений.
Передача данных
XML можно использовать для передачи данных между двумя системами, которые хранят одни и те же данные в разных форматах. Например, ваш веб-сайт хранит даты в формате ММ/ДД/ГГГГ, а ваша система учета хранит даты в формате ДД/ММ/ГГГГ. Вы можете передавать данные с сайта в учетную систему с помощью XML. Ваши разработчики могут написать код, который автоматически преобразует следующее:
- Данные веб-сайта в формате XML
- Данные XML в данные системы учета
- Возврат данных системы учета в формат XML
- Данные XML обратно в данные веб-сайта
Веб-приложения
XML структурирует данные, которые вы видите на веб-страницах. Другие технологии веб-сайтов, такие как HTML, работают с XML для предоставления согласованных и актуальных данных посетителям веб-сайта. Например, рассмотрим веб-сайт электронной коммерции, который продает одежду. Вместо того, чтобы показывать всю одежду всем посетителям, веб-сайт использует XML для создания настраиваемых веб-страниц на основе предпочтений пользователя. Он показывает продукты определенных брендов, фильтруя тег
Документация
XML можно использовать для указания структурной информации любого технического документа. Затем другие программы обрабатывают структуру документа для гибкого представления. Например, есть теги XML для абзаца, элемента нумерованного списка и заголовка. Используя эти теги, другие типы программного обеспечения автоматически подготавливают документ для таких целей, как печать и публикация на веб-странице.
Тип данных
Многие языки программирования поддерживают XML как тип данных. Благодаря этой поддержке вы можете легко писать программы на других языках, которые работают непосредственно с XML-файлами.
Каковы компоненты файла XML?
Файл Extensible Markup Language (XML) — это текстовый документ, который можно сохранить с расширением .xml. Вы можете писать XML аналогично другим текстовым файлам. Чтобы создать или отредактировать XML-файл, вы можете использовать любое из следующего:
- Текстовые редакторы, такие как Notepad или Notepad++
- Онлайн-редакторы XML
- Веб-браузеры
Любой файл XML включает следующие компоненты.
XML-документ
Теги
Декларация XML
Документ XML начинается с некоторой информации о самом XML. Например, в нем может быть указана версия XML, которой он следует. Это открытие называется декларацией XML. Вот пример.
Элементы XML
Все остальные теги, которые вы создаете в документе XML, называются элементами XML. Элементы XML могут содержать следующие функции:
- Текст
- Атрибуты
- Прочие элементы
Все XML-документы начинаются с первичного тега, который называется корневым элементом.
Например, рассмотрим XML-файл ниже.
<Тетя>
<Имя> Кристина
<имя> Стефани имя>
тетя>
/InvitationList>
Атрибуты XML
Элементы XML могут иметь другие дескрипторы, называемые атрибутами. Вы можете определить свои собственные имена атрибутов и написать значения атрибутов в кавычках, как показано ниже.
Содержимое XML
Данные в файлах XML также называются содержимым XML. Например, в файле XML вы можете увидеть такие данные.
Значения данных Charlie и Steve 90.
Что такое схема XML?
Схема Extensible Markup Language (XML) — это документ, описывающий некоторые правила или ограничения структуры XML-файла. Вы можете описать эти ограничения несколькими различными способами, например: 9.0005
- Грамматические правила для определения порядка элементов
- Да или Нет условия, которым должен удовлетворять контент
- Типы данных для содержимого в файлах XML
- Ограничения целостности данных
Например, XML-схема для книжных магазинов может накладывать следующие ограничения:
- Элемент книги будет иметь атрибуты название и автор .
- Элемент book будет вложен в элемент категории с именем атрибута.
- Цена книги будет отдельным элементом, вложенным в book .
Чтобы выполнить эти ограничения, мы напишем XML-файл, как показано ниже.
Схемы XML обеспечивают согласованность в том, как различные программные приложения создают и используют XML-файлы. В некоторых отраслях используются XML-схемы, специфичные для их операций, чтобы упростить написание XML-кода для передачи данных между предприятиями. Например, масштабируемая векторная графика (SVG) — это спецификация XML для описания данных, связанных с компьютерной графикой. Разработчики программного обеспечения пишут XML-файлы таким образом, чтобы они соответствовали отраслевым спецификациям.
Что такое синтаксический анализатор XML?
Анализатор Extensible Markup Language (XML) — это программное обеспечение, которое может обрабатывать или читать XML-документы для извлечения содержащихся в них данных. Синтаксические анализаторы XML также проверяют синтаксис или правила XML-файла и могут сверять его с определенной схемой XML. Поскольку XML является строгим языком разметки, синтаксические анализаторы не будут обрабатывать файл при наличии ошибок проверки или синтаксиса. Например, синтаксический анализатор XML выдаст ошибки, если выполняется одно из следующих условий:
- Отсутствует закрывающий или закрывающий тег
- Значения атрибутов не заключаются в кавычки
- Условие схемы не выполнено
Программные приложения используют синтаксические анализаторы XML для преобразования файлов XML в собственные типы данных. Таким образом, они могут сосредоточиться на логике приложения, не вникая в детали самого XML.
Чем XML отличается от HTML?
Язык гипертекстовой разметки (HTML) — это язык, используемый на большинстве веб-страниц. Веб-браузер обрабатывает HTML-документы и отображает их как мультимедийную страницу. Консорциум World Wide Web (W3C) — это международное сообщество, разрабатывающее протоколы и рекомендации для обеспечения долгосрочного роста Интернета. W3C установил стандарты HTML и Extensible Markup Language (XML), которые разработчики веб-сайтов внедряют для обеспечения согласованности и качества.
XML и HTML
Хотя файлы HTML и XML очень похожи, между ними есть некоторые ключевые отличия.
Назначение
Целью HTML является представление и отображение данных. Однако XML хранит и передает данные.
Теги
HTML имеет предопределенные теги, но пользователи могут создавать и определять свои собственные теги в XML.
Правила синтаксиса
Существуют небольшие, но важные различия между синтаксисом HTML и XML. Например, XML чувствителен к регистру, а HTML — нет. Синтаксические анализаторы XML будут выдавать ошибки, если вы напишете тег как
Как сервисы AWS поддерживают XML?
Все сервисы интеграции данных AWS могут обрабатывать файлы Extensible Markup Language (XML). Мы перечисляем некоторые примеры ниже.
AWS Glue — это бессерверная служба интеграции данных, которую можно использовать для обнаружения, подготовки и объединения данных для аналитики, машинного обучения и разработки приложений. AWS Glue DataBrew — это визуальный инструмент подготовки данных, который можно использовать для подготовки данных с помощью интерактивного визуального интерфейса «укажи и щелкни» без написания кода. DataBrew может вводить все типы форматов файлов, включая XML.
Amazon Simple Queue Service (SQS) — это полностью управляемая служба очередей сообщений, которую можно использовать для отправки, хранения и получения сообщений между программными компонентами любого объема. Сообщения Amazon SQS могут содержать до 256 КБ текстовых данных, включая XML, JSON и неформатированный текст.
Amazon Kinesis позволяет легко собирать, обрабатывать и анализировать потоковые данные в режиме реального времени, чтобы вы могли получать своевременную аналитическую информацию и быстро реагировать на новую информацию. Благодаря ключевым возможностям Kinesis вы можете экономически эффективно обрабатывать потоковые данные в любом масштабе. Вы также получаете гибкость в выборе инструментов, соответствующих требованиям вашего приложения. Передавайте, преобразовывайте и анализируйте XML-данные в режиме реального времени с помощью Kinesis.
Начните интеграцию данных, создав учетную запись AWS уже сегодня.
Введение в XML — XML: расширяемый язык разметки
XML (расширяемый язык разметки) — это язык разметки, аналогичный HTML, но без предопределенных тегов. Вместо этого вы определяете свои собственные теги, разработанные специально для ваших нужд. Это мощный способ хранения данных в формате, удобном для хранения, поиска и совместного использования. Что наиболее важно, поскольку основной формат XML стандартизирован, если вы делитесь или передаете XML между системами или платформами, локально или через Интернет, получатель все равно может анализировать данные благодаря стандартизированному синтаксису XML.
Существует множество языков, основанных на XML, включая XHTML, MathML, SVG, RSS и RDF. Вы также можете определить свои собственные.
Вся структура XML и языков на основе XML построена на тегах.
Объявление XML
XML — объявление не является тегом. Он используется для передачи метаданных документа.
Атрибуты
- версия:
-
Используемая версия XML в этом документе.
- :
-
Используемая кодировка в этом документе.
Кодировка
Правильные правила разработки
Чтобы XML-документ был правильным, должны выполняться следующие условия:
- Документ должен быть правильно сформирован.
- Документ должен соответствовать всем правилам синтаксиса XML.
- Документ должен соответствовать семантическим правилам, которые обычно устанавливаются в схеме XML или DTD ( Определение типа документа) .
Пример
<сообщение> <предупреждение> Привет, мир сообщение>
Теперь давайте посмотрим на исправленную версию того же документа:
<сообщение> <предупреждение> Привет, мир предупреждение> сообщение>
Документ, содержащий неопределенный тег, недействителен. Например, если мы никогда не определяли
, документ выше недействителен.
Большинство браузеров предлагают отладчик, который может идентифицировать XML-документы неправильного формата.
Как и HTML, XML предлагает методы (называемые объектами) для ссылки на некоторые специальные зарезервированные символы (например, знак больше, который используется для тегов). Вы должны знать пять таких символов:
Entity | Символ | Описание |
---|---|---|
< | < | Знак меньше |
> | > | Знак больше |
& | и | Амперсанд |
" | » | Одна двойная кавычка |
‘ | ‘ | Один апостроф (или одинарная кавычка) |
Несмотря на то, что объявлено всего 5 объектов, можно добавить больше, используя определение типа документа. Например, чтобы создать новый &warning;
, вы можете сделать это:
]> <тело> <сообщение> &предупреждение; сообщение> тело>
Вы также можете использовать числовые ссылки на символы для указания специальных символов; например, © является символом «©».
XML обычно используется в описательных целях, но существуют способы отображения XML-данных. Если не указать конкретный способ отображения XML, необработанный XML отображается в браузере.
Один из способов оформления вывода XML — указать CSS для применения к документу с помощью инструкции обработки xml-stylesheet
.
Существует еще один более мощный способ отображения XML: Extensible Stylesheet Language Transformations (XSLT), который можно использовать для преобразования XML в другие языки, такие как HTML. Это делает XML невероятно универсальным.
Эта статья, очевидно, является лишь очень кратким введением в то, что такое XML, с несколькими небольшими примерами и ссылками, которые помогут вам начать работу. Для получения более подробной информации об XML вам следует поискать в Интернете более подробные статьи.