Инструменты обработки структурированной разметки¶
Python поддерживает множество модулей для работы с различными формами разметки структурированных данных. Сюда входят модули для работы со стандартным обобщенным языком разметки (SGML) и языком разметки гипертекста (HTML), а также несколько интерфейсов для работы с расширяемым языком разметки (XML).
html— Поддержка языка разметки гипертекстаhtml.parser— Простой парсер HTML и XHTMLhtml.entities— Определения общих сущностей HTML- Модули обработки XML
xml.etree.ElementTree— API ElementTree XMLxml.dom— API объектной модели документаxml.dom.minidom— Минимальная реализация DOMxml.dom.pulldom— Поддержка построения частичных деревьев DOMxml.sax— Поддержка парсеров SAX2xml.sax.handler— Базовые классы для обработчиков SAXxml.sax.saxutils— Утилиты SAXxml.sax.xmlreader— Интерфейс для анализаторов XMLxml.parsers.expat— Быстрый разбор XML с помощью Expat