lxml_html_clean — это проект функций очистки HTML, скопированный из lxml.html.clean. До версии 0.4.4 тег <base> проходит через конфигурацию Cleaner по умолчанию. Хотя page_structure=True удаляет теги html, head и title, для <base> не существует специальной обработки, что позволяет злоумышленнику внедрить его и перехватить относительные ссылки на странице.
Эта проблема исправлена в версии 0.4.4.
Показать оригинальное описание (EN)
lxml_html_clean is a project for HTML cleaning functionalities copied from `lxml.html.clean`. Prior to version 0.4.4, the <base> tag passes through the default Cleaner configuration. While page_structure=True removes html, head, and title tags, there is no specific handling for <base>, allowing an attacker to inject it and hijack relative links on the page. This issue has been patched in version 0.4.4.
Характеристики атаки
Последствия
Строка CVSS v3.1