lxml_html_clean — это проект функций очистки HTML, скопированный из lxml.html.clean. До версии 0.4.4 метод _has_sneaky_javascript() удалял обратную косую черту перед проверкой опасных ключевых слов CSS. Это приводит к тому, что escape-последовательности CSS Unicode обходят фильтры @import и express(), позволяя загружать внешний CSS или XSS в старых браузерах.
Эта проблема исправлена в версии 0.4.4.
Показать оригинальное описание (EN)
lxml_html_clean is a project for HTML cleaning functionalities copied from `lxml.html.clean`. Prior to version 0.4.4, the _has_sneaky_javascript() method strips backslashes before checking for dangerous CSS keywords. This causes CSS Unicode escape sequences to bypass the @import and expression() filters, allowing external CSS loading or XSS in older browsers. This issue has been patched in version 0.4.4.
Характеристики атаки
Последствия
Строка CVSS v3.1