Document running Spark jobs on a Kerberised cluster #356

Jimvin · 2024-02-13T10:12:50Z

As a Spark developer I would like to be able to run Spark jobs on a cluster where one or more services have Kerberos enabled. There are additional setup required to get a Spark job to run with Kerberos, including providing keytab, Kerberos configuration, service configuration and Spark context config.

We should document how to run an example Spark job that connects to a kerberos-enabled HDFS and Hive service.

adwk67 · 2024-02-13T10:15:18Z

A spark-job that uses the secret operator to generate keytabs for named users can be found here: https://github.com/stackabletech/hdfs-topology-provider/pull/5/files#diff-49100e41e40194b8d1f7aba8218bec678d9a9817efd5346b4609a92269721264 (this should indicate what needs to be implemented in the spark-k8s-operator)

sbernauer · 2024-05-02T11:51:52Z

Duplicate of stackabletech/issues#530, closing this as well. This is included in the end-to-end-security demo

Jimvin self-assigned this Feb 13, 2024

razvan self-assigned this Feb 16, 2024

razvan mentioned this issue Feb 16, 2024

docs/kerberos example #358

Draft

lfrancke mentioned this issue Feb 20, 2024

Demo: Spark connecting to Kerberized HDFS & Hive stackabletech/issues#530

Closed

sbernauer closed this as completed May 2, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Document running Spark jobs on a Kerberised cluster #356

Document running Spark jobs on a Kerberised cluster #356

Jimvin commented Feb 13, 2024

adwk67 commented Feb 13, 2024 •

edited

sbernauer commented May 2, 2024

Document running Spark jobs on a Kerberised cluster #356

Document running Spark jobs on a Kerberised cluster #356

Comments

Jimvin commented Feb 13, 2024

adwk67 commented Feb 13, 2024 • edited

sbernauer commented May 2, 2024

adwk67 commented Feb 13, 2024 •

edited