Подключение Apache Spark
dbt-databricks
Если вы используете Databricks, рекомендуется использовать адаптер dbt-databricks
вместо dbt-spark
. Если вы все еще используете dbt-spark с Databricks, рассмотрите возможность миграции с адаптера dbt-spark на адаптер dbt-databricks.
Для версии этой страницы для Databricks обратитесь к разделу Настройка Databricks.
См. Подключение Databricks для версии этой страницы для Databricks.
dbt Cloud поддерживает подключение к кластеру Apache Spark с использованием метода HTTP или метода Thrift. Примечание: хотя метод HTTP может использоваться для подключения к универсальному кластеру Databricks, для всех подключений к Databricks рекомендуется использовать метод ODBC. Для получения дополнительной информации о настройке этих параметров подключения, пожалуйста, ознакомьтесь с документацией dbt-spark.
Чтобы узнать, как оптимизировать производительность с помощью специфичных для платформы данных конфигураций в dbt Cloud, обратитесь к конфигурации, специфичной для Apache Spark.
Следующие поля доступны при создании подключения Apache Spark с использованием методов подключения HTTP и Thrift:
Поле | Описание | Примеры |
---|---|---|
Host Name | Имя хоста кластера Spark для подключения | yourorg.sparkhost.com |
Port | Порт для подключения к Spark | 443 |
Organization | Необязательно (по умолчанию: 0) | 0123456789 |
Cluster | ID кластера для подключения | 1234-567890-abc12345 |
Connection Timeout | Количество секунд до истечения времени ожидания подключения | 10 |
Connection Retries | Количество попыток подключения к кластеру перед отказом | 10 |
User | Необязательно | dbt_cloud_user |
Auth | Необязательно, укажите, если используется Kerberos | KERBEROS |
Kerberos Service Name | Необязательно, укажите, если используется Kerberos | hive |