Перейти к основному содержимому

Подключение Apache Spark

Если вы используете Databricks, используйте dbt-databricks

Если вы используете Databricks, рекомендуется использовать адаптер dbt-databricks вместо dbt-spark. Если вы все еще используете dbt-spark с Databricks, рассмотрите возможность миграции с адаптера dbt-spark на адаптер dbt-databricks.

Для версии этой страницы для Databricks обратитесь к разделу Настройка Databricks.

примечание

См. Подключение Databricks для версии этой страницы для Databricks.

dbt Cloud поддерживает подключение к кластеру Apache Spark с использованием метода HTTP или метода Thrift. Примечание: хотя метод HTTP может использоваться для подключения к универсальному кластеру Databricks, для всех подключений к Databricks рекомендуется использовать метод ODBC. Для получения дополнительной информации о настройке этих параметров подключения, пожалуйста, ознакомьтесь с документацией dbt-spark.

Чтобы узнать, как оптимизировать производительность с помощью специфичных для платформы данных конфигураций в dbt Cloud, обратитесь к конфигурации, специфичной для Apache Spark.

Следующие поля доступны при создании подключения Apache Spark с использованием методов подключения HTTP и Thrift:

ПолеОписаниеПримеры
Host NameИмя хоста кластера Spark для подключенияyourorg.sparkhost.com
PortПорт для подключения к Spark443
OrganizationНеобязательно (по умолчанию: 0)0123456789
ClusterID кластера для подключения1234-567890-abc12345
Connection TimeoutКоличество секунд до истечения времени ожидания подключения10
Connection RetriesКоличество попыток подключения к кластеру перед отказом10
UserНеобязательноdbt_cloud_user
AuthНеобязательно, укажите, если используется KerberosKERBEROS
Kerberos Service NameНеобязательно, укажите, если используется Kerberoshive
Настройка подключения SparkНастройка подключения Spark
0