Перейти к основному содержимому

Подключение Apache Spark

Если вы используете Databricks, используйте dbt-databricks

Если вы используете Databricks, рекомендуется использовать адаптер dbt-databricks вместо dbt-spark. Если вы все еще используете dbt-spark с Databricks, рассмотрите возможность миграции с адаптера dbt-spark на адаптер dbt-databricks.

Для версии этой страницы для Databricks обратитесь к разделу Настройка Databricks.

примечание

См. Подключение Databricks для версии этой страницы для Databricks.

dbt поддерживает подключение к кластеру Apache Spark с использованием HTTP-метода или метода Thrift. Примечание: хотя HTTP-метод можно использовать для подключения к all-purpose кластеру Databricks, для всех подключений к Databricks рекомендуется использовать ODBC-метод. Подробнее о настройке этих параметров подключения см. в документации dbt-spark.

Чтобы узнать, как оптимизировать производительность с помощью платформенно-специфичных настроек данных в dbt, см. конфигурации, специфичные для Apache Spark.

Следующие поля доступны при создании подключения Apache Spark с использованием методов подключения HTTP и Thrift:

ПолеОписаниеПримеры
Host NameИмя хоста кластера Spark для подключенияyourorg.sparkhost.com
PortПорт для подключения к Spark443
OrganizationНеобязательно (по умолчанию: 0)0123456789
ClusterID кластера для подключения1234-567890-abc12345
Connection TimeoutКоличество секунд до истечения времени ожидания подключения10
Connection RetriesКоличество попыток подключения к кластеру перед отказом10
UserНеобязательноdbt_cloud_user
AuthНеобязательно, укажите, если используется KerberosKERBEROS
Kerberos Service NameНеобязательно, укажите, если используется Kerberoshive
Loading table...
Настройка подключения SparkНастройка подключения Spark

Нашли ошибку?

0