Настройка Databricks
profiles.yml
предназначен только для пользователей dbt CoreЕсли вы используете dbt Cloud, вам не нужно создавать файл profiles.yml
. Этот файл предназначен только для пользователей dbt Core. Чтобы подключить вашу платформу данных к dbt Cloud, обратитесь к разделу О платформах данных.
- Поддерживается: Databricks
- Авторы: some dbt loving Bricksters
- Репозиторий на GitHub: databricks/dbt-databricks
- Пакет на PyPI:
dbt-databricks
- Канал в Slack: #db-databricks-and-spark
- Поддерживаемая версия dbt Core: v0.18.0 и новее
- Поддер жка dbt Cloud: Supported
- Минимальная версия платформы данных: Databricks SQL or DBR 12+
Установка dbt-databricks
Используйте pip
для установки адаптера. До версии 1.8 установка адаптера автоматически устанавливала dbt-core
и любые дополнительные зависимости. Начиная с версии 1.8, установка адаптера не устанавливает автоматически dbt-core
. Это связано с тем, что адаптеры и версии dbt Core были разделены, и мы больше не хотим перезаписывать существующие установки dbt-core.
Используйте следующую команду для установки:
Конфигурация dbt-databricks
Для конфигурации, специфичной для Databricks, пожалуйста, обратитесь к конфигурациям Databricks.
dbt-databricks
— это рекомендуемый адаптер для Databricks. Он включает функции, недоступные в dbt-spark
, такие как:
- Поддержка Unity Catalog
- Нет необходимости устанавливать дополнительные драйверы или зависимости для использования в CLI
- Использование Delta Lake для всех моделей по умолчанию
- SQL макросы, оптимизированные для работы с Photon
Подключение к Databricks
Чтобы подключиться к платформе данных с помощью dbt Core, создайте соответствующие ключи/значения profile и target в YAML-файле конфигурации profiles.yml
для вашего Databricks SQL Warehouse/кластера. Этот YAML-файл dbt находится в директории .dbt/
вашего пользовательского/домашнего каталога. Для получения дополнительной информации обратитесь к Профили подключения и profiles.yml.
dbt-databricks
может подключаться к Databricks SQL Warehouses и универсальным кластерам. Databricks SQL Warehouses — это рекомендуемый способ начать работу с Databricks.
Обратитесь к документации Databricks для получения дополнительной информации о том, как получить учетные данные для настройки вашего профиля.