Настройка Databricks Preview
Вы можете настроить адаптер Databricks, запустив dbt init в CLI, либо вручную создав файл profiles.yml и указав в нём поля, соответствующие выбранному типу аутентификации.
Адаптер Databricks для Fusion поддерживает следующие методы аутентификации:
- Personal access token (для индивидуальных пользователей)
- Service Principal token (для сервисных пользователей)
- OAuth
Детали конфигурации Databricks
Адаптер dbt Fusion Engine dbt-databricks — это единственный поддерживаемый способ подключения к Databricks.
dbt-databricks может подключаться к Databricks SQL Warehouses. Эти хранилища рекомендуется использовать для начала работы с Databricks.
Дополнительную информацию о получении учётных данных для настройки профиля см. в документации Databricks.
Настройка Fusion
При выполнении dbt init в CLI вам будет предложено указать следующие поля:
- Host: имя хоста экземпляра Databricks (без префикса
httpилиhttps) - HTTP Path: путь к вашему SQL-серверу или кластеру
- Schema: схема для разработки / стейджинга / деплоя проекта
- Catalog (Optional): каталог Databricks, содержащий ваши схемы и таблицы
В качестве альтернативы вы можете вручную создать файл profiles.yml и настроить необходимые поля. Примеры форматирования см. в разделе authentication. Если файл profiles.yml уже существует, вам будет предложено сохранить текущие поля или перезаписать их.
Далее выберите метод аутентификации и следуйте инструкциям на экране, чтобы предоставить требуемую информацию.
Поддерживаемые типы аутентификации
- Personal access token
- Service Principal token
- OAuth (Recommended)
Введите ваш personal access token (PAT) для среды Databricks. Подробнее о получении PAT см. в документации Databricks. Databricks считает этот механизм устаревшим, поэтому рекомендуется использовать OAuth вместо PAT.
Пример конфигурации с personal access token
default:
target: dev
outputs:
dev:
type: databricks
database: TRANSFORMING
schema: JANE_SMITH
host: YOUR.HOST.COM
http_path: YOUR/PATH/HERE
token: ABC123
auth_type: databricks_cli
threads: 16
Введите Service Principal token для среды Databricks. Подробнее о получении Service Principal token см. в документации Databricks.
Пример конфигурации с Service Principal token
default:
target: dev
outputs:
dev:
type: databricks
database: TRANSFORMING
schema: JANE_SMITH
host: YOUR.HOST.COM
http_path: YOUR/PATH/HERE
token: ABC123
auth_type: databricks_cli
threads: 16
При выборе OAuth будет создано подключение к вашей среде Databricks и автоматически открыт веб-браузер для завершения аутентификации. Пользователям потребуется проходить повторную аутентификацию при запуске каждой новой сессии dbt.
Пример конфигурации OAuth
default:
target: dev
outputs:
dev:
type: databricks
database: TRANSFORMING
schema: JANE_SMITH
host: YOUR.HOST.COM
http_path: YOUR/PATH/HERE
auth_type: oauth
threads: 16
Дополнительная информация
Конфигурационные параметры, специфичные для Databricks, см. в справочнике по адаптеру Databricks.