Подключение Onehouse

dbt поддерживает подключение к Onehouse SQL с использованием Apache Spark Connector через метод Thrift.

примечание

Подключайтесь к Onehouse SQL Cluster с помощью адаптера dbt-spark.**

Требования

Для dbt убедитесь, что ваш Onehouse SQL endpoint доступен через внешний DNS/IP, и выполнена настройка whitelisting IP-адресов dbt.

Что работает

Все команды dbt, включая: dbt clean, dbt compile, dbt debug, dbt seed и dbt run.
Материализации dbt: table и incremental
Типы таблиц Apache Hudi: Merge on Read (MoR) и Copy on Write (CoW). Для изменяемых (mutable) нагрузок рекомендуется использовать MoR.

Ограничения

Представления (views) не поддерживаются
Для dbt seed существуют ограничения по количеству строк / записей.
dbt seed поддерживает только таблицы Copy on Write.

Подключение dbt

При создании подключения Apache Spark с использованием метода Thrift заполните следующие поля:

Field	Description	Examples
Method	Метод подключения к Spark	Thrift
Hostname	Имя хоста endpoint’а вашего Onehouse SQL Cluster	`yourProject.sparkHost.com`
Port	Порт для подключения к Spark	10000
Cluster	Onehouse не использует это поле
Connection Timeout	Количество секунд до таймаута соединения	10
Connection Retries	Количество попыток подключения к кластеру перед ошибкой	0
Organization	Onehouse не использует это поле
User	Необязательно. По умолчанию не включено.	dbt_cloud_user
Auth	Необязательно, укажите при использовании Kerberos. По умолчанию не включено.	`KERBEROS`
Kerberos Service Name	Необязательно, укажите при использовании Kerberos. По умолчанию не включено.	`hive`

Loading table...

Конфигурация Onehouse

проект dbt

Мы рекомендуем задать конфигурации по умолчанию в dbt_project.yml, чтобы адаптер выполнялся с SQL, совместимым с Onehouse.

Field	Description	Required	Default	Recommended
materialized	Материализация, используемая по умолчанию для проекта/каталога	Yes	без указания — `view`	`table`
file_format	Формат таблиц, используемый по умолчанию в проекте	Yes	N/A	hudi
location_root	Расположение базы данных в DFS	Yes	N/A	`<your_database_location_dfs>`
hoodie.table.type	Merge on Read или Copy on Write	No	cow	mor

Loading table...

Шаблон dbt_project.yml

      +materialized: table | incremental
      +file_format: hudi
      +location_root: <storage_uri>
      +tblproperties:
         hoodie.table.type: mor | cow

Пример dbt_project.yml при использовании jaffle shop:

models:
  jaffle_shop:
    +file_format: hudi
    +location_root: s3://lakehouse/demolake/dbt_ecomm/
    +tblproperties:
      hoodie.table.type: mor
    staging:
      +materialized: incremental
    marts:
      +materialized: table

Нашли ошибку?

Создать GitHub Issue

Подключение Onehouse

Требования

Что работает

Ограничения

Подключение dbt

проект dbt

Нашли ошибку?

Начните работать с dbt.

Продукты

Сообщество

Поддержка

Наши соцсети

Требования​

Что работает​

Ограничения​

Подключение dbt​

проект dbt​

Нашли ошибку?

Продукты

Сообщество

Поддержка

Наши соцсети

Требования

Что работает

Ограничения

Подключение dbt

проект dbt