Перейти к основному содержимому

Могу ли я подключить свой проект dbt к двум базам данных?

Значение термина 'база данных' варьируется в зависимости от каждого крупного менеджера хранилищ. Поэтому ответ на вопрос "может ли проект dbt подключаться к более чем одной базе данных?" зависит от хранилища, используемого в вашей технологической инфраструктуре.

  • Проекты dbt, подключающиеся к хранилищам, таким как Snowflake или Bigquery—где один набор учетных данных может обращаться ко всем наборам данных или 'проектам', доступным для учетной записи—иногда говорят, что они подключаются к более чем одной базе данных.
  • Проекты dbt, подключающиеся к хранилищам, таким как Redshift и Postgres—где один набор учетных данных привязан к одной базе данных—говорят, что они подключаются только к одной базе данных.

Избегайте проблемы 'одной базы данных', полагаясь на мышление (т.е. извлечение -> загрузка -> преобразование). Помните, dbt не является загрузчиком — за редкими исключениями, он не перемещает данные из источников в хранилище. dbt является преобразователем. Он вступает в игру после того, как извлекатели и загрузчики направили источники в хранилище. Он перемещает и комбинирует данные внутри самого хранилища.

Поэтому вместо того, чтобы думать "как подключить мой проект dbt к двум базам данных", спросите "какие сервисы загрузки лучше всего подготовят наше хранилище для преобразований dbt."

Для получения дополнительной информации о современной инфраструктуре данных, основанной на 'ELT', см. раздел "dbt и современная BI-инфраструктура" в этом посте в блоге dbt.

0