Перейти к основному содержимому

Чеклист конфигурации dbt platform StarterEnterpriseEnterprise +

Итак, вы создали новый облачный аккаунт dbt platform и готовы начать знакомство с его быстрыми и интуитивно понятными возможностями. Добро пожаловать! Прежде чем приступить к работе, давайте убедимся, что ваш аккаунт настроен корректно — это позволит без проблем подключать новых пользователей и использовать все интеграции, которые предлагает dbt.

Для большинства организаций на этом этапе потребуется взаимодействие с IT‑специалистами и/или командой безопасности. В зависимости от используемых возможностей, вам может понадобиться помощь следующих административных ролей:

  • Хранилище данных (Snowflake, BigQuery, Databricks и т.д.)
  • Управление доступом (Okta, Entra ID, Google, SAML 2.0)
  • Git (GitHub, GitLab, Azure DevOps и т.д.)

Этот чек-лист поможет убедиться, что всё настроено правильно, чтобы вы могли быстро начать работу и избежать узких мест.

Хранилище данных

dbt platform поддерживает глобальные подключения к хранилищам данных. Это означает, что одно настроенное подключение может использоваться в нескольких проектах и окружениях. dbt platform поддерживает несколько подключений к хранилищам данных, включая (но не ограничиваясь) BigQuery, Databricks, Redshift и Snowflake. Один из самых ранних шагов настройки аккаунта — убедиться, что подключение к хранилищу данных работает корректно:

  • Используйте документацию по настройке подключений, чтобы сконфигурировать выбранное хранилище данных.
  • Убедитесь, что dbt‑разработчики имеют необходимые роли и доступы в вашем хранилище данных.
  • Проверьте, что в хранилище есть реальные данные, к которым можно обращаться. Это могут быть как продакшн‑, так и девелопмент‑данные. При желании вы можете использовать наш песочничный e‑commerce‑проект The Jaffle Shop, который включает тестовые данные и готовые к запуску модели.
  • Независимо от того, начинаете ли вы новый проект или импортируете существующий dbt Core проект, убедитесь, что у вас настроена корректная структура проекта.
    • Если вы мигрируете с Core, есть несколько важных моментов, о которых стоит знать — ознакомьтесь с нашим руководством по миграции.
  • Пользователям необходимо настроить свои учетные данные для подключения к dev‑окружению в dbt Studio IDE.
    • Убедитесь, что всем пользователям, которым нужен доступ к работе в IDE, в аккаунте назначена лицензия разработчика.
  • Модели dbt в основном пишутся в виде SELECT‑запросов, поэтому одним из первых критериев успеха является выполнение простого select‑запроса в IDE и проверка результатов.
    • Также можно проверить подключение, выполнив базовые SQL‑запросы с помощью dbt Insights.
  • Создайте одну модель и убедитесь, что вы можете успешно запустить её.
    • Для простого интерфейса с drag‑and‑drop попробуйте создать модель с помощью dbt Canvas.
  • Создайте сервисный аккаунт с корректными правами доступа для ваших production jobs.

Настройка Git

Git является основой большинства dbt‑окружений. Именно в Git‑репозиториях хранятся файлы dbt‑проекта, и именно там разработчики совместно работают над кодом и управляют версиями.

Окружения и job-ы

Environments позволяют разделять данные разработки и продакшена. dbt поддерживает два типа окружений: Development и Deployment. Существует три типа Deployment‑окружений:

  • Production — одно на проект
  • Staging — одно на проект
  • General — несколько на проект

Кроме того, в каждом проекте может быть только одно Development‑окружение, но у каждого разработчика будет собственный изолированный доступ к IDE, независимый от работы других разработчиков.

Jobs определяют, какие команды выполняются в окружениях. Они могут запускаться вручную, по расписанию, другими job‑ами, через API или при создании либо слиянии pull request.

После подключения хранилища данных и завершения интеграции с Git можно переходить к настройке окружений и job‑ов:

  • Начните с создания нового Development environment для проекта.
  • Создайте Production Deployment environment.
    • (Опционально) Создайте дополнительное Staging или General окружение.
  • Создайте и запланируйте deployment job.
    • Для проверки сначала запустите job вручную.
  • При необходимости настройте разные базы данных для разных окружений.

Пользовательский доступ

dbt platform предоставляет широкий набор инструментов управления доступом, которые позволяют предоставлять и отзывать доступ пользователей, настраивать RBAC, а также назначать лицензии и разрешения.

Продолжайте

После завершения этого чек-листа вы будете готовы начать работу с dbt platform, но на этом путь только начинается. Ознакомьтесь с дополнительными ресурсами, которые помогут вам дальше:

  • Изучите guides — это быстрые руководства по началу работы с проектами и возможностями.
  • Пройдите практический курс dbt Learn.
  • Ознакомьтесь с нашими best practices, где собраны практические рекомендации по структуре и деплою dbt‑проектов.
  • Разберитесь с references — это своего рода словарь продукта с подробными примерами реализации.

Нашли ошибку?

0
Loading