Быстрый старт с dbt Mesh
Введение
dbt Mesh — это фреймворк, который помогает организациям эффективно масштабировать свои команды и данные. Он способствует лучшим практикам управления и разбивает крупные проекты на управляемые части — для более быстрого развития данных. dbt Mesh доступен для аккаунтов dbt Cloud Enterprise.
Это руководство научит вас, как настроить многопроектный дизайн, используя основные концепции dbt Mesh и как реализовать data mesh в dbt Cloud:
- Настройте основной проект под названием “Jaffle | Data Analytics”
- Настройте downstream проект под названием “Jaffle | Finance”
- Добавьте доступ к моделям, версии и контракты
- Настройте dbt Cloud задачу, которая запускается по завершении upstream задачи
Для получения дополнительной информации о важности data mesh, прочитайте этот пост: Что такое data mesh? Определение и важность data mesh.
Вы можете бесплатно ознакомиться с Основами dbt, если вас интересует обучение с видео.
Вы также можете посмотреть видео на YouTube о dbt и Snowflake.
Связанные материалы:
- Концепции data mesh: что это и как начать
- Решение о структуре вашего dbt Mesh
- Руководство по лучшим практикам dbt Mesh
- Часто задаваемые вопросы о dbt Mesh
Предварительные требования
Чтобы использовать dbt Mesh, вам необходимо следующее:
- У вас должен быть аккаунт dbt Cloud Enterprise enterprise
- У вас должен быть доступ к облачной платформе данных, разрешения на загрузку образцов таблиц данных и разрешения dbt Cloud для создания новых проектов.
- Это руководство использует образцы данных Jaffle Shop, включая таблицы
customers
,orders
иpayments
. Следуйте предоставленным инструкциям, чтобы загрузить эти данные в вашу соответствующую платформу данных:
Это руководство предполагает, что у вас есть опыт работы с dbt или базовые знания о нем. Пройдите курс Основы dbt, если вы новичок в dbt.
Создание и настройка двух проектов
В этом разделе вы создадите два новых пустых проекта в dbt Cloud, которые будут служить вашими основными и downstream проектами:
- Основные проекты (или upstream проекты) обычно содержат основные модели и наборы данных, которые служат основой для дальнейшего анализа и отчетности.
- Downstream проекты строятся на этих основах, часто добавляя более с пецифические преобразования или бизнес-логику для выделенных команд или целей.
Например, всегда предприимчивый и вымышленный аккаунт "Jaffle Labs" создаст два проекта для своей команды по аналитике данных и финансовой команды: Jaffle | Data Analytics и Jaffle | Finance.
Чтобы создать новый проект в dbt Cloud:
- В Настройках аккаунта нажмите + Новый проект.
- Введите имя проекта и нажмите Продолжить.
- Используйте "Jaffle | Data Analytics" для одного проекта
- Используйте "Jaffle | Finance" для другого проекта
- Выберите вашу платформу данных, затем нажмите Далее, чтобы настр оить ваше подключение.
- В разделе Настройка вашей среды введите Настройки для вашего нового проекта.
- Нажмите Тестировать подключение. Это проверяет, может ли dbt Cloud получить доступ к вашему аккаунту платформы данных.
- Нажмите Далее, если тест прошел успешно. Если он не прошел, возможно, вам нужно вернуться и дважды проверить ваши настройки.
- Для этого руководства убедитесь, что вы создаете одну разработческую и развертываемую среду на проект.
- Для "Jaffle | Data Analytics" установите базу данных по умолчанию на
jaffle_da
. - Для "Jaffle | Finance" установите базу данных по умолчанию на
jaffle_finance
- Для "Jaffle | Data Analytics" установите базу данных по умолчанию на
- Для этого руководства убедитесь, что вы создаете одну разработческую и развертываемую среду на проект.