Перейти к основному содержимому

Лучшие практики

Собираем всё вместе

  • 📊 Мы рассмотрели создание семантических моделей и метрик для базового охвата ключевой бизнес-области.
  • 🔁 При этом мы изучили, как рефакторить замороженные сводки в динамичную, гибкую новую жизнь в Семантическом слое.

Лучшие практики

  • Предпочитайте нормализацию, когда это возможно, чтобы позволить MetricFlow динамически денормализовать данные для конечных пользователей.
  • ✅ Используйте marts для денормализации, когда это необходимо, например, группируя таблицы в более богатые компоненты или получая меры на размерных таблицах, прикрепленных к таблице с временной осью.
  • ✅ Когда исходные данные хорошо нормализованы, вы можете строить семантические модели поверх моделей подготовки данных.
  • Предпочитайте вычисление значений в мерах и метриках, когда это возможно, вместо замороженных сводок.
  • Не рефакторьте напрямую код, который у вас в продакшене, стройте параллельно, чтобы вы могли проверять вывод Семантического слоя и плавно выводить из эксплуатации старые marts.

Ключевые команды

  • 🔑 Используйте dbt parse для генерации свежего семантического манифеста.
  • 🔑 Используйте dbt sl list dimensions --metrics [metric name], чтобы проверить, увеличиваете ли вы размерность по мере продвижения.
  • 🔑 Используйте dbt sl query [query options], чтобы предварительно просмотреть вывод ваших метрик в процессе разработки.

Следующие шаги

  • 🗺️ Используйте эти лучшие практики, чтобы наметить план вашей команды по постепенному внедрению Семантического слоя.
  • 🤗 Присоединяйтесь к сообществу и задавайте вопросы, помогайте формировать лучшие практики и делитесь своим прогрессом в построении Семантического слоя dbt.
  • Проверяйте семантические узлы в CI, чтобы убедиться, что изменения в коде dbt моделей не нарушают эти метрики.

Семантический слой dbt — это самый большой сдвиг парадигмы на сегодняшний день в молодой практике аналитической инженерии. Он готов предоставить ценность сразу, но будет наиболее эффективен, если вы направите свой проект к увеличению нормализации и позволите MetricFlow выполнять денормализацию с максимальной размерностью.

Мы скоро выпустим больше ресурсов, охватывающих внедрение Семантического слоя в dbt Cloud с различными интегрированными BI-инструментами. Это только начало, надеемся, что это руководство дало вам путь вперед для построения вашей платформы данных в эту новую эпоху. Обратитесь к Часто задаваемым вопросам о Семантическом слое dbt для получения дополнительной информации.

0