Перейти к основному содержимому

О Discovery API StarterEnterpriseEnterprise +

Каждый раз, когда dbt запускает проект, он генерирует и сохраняет информацию о проекте. Эти метаданные включают сведения о моделях, источниках и других узлах проекта, а также результаты их выполнения. С помощью Discovery API в dbt вы можете запрашивать эту обширную информацию, чтобы лучше понимать ваш DAG и данные, которые он производит.

Используя метаданные в dbt, вы можете создавать системы мониторинга данных и оповещений, инструменты для изучения lineage, а также автоматизированную отчетность. Это помогает улучшить обнаружение данных, качество данных и операционные процессы пайплайнов внутри вашей организации.

Вы можете получить доступ к Discovery API через ad hoc queries, пользовательские приложения, широкий спектр интеграций партнерской экосистемы (например, BI/аналитику, каталоги и управление данными, а также инструменты качества и наблюдаемости), а также с помощью функций dbt, таких как model timing и data health tiles.

Богатая экосистема для интеграцииБогатая экосистема для интеграции

Вы можете запрашивать метаданные dbt:

  • На уровне environment — как для актуального состояния (используйте endpoint environment), так и для исторических результатов запусков (используйте modelHistoricalRuns) проекта dbt в production.
  • На уровне job — для получения результатов конкретного запуска job dbt для заданного типа ресурса, например models или test.

Предварительные требования

Для чего можно использовать Discovery API

Нажмите на следующие вкладки, чтобы узнать больше о случаях использования API, анализе, который вы можете провести, и результатах, которых вы можете достичь, интегрировав его.

Чтобы использовать API напрямую или интегрировать ваш инструмент с ним, обратитесь к случаям использования и примерам для получения подробной информации.

Используйте API для анализа исторической информации, такой как время сборки модели, чтобы определить состояние ваших проектов dbt. Поиск неэффективностей в конфигурациях оркестрации может помочь снизить затраты на инфраструктуру и улучшить своевременность. Чтобы узнать больше о том, как это сделать, обратитесь к Производительность.

Вы можете использовать, например, вкладку время выполнения моделей, чтобы помочь выявить и оптимизировать узкие места в сборке моделей:

Визуализация времени выполнения модели в dbtВизуализация времени выполнения модели в dbt

Типы состояния проекта

Вы можете выполнять запросы к этим двум типам состояния проекта на уровне окружения:

  • Определение — Логическое состояние ресурсов проекта dbt, которое обновляется при изменении проекта.
  • Примененное — Результат успешного выполнения DAG dbt, который создает или описывает состояние базы данных (например: dbt run, dbt test, свежесть источников и так далее).

Эти состояния позволяют вам легко изучать разницу между определением модели и ее примененным состоянием, чтобы вы могли получить ответы на такие вопросы, как: была ли выполнена модель? или выполнение не удалось? Примененные модели существуют как таблица/представление в платформе данных после их последнего успешного выполнения.

Нашли ошибку?

0
Loading