Перейти к основному содержимому

О Discovery API

Каждый раз, когда dbt Cloud выполняет проект, он генерирует и сохраняет информацию о проекте. Метаданные включают детали о моделях вашего проекта, источниках и других узлах вместе с результатами их выполнения. С помощью Discovery API dbt Cloud вы можете запрашивать эту обширную информацию, чтобы лучше понять ваш DAG и данные, которые он производит.

Используя метаданные в dbt Cloud, вы можете создавать системы для мониторинга данных и оповещений, исследования происхождения данных и автоматизированной отчетности. Это может помочь вам улучшить обнаружение данных, их качество и работу конвейеров в вашей организации.

Вы можете получить доступ к Discovery API через разовые запросы, пользовательские приложения, широкий спектр интеграций с партнерами (таких как BI/аналитика, каталогизация и управление, а также качество и наблюдаемость), а также используя функции dbt Cloud, такие как время выполнения моделей и плитки здоровья данных.

Богатая экосистема для интеграцииБогатая экосистема для интеграции

Вы можете запрашивать метаданные dbt Cloud:

  • На уровне окружения как для последнего состояния (используйте конечную точку environment), так и для результатов исторических запусков (используйте modelByEnvironment) проекта dbt Cloud в производстве.
  • На уровне задания для получения результатов по конкретному запуску задания dbt Cloud для данного типа ресурса, например, models или test.

Предварительные требования

Для чего можно использовать Discovery API

Нажмите на следующие вкладки, чтобы узнать больше о случаях использования API, анализе, который вы можете провести, и результатах, которых вы можете достичь, интегрировав его.

Чтобы использовать API напрямую или интегрировать ваш инструмент с ним, обратитесь к случаям использования и примерам для получения подробной информации.

Используйте API для анализа исторической информации, такой как время сборки модели, чтобы определить состояние ваших проектов dbt. Поиск неэффективностей в конфигурациях оркестрации может помочь снизить затраты на инфраструктуру и улучшить своевременность. Чтобы узнать больше о том, как это сделать, обратитесь к Производительность.

Вы можете использовать, например, вкладку время выполнения моделей, чтобы помочь выявить и оптимизировать узкие места в сборке моделей:

Визуализация времени выполнения модели в dbt CloudВизуализация времени выполнения модели в dbt Cloud

Типы состояния проекта

Существует два типа состояния проекта на уровне окружения, результаты которых вы можете запрашивать:

  • Определение — Логическое состояние ресурсов проекта dbt, которое обновляется при изменении проекта.
  • Примененное — Результат успешного выполнения DAG dbt, который создает или описывает состояние базы данных (например: dbt run, dbt test, свежесть источников и так далее).

Эти состояния позволяют вам легко изучать разницу между определением модели и ее примененным состоянием, чтобы вы могли получить ответы на такие вопросы, как: была ли выполнена модель? или выполнение не удалось? Примененные модели существуют как таблица/представление в платформе данных после их последнего успешного выполнения.

Связанные документы

0