Актуальность источников
dbt предоставляет удобный интерфейс для работы с расчетами актуальности исходных данных в dbt. Когда задание dbt настроено на создание snapshot’ов актуальности исходных данных, dbt отображает пользовательский интерфейс, показывающий состояние самого последнего snapshot’а. Этот интерфейс предназначен для того, чтобы помочь вам определить, соответствует ли актуальность ваших исходных данных соглашению об уровне сервиса (SLA), которое вы определили для своей организации.
Включение снимков актуальности источников
dbt build не включает проверки свежести источников (source freshness) при сборке и тестировании ресурсов в вашем DAG. Вместо этого вы можете использовать один из следующих распространённых шаблонов для определения jobs:
- Добавьте
dbt buildв шаг run, чтобы запускать модели, тесты и т.д. - Установите флажок Generate docs on run, чтобы автоматически генерировать документацию проекта.
- Установите флажок Run source freshness, чтобы включить проверку свежести источников в качестве первого шага job.
Чтобы включить снимки актуальности источников, сначала убедитесь, что ваши источники настроены для снимка информации об актуальности. Вы можете добавить актуальность источников в список команд на этапах выполнения задачи или включить флажок. Однако вы можете ожидать разные результаты при настройке задачи, выбрав флажок Run source freshness по сравнению с добавлением команды в этапы выполнения.
Рассмотрите следующие варианты и результаты:
| Loading table... |
Частота снимков актуальности источников
Важно, чтобы ваши задачи по проверке актуальности выполнялись достаточно часто, чтобы фиксировать задержку данных в соответствии с вашими SLA. Вы можете представить, что если у вас есть SLA в 1 час для определенного набора данных, то создание снимка актуальности этого table раз в день будет неуместным. Как хорошее практическое правило, вы должны запускать задачи по проверке актуальности источников с частотой как минимум вдвое превышающей ваш минимальный SLA. Вот пример таблицы с разумными частотами снимков, учитывая типичные SLA:
| Loading table... |
Дополнительное чтение
- Обратитесь к разделу Artifacts, чтобы узнать больше о том, как создавать артефакты dbt, делиться ссылками на актуальную документацию и распространять отчёты о свежести источников внутри команды.
- Свежесть источников для Snowflake рассчитывается с использованием столбца
LAST_ALTERED. Подробнее об ограничениях читайте в разделе Snowflake configs.


