Примечания к релизам dbt Cloud за 2024 год
Примечания к релизам dbt для недавних и исторических изменений. Примечания к релизам относятся к одной из следующих категорий:
- New: Новые продукты и возможности
- Enhancement: Улучшения производительности и расширения функциональности
- Fix: Исправления ошибок и уязвимостей безопасности
- Behavior change: Изменения существующего поведения, которые не подпадают под другие категории, например, устаревание функций или изменения значений по умолчанию
Примечания к релизам сгруппированы по месяцам как для многоарендных (multi-tenant), так и для сред с виртуальным частным облаком (VPC)*
* Официальная дата выпуска этого нового формата примечаний к релизам — 15 мая 2024 года. Исторические примечания к релизам за более ранние даты могут не отражать все функции, выпущенные ранее в этом году, или их доступность в зависимости от типа развертывания.
Декабрь 2024
-
New: Сохранённые запросы теперь поддерживают tags, которые позволяют категоризировать ресурсы и фильтровать их. Добавляйте теги к вашим saved queries в файле
semantic_model.ymlилиdbt_project.yml. Например:dbt_project.ymlsaved-queries:
jaffle_shop:
customer_order_metrics:
+tags: order_metrics -
New: Dimensions теперь поддерживают свойство конфигурации
metaв dbt Cloud "Latest" release track и начиная с dbt Core 1.9. Вы можете добавлять метаданные к измерениям, чтобы предоставить дополнительный контекст и информацию. Подробнее см. meta. -
New: Downstream exposures теперь общедоступны (GA) для тарифов dbt Enterprise. Downstream exposures нативно интегрируются с Tableau (поддержка Power BI появится позже) и автоматически создают downstream lineage в dbt Explorer для более богатого пользовательского опыта.
-
New: Semantic Layer поддерживает Sigma в качестве партнёрской интеграции, доступной в Preview. Подробнее см. Sigma.
-
New: Semantic Layer теперь поддерживает развертывания Azure Single-tenant. Подробнее о начале работы см. Set up the Semantic Layer.
-
Fix: Устранены периодические проблемы в средах Single-tenant, затрагивавшие Semantic Layer и историю запросов.
-
Fix: The dbt Semantic Layer теперь корректно учитывает атрибут BigQuery
execution_project, в том числе при экспортах. -
New: Model notifications теперь общедоступны (GA) в dbt. Эти уведомления оповещают владельцев моделей по электронной почте о любых проблемах, возникающих при выполнении моделей и тестов во время запуска заданий.
-
New: Теперь вы можете использовать свой Azure OpenAI key (доступно в beta) для использования функций dbt, таких как Copilot и Ask dbt. Кроме того, вы можете использовать собственный OpenAI API key или ключ OpenAI, управляемый dbt Labs. Подробнее см. AI integrations.
-
New: Конфигурация
hard_deletesпредоставляет больше контроля над обработкой удалённых строк из источника. Поддерживаемые варианты:ignore(по умолчанию),invalidate(заменяет устаревшийinvalidate_hard_deletes=true) иnew_record. Обратите внимание, чтоnew_recordсоздаёт новый столбец метаданных в таблице snapshot.
Ноябрь 2024
- Enhancement: Сигналы состояния данных (data health signals) в dbt Explorer теперь доступны для Exposures, обеспечивая быстрый обзор качества данных при просмотре ресурсов. Чтобы увидеть иконки сигналов доверия, перейдите в dbt Explorer и выберите Exposures на вкладке Resource. Подробнее см. Data health signals for resources.
- Bug: Обнаружена и исправлена ошибка в запросах Semantic Layer, выполнение которых занимало более 10 минут.
- Fix: Переопределения переменных окружения задания в учетных данных теперь учитываются для Exports. Ранее они игнорировались.
- Behavior change: Если вы используете пользовательский microbatch macro, установите behavior flag
require_batched_execution_for_custom_microbatch_strategyвdbt_project.yml, чтобы включить пакетное выполнение. Если у вас нет пользовательского microbatch macro, устанавливать этот флаг не требуется — dbt автоматически обработает microbatching для любой модели, использующей microbatch strategy. - Enhancement: Для пользователей с включённой функцией Advanced CI compare changes теперь доступна оптимизация производительности при выполнении сравнений с помощью пользовательского синтаксиса dbt: можно настраивать использование deferral, исключать конкретные крупные модели (или группы моделей с тегами) и многое другое. Примеры см. в Compare changes custom commands.
- New: SQL linting в CI-заданиях теперь общедоступен (GA) в dbt. Вы можете включить SQL linting в своих CI-заданиях с использованием SQLFluff для автоматической проверки всех SQL-файлов проекта перед сборкой CI-задания. SQLFluff linting доступен на dbt release tracks и для аккаунтов dbt Team или Enterprise. Подробнее см. SQL linting.
- New: Используйте конфигурацию
dbt_valid_to_current, чтобы задать пользовательское значение индикатора дляdbt_valid_toв текущих snapshot-записях (например, будущую дату). По умолчанию это значение равноNULL. При настройке dbt будет использовать указанное значение вместоNULLдляdbt_valid_toтекущих записей в таблице snapshot. Функция доступна в dbt Cloud "Latest" release track (ранее называлсяVersionless) и в dbt Core v1.9 и выше. - New: Используйте конфигурацию
event_time, чтобы указать «в какое время произошла строка». Эта конфигурация обязательна для Incremental microbatch и может быть добавлена для корректного сравнения перекрывающихся периодов времени в Advanced CI compare changes. Доступно в dbt Cloud "Latest" release track (ранееVersionless) и в dbt Core v1.9 и выше. - Fix: Это обновление улучшает интеграцию Semantic Layer с Tableau, делая разбор запросов более надёжным. Ключевые исправления включают:
- Сообщения об ошибках для неподдерживаемых join между saved queries и таблицами ALL.
- Улучшенную обработку запросов при выборе нескольких таблиц в источнике данных.
- Исправление ошибки при использовании фильтра IN с большим количеством значений.
- Более информативные сообщения об ошибках для запросов, которые не удаётся корректно разобрать.
- Enhancement: Semantic Layer поддерживает создание новых учетных данных для пользователей, не имеющих прав на создание service tokens. В боковой панели Credentials & service tokens для таких пользователей опция +Add Service Token недоступна. Вместо этого отображается сообщение о недостаточных правах с рекомендацией обратиться к администратору. Подробнее см. Set up Semantic Layer.
Октябрь 2024
- Behavior change: Многофакторная аутентификация теперь обязательна для всех пользователей, входящих с использованием имени пользователя и пароля.
- Enhancement: JDBC для dbt Semantic Layer теперь позволяет выполнять пагинацию для
semantic_layer.metrics()иsemantic_layer.dimensions()с использованием параметровpage_sizeиpage_number. Подробнее см. Paginate metadata calls. - Enhancement: JDBC для dbt Semantic Layer теперь позволяет фильтровать метрики по наличию определённой подстроки с помощью параметра
search. Если подстрока не указана, запрос возвращает все метрики. Подробнее см. Fetch metrics by substring search. - Fix: Интеграция Semantic Layer с Excel теперь корректно отображает ошибки при сбое выполнения запроса. Ранее было неясно, почему запрос не выполнялся.
- Fix: Ранее POST-запросы к Jobs API с некорректными
cron-строками возвращали HTTP-статус 500 и при этом обновляли базовую сущность. Теперь такие запросы возвращают статус 400 без обновления сущности. - Fix: Исправлена проблема, из-за которой страница Source в dbt Explorer некорректно отображала статус свежести источника, если данные были старше 30 дней.
- Fix: Интерфейс теперь указывает, когда описание модели унаследовано из комментария каталога.
- Behavior change: Пользовательские API-токены объявлены устаревшими. Обновитесь до personal access tokens, если вы всё ещё используете старые токены.
- New: Cloud IDE поддерживает подписанные коммиты для Git, доступно для тарифов Enterprise. Вы можете подписывать коммиты Git при отправке в репозиторий, чтобы предотвратить подмену личности и повысить безопасность. Поддерживаемые провайдеры Git — GitHub и GitLab. Подробнее см. Git commit signing.
- New: С Mesh теперь можно включать двунаправленные зависимости между проектами. Ранее dbt требовал, чтобы зависимости имели только одно направление. dbt проверяет наличие циклов между проектами и выдаёт ошибки при их обнаружении. Подробнее см. Cycle detection. Также доступно руководство Intro to Mesh.
- New: Python SDK для Semantic Layer теперь общедоступен (GA). Он предоставляет простой доступ к Semantic Layer из Python и позволяет разработчикам взаимодействовать с API для запросов метрик и измерений в downstream-инструментах.
- Enhancement: Теперь можно добавлять описание к одиночному data test. Используйте свойство
descriptionдля документирования singular data tests. Также можно использовать docs block для описания тестов. Улучшение уже доступно в "Latest" release track в dbt Cloud и будет включено в dbt Core v1.9. - New: Представлена стратегия microbatch incremental model (beta), доступная в dbt Cloud Latest и вскоре поддерживаемая в dbt Core v1.9. Стратегия microbatch обеспечивает эффективную пакетную обработку больших временных рядов для повышения производительности и отказоустойчивости, особенно при работе с изменяющимися со временем данными (например, ежедневным добавлением новых записей). Чтобы включить эту функцию в dbt Cloud, установите переменную окружения
DBT_EXPERIMENTAL_MICROBATCHв значениеtrue. - New: dbt Semantic Layer поддерживает пользовательские конфигурации календаря в MetricFlow, доступно в Preview. Пользовательские календари позволяют выполнять запросы с использованием нестандартных периодов времени, таких как
fiscal_yearилиretail_month. Подробнее см. custom calendar. - New: В "Latest" release track в dbt Snapshots были обновлены для использования YAML-файлов конфигурации вместо SQL snapshot blocks. Это упрощает управление snapshots и повышает производительность, а также скоро будет выпущено в dbt Core 1.9.
- Кого это касается? Пользователи "Latest" release track в dbt могут определять snapshots с использованием новой YAML-спецификации. Пользователи, обновляющиеся до "Latest" с существующими snapshot-определениями, могут сохранить текущие конфигурации или мигрировать их в YAML.
- Пользователи старых версий: никаких действий не требуется — существующие snapshots продолжат работать как прежде. Тем не менее, мы рекомендуем обновиться до "Latest" release track, чтобы воспользоваться новыми возможностями snapshots.
- Behavior change: Установите
state_modified_compare_more_unrendered_valuesвtrue, чтобы уменьшить количество ложных срабатыванийstate:modified, когда конфигурации различаются между окружениямиdevиprod. - Behavior change: Установите флаг
skip_nodes_if_on_run_start_failsвTrue, чтобы пропускать выполнение всех выбранных ресурсов, если происходит сбой вon-run-starthook. - Enhancement: В "Latest" release track в dbt Cloud snapshots, определённые в SQL-файлах, теперь могут использовать
config, определённый в YAML-файлахschema.yml. Это обновление устраняет прежнее ограничение, требовавшее определять свойства snapshots исключительно вdbt_project.ymlи/или в блокеconfig()внутри SQL-файла. Это также будет выпущено в dbt Core 1.9. - New: В "Latest" release track в dbt Cloud конфигурация
snapshot_meta_column_namesпозволяет настраивать имена метаданных столбцов snapshot. Эта функция позволяет организации привести автоматически создаваемые имена столбцов в соответствие с внутренними соглашениями и будет включена в предстоящий релиз dbt Core 1.9. - Enhancement: "Latest" release track в dbt Cloud автоматически определяет
primary_keyмодели на основе настроенных data tests и/или ограничений вmanifest.json. Определённыйprimary_keyотображается в dbt Explorer и используется функцией dbt Cloud compare changes. Это также будет выпущено в dbt Core 1.9. Подробнее см. порядок, в котором dbt определяет столбцы, используемые в качестве primary key модели. - New: dbt Explorer теперь включает иконки trust signals, которые в настоящее время доступны в Preview. Trust signals предоставляют быстрый визуальный обзор состояния данных при просмотре моделей dbt в dbt Explorer. Эти иконки показывают, находится ли модель в состоянии Healthy, Caution, Degraded или Unknown. Для получения корректных данных о состоянии убедитесь, что ресурс актуален и недавно выполнялся job. Подробнее см. Data health signals.
- New: Downstream exposures теперь доступны в Preview в dbt. Downstream exposures помогают пользователям понимать, как их модели используются в downstream аналитических инструментах, чтобы обоснованно инвестировать и снижать количество инцидентов. Функция импортирует и автоматически генерирует exposures на основе дашбордов Tableau с возможностью пользовательской курации. Подробнее см. Downstream exposures.
Сентябрь 2024
- Fix: В MetricFlow обновлён
get_and_expire, который заменяет неподдерживаемую командуGETEXнаGETс условным сроком действия, обеспечивая совместимость с Azure Redis 6.0. - Enhancement: dbt Semantic Layer Python SDK теперь поддерживает пользовательскую гранулярность
TimeGranularityдля метрик. Это позволяет определять нестандартные временные гранулярности, такие какfiscal_yearилиretail_month, для выполнения запросов по нетипичным временным периодам. - New: Используйте AI-движок Copilot для генерации semantic model для ваших моделей — теперь доступно в beta. Copilot автоматически создаёт документацию, тесты и теперь semantic models на основе данных вашей модели. Подробнее см. Copilot.
- New: Используйте новый рекомендуемый синтаксис для определения ограничений
foreign_keyс применениемrefs, доступный в "Latest" release track в dbt Cloud. Вскоре это будет выпущено в dbt Core v1.9. Новый синтаксис корректно фиксирует зависимости и работает в разных окружениях. - Enhancement: Теперь вы можете запускать Semantic Layer commands в dbt Cloud IDE. Поддерживаемые команды:
dbt sl list,dbt sl list metrics,dbt sl list dimension-values,dbt sl list saved-queries,dbt sl query,dbt sl list dimensions,dbt sl list entitiesиdbt sl validate. - New: Интеграция с Microsoft Excel — интеграция Semantic Layer — теперь общедоступна (GA). Она позволяет подключаться к Microsoft Excel для запросов метрик и совместной работы с командой. Доступно для Excel Desktop и Excel Online. Подробнее см. Microsoft Excel.
- New: Data health tile теперь общедоступен (GA) в dbt Explorer. Data health tiles предоставляют быстрый обзор качества данных, подсвечивая потенциальные проблемы. Вы можете встраивать эти tiles в дашборды для быстрого выявления и устранения проблем с данными в вашем dbt-проекте.
- New: Функция истории запросов моделей (Model query history) в dbt Explorer теперь доступна в Preview для клиентов dbt Enterprise. Она позволяет просматривать количество запросов потребления для модели на основе логов запросов хранилища данных, помогая командам сосредоточить усилия и расходы инфраструктуры на действительно используемых data products. Подробнее см. Model query history.
- Enhancement: Теперь вы можете использовать Extended Attributes и Environment Variables при подключении к Semantic Layer. Если значение задано напрямую в учетных данных Semantic Layer, оно имеет более высокий приоритет, чем Extended Attributes. При использовании environment variables будет применяться значение по умолчанию для окружения. Если вы используете exports, переопределения переменных окружения заданий пока не поддерживаются, но скоро будут.
- New: Добавлены два новых значения по умолчанию для environment variable defaults —
DBT_CLOUD_ENVIRONMENT_NAMEиDBT_CLOUD_ENVIRONMENT_TYPE. - New: Подключение к хранилищу Amazon Athena доступно в режиме public preview для аккаунтов dbt, обновлённых до “Latest” release track.
Август 2024
- Fix: Исправлена проблема в dbt Explorer, при которой переход в consumer project из публичного узла приводил к отображению случайной публичной модели вместо исходного выбора.
- New: Теперь вы можете настраивать метрики с более мелкой временной гранулярностью, например по часам, минутам или даже секундам. Это особенно полезно для более детального анализа и для наборов данных с высокоточной временной информацией, таких как поминутное отслеживание событий. Подробнее см. dimensions.
- Enhancement: Microsoft Excel теперь поддерживает saved selections и saved queries. Saved selections позволяют сохранять выбранные параметры запроса внутри приложения Excel. Приложение также по умолчанию очищает устаревшие данные в trailing rows. Чтобы вернуть результаты и сохранить ранее выбранные данные, снимите флажок Clear trailing rows.
- Behavior change: GitHub больше не поддерживается для OAuth-входа в dbt. Используйте поддерживаемого SSO или OAuth provider для безопасного управления доступом к вашему аккаунту dbt.
Июль 2024
-
Behavior change:
target_schemaбольше не является обязательной конфигурацией для snapshots. Теперь вы можете нацеливать snapshots на разные схемы в средах разработки и развертывания, используя schema config. -
New: Connections теперь доступны в разделе Account settings как глобальная настройка. Ранее они находились в Project settings. Изменение внедряется поэтапно в течение ближайших недель.
-
New: Администраторы теперь могут назначать environment-level permissions группам для конкретных ролей.
-
New: Merge jobs для реализации workflows continuous deployment (CD) теперь общедоступны (GA) в dbt. Ранее требовалось либо настраивать пользовательский GitHub action, либо вручную собирать изменения при каждом merge pull request.
-
New: Возможность выполнять lint ваших SQL-файлов из CLI dbt теперь доступна. Подробнее см. Lint SQL files.
-
Behavior change: dbt Cloud IDE автоматически добавляет
--limit 100к preview-запросам, чтобы избежать медленных и дорогих запросов во время разработки. Недавно dbt Core изменил способ примененияlimit, чтобы гарантировать корректную обработкуorder by. Из-за этого запросы, уже содержащиеlimit, могут теперь вызывать ошибки в preview IDE. Для решения проблемы dbt Labs планирует вскоре предоставить возможность отключать автоматическое добавление limit. До этого момента dbt Labs рекомендует удалять (дублирующийся) limit из запросов при preview, чтобы избежать ошибок IDE. -
Enhancement: Представлена обновлённая страница обзора dbt Explorer, доступная в beta. Она включает новый дизайн и компоновку главной страницы dbt Explorer, а также новый раздел Latest updates для просмотра последних изменений или проблем, связанных с ресурсами проекта. Подробнее см. Overview page.
dbt Semantic Layer
- New: Представлена Python-библиотека
dbt-sl-sdkSDK, которая предоставляет удобный доступ к dbt Semantic Layer из Python. Она позволяет разработчикам взаимодействовать с API dbt Semantic Layer и выполнять запросы метрик и измерений в downstream-инструментах. Подробнее см. dbt Semantic Layer Python SDK. - New: Введены semantic validations в CI pipelines. Теперь можно автоматически тестировать semantic nodes (метрики, semantic models и saved queries) во время code review, добавляя проверки в CI-задание с помощью команды
dbt sl validate. Также можно валидировать изменённые semantic nodes, чтобы гарантировать, что изменения в dbt-моделях не нарушают работу метрик. Подробнее см. Semantic validations in CI. - New: Поле
metaтеперь доступно в свойстве config для метрик dbt Semantic Layer в JDBC и GraphQL API в полеmeta. - New: Добавлена новая команда dbt CLI —
export-all, которая позволяет экспортировать несколько или все saved queries. Ранее требовалось явно указывать список saved queries. - Enhancement: Semantic Layer теперь предоставляет более детальный контроль, поддерживая несколько учетных данных платформ данных, которые могут представлять разные роли или service accounts. Доступно для тарифов dbt Enterprise — вы можете сопоставлять учетные данные с service tokens для безопасной аутентификации. Подробнее см. Set up Semantic Layer.
- Fix: Исправлена ошибка, из-за которой unicode-фильтры запросов (например, с китайскими символами) не работали корректно в интеграции Semantic Layer с Tableau.
- Fix: Исправлена ошибка разбора некоторых приватных ключей для BigQuery при выполнении экспорта.
- Fix: Устранена ошибка, из-за которой при выполнении запроса или экспорта возвращалась ошибка «closed connection».
- Fix: Исправлена проблема в dbt Core, при которой во время partial parsing все сгенерированные метрики в файле ошибочно удалялись вместо удаления только тех, которые связаны с изменённой semantic model. Теперь затрагиваются только метрики, связанные с модифицированной моделью.
Июнь 2024
-
New: Добавлена поддержка новой гранулярности для cumulative metrics в MetricFlow. Параметры гранулярности для cumulative metrics немного отличаются от других типов метрик. Для обычных метрик используется функция
date_trunc. Однако cumulative metrics являются неаддитивными (значения нельзя просто суммировать), поэтомуdate_truncнеприменим для изменения их временной гранулярности.Вместо этого используются агрегатные функции
first(),last()иavg()для агрегации cumulative metrics за запрошенный период. По умолчанию используется первое значение периода. Это поведение можно изменить с помощью параметраperiod_agg. Подробнее см. Granularity options for cumulative metrics.
dbt Semantic Layer
- New: Добавлена поддержка SQL-оптимизации Predicate pushdown в MetricFlow. Теперь категориальные фильтры измерений передаются (push down) непосредственно в таблицу-источник метрик. Ранее фильтры применялись после выбора данных из таблицы-источника. Это изменение помогает сократить полные сканирования таблиц в некоторых движках запросов.
- New: Включена поддержка
where-фильтров для измерений (включённых в saved queries) с использованием кэша во время выполнения запросов. Это означает, что теперь вы можете динамически фильтровать дашборды, не теряя преимуществ кэширования. Подробнее см. caching. - Enhancement: В Google Sheets добавлены иконки информации и описания для опций метрик и измерений в меню Query Builder. Нажмите на кнопку Info, чтобы просмотреть описание метрики или измерения. Доступно в следующих разделах меню Query Builder: metric, group by, where, saved selections и saved queries.
- Enhancement: В Google Sheets теперь можно применять гранулярность ко всем временным измерениям, а не только ко времени метрики. Обновление использует наши API для поддержки выбора гранулярности для любого выбранного временного измерения.
- Enhancement: Предупреждения о time spine в MetricFlow теперь побуждают пользователей настраивать отсутствующие или слишком крупные time spine. Сообщение об ошибке отображается при наличии нескольких time spine для одной гранулярности.
- Enhancement: Теперь отображаются ошибки, если для запрошенной или более мелкой гранулярности не настроен time spine.
- Enhancement: Улучшено сообщение об ошибке при выполнении запросов, если не заданы учетные данные semantic layer.
- Enhancement: Запрос гранулярностей для cumulative metrics теперь возвращает несколько вариантов (day, week, month, quarter, year), как и для всех других типов метрик. Ранее для cumulative metrics был доступен только один вариант.
- Fix: Удалены ошибки, препятствовавшие запросам cumulative metrics с другими гранулярностями.
- Fix: Исправлены различные ошибки Tableau при запросах некоторых метрик или при использовании вычисляемых полей.
- Fix: В Tableau были ослаблены требования к именованию полей для более корректного распознавания вычисляемых полей.
- Fix: Исправлена ошибка при обновлении метаданных базы данных для столбцов, которые невозможно преобразовать в Arrow. Такие столбцы теперь пропускаются. В основном это затрагивало пользователей Redshift с пользовательскими типами.
- Fix: Исправлены Private Link подключения для Databricks.
Также доступно в этом месяце:
- Улучшение: Теперь доступны обновления UI при создании merge jobs. Обновления включают улучшенный вспомогательный текст, новые настройки deferral и улучшения производительности.
- Новое: Semantic Layer теперь предлагает бесшовную интеграцию с Microsoft Excel, доступную в режиме preview. Вы можете строить запросы к semantic layer и получать данные по метрикам напрямую в Excel через специальное меню. Подробнее и для установки дополнения см. Microsoft Excel.
- Новое: Предупреждения заданий (Job warnings) теперь доступны в статусе GA. Ранее вы могли получать email- или Slack-уведомления о заданиях при их успешном выполнении, ошибке или отмене. Теперь с новой опцией Warns вы также можете получать уведомления, когда во время выполнения задания возникали предупреждения из тестов или проверок свежести источников. Это дает больше гибкости в том, когда получать уведомления.
- Новое: Теперь доступен preview dbt Snowflake Native App. С помощью этого приложения вы можете получать доступ к dbt Explorer, чат-боту Ask dbt и функциям наблюдаемости оркестрации, расширяя возможности dbt прямо в интерфейсе Snowflake. Подробнее см. About the dbt Snowflake Native App и Set up the dbt Snowflake Native App.
Май 2024
- Улучшение: В IDE появился новый кнопка Prune branches Git. Эта кнопка позволяет удалять локальные ветки, которые уже были удалены из удаленного репозитория, помогая поддерживать порядок в управлении ветками. Доступно во всех регионах и будет выпущено для single-tenant аккаунтов в следующем релизном цикле.
Событие dbt Cloud Launch Showcase
Следующие функции были добавлены или улучшены в рамках мероприятия dbt Launch Showcase, которое состоялось 14 мая 2024 года:
-
Новое: Copilot — это мощный AI-движок, который помогает генерировать документацию, тесты и семантические модели, экономя время при создании высококачественных данных. Доступен в private beta для части пользователей dbt Enterprise и в IDE. Зарегистрируйте интерес, чтобы присоединиться к private beta.
-
Новое: Новый low-code редактор, сейчас в private beta, позволяет аналитикам с ограниченными знаниями SQL создавать или редактировать dbt-модели через визуальный интерфейс drag-and-drop внутри dbt. Эти модели компилируются напрямую в SQL и не отличаются от других dbt-моделей в ваших проектах: они находятся под контролем версий, доступны между проектами в Mesh и интегрируются с dbt Explorer и Cloud IDE. Зарегистрируйте интерес, чтобы присоединиться к private beta.
-
Новое: dbt CLI теперь доступен в статусе GA для всех пользователей. dbt CLI — это интерфейс командной строки, который позволяет взаимодействовать с dbt, использовать автоматический deferral, работать с Mesh и многое другое.
-
Новое: Unit tests теперь доступны в статусе GA в dbt. Unit-тесты позволяют проверять логику SQL-моделей на наборе статических входных данных.
-
Новое: MetricFlow теперь позволяет добавлять метрики в качестве измерений (dimensions) в фильтры метрик для создания более сложных метрик и получения большего количества инсайтов. Доступно для всех пользователей Semantic Layer.
-
Новое: Staging environment теперь доступна в статусе GA. Используйте staging-окружения, чтобы предоставлять разработчикам доступ к деплой-воркфлоу и инструментам, при этом контролируя доступ к production-данным. Доступно всем пользователям dbt.
-
Новое: Поддержка входа по OAuth через Databricks теперь доступна в статусе GA для Enterprise-клиентов.
-
Новое: Нативная поддержка Microsoft Fabric в dbt теперь доступна в статусе GA. Функция реализована с помощью адаптера dbt-fabric. Подробнее см. Connect Microsoft Fabric и Microsoft Fabric DWH configurations. Также доступен quickstart guide, который поможет начать работу.
-
Новое: Mesh теперь доступен в статусе GA для пользователей dbt Enterprise. Mesh — это фреймворк, который помогает организациям эффективно масштабировать команды и данные. Он продвигает лучшие практики управления и разбивает крупные проекты на управляемые части. Начните работу с Mesh, прочитав Mesh quickstart guide.
-
Новое: Интеграции Semantic Layer с Tableau Desktop, Tableau Server и Google Sheets теперь доступны в статусе GA для аккаунтов dbt Team или Enterprise. Эти первоклассные интеграции позволяют выполнять запросы и получать ценные инсайты из вашей экосистемы данных.
-
Улучшение: В рамках постоянной работы над улучшением IDE, файловая система получила оптимизации для ускорения разработки в dbt, включая введение лимита репозитория Git в 10GB.
Также доступно в этом месяце:
-
Обновление: dbt CLI теперь доступен для Azure single-tenant и доступен во всех регионах развертывания как для multi-tenant, так и для single-tenant аккаунтов.
-
Новое: Semantic Layer представляет declarative caching, позволяя кэшировать часто используемые запросы для повышения производительности и снижения вычислительных затрат. Доступно для аккаунтов dbt Team или Enterprise.
-
Изменение поведения: Введен флаг
require_resource_names_without_spaces, опциональный и отключенный по умолчанию. Если установлен вTrue, dbt выбросит исключение, если обнаружит имя ресурса с пробелом в проекте или установленном пакете. В будущей версии dbt это поведение станет стандартным. Подробнее см. No spaces in resource names.
Апрель 2024
-
Изменение поведения: Введен флаг
require_explicit_package_overrides_for_builtin_materializations, опциональный и отключенный по умолчанию. Если установлен вTrue, dbt будет использовать только встроенные materializations, определенные в корневом проекте или в самом dbt, а не реализации из пакетов. Это станет поведением по умолчанию в мае 2024 года (dbt Core v1.8 и release tracks dbt Cloud). Подробнее см. Package override for built-in materialization.
Semantic Layer
- Новое: Используйте Saved selections для сохранения выборок запросов в приложении Google Sheets. Они могут быть приватными или публичными и обновляются при загрузке.
- Новое: Метрики теперь отображаются по своим labels как
metric_name. - Улучшение: Metrics теперь поддерживают опцию
metaв свойстве config. Ранее поддерживался только теперь уже deprecated тегmeta. - Улучшение: В приложении Google Sheets добавлена поддержка перехода и исследования сохраненных запросов, определенных в MetricFlow.
- Улучшение: В приложении Google Sheets добавлена поддержка запросов измерений без метрик. Ранее требовалось наличие метрики.
- Улучшение: В приложении Google Sheets добавлена поддержка временных пресетов и сложных фильтров временных диапазонов, таких как «between», «after» и «before».
- Улучшение: В приложении Google Sheets добавлена поддержка автоматического заполнения значений измерений при выборе фильтра «where», что избавляет от необходимости вводить их вручную.
- Улучшение: В приложении Google Sheets добавлена поддержка прямых запросов к entities, расширяя гибкость запросов данных.
- Улучшение: В приложении Google Sheets добавлена опция исключения заголовков колонок, что полезно для заполнения шаблонов только необходимыми данными.
- Устаревание: Для интеграции с Tableau источник данных
METRICS_AND_DIMENSIONSбыл объявлен устаревшим для всех аккаунтов, которые активно его не используют. Рекомендуется перейти на источник данных «ALL» для будущих интеграций.
Март 2024
- Новое: Сервисы Semantic Layer теперь поддерживают использование Privatelink для клиентов, у которых он включен.
- Новое: Теперь вы можете разрабатывать и тестировать Semantic Layer в dbt CLI, если ваши developer credentials используют SSO.
- Улучшение: Теперь можно выбирать entities для Group By, Filter By и Order By.
- Исправление:
dbt parseбольше не показывает ошибку при использовании списка фильтров (вместо строкового фильтра) для метрики. - Исправление:
join_to_timespineтеперь корректно применяется к входным мерам conversion-метрик. - Исправление: Исправлена проблема, при которой экспорты в Redshift не всегда коммитились в DWH, что также приводило к оставшимся блокировкам таблиц.
- Изменение поведения: Введен флаг
source_freshness_run_project_hooks, опциональный и отключенный по умолчанию. Если установлен вTrue, dbt будет включать project hookson-run-*в командуsource freshness. В будущей версии dbt это станет поведением по умолчанию. Подробнее см. Project hooks with source freshness.
Февраль 2024
-
Новое: Exports позволяют материализовать сохраненный запрос в виде таблицы или представления в вашей data platform. Используя exports, вы можете унифицировать определения метрик в платформе данных и запрашивать их как любые другие таблицы или представления.
-
Новое: Теперь вы можете получить список своих exports с помощью новой команды list saved-queries, добавив
--show-exports. -
Новое: Semantic Layer и Tableau Connector теперь поддерживают относительные фильтры дат в Tableau.
-
Улучшение: Интеграция Semantic Layer с Google Sheets теперь добавляет заметку в ячейке, из которой был запрошен набор данных, делая запросы более понятными. Также появилась новая опция Time Range, позволяющая быстро выбирать диапазоны дат.
-
Улучшение: В GraphQL API добавлен параметр
requiresMetricTimeдля лучшей обработки метрик, которые должны группироваться по времени (некоторые метрики MetricFlow нельзя анализировать без временного измерения). -
Улучшение: Включена возможность запрашивать метрики со смещением (offset) и накопительные метрики с использованием имени временного измерения вместо
metric_time. Issue #1000- Также включена возможность запрашивать
metric_timeбез метрик. Issue #928
- Также включена возможность запрашивать
-
Улучшение: Добавлена поддержка согласованной генерации SQL-запросов, обеспечивающей一致ность ID между идентичными MF-запросами. Ранее SQL, генерируемый
MetricFlowEngine, мог отличаться для одинаковых запросов. Issue 1020 -
Исправление: Tableau Connector теперь возвращает фильтр по дате при фильтрации по датам. Ранее ошибочно возвращался фильтр по timestamp.
-
Исправление: MetricFlow теперь валидирует наличие
metrics,group byилиsaved_queryв каждом запросе. Ранее валидация отсутствовала. Issue 1002 -
Исправление: Меры с
join_to_timespineв MetricFlow теперь корректно применяют фильтры после join с time spine. -
Исправление: Исправлены проблемы при запросе нескольких гранулярностей с offset-метриками:
- Если запрашивается offset-метрика с несколькими экземплярами
metric_time/agg_time_dimension, смещение применялось только к одному из них — теперь ко всем. - Если запрашивается offset-метрика с одним экземпляром
metric_time/agg_time_dimension, но фильтрация идет по другому, запрос ранее падал.
- Если запрашивается offset-метрика с несколькими экземплярами
-
Исправление: MetricFlow теперь отдает приоритет candidate join type над типом по умолчанию при вычислении join-узлов. Например, тип join по умолчанию для запросов distinct values —
FULL OUTER JOIN, однако для join с time spine требуетсяCROSS JOIN, который является более подходящим. -
Исправление: Исправлена ошибка, которая ранее вызывала сбои при использовании entities в фильтрах
where.
Январь 2024
-
Новое: Новый тип метрик, который позволяет измерять события конверсии. Например, пользователей, которые просмотрели веб‑страницу, а затем заполнили форму. Подробнее см. Conversion metrics.
-
Новое: Вместо указания полностью квалифицированного имени измерения (например,
order__user__country) в выражениях group by или filter теперь достаточно указывать основную сущность и имя измерения, напримерuser__county. -
Новое: Теперь вы можете выполнять запросы к сохранённым запросам, которые вы определили в Semantic Layer, используя Tableau, GraphQL API, JDBC API и CLI dbt.
-
Улучшение: Параметр спецификации YAML
labelтеперь доступен для метрик Semantic Layer в JDBC и GraphQL API. Это означает, что вы можете удобно использоватьlabelв качестве отображаемого имени метрики при её публикации. -
Улучшение: Добавлена поддержка
create_metric: trueдля measure — это сокращённый способ быстрого создания метрик. Полезно в случаях, когда метрики используются только для построения других метрик. -
Улучшение: Добавлена поддержка параметрических фильтров Tableau. Вы можете использовать коннектор Tableau для создания и использования параметров с данными Semantic Layer.
-
Улучшение: Добавлена поддержка экспонирования
exprиaggдля Measures в GraphQL API. -
Улучшение: Улучшены сообщения об ошибках в интерфейсе командной строки при выполнении запросов к измерению, которое недоступно для заданной метрики.
-
Улучшение: Теперь можно выполнять запросы к сущностям через интеграцию с Tableau (аналогично запросам к измерениям).
-
Улучшение: В интеграции с Tableau появился новый источник данных с названием «ALL», который содержит все определённые семантические объекты. Он содержит ту же информацию, что и «METRICS_AND_DIMENSIONS». В будущем «METRICS_AND_DIMENSIONS» будет признан устаревшим в пользу «ALL» для большей ясности.
-
Исправление: Теперь доступна поддержка числовых типов с точностью больше 38 (например,
BIGDECIMAL) в BigQuery. Ранее такие типы не поддерживались и приводили к ошибке. -
Исправление: В некоторых случаях большие числовые измерения интерпретировались Tableau в научной нотации, из‑за чего их было сложно использовать. Теперь они должны отображаться как обычные числа.
-
Исправление: Теперь значения измерений сохраняются корректно и больше не преобразуются непреднамеренно в строки.
-
Исправление: Устранены проблемы с конфликтами имён в запросах, использующих несколько производных метрик с одинаковыми входными метриками. Ранее это могло вызывать конфликт имён. Теперь входные метрики дедуплицируются и каждая используется только один раз.
-
Исправление: Устранены предупреждения, связанные с использованием двух одинаковых входных measure в производной метрике. Ранее это вызывало предупреждение. Теперь входные measure дедуплицируются, что улучшает обработку запросов и их читаемость.
-
Исправление: Исправлена ошибка, при которой ссылка на сущность в фильтре с использованием объектного синтаксиса не работала. Например,
{{Entity('entity_name')}}не могло быть корректно разрешено.








