2023 заметки о релизах dbt Cloud
Архивированные заметки о релизах dbt Cloud за 2023 год
Декабрь 2023
-
Обновления семантического слоя
Команда dbt Labs продолжает работать над добавлением новых функций, исправлением ошибок и повышением надежности семантического слоя dbt. Следующий список более подробно объясняет обновления и исправления за декабрь 2023 года.
Исправления ошибок
- Интеграция с Tableau — Интеграция семантического слоя dbt с Tableau теперь поддерживает запросы, которые разрешаются в условие "NOT IN". Это относится к использованию "exclude" в интерфейсе фильтрации пользователей. Ранее это не поддерживалось.
- Поддержка
BIGINT
— Семантический слой dbt теперь может поддерживать значенияBIGINT
с точностью более 18. Ранее это вызывало ошибку. - Утечка памяти — Исправлена утечка памяти в JDBC API, которая ранее приводила к периодическим ошибкам при запросах.
- Поддержка преобразования данных — Добавлена поддержка преобразования различных типов данных, специфичных для Redshift и Postgres. Ранее драйвер выдавал ошибку при встрече с колонками таких типов.
Улучшения
- Устаревание — Мы объявили устаревшими метрики dbt и устаревший семантический слой dbt, которые поддерживались в версии dbt 1.5 или ниже. Это изменение вступило в силу 15 декабря 2023 года.
- Улучшенный инструмент конвертации dbt — Инструмент конвертации dbt теперь может помочь автоматизировать часть работы по конвертации из LookML (язык моделирования Looker) для тех, кто мигрирует. Ранее это не было доступно.
-
Внешние атрибуты
Функция расширенных атрибутов в dbt Cloud теперь доступна в GA! Она позволяет переопределять любой атрибут YAML на уровне окружения, который принимает адаптер dbt в своем
profiles.yml
. Вы можете предоставить фрагмент YAML, чтобы добавить или заменить любое значение профиля.Чтобы узнать больше, обратитесь к Расширенным атрибутам.
Текстовое поле Расширенные атрибуты доступно на странице настроек вашего окружения:
-
Устаревши й семантический слой
dbt Labs объявил устаревшими метрики dbt и устаревший семантический слой dbt, которые поддерживались в версии dbt 1.5 или ниже. Это изменение вступает в силу 15 декабря 2023 года.
Это устаревание означает, что метрики dbt и устаревший семантический слой больше не поддерживаются. Мы также удалили эту функцию из пользовательского интерфейса dbt Cloud и сайта документации.
Почему это изменение?
Переизданный семантический слой dbt, работающий на MetricFlow, предлагает улучшенную гибкость, производительность и пользовательский опыт, что является значительным шагом вперед для сообщества dbt.
Ключевые изменения и влияние
- Дата устаревания — Устаревание устаревшего семантического слоя и метрик dbt официально произойдет 15 декабря 2023 года.
- Замена — MetricFlow заменяет метрики dbt для определения семантической логики. Пакет
dbt_metrics
больше не будет поддерживаться после устаревания. - Новая функция — Экспорт заменяет материализацию данных с функциональностью
metrics.calculate
и будет доступен в dbt Cloud в декабре или январе.
Ломающее изменения и рекомендации
-
Для пользователей на версии dbt 1.5 и ниже с метриками dbt и прокси Snowflake:
-
Влияние: После устаревания запросы, использующие прокси, не будут выполняться.
-
Необходимое действие: Необходима немедленная миграция. Обратитесь к руководству по миграции с емантического слоя dbt
-
Для пользователей на версии dbt 1.5 и ниже, использующих метрики dbt без прокси Snowflake:
-
Влияние: Никаких немедленных нарушений, но пакет не будет получать обновления или поддержку после устаревания.
-
Рекомендация: Запланируйте миграцию на переизданный семантический слой для совместимости с версиями dbt 1.6 и выше.
Взаимодействие и поддержка
- Обратная связь и поддержка сообщества — Взаимодействуйте и делитесь отзывами с командой dbt Labs и сообществом dbt в Slack, используя каналы, такие как #dbt-cloud-semantic-layer и #dbt-metricflow. Или свяжитесь с вашим представителем по аккаунту dbt Cloud.
- Ресурсы для обновления — Ознакомьтесь с дополнительной информацией и ресурсами, которые помогут вам обновить вашу версию dbt:
- Обновление версии в dbt Cloud
- Руководства по миграции версий
Ноябрь 2023
-
Новые функции и изменения интерфейса в dbt Explorer
В dbt Cloud появились новые улучшения качества жизни для уведомлений по электронной почте и Slack о ваших заданиях:
- Вы можете добавлять внешние адреса электронной почты и отправлять уведомления о заданиях на них. Внешние электронные адреса могут быть:
- Адреса, которые находятся за пределами вашей учетной записи dbt Cloud
- Адреса сторонних интеграций для настройки уведомлений для таких сервисов, как Microsoft Teams или PagerDuty
- Вы можете настраивать уведомления для нескольких каналов Slack. Ранее можно было настраивать только один канал Slack.
- Теперь любой администратор аккаунта может редакти ровать уведомления Slack, а не только тот, кто их создал.
Чтобы узнать больше, ознакомьтесь с Уведомлениями о заданиях.
- Вы можете добавлять внешние адреса электронной почты и отправлять уведомления о заданиях на них. Внешние электронные адреса могут быть:
-
Уведомления о заданиях
В dbt Cloud появились новые улучшения качества жизни для уведомлений по электронной почте и Slack о ваших заданиях:
- Вы можете добавлять внешние адреса электронной почты и отправлять уведомления о заданиях на них. Внешние электронные адреса могут быть:
- Адреса, которые находятся за пределами вашей учетной записи dbt Cloud
- Адреса сторонних интеграций для настройки уведомлений для таких сервисов, как Microsoft Teams или PagerDuty
- Вы можете настраивать уведомления для нескольких каналов Slack. Ранее можно было настраивать только один канал Slack.
- Теперь любой администратор аккаунта может редактировать уведомления Slack, а не только тот, кто их создал.
Чтобы узнать больше, ознакомьтесь с Уведомлениями о заданиях.
- Вы можете добавлять внешние адреса электронной почты и отправлять уведомления о заданиях на них. Внешние электронные адреса могут быть:
-
Кэширование репозитория
Теперь для планов dbt Cloud Enterprise доступна новая опция для включения кэширования Git-репозитория для ваших запусков заданий. При включении dbt Cloud кэширует Git-репозиторий вашего проекта dbt и использует кэшированную копию, если происходит сбой с поставщиком Git. Эта функция улучшает надежность и стабильность ваших запусков заданий.
Чтобы узнать больше, обратитесь к Кэшированию репозитория.
Октябрь 2023
-
API dbt Cloud
Начиная с 1 декабря 2023 года, Административный API v2 и v3 будут ожидать, что вы ограничите все методы API "list" или
GET
до 100 результатов на запрос API. Это ограничение повышает эффективность и стабильность наших услуг. Если вам нужно обработать более 100 результатов, используйте параметры запросаlimit
иoffset
для постраничной навигации; в противном случае вы получите ошибку.Это максимальное ограничение применяется только к многоарендным экземплярам и не применяется к одноарендным экземплярам.
Обратитесь к разделам API v3 Pagination или API v2 Pagination для получения дополнительной информации о том, как постранично навигировать ваши ответы API.
-
CLI dbt Cloud
Мы рады сообщить, что dbt Cloud CLI, унифицированная командная строка для dbt, доступна в публичном предварительном просмотре. Это локальный опыт разработки, поддерживаемый dbt Cloud. Начать легко:
pip3 install dbt
илиbrew install dbt
, и вы готовы к работе.Мы продолжим инвестировать в IDE dbt Cloud как в самый простой и доступный способ начать использовать dbt, особенно для аналитиков данных, которые никогда не разрабатывали программное обеспечение с использованием командной строки. Мы будем продолжать улучшать скорость, стабильность и богатство функций IDE, как мы это делали весь год.
Мы также знаем, что многие люди, разрабатывающие в dbt, предпочитают локальную разработку, где они могут использовать свой любимый терминал, текстовый редактор, сочетания клавиш, цветовую схему и так далее. Это включает людей с опытом в области инженерии данных, а также тех аналитических инженеров, которые начали писать код в IDE dbt Cloud и расширили свои навыки.
Новый dbt Cloud CLI предлагает лучшее из обоих миров, включая:
- Возможность разработки на платформе dbt Cloud
- Гибкость вашей локальной настройки
Запускайте любые плагины, разработанные сообществом, хуки предварительного коммита или другие произвольные скрипты, которые вам нравятся.
Некоторые уникальные возможности этого dbt Cloud CLI включают:
- Автоматическая отложенная передача артефактов сборки в производственную среду вашего Cloud проекта
- Безопасное хранение учетных данных на платформе dbt Cloud
- Поддержка dbt Mesh (кросс-проектный
ref
) - Рабочий процесс разработки для семантического слоя dbt
- Более быстрые и менее затратные сборки
Обратитесь к dbt Cloud CLI, чтобы узнать больше.
-
Исправление пользовательской ветки
Если вы не установили пользовательскую ветку для вашего окружения dbt Cloud, она теперь по умолчанию устанавливается на ветку по умолчанию вашего Git-репозитория (например,
main
). Ранее CI задания выполнялись для запросов на вытягивание (PR), которые были открыты против любой ветки или обновлены новыми коммитами, если опция Пользовательская ветка не была установлена.Azure DevOps
Ваши запросы на вытягивание (PR) могут не срабатывать против вашей ветки по умолчанию, если вы используете Azure DevOps, и ветка по умолчанию не является
main
илиmaster
. Чтобы решить эту проблему, установите пользовательскую ветку с веткой, которую вы хотите нацелить. -
Автоустановка dbt deps
IDE dbt Cloud и dbt Cloud CLI теперь автоматически устанавливают
dbt deps
, когда ваше окружение запускается или когда это необходимо. Ранее вам предлагалось запуститьdbt deps
во время инициализации.Этот улучшенный рабочий процесс доступен всем пользователям многоарендного dbt Cloud (поддержка одноар ендных пользователей появится на следующей неделе) и применяется к версиям dbt.
Тем не менее, вам все равно следует запускать команду
dbt deps
в следующих ситуациях:- Когда вы вносите изменения в файл
packages.yml
илиdependencies.yml
во время сеанса - Когда вы обновляете версию пакета в файле
packages.yml
илиdependencies.yml
. - Если вы редактируете файл
dependencies.yml
, и количество пакетов остается прежним, запуститеdbt deps
. (Обратите внимание, что это известная ошибка, которую dbt Labs исправит в будущем.)
- Когда вы вносите изменения в файл
-
Поддержка повторных попыток
Ранее в dbt Cloud вы могли только перезапустить задание с ошибкой с самого начала, но теперь вы также можете перезапустить его с точки его сбоя.
Вы можете увидеть, какое задание не удалось завершить успешно, какая команда не удалась на этапе выполнения и выбрать, как его перезапустить. Чтобы узнать больше, обратитесь к Повторным попыткам заданий.
-
Обновления документации продукта
Привет от команды документации dbt: @mirnawong1, @matthewshaver, @nghi-ly и @runleonarun! Во-первых, мы хотели бы поблагодарить 15 новых участников сообщества, которые внесли вклад в docs.getdbt.com. Мы объединили 107 PR в сентябре.
Вот что нового на docs.getdbt.com:
- Перенос документации с Netlify на Vercel.
☁ Проекты Cloud
- Задания непрерывной интеграции теперь доступны в общем доступе и больше не находятся в бета-версии!
- Добавлена страница настройки Postgres PrivateLink
- Опубликованы бета-документы для dbt Explorer.
- Добавлена новая документация API Semantic Layer GraphQL и обновлены документы интеграции для включения Hex. Ответили на отзывы сообщества dbt и уточнили случаи использования Metricflow для dbt Core и dbt Cloud.
- Добавлен FAQ, описывающий, как мигрировать от одного поставщика git к другому в dbt Cloud.
- Уточнен пример и добавлен раздел по устранению неполадок в документацию по подключению Snowflake для решения распространенных ошибок и предоставления решений.
🎯 Проекты Core
- Устарели версии dbt Core v1.0 и v1.1 в документации.
- Добавлены инструкции по настройке для плагина сообщества AWS Glue.
- Переработан быстрый старт dbt Core, чтобы сделать его более удобным для следования. Этот гид разделен на шаги, которые соответствуют другим руководствам.
Новые 📚 Руководства, ✏️ блог-посты и FAQ
Добавлен шаблон стиля, который вы можете скопировать и вставить, чтобы убедиться, что вы соблюдаете лучшие практики при стилизации проектов dbt!
Предстоящие изменения
Ожидайте множество релизов в октябре и фильтруемый раздел руководств, который упростит поиск руководств!
-
С емантический слой GA
Если вы используете устаревший семантический слой, мы настоятельно рекомендуем вам обновить вашу версию dbt до версии dbt v1.6 или выше и мигрировать на последний семантический слой.
dbt Labs с радостью объявляет, что семантический слой dbt теперь доступен в общем доступе. Он предлагает последовательную организацию данных, улучшенное управление, сниженные затраты, повышенную эффективность и доступные данные для лучшего принятия решений и сотрудничества в организациях.
Он направлен на то, чтобы принести лучшее из моделирования и семантики в downstream-приложения, вводя:
- Совершенно новые интеграции, такие как Tableau, Google Sheets, Hex, Mode и Lightdash.
- Новые API семантического слоя с использованием GraphQL и JDBC для запроса метрик и построения интеграций.
- Поддержка dbt Cloud многоарендных регионов для Северной Америки, EMEA и APAC. Поддержка одноарендных клиентов скоро появится.
- Скоро появится — Запланированные экспорты (способ создания таблиц в вашей платформе данных) как часть вашего задания dbt Cloud. Используйте API для вызова экспорта, а затем получайте доступ к ним в вашем предпочтительном BI-инструменте.
Используйте универсальный семантический слой dbt для определения и запроса метрик в интеграционных инструментах.Семантический слой dbt доступен для командных или корпоративных многоарендных планов dbt v1.6 или выше.
- Клиенты команд и предприятий могут использовать 1,000 запрашиваемых метрик в месяц без дополнительной платы на ограниченной пробной осно ве, при условии разумных ограничений использования. Обратитесь к Биллинг для получения дополнительной информации.
- Планы разработчиков dbt Cloud и пользователи dbt Core могут определять метрики, но не смогут запрашивать их с интегрированными инструментами.
Сентябрь 2023
-
Обновления CI
dbt Cloud теперь имеет два различных типа заданий: задания развертывания для создания производственных данных и задания непрерывной интеграции (CI) для проверки изменений кода. Эти задания выполняют принципиально разные задачи, поэтому dbt Labs улучшил опыт настройки с лучшими настройками по умолчанию для каждого.
С двумя типами заданий, вместо одного общего типа, мы можем лучше направить вас через процесс настройки. Лучшие практики встроены в настройки по умолчанию, так что вы можете быстро перейти от любопытства к настройке за считанные секунды.
И теперь у нас есть более эффективные сравнения состояния на проверках CI: никогда не тратьте сборку или тест на код, который не был изменен. Теперь мы более эффективно сравниваем код запроса на вытягивание (PR) с тем, что работает в производственной среде, благодаря введению отложенной передачи в окружение, а не в задание. Чтобы узнать больше, обратитесь к Непрерывной интеграции в dbt Cloud.
Ниже представлена таблица сравнения, описывающая, как задания развертывания и CI задания ведут себя по-разному:
Задания развертывания CI задания Цель Создает производственные данные. Создает и тестирует новый код перед слиянием изменений в производственную среду. Типы триггеров Запускается по расписанию или через API. Запускается по коммиту в PR или через API. Назначение Создает в производственной базе данных и схеме. Создает в промежуточной базе данных и эфемерной схеме, существующей на время PR. Режим выполнения Выполняется последовательно, чтобы избежать конфликтов в подлежащем DAG. Выполняется параллельно для повышения скорости команды. Экономия на эффективных запусках Обнаруживает чрезмерно запланированные задания и отменяет ненужные запуски, чтобы избежать засорения очереди. Отменяет существующие запуски, когда новый коммит отправляется, чтобы избежать избыточной работы. Сравнение состояния Иногда нужно обнаружить состояние. Почти всегда нужно сравнивать состояние с производственной средой, чтобы строить на измененном коде и его зависимостях. Что вам нужно обновить