О свойстве модульных тестов
примечание
Эта функциональность доступна в dbt Core версии 1.8+ и выпусках dbt Cloud.
Модульные тесты проверяют вашу SQL-логику моделирования на небольшом наборе статических входных данных перед тем, как вы материализуете вашу полную модель в производственной среде. Они поддерживают подход разработки, основанный на тестировании, улучшая как эффективность разработчиков, так и надежность кода.
Чтобы запустить только ваши модульные тесты, используйте команду:
dbt test --select test_type:unit
Прежде чем начать
- В настоящее время мы поддерживаем модульное тестирование только для SQL-моделей.
- В настоящее время мы поддерживаем добавление модульных тестов только к моделям в вашем текущем проекте.
- Если у вашей модели несколько версий, по умолчанию модульный тест будет запускаться на всех версиях вашей модели. Прочтите модульное тестирование версионных моделей для получения дополнительной информации.
- Модульные тесты должны быть определены в YML-файле в вашем каталоге
models/
. - Если вы хотите протестировать модель, которая зависит от эфемерной модели, вы должны использовать
format: sql
для этого входного параметра.
unit_tests:
- name: <test-name> # это уникальное имя теста
model: <model-name>
versions: #опционально
include: <list-of-versions-to-include> #опционально
exclude: <list-of-versions-to-exclude> #опционально
config:
meta: {dictionary}
tags: <string> | [<string>]
given:
- input: <ref_or_source_call> # опционально для seeds
format: dict | csv | sql
# либо определите строки в коде, либо имя фикстуры
rows: {dictionary} | <string>
fixture: <fixture-name> # sql или csv
- input: ... # объявите дополнительные входные данные
expect:
format: dict | csv | sql
# либо определите строки в коде, либо имя фикстуры
rows: {dictionary} | <string>
fixture: <fixture-name> # sql или csv
overrides: # опционально: конфигурация для среды выполнения dbt
macros:
is_incremental: true | false
dbt_utils.current_timestamp: <string>
# ... любая другая функция jinja из https://docs.getdbt.com/reference/dbt-jinja-functions
# ... любое другое свойство контекста
vars: {dictionary}
env_vars: {dictionary}
- name: <test-name> ... # объявите дополнительные модульные тесты
Примеры
unit_tests:
- name: test_is_valid_email_address # это уникальное имя теста
model: dim_customers # имя модели, которую я тестирую
given: # фиктивные данные для ваших входных данных
- input: ref('stg_customers')
rows:
- {email: cool@example.com, email_top_level_domain: example.com}
- {email: cool@unknown.com, email_top_level_domain: unknown.com}
- {email: badgmail.com, email_top_level_domain: gmail.com}
- {email: missingdot@gmailcom, email_top_level_domain: gmail.com}
- input: ref('top_level_email_domains')
rows:
- {tld: example.com}
- {tld: gmail.com}
expect: # ожидаемый результат, учитывая вышеуказанные входные данные
rows:
- {email: cool@example.com, is_valid_email_address: true}
- {email: cool@unknown.com, is_valid_email_address: false}
- {email: badgmail.com, is_valid_email_address: false}
- {email: missingdot@gmailcom, is_valid_email_address: false}
unit_tests:
- name: test_is_valid_email_address # это уникальное имя теста
model: dim_customers # имя модели, которую я т естирую
given: # фиктивные данные для ваших входных данных
- input: ref('stg_customers')
rows:
- {email: cool@example.com, email_top_level_domain: example.com}
- {email: cool@unknown.com, email_top_level_domain: unknown.com}
- {email: badgmail.com, email_top_level_domain: gmail.com}
- {email: missingdot@gmailcom, email_top_level_domain: gmail.com}
- input: ref('top_level_email_domains')
format: csv
rows: |
tld
example.com
gmail.com
expect: # ожидаемый результат, учитывая вышеуказанные входные данные
format: csv
fixture: valid_email_address_fixture_output
unit_tests:
- name: test_is_valid_email_address # это уникальное имя теста
model: dim_customers # имя модели, которую я тестирую
given: # фиктивные данные для ваших входных данных
- input: ref('stg_customers')
rows:
- {email: cool@example.com, email_top_level_domain: example.com}
- {email: cool@unknown.com, email_top_level_domain: unknown.com}
- {email: badgmail.com, email_top_level_domain: gmail.com}
- {email: missingdot@gmailcom, email_top_level_domain: gmail.com}
- input: ref('top_level_email_domains')
format: sql
rows: |
select 'example.com' as tld union all
select 'gmail.com' as tld
expect: # ожидаемый результат, учитывая вышеуказанные входные данные
format: sql
fixture: valid_email_address_fixture_output
0