SQL UPPER
UPPER является аналогом LOWER (кто бы мог подумать?) — и это, вероятно, одна из самых интуитивно понятных функций SQL.
Использование функции UPPER для строкового значения вернет ввод в виде строки, состоящей из всех заглавных букв. Это эффективный способ создать ожидаемую капитализацию для определенных строковых значений в ваших данных.
Как использовать функцию SQL UPPER
Синтаксис для использования функции UPPER выглядит следующим образом:
upper(<string_column>)
Выполнение этой команды в операторе SELECT вернет строковое значение ввода в верхнем регистре. Вы также можете использовать функцию UPPER в предложениях WHERE и на значениях для соединения.
Ниже мы рассмотрим практический пример использования функции UPPER.
Пример использования функции SQL UPPER
Вы можете преобразовать в верхний регистр имя в модели customers Jaffle Shop с помощью следующего кода:
select
customer_id,
upper(first_name) as first_name,
last_name
from {{ ref('customers') }}
После выполнения этого запроса таблица customers будет выглядеть примерно так:
| Loading table... |
Теперь все символы в first_name в верхнем регистре (а last_name остались без изменений).
Приведение строковых столбцов к верхнему регистру для обеспечения единообразия данных из разных источников обычно выполняется в наших dbtodels. На это есть несколько причин: очистка и стандартизация данных — такие как aliasing, casting, а также приведение к нижнему или верхнему регистру — в идеале должны происходить на уровне staging-моделей, чтобы обеспечить единообразие для последующих слоёв и повысить производительность downstream-моделей.
Синтаксис функции SQL UPPER в Snowflake, Databricks, BigQuery и Redshift
Google BigQuery, Amazon Redshift, Snowflake, Postgres и Databricks поддерживают функцию UPPER. Кроме того, синтаксис использования функции UPPER одинаков для всех них.
Примеры использования функции UPPER
Создавая единообразный формат капитализации (верхний или нижний регистр) для всех строковых значений в ваших моделях данных, вы создаете некоторые ожидания для бизнес-пользователей в вашем BI-инструменте.
- Преобразование кодов стран в верхний регистр в источниках данных для соответствия ожиданиям пользователей
- Создание единообразного формата капитализации для строковых значений в ваших моделях данных, также создавая ожидания для бизнес-пользователей в вашем BI-инструменте
Скорее всего, никогда не будет 100% согласованности в ваших моделях данных, но делая все возможное, чтобы уменьшить этот хаос, вы облегчите жизнь себе и вашим бизнес-пользователям. Используйте функцию UPPER, чтобы создать единообразный регистр для всех строк в ваших источниках данных.