Перейти к основному содержимому

hover-terms


aggregate: displayText: aggregate hoverSnippet: Тип UDF, который возвращает одно значение для каждой группы, агрегируя несколько строк.

cte: displayText: CTE hoverSnippet: Общая табличная выражение (CTE) — это временный набор результатов, который можно использовать в SQL-запросе. Вы можете использовать CTE, чтобы разбить сложные запросы на более простые блоки кода, которые могут соединяться и строиться друг на друге.

dag: displayText: DAG hoverSnippet: DAG — это направленный ациклический граф, тип графа, узлы которого направленно связаны друг с другом и не образуют направленного замкнутого цикла.

data-extraction: displayText: data extraction hoverSnippet: Извлечение данных — это процесс, при котором данные извлекаются из множества источников, часто различающихся по объему и структуре.

data-lake: displayText: data lake hoverSnippet: Озеро данных — это система управления данными, используемая для хранения больших объемов данных в их сыром, исходном виде в виде файлов. Озера данных могут хранить любые типы данных — структурированные, полуструктурированные, неструктурированные — в одном централизованном месте.

data-lineage: displayText: data lineage hoverSnippet: Происхождение данных предоставляет целостное представление о том, как данные перемещаются по организации, где они трансформируются и потребляются.

data-warehouse: displayText: data warehouse hoverSnippet: Хранилище данных — это система управления данными, используемая для хранения и вычисления данных, которая позволяет выполнять аналитические действия, такие как преобразование и обмен данными.

data-catalog: displayText: data catalog hoverSnippet: Каталог данных — это инвентарь данных из различных частей стека данных в организации. Этот каталог может отображать метаданные, происхождение и бизнес-определения из ваших различных источников данных.

data-wrangling: displayText: data wrangling hoverSnippet: Обработка данных описывает различные процессы, используемые для преобразования сырых данных в согласованный и легко используемый формат. Конечная цель обработки данных — работать таким образом, чтобы вы могли сразу приступить к анализу набора данных или построению на основе этих данных.

dataframe: displayText: dataframe
hoverSnippet: DataFrame — это двумерная структура данных (строки и столбцы). Это наиболее распространенный способ представления и взаимодействия с большими наборами данных в Python.

ddl: displayText: DDL
hoverSnippet: Язык определения данных (DDL) — это группа SQL-операторов, которые вы можете выполнять для управления объектами базы данных, включая таблицы, представления и многое другое.

deploying: displayText: Deploying hoverSnippet: Развертывание dbt в производственной среде означает настройку системы для выполнения задания dbt по расписанию, а не выполнение команд dbt вручную из командной строки.

dimensional-modeling: displayText: dimensional modeling hoverSnippet: Моделирование измерений — это техника моделирования данных, при которой вы разбиваете данные на «факты» и «измерения», чтобы организовать и описать сущности в вашем хранилище данных.

dml: displayText: DML
hoverSnippet: Язык манипулирования данными (DML) — это класс SQL-операторов, которые используются для запроса, редактирования, добавления и удаления данных на уровне строк из таблиц или представлений базы данных. Основные операторы DML — SELECT, INSERT, DELETE и UPDATE.

dry: displayText: DRY
hoverSnippet: DRY — это принцип разработки программного обеспечения, который означает «Не повторяйся». Следование этому принципу означает, что ваша цель — уменьшить повторяющиеся шаблоны и дублирование кода и логики в пользу модульного и ссылочного кода.

edw: displayText: EDW
hoverSnippet: Корпоративное хранилище данных (EDW), как и любое другое хранилище данных, представляет собой коллекцию баз данных, которые централизуют информацию бизнеса из множества источников и приложений.

elt: displayText: ELT
hoverSnippet: Извлечение, загрузка, трансформация (ELT) — это процесс, при котором сначала извлекаются данные из различных источников данных, загружаются в целевое хранилище данных, а затем трансформируются.

etl: displayText: ETL hoverSnippet: Извлечение, трансформация, загрузка (ETL) — это процесс, при котором сначала извлекаются данные из источника данных, затем трансформируются, а затем загружаются в целевое хранилище данных.

grain: displayText: grain
hoverSnippet: Зерно ваших данных — это комбинация столбцов, по которым записи в таблице уникальны. В идеале это фиксируется в одном столбце и уникальном первичном ключе.

idempotent: displayText: idempotent hoverSnippet: Идемпотентность описывает процесс, который дает вам один и тот же результат, независимо от того, сколько раз вы его выполняете.

json: displayText: JSON hoverSnippet: JSON (JavaScript Object Notation) — это минимальный формат для полуструктурированных данных, используемый для фиксации отношений между полями и значениями.

lsp: displayText: LSP hoverSnippet: Протокол Language Server Protocol (LSP) обеспечивает возможности для разработчиков, такие как живые предпросмотры CTE, информация при наведении, подсветка ошибок и многое другое.

materialization: displayText: materialization hoverSnippet: Точный язык определения данных (DDL), который dbt будет использовать при создании эквивалента модели в хранилище данных.

model: hoverSnippet: Модель — это основной строительный блок DAG displayText: model

monotonically-increasing: displayText: monotonically increasing hoverSnippet: Монотонно возрастающая последовательность — это последовательность, значения которой отсортированы в порядке возрастания и не убывают. Например, последовательности 1, 6, 7, 11, 131 или 2, 5, 5, 5, 6, 10.

predicate-pushdown: displayText: Predicate pushdown hoverSnippet: Проталкивание предиката — это выражение, используемое для определения того, какие строки в базе данных применимы к конкретному запросу.

primary-key: displayText: primary key
hoverSnippet: Первичный ключ — это ненулевой столбец в объекте базы данных, который уникально идентифицирует каждую строку.

relational-database: displayText: relational database hoverSnippet: Реляционная база данных предоставляет структурированный способ хранения данных в таблицах, состоящих из строк и столбцов. Различные таблицы в реляционной базе данных могут быть объединены с использованием общих столбцов из каждой таблицы, формируя отношения.

reverse-etl: displayText: reverse ETL hoverSnippet: Обратный ETL — это процесс передачи ваших преобразованных данных, хранящихся в вашем хранилище данных, в конечные бизнес-платформы, такие как CRM для продаж и рекламные платформы.

scalar: displayText: scalar hoverSnippet: Тип UDF, который возвращает одно значение на строку.

scalar-value: displayText: scalar value hoverSnippet: Отдельное значение данных (например, число или строка), а не коллекция или набор значений.

sql-expression: displayText: SQL expression hoverSnippet: SQL-выражение — это комбинация столбцов, значений, операторов и функций, которая вычисляется в одно значение.

sql-rendering: displayText: SQL rendering
hoverSnippet: Движок dbt Core принимает SQL с Jinja и рендерит все макросы, присутствующие в модели, чтобы получить SQL, готовый к выполнению в базе данных. Для возможностей парсинга и компиляции SQL вместо этого используйте движок Fusion, чтобы лучше понимать структуру вашего SQL.

subquery: displayText: subquery hoverSnippet: Подзапрос — это запрос внутри другого запроса. Подзапросы часто используются, когда необходимо обработать данные в несколько этапов.

surrogate-key: displayText: surrogate key
hoverSnippet: Суррогатный ключ — это уникальный идентификатор, полученный из самих данных. Он часто принимает форму хешированного значения нескольких столбцов, которое создаст ограничение уникальности для каждой строки.

table: displayText: table hoverSnippet: В простейших терминах, таблица — это прямое хранение данных в строках и столбцах. Представьте себе лист Excel с сырыми значениями в каждой из ячеек.

view: displayText: view
hoverSnippet: Представление (в отличие от таблицы) — это определенный проходной SQL-запрос, который может быть выполнен в базе данных (или хранилище данных).

Нашли ошибку?

0