Перейти к основному содержимому
Эмили Ридерер

Эмили Ридерер

she/her
Senior Manager - Data Science & Analytics, Capital One
Location: Chicago, IL
Organizations: rOpenSci Editorial Board

About

Я давний пользователь dbt и уже несколько лет являюсь активным участником сообщества. В профессиональной сфере я руководила различными data‑командами в Capital One — от аналитики и моделирования до innersource‑инструментов для работы с данными и data‑инфраструктуры. Общим знаменателем всех этих ролей была критическая важность высококачественных пайплайнов обработки данных. Вне работы мне нравится заниматься pro bono‑проектами и применять тот же набор навыков в более «скрапперских» (менее формализованных) средах. Моя работа с сообществом dbt мотивирована интересом к качеству данных и инструментам для разработчиков. Среди моих недавних вкладов — поддержка пакета dbtplyr, выступление на Coalesce 2021, а также написание поста в dbt Developer Blog о моём PR в набор тестов dbt-utils.

Когда вы присоединились к сообществу dbt и как это повлияло на вашу карьеру?

Я участвую в сообществе dbt уже несколько лет. Хотя мне нравится быть активным участником, одна из моих любимых частей — это просто «читать молча» каналы в Slack. Сейчас data‑пространство развивается с невероятной скоростью: существует множество конкурирующих фреймворков, инструментов и идей. При этом работа с данными, как правило, обсуждается и публикуется реже, чем методы анализа (например, новые пакеты для моделирования), из‑за вопросов приватности данных и интеллектуальной собственности. Я не нашла лучшего места, чтобы буквально «пить из пожарного шланга» и получать пользу из инсайтов других людей — их вопросов, сложностей и успехов.

С каким лидером сообщества dbt вы себя ассоциируете? Как вы планируете развивать своё лидерство в сообществе dbt?

Два участника сообщества, которые меня особенно вдохновляют, — это Claire Carroll и Joel Labes. Мне кажется, что оба они демонстрируют высокий уровень технических best practices, кристально ясное объяснение технических концепций в своих многочисленных текстах, а также страсть к построению сообщества и созданию удобных «точек входа». Такое сочетание так называемых «жёстких» и «мягких» навыков очень много даёт сообществу и помогает каждому его участнику раскрыть свой потенциал. Я всегда стараюсь находить баланс между временем, которое уделяю развитию навыков в обоих этих направлениях.

Чему вы научились у участников сообщества? Чему, по вашему мнению, другие могут научиться у вас?

Учитывая мою страсть к качеству данных и к проектной стороне работы с данными, мне особенно интересно размышлять о моделировании данных и учиться на опыте сообщества, которое использует самые разные — как классические, так и новые — фреймворки для проектирования устойчивых и гибких datamart’ов.

Как большой поклонник open‑source (и также процветающего сообщества #rstats), я надеюсь вдохновлять других на создание новых пакетов и PR’ов, расширяющих инструментарий разработчиков. Мне также особенно нравится обсуждать свои взгляды на качество данных и способы избегать data‑катастроф.

Есть ли что‑нибудь ещё интересное, чем вы хотели бы поделиться?

тест
Моя увлечённость open‑source‑инструментами и открытыми знаниями выходит далеко за рамки dbt. Мне также нравится участвовать в работе редакционного совета rOpenSci, продвигая создание open‑source программного обеспечения для исследований, рецензировать технические книги для CRC Press, заниматься pro bono‑проектами в области данных и делиться собственными выводами через конференционные доклады и письменные материалы (включая мой сайт, гостевые блоги и книги, такие как R Markdown Cookbook и 97 Things Every Data Engineer Should Know).

0