Как стать автором
Обновить
43.15

Как стать продуктовым аналитиком в Ozon Банке?

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров6.2K

Всем привет! Меня зовут Миша, и я работаю продуктовым аналитиком в Ozon Банке. Мой путь в профессии начался всего 3 года назад, и я отлично помню, как мне самому не хватало подробного плана по входу в профессию. Поэтому я решил написать свой. Надеюсь, что он поможет новичкам и тем, кто только задумывается об аналитике данных)

Для того чтобы мой план был более интерактивным, давайте представим, что, идя по плану мы как Танос из вселенной Marvel – собираем навыки аналитика в свою перчатку бесконечности.

Сразу оговорюсь — этот план основан на моём личном опыте, и он сработал у меня, но я не могу на 100% гарантировать, что он подойдёт абсолютно всем. Поэтому если у вас есть какие-то комментарии или предложения — давайте обсудим в комментариях.

Что это за зверь такой «продуктовый аналитик»?

Как следует из самого названия, продуктовый аналитик анализирует продукт. С одной стороны основываясь на данных о взаимодействии пользователей с продуктом, а с другой — на собственных знаниях.

Чтобы лучше понять суть работы — давайте посмотрим на фреймворк от Валеры Бабушкина «Чем занимается продуктовый аналитик». Суть в том, что во время работы аналитик отвечает на 4 вопроса:

  1. Что произошло?

  2. Почему произошло?

  3. Что произойдёт?

  4. Что нам сделать, чтобы произошло то, что мы хотим?

И для ответа на каждый из этих вопросов аналитик использует данные продукта.

Часть 1:SQL — язык общения с базами данных

Кажется я сказал «использовать данные», но сначала их нужно подготовить. Обычно все данные собраны в базах данных (иногда даже нескольких), а внутри каждой базы может быть несколько тысяч таблиц с собственной структурой и особенностями. Чтобы достать данные, соединить несколько таблиц между собой, правильно отфильтровать и агрегировать, нужен SQL — язык общения с базами данных.

По своей сути SQL — несложный язык программирования. Он изначально создавался так, чтобы им без проблем пользовались бухгалтеры, финансисты, менеджеры — те, кто к программирования не имеют отношения. Потому он очень похож на базовый английский.

Несмотря на лёгкость, на мой взгляд SQL — это самый полезный и часто применяемый hard skill аналитика. Вы будете пользоваться им каждый день по многу раз, поэтому его нужно выучить так, чтобы он ощущался буквально «на кончиках пальцев» — а в нашем случае на кончиках нашей перчатки.

Существуют сотни курсов — бесплатных и за большие деньги, но оставляю те материалы, что помогли лично мне.

Базовый курс

Этот курс погрузит вас в SQL, научит синтаксису и логике работы языка. А ещё в нём есть больше сотни задач, на которых вы научитесь писать запросы.

В каждой теме сначала есть лекция на 5-10 минут с теорией и примерами. А затем вы решаете 4-5 задач для закрепления темы.

Важно, что на этом курсе, в отличие от многих других, целый блок посвящён DDL-операциям — когда мы не просто выбираем данные из таблиц, но и сами создаём таблицы, в которые самостоятельно вставляем, обновляем или удаляем данные.

Совет: установите СУБД на свой компьютер, создайте таблички и решайте задачи у себя, а не на платформе курса. Танцы с бубном при установке подготовят вас к реальной работе, ведь на ней нет никакой платформы — только недружелюбное IDE и командная строка.

На прохождение курса с прорешиванием каждой задачки уйдёт примерно 1 месяц.

А дальше — к практике!

Сайт с практическими задачами

Хорошо знакомый почти каждому аналитику сайт с задачками, который поможет вам натаскаться в написании запросов. Не смотрите на дизайн прямиком из нулевых — здесь есть важный блок «Упражнение по SQL» с более чем сотней задач.

Вот эту сотню вам и надо прорешать. В каждой задаче есть схема из нескольких таблиц и результат, который вы должны получить. А ещё на сайте есть основная документация по SQL, которая поможет, если что-то подзабылось с первого курса.

Здесь есть задачи разного уровня: от самых элементарных до тех, на решение которых уйдёт несколько дней (и это нормально, вы ведь учитесь). Просто решайте все подряд.

Лично я прорешал около 70 — рекомендую и вам остановится примерно на этом числе. Кстати, сами задачи очень похожи на те, с которыми вы столкнётесь в работе.

Прорешивание такого количества очень поможет приобрести уверенность в знаниях — ну и потом пройти собеседование на знание SQL.

На прорешивание всех задач в активном темпе уйдёт ещё примерно месяц.

Курс по оконным функциям

Теперь знания SQL надо приправить знанием оконных функций. На курсе автор в формате гифок и текста подает теорию и сразу предлагает решить задачки на её усвоение — почти как в первом курсе.

Оконные функции — это надстройка над базовым синтаксисом SQL. Она очень помогает сокращать запросы и выполнять агрегацию к определенным строчками или окнами в пару движений. Оконными функциями обычно принято пугать, хотя в них нет ничего сложного.

Я не просто так выделяю оконные функции в отдельный пункт — их знание отличает человека, который реально погрузился в SQL. Во многих местах от стажёров и джунов не ждут знаний оконных функций — вам же это поможет выделиться на фоне других кандидатов.

На усвоение этого курса вместе с прорешиванием задач у вас уйдёт ещё 2-3 недели.

Краткий итог по изучению SQL

Теперь, после прохождения всех пунктов, вас можно будет назвать человеком, который освоил SQL и готов применять его в реальных бизнес-задачах.
Правильно написав запросы к базам данных и применив базовую логику, вы сможете ответить на 2 из 4 вопроса из фреймворка.

Что произошло? — выбираете данные по нужной вам метрике и смотрите на движение метрики во времени.

Почему произошло? — зная движение метрики во времени, можно уже строить предположения о том, какие изменения в продукте/ компании/ мире повлияли на метрику.

Камень SQL у нас в кармане – добавим его в свою перчатку аналитика!

Часть 2:

Python — инструмент работы с данными и автоматизации

Python — язык программирования, подходящий много для чего. На нём пишут серверную часть продуктов, делают сайты и пишут ботов. Но нам интереснее всего то, что благодаря низкому порогу входа и присутствию сотен уже написанных библиотек, Python подходит для работы с данными и автоматизации этой работы.

Лично я использую Python на работе для следующих задач:

  1. Дизайн и подведения итогов A/B-тестов — вряд ли в каком-либо другом языке программирования можно так же удобно и быстро работать со статистическими библиотеками.

  2. Автоматизация отправки отчётности заказчикам — вместо того, чтобы каждый день писать менеджеру, куда двинулась ключевая метрика, можно один раз написать скрипт на Python + SQL и не знать бед.

  3. Создание потоков данных для формирования удобных витрин данных — обычно этим аналитики занимаются редко, но в Ozon Банке мы постоянно создаём потоки данных благодаря написанным нашими дата-инженерами AirFlow-операторам. Python позволяет доставать данные из одной базы данных, загружать их в другую, обрабатывать и отправлять в систему визуализации всего за пару часов.

  4. Исследование данных — иногда SQL недостаточно, и хочется гибче и глубже погрузиться в данные, поискать в них инсайты — тут без Python не обойтись.

  5. Утилитарные задачи — склеить несколько файлов в один, выгрузить данные в Excel, нарисовать пару графиков. Все эти задачи потрясающе быстро решает Python.

В общем, вы поняли, без Python никуда. Благо язык интуитивно понятный, и аналитику не нужно сильно в него закапываться. Выучил синтаксис и логику работы, погрузился в 3-4 библиотеки — и в бой.

Основы Python

Отличный базовый курс по синтаксису, типам данным, конструкциям условий и ветвлениям, а также началу работы с библиотеками. Как и в курсах по SQL, здесь тоже сначала кратко изложена теория, а затем следуют задачи для её закрепления.

Курс буквально с нуля объясняет, как программировать простейшие вещи, создавать лёгкие алгоритмы — в общем, база, без которой будет непросто впоследствии.

Без базового понимания, как работает Python, в будущем может часто казаться, что вы используете какие-то функции и методы, которые работают как черный ящик — что-то засунул внутрь, что-то получил в ответ. Но шаг влево, шаг вправо — и будет уже сложно. Поэтому очень советую потратить 2-3 недели, пройти задачки и пойти дальше.

Погружение в библиотеки по работе с данными

Курс поможет изучить механизм работы с популярными библиотеками, с помощью которых обрабатывают и визуализируют табличные данные — pandas, matplotlib и seaborn.

Доступных в демо-версии 3 уроков хватит, чтобы изучить:

  1. Создание и загрузку данных в датафреймы

  2. Работу с данными в датафреймах — фильтрацию, агрегирование, создание новых полей и применение функций к уже существующим

  3. Визуализацию данных с помощью графиков

Задач в демоверсии не очень много, поэтому после окончания курса лучше найти примеры данных в интернете (на том же Kaggle) и самостоятельно их поизучать. 

Поставьте сами себе вопросы на основе найденных данных, ответьте на них, постройте визуализацию — в общем, попробуйте их “покрутить”!

И это всё?

На самом деле нет. К Python мы вернёмся ещё раз в рамках изучения статистики и A/B-тестирования. А в остальном — да. Задачи на Python могут быть самыми разнообразными (изучить и подготовиться ко всему невозможно). Теперь у вас есть база — а дальше поможет интернет и документация по миллиону доступных библиотек. Python сам по себе не даст ответы на какие-то вопросы, которые у вас возникнут в работе. Он просто сделает работу легче и быстрее.

Камень знания Python для аналитических задач уже у вас!

Часть 3:Математика и A/B-тесты

Вспомним третий вопрос из фреймворка — «что произойдёт?» Кажется, вопрос висит в вакууме, но на самом деле в продуктах постоянно что-то меняется: выкатываются новые фичи, меняются клиентские пути, обновляется дизайн и тд.

И не всегда очевидно, насколько и как именно эти изменения повлияют на метрики продукта. Конечно, можно начать гадать, делать расклады или заглядывать в хрустальный шар. Но зачем, если у нас есть математика и A/B-тесты?

A/B-тесты — способ оценки эффекта от изменений в продукте. Например, команда выкатывает новый дизайн продуктового лэндинга, и у них есть такая гипотеза: «Если изменить дизайн лэндинга, то люди, посетив его, будут чаще покупать наш продукт».

Просто так взять и обновить дизайн для всех посетителей — идея довольно рискованная: вдруг людям новый сайт не понравится, продажи продукта упадут, а это напрямую повлияет на деньги.

Поэтому поступают по-другому: какой-то части пользователей (допустим, 50% трафика лэндинга) показывают новый дизайн, а остальной — старый. Такой тест держат определенное количество дней, и по окончании сравнивают метрики в тестовой и контрольной группах.

На словах идея довольно простая, но чтобы не совершать ошибки при дизайне таких экспериментов во время их проведения и на этапе подведения итогов, нужно выучить теорию, основанную на математике.

Теория и практика A/B-тестирования

Курс от Академии Аналитиков Авито на практических примерах погрузит вас в A/B-тесты. Лектор сначала рассказывает о каком-либо аспекте A/B-тестирования — причём с выведением и доказательством. А после сразу переключается на Python (вот и обещанное мной выше продолжение изучения Python) и программирует то, что только что рисовал на доске.

Чем мне нравится этот курс, здесь разбираются максимально актуальные темы — то, с чем лично я на работе сталкиваюсь чуть ли не ежедневно.

Если вы не учили математику в университете, может быть сложно понять, как лектор выводит какие-то вещи. В таком случае советую переслушивать, гуглить или читать главы из книги, о которой расскажу ниже — понемногу продираться сквозь видео, и у вас обязательно получится.

Ещё очень рекомендую конспектировать то, что пишет лектор на доске, а также программировать то, что он делает в IDE. Это поможет не просто прослушать курс, а действительно запомнить материал.

Конспектировать будет полезно вообще всё, о чём я пишу в этой статье. Лично я слабо запоминаю информацию, которую не записал. А имея на руках конспекты, всегда можно освежить знания.

На прохождения курса лекций и практическую работу уйдёт также примерно месяц.

Суровое изучения математики через литературу

Книга «Теория вероятностей и математическая статистика» В.Е. Гмурмана — вещь серьёзная и основательная. Она познакомит с теорией, на которой строится A/B-тестирование, и настроит мозг на более математическое мышление.

Прочтение, конспектирование и прорешивание задачек из этой книги — это босс для настоящего аналитика-супергероя. У меня лично на всё это ушло 2,5 месяца ежедневного изучения по 3-4 часа в день.

Если во время прохождения учебника вы почувствуете, что мотивация падает — бросайте и идите дальше. Но если всё-таки решитесь дойти до конца, особенно советую главы 1 — 13 и 15 — 19 c задачами.

А вообще книга довольно простым языком (для учебников по математике) объясняет теорию вероятностей и статистику с самого нуля и до статистической проверки гипотез.

Итоги — математика и A/B-тесты

После прохождения этих двух этапов вы сможете дизайнить, проводить и подводить итоги экспериментов. А также с большей уверенностью контролировать изменения в продукте и давать рекомендации по ним.

Часть 4:Soft Skills

Во время прокачки технических и математических навыков может показаться, что продуктовый аналитик — человек с чисто техническими навыками работы с данными, но это не так.

В идеальном мире продуктовые аналитики отлично разбираются в своём продукте и сами его используют — проверяют клиентские воронки, тестируют новые фичи и интересуются аналогичными продуктами конкурентов. И уже основываясь на этом выдвигают гипотезы по улучшению продукта.

Мне сложно сказать, как прокачать знание доменной области. Нельзя же просто сказать: «Интересуйся своим продуктом», — ведь у новичков без работы никакого продукта пока нет.

Но вы ведь живёте в современном мире, пользуетесь digital-сервисами — можно подумать над их улучшением. Например:

  1. Где по вашему мнению кривая воронка регистрации?

  2. Где неудобно устроен процесс оплаты?

  3. Где не очевидно донесена ценность продукта?

Когда я только задумывался о карьере в продуктовой аналитике, моя знакомая из этой сферы посоветовала постоянно задаваться вопросом «почему что-то устроено именно так, а не иначе; какие у этого есть плюсы и минусы».

Что касается критического мышления, могу посоветовать чаще ставить свои выводы и код под сомнение. А также задаваться вопросами:

  1. Всё ли я учёл?

  2. Точно ли код работает как я думаю?

  3. Валидные ли у меня данные?

  4. Какие действия может спровоцировать мой вывод? Как его воспримут люди?

Ну и банально пользоваться техникой «5 почему» (главное не переусердствуйте).

Если говорить о soft skills в целом, для аналитика важно уметь коммуницировать с другими людьми, отстаивать своё мнение и аргументированно говорить «нет». Это не просто пункты из требований к кандидату в вакансии, а то, чем продуктовый аналитик занимается каждый день:

  1. Договаривается с разработкой о поставке данных.

  2. Обговаривает с продактом дизайн A/B-теста.

  3. Предлагает гипотезы по улучшению продукта.

  4. Отговаривает от решений, не подтверждённых данными.

Базовый совет для прокачки всего этого — побольше читать разной, в том числе не технической литературы.

Итак, вы стали интересоваться окружающими вас продуктами, критичны к самому себе и к данным и нашли время на чтение в свободное время – и тем самым обрели камень мягких навыков!

Выводы

В этой статье я рассказал только об основных навыках, необходимых продуктовому аналитику. Хотя, конечно, есть и те разделы, которые остались без моего внимания, например:

  1. Машинное обучение

  2. Визуализация данных в BI-инструментах

  3. Работа с GIT

Это всё не менее важные навыки, которые пригодятся любому аналитику. Но начать карьеру можно и без этого, и в процессе изучить остальное.

Надеюсь, мой план погружения в профессию поможет вам стать продуктовым аналитиком и запустить карьеру.
И как Танос стал покорителем миров, вы станете аналитиком — покорителем данных!

Также держите ссылку на сайт с вакансиями Ozon Банка.

Теги:
Хабы:
+7
Комментарии10

Публикации

Информация

Сайт
job.ozon.ru
Дата регистрации
Дата основания
Численность
1 001–5 000 человек
Местоположение
Россия

Истории