Pull to refresh

BIG one day offer — Sportmaster Lab в поиске Data Engineer и DWH developer

Reading time1 min
Views1.3K

10 февраля, в субботу, мы проведем онлайн One Day Offer в Sportmaster Lab, в рамках которого будем искать Data Engineer и DWH developer в нашу команду.

Как всё будет проходить

- Сбор заявок до 6 февраля.
- Предварительный этап — с вами свяжется hr для уточнений.
- Подготовка к собеседованию — попробуйте свои силы в тестирование по DE или DWH. Тестирование не является обязательным, но темы, которые вы встретите в процессе прохождения, будут также затронуты на собеседовании.
- Техническое интервью. Заранее назначим время технического интервью и отправим ссылку на комнату MS Teams, в которую подключится интервьюер. Длительность собеседования — полтора часа.
- Оффер. Презентация оффера 10 февраля.

Как принять участие

Просто отправьте заявку. Важно — сделать это надо до 6 февраля.

Читать далее

III исследование «BI-круг Громова 2022». Боевые испытания, импортозамещение и немного эмоций

Reading time7 min
Views6.4K

На днях состоялась публикация новый выпуск нашего уже традиционного исследования российских BI-решений. Готовили мы его долго, так что, смеем надеяться, что он стал лучше, удобнее, нагляднее и информативнее – в том числе за счет того, что произошел ряд изменений в самой структуре работы над ним.

Мы все прекрасно знаем, какова сейчас ситуация с представленностью на российском рынке зарубежных IT-компаний. BI-сегмент не исключение, что делает информацию в нашем исследовании максимально актуальной. И фраза о том, что сейчас наблюдается колоссальный рост интереса к сегменту российских BI-решений у отечественного пользователя, уже перестала быть преувеличением.  

Бизнес сейчас оказался в ситуации, когда он вынужден не просто повторить то, что было реализовано, а найти решение, которое быстро закроет оперативные задачи, поможет улучшить качество принятий решений и бесшовно впишется в IT-архитектуру. Так что выбор это нелегкий. Но мы надеемся, что наш анализ российских BI-продуктов поможет его сделать обосновано и правильно.

В общий обзор вошли порядка 40 платформ. Среди них – Visiology, Modus BI, Luxms BI, «Форсайт. Аналитическая платформа», «Триафлай», DataLens, «Криста BI», PolyAnalyst, N3.Аналитика, «Аналитическая платформа Polymatica», Alpha BI, Analytic Workspace, Almaz BI, Cubisio, Visary BI, «1С:Аналитика», «Пульс Дела/Пульс Региона», Dataplan, Storm и многие другие.

Читать далее

Вебинар «Построение DWH на основе Greenplum»

Reading time1 min
Views1.2K

Southbridge приглашает на вебинар «Построение DWH на основе Greenplum. Практический опыт» 29 апреля в 19:00.

На вебинаре рассмотрим особенности использования Greenplum в построении DWH (Data Warehouse), поговорим о проблемах, которые могут возникнуть, и способах их решения.

Читать дальше

Citymobil Data Meetup №3

Reading time2 min
Views788

Ситимобил каждый месяц проводит митапы о применении Data science в городских и геосервисах, логистике и технологиях умных городов.

На митапе мы рассмотрим разные особенности применения современных технологий в геосервисах. Поговорим и о классическом data science в задачах прогнозирования времени прибытия, о проектирование data warehouse (DWH), чтобы можно было эффективно применять методы машинного обучения и строить дэшборды. А также продолжим говорить о Switchback-экспериментах (у нас уже был доклад об этом не первом митапе), которые часто просто незаменимы в геосервисах.
В этот раз в гости к Ситимобил придут коллеги из Самоката.

Ждём вас 28 октября в 18:00.  Регистрация

Читать далее

Вебинар «Современные базы данных для аналитики: почему DWH лучше строить в облаке?» 18 июня от Mail.ru Group

Reading time2 min
Views2.1K


Привет, друзья.

Хайп вокруг Big Data давно прошёл. Но потребность компаний в отказоустойчивой инфраструктуре для хранения и обработки больших данных стала даже острее. 18 июня мы приглашаем вас принять участие в вебинаре, на котором расскажем про аналитическую СУБД Arenadata DB на основе Greenplum.

Вы узнаете:

  • Как устроен Greenplum и для каких задач лучше использовать эту современную массивно-параллельную, изначально кластерную СУБД
  • Преимущества Greenplum в облаке по сравнению с BareMetal
  • Какие бизнес-задачи можно решать с помощью DWH, в основе которого лежит Greenplum
  • Как настроить и запустить Arenadata DB Cloud на базе Greenplum в облаке Mail.ru Group за пару минут

На вебинаре мы ответим на эти вопросы и расскажем про возможности Arenadata DB, которая теперь доступна в облаке Mail.ru Cloud Solutions

Вебинар пройдет 18 июня (четверг) в 17:00.

Регистрация обязательна, ссылка для подключения будет отправлена сразу после ее прохождения.
Подробнее о вебинаре

Как мы провели встречи по NiFi. Видео и впечатления

Reading time2 min
Views5K
Приветствую!

Все чаще я встречаю упоминания такого замечательного продукта, как Apache NiFi. Даже на Хабре за этот год появилось несколько статей об этом достаточно нишевом продукте.

Мы в Тинькофф уже более двух лет используем Apache NiFi и поэтому посвятили ему митап (сразу признаемся, что на проведение мероприятия нас подвигло сообщество телеграм-канала @nifiusers). Событие мы разбили на две части, которые проходили два четверга подряд.


DBT meetup 14/12/2021

Reading time1 min
Views630

Meetup для интересующихся и использующих DBT

Привет. Приглашаем провести вечер 14 декабря с коллегами на митапе по DBT. Для вас подготовлены 4 доклада разного уровня - от введения в инструмент и его использования в облаках, до стандартизации метрик компании в нем и технических подробностей работы.

Читать далее

Авторский курс по GreenPlum: стань опытным строителем DWH

Reading time1 min
Views1.9K

19 сентября стартует курс по GreenPlum от Ивана Чувашова, администратора баз данных в Southbridge, ведущего инженера компании Okko и автор курса по PostgreSQL. Вы узнаете, что такое DWH и СУБД GreenPlum, а также научитесь администрировать GreenPlum: настраивать ресурсные группы, обеспечивать отказоустойчивость сегментов и мастер-ноды, делать балансировку данных между нодами, выбирать оптимальные конфигурационные параметры GreenPlum.

Читать далее

«Все делают это...» — Data People by GlowByte приглашает на весенний митап

Reading time1 min
Views648

Привет! 16 апреля в 18:00 Data People by GlowByte приглашает тебя на пикантный митап про данные!

Наши друзья, занимающие руководящие позиции в Data-подразделениях крупнейших российских ФинТех-компаний, поделятся опытом реализации проектов по миграции платформ данных.

Узнать больше и зарегистрироваться

Авторский курс по GreenPlum от администратора баз данных в Southbridge и ведущего инженера в Data Driven Lab

Reading time2 min
Views1.1K

GreenPlum помогает компаниям с разными объёмами бизнеса извлекать реальную пользу из накопленных данных. Благодаря масштабируемости и скорости работы с данными он позволяет быстрее принимать бизнес-решения и повышает их качество.

19 сентября у нас стартует «DWH на основе GreenPlum» — авторский курс Ивана Чувашова, администратора баз данных в Southbridge и ведущего инженера компании Data Driven Lab. На нём Иван поделится знаниями в области хранилищ данных, которые собирал на протяжении 10 лет. Мы разберём основы устройства DWH и углубимся в GreenPlum — поломаем и починим его. А ещё поговорим об архитектуре и способах хранения данных, оптимизации запросов.

Читать далее

«DWH на основе GreenPlum»: теперь в формате видеокурса

Reading time1 min
Views946

Сегодня стартовал первый поток «DWH на основе GreenPlum». Для тех, кто хотел, но не успел присоединиться, хорошие новости. Вы можете купить его в формате видеокурса с доступом к урокам на 2 года. 

«DWH на основе GreenPlum» — полностью авторский курс. Мы подготовили его по инициативе спикера Ивана Чувашова, администратора баз данных Southbridge и ведущего инженера Data Driven Lab. Все материалы он собирал на протяжении 10 лет, мы просто доработали их с методистом и подготовили стенды под практические задания.  

Читать далее

Видеокурс «DWH на основе GreenPlum» с 3 АМА-сессиями со спикером

Reading time3 min
Views828

Видеокурс «DWH на основе GreenPlum» с 3 АМА-сессиями от Ивана Чувашова, администратора баз данных в Southbridge и ведущего инженера компании Data Driven Lab.

На курсе вы узнаете, что такое DWH, СУБД GreenPlum и научитесь администрировать его: настраивать ресурсные группы, обеспечивать отказоустойчивость сегментов и мастер-ноды, делать балансировку данных между нодами и выбирать оптимальные конфигурационные параметры.

Читать далее

Data Warehouse, Data Lake, Data Lakehouse, Data Fabric, Data Mesh – что это такое, и в чем разница между концепциями

Reading time14 min
Views22K

Эпоха современных хранилищ данных началась с появления реляционных баз данных (далее БД). С появлением бизнес‑аналитики следствием развития БД стала концепция Data Warehouse (корпоративное хранилище данных, DWH).

Дальнейший рост объемов данных, введение термина «большие данные» и разнообразие требований к обработке привели к эволюции архитектур данных.

Рассмотрим этапы эволюции архитектуры данных: чем отличаются концепции, какие у них преимущества и недостатки, для каких задач в работе с данными подходят.

Читать далее

Data Lake – от теории к практике. Методы интеграции данных Hadoop и корпоративного DWH

Reading time6 min
Views24K
В этой статье я хочу рассказать про важную задачу, о которой нужно думать и нужно уметь решать, если в аналитической платформе для работы с данными появляется такой важный компонент как Hadoop — задача интеграции данных Hadoop и данных корпоративного DWH. В Data Lake в Тинькофф Банке мы научились эффективно решать эту задачу и дальше в статье я расскажу, как мы это сделали.



Данная статья является продолжением цикла статей про Data Lake в Тинькофф Банке (предыдущая статья Data Lake – от теории к практике. Сказ про то, как мы строим ETL на Hadoop).

Читать дальше →

Современная Lakehouse-платформа данных Data Ocean Nova

Level of difficultyMedium
Reading time15 min
Views4.5K

Привет. Меня зовут Евгений Вилков. Я занимаюсь системами управления и интеграции данных с 2002 г., а конкретно системами анализа и обработки данных — с 2007 г. Технологии, с которыми я имел дело на протяжении моего профессионального пути, стремительно развивались. Начиная с решений, основанных на стеке традиционных СУБД, таких как Oracle, MS SQL Server, Postgres, постепенно эволюционируя в ставшие уже классическими (а некоторые даже и закрытыми) MPP-системы, такие как Teradata, GreenPlum, Netezza, Vertica, IQ, HANA, Exadata, ClickHouse, в различные решения на базе экосистемы Hadoop, облачные сервисы и платформы. Меняется мир, меняются технологии, меняются подходы к проектированию, меняются и требования к задачам аналитического ландшафта данных.

Уверен, что многие, кто уже знаком с терминами Data Mesh и Data Lakehouse, задаются вопросом: что может предложить рынок аналитических систем в этих методологиях проектирования и архитектурных подходах. Я хочу рассказать об аналитической платформе данных Data Ocean Nova, владельцем и технологическим идеологом которой я являюсь.

Читать далее

7 способов выгрузить данные из 1С для бизнес-аналитики

Reading time7 min
Views16K

При загрузке данных из 1С во внешнюю BI‑платформу обычно возникают трудности. 1C — закрытая проприетарная система, подключиться к которой напрямую и просто выгрузить данные без нарушения лицензионной политики нельзя.

Как решить эту проблему?

Рассматриваем 7 самых популярных способов извлечения данных из 1С для бизнес‑аналитики, их плюсы и минусы.

Читать далее

Kafka как интеграционная платформа: от источников данных к потребителям и в хранилище (часть 2)

Reading time9 min
Views7.1K

Привет! Продолжаю рассказ про интеграционную платформу на базе Apache Kafka и про то, как мы постарались гармонично вписать ее в непростую ИТ инфраструктуру группы НЛМК.

Напомню, что в первой части статьи были описаны соглашения об именовании топиков, подход к реализации ролевой модели и соглашение по базовой схеме данных. Здесь расскажу, как сделали универсальное охлаждение для всех данных из Kafka в корпоративное хранилище на базе Hadoop, про сервис доставки сообщений в ИС и про разработанные сервисы, доступные на нашем Self-Service портале.

Читать далее

Бизнес-сериал: формируем BI-систему в строительстве почти в прямом эфире. Часть II

Level of difficultyMedium
Reading time21 min
Views1.7K

Привет, друзья!

Продолжаем нашу серию статей о создании BI-системы в компании Sminex. Расскажем о наших дальнейших шагах по построению хранилища с якорной моделью.

Жмяк 🐤

Технология проектирования хранилищ данных Data Vault 2.0

Level of difficultyEasy
Reading time19 min
Views12K

Data Vault 2.0 остаётся одним из самых популярных методов моделирования данных. Его выбирают за гибкость, масштабируемость и устойчивость к изменениям. Этот разработанный Дэном Линстедом подход помогает организациям быстро адаптироваться к новым бизнес-требованиям, легко интегрировать новые источники данных и надёжно хранить исторические данные.

Эта статья будет полезна дата-инженерам, аналитикам данных, архитекторам данных и бизнес-аналитикам. Она поможет усовершенствовать умения в моделировании данных. Мы рассмотрим ключевые принципы Data Vault 2.0 и на практическом примере покажем, как разложить сырые данные по Data Vault 2.0.

Читать далее
1
23 ...