ITSumma - Эксперты в производительности / Статьи / Хабр

Профиль Статьи 210Посты 7Новости 225Подписчики 90K

anastmay 14 мар в 03:14

Инхаус и аутсорс DevOps. Плюсы, минусы, подводные камни

Простой

6 мин

3.1K

Блог компании ITSummaDevOps*Управление проектами*Управление разработкой*

Мнение

Несмотря на то, что я почти десять лет работаю в сфере Ops и DevOps аутсорса, моё отношение к этому остаётся неоднозначным. На старте я искренне горела этим и гордилась результатами компании. Но со временам мне начало казаться, что направление зашло в тупик.
Своего пика мой личный кризис достиг после изучения паттернов и антипаттернов DevOps топологий в компаниях. Кажется, что всё просто и наглядно: только в модели инхаус DevOps может работать так, как оно задумывалось.

Ниже хочу порассуждать о жизнеспособности разных моделей DevOps в текущих реалиях.

Инхаус – бестпрактиc в DevOps?

У инхауса много очевидных плюсов: только один проект в фокусе человека, что, в свою очередь, повышает вовлечённость и позволяет всегда оставаться в контексте. Со временем команда DevOps может выучить буквально каждую запятую в коде. Инхаус — это всегда про скорость взаимодействия: поставить задачу, сменить приоритет, получить статус — всё решается одним сообщением в корпоративном чате и не проходит через целую цепь людей или, господи, электронную почту и череду заявок.

Читать дальше →

+10

ITSumma 25 июл 2024 в 15:13

Как построить эффективную стратегию мониторинга с высокой наблюдаемостью

Простой

14 мин

9.8K

Блог компании ITSummaМикросервисы*Системное администрирование*Управление проектами*Управление разработкой*

Мнение

Давайте сразу определимся: самым важным в разработке сейчас является производительность и надежность вашей инфраструктуры, потому что если ваш проект лагает или работает через раз, вас не спасут никакие фичи. Клиент просто уйдет к конкурентам.

Исходя из постулата выше, роль мониторинга систем в последние годы резко возросла. Наши системы перешли от технологических новшеств к статусу критической инфраструктуры, без которой повседневная жизнедеятельность просто невозможна. Однако существует зияющая пропасть между формальным мониторингом и мониторингом, который будет соответствовать сложности и глубине современных систем.

Читать дальше →

+40

ITSumma 13 июн 2024 в 10:01

Соединяя лучшее из двух миров: как мы построили мост между Spark и Greenplum в ITSumma

Средний

4 мин

3.2K

Блог компании ITSummaBig Data*Data Engineering*

В этой статье ведущий администратор баз данных ITSumma Алексей Пономаревский расскажет о том, как мы интегрировали популярный фреймворк для распределенной обработки данных Apache Spark с мощной массивно-параллельной базой данных Greenplum.

Текст будет полезен для разработчиков, решающих схожие задачи по интеграции распределенных фреймворков обработки с реляционными БД, использующих параллельные вычисления.

+23

ragequit 5 апр 2024 в 10:32

Мы шутили над «опытными пользователями ПК», а ведь они вымирают

Простой

7 мин

90K

Блог компании ITSummaЛайфхаки для гиковНастольные компьютерыСмартфоныУчебный процесс в IT

Мнение

Пока в Лас-Вегасе проводят киберспортивные турниры по Excel, где сверхлюди уверенно соревнуются в скоростном решении абсурдно сложных рабочих задач при помощи самого универсального офисного софта, весь остальной мир так же уверенно в вопросе офисных задач деградирует. Двадцать лет назад гики и энтузиасты компьютерной техники шутили, что «отбери у современного пользователя компьютерную мышь и он будет беспомощен», и в чем-то они были правы. Когда-то ненавистные многим графические операционные системы «извратили» работу за ПК, превратив ее из ввода-вывода информации с помощью клавиатуры в тыканье курсором мыши по экрану. Нелюбовь к мыши, кстати говоря, через года пронесли многие: есть огромный массив рабочих задач, где использование мыши избыточно. То, что можно было сделать за две секунды, делается мышью минуту.

Но если я скажу вам, что для того, чтобы ввести в ступор молодого пользователя сейчас, ему достаточно открыть на ПК гугл-таблицу? Или даже просто показать персональный компьютер? Отберите у молодого человека смартфон, дайте ему компьютер и наблюдайте за тем, как он впадает в отчаянье. Сейчас та самая Марьивановна из бухгалтерии на фоне людей, выросших со смартфоном в руках, кажется просто гениальным хакером. И это не брюзжание старика про «раньше было лучше». Это реальная проблема, к которой мы не просто летим на сверхзвуке, мы уже в ней по самые уши. Людей, умеющих пользоваться компьютером даже на уровне тыканья курсором мыши по иконкам все меньше и меньше, хотя вычислительной техники вокруг все больше и больше.

Читать дальше →

+263

670

ITSumma 28 фев 2024 в 13:35

Сборник советов, как упростить работу с YAML-файлами

Простой

5 мин

20K

Блог компании ITSummaСистемное администрирование*DevOps*

Туториал

YAML (.yml) — популярный язык для конфигурационных файлов, широко используемый DevOps в подходе «Инфраструктура как Код» (IaC). Несмотря на то, что работать с ним бывает проще, чем с тем же JSON (особенно в контексте взаимодействия с большими объемами данных), иногда использовать его бывает трудно. В этой статье мы рассмотрим несколько советов, которые помогут упростить процесс создания и редактирования yml-файлов.

+24

ITSumma 21 фев 2024 в 13:48

Вакуумируй это: сбор и удаление мусора в базе данных Greenplum

Простой

6 мин

Блог компании ITSummaBig Data*Data Engineering*Администрирование баз данных*

Туториал

Всем привет! ITSumma на связи! Недавно — 8 февраля мы провели вебинар о мониторинге и обслуживании реляционной базы данных Greenplum.

При всех своих достоинствах у Greenplum есть подводные камни, о которых стоит знать разработчикам и администраторам. Один из таких потенциально опасных моментов — процедура сбора и удаления мусора, её ещё называют вакуумирование, потому что она инициируется командой Vacuum. Работать с вакуумированием нужно деликатно, иначе велик риск надолго нарушить работу всей системы. Как раз о том, как этого избежать, правильно мониторить и очищать таблицы, мы и рассказывали на вебинаре.

Это статья — выжимка нашего мероприятия. Вот что вы из неё узнаете:

ITSumma 1 фев 2024 в 11:53

Как проводят оценку качества данных в Airbnb

Простой

9 мин

2.9K

Блог компании ITSummaBig Data*DevOps*Статистика в ITУправление сообществом*

Кейс

Перевод

Сегодня, когда объем собираемых компаниями данных растет в геометрической прогрессии, мы понимаем, что больше данных — не всегда лучше. На самом деле слишком большой объем информации, особенно если вы не можете гарантировать ее качество, может помешать компании и замедлить процесс принятия решений. Или это приведет к принятию неправильных решений.

Рост показателей Airbnb до 1,4 миллиарда гостей на конец 2022 года привел нас в точку, когда снижение качества данных стало мешать нашим специалистам по работе с этими самыми данными. Еженедельные отчеты по метрикам стало сложно предоставлять вовремя, такие базовые показатели как «Активные объявления» стали иметь целую паутину зависимостей. Для полноценной работы с данными стали требоваться значительные институциональные знания, просто чтобы преодолеть все «подводные камни» в нашем информационном потоке.

Чтобы решить эту проблему, мы внедрили процесс под кодовым названием «Мидас» (Midas), который предназначался для сертификации наших данных. Начиная с 2020 года, процесс Midas, а также работа по реорганизации наших наиболее важных моделей позволили значительно повысить качество и оперативность получения важнейших данных Airbnb. Однако достижение всех критериев качества данных требует значительных межфункциональных инвестиций в такие вещи как проектирование, разработка, проверка и поддержка необходимых информационных ассетов и документации.

Читать дальше →

+29

ITSumma 21 дек 2023 в 13:17

Создание сквозного конвейера MLOps с помощью Open-source инструментов

Простой

12 мин

2.9K

Блог компании ITSummaDevOps*Open source*

Обзор

Перевод

MLOps с открытым исходным кодом: TL;DR
Эта статья служит целенаправленным руководством для специалистов по исследованию данных и инженеров ML, которые хотят перейти от экспериментального машинного обучения к готовым к производству конвейерам MLOps. Мы выявим ограничения традиционных систем ML и познакомим вас с основными инструментами с открытым исходным кодом, которые помогут вам создать более надежную, масштабируемую и поддерживаемую систему ML.

Среди обсуждаемых инструментов — Feast для управления функциями, MLflow для отслеживания и версионирования моделей, Seldon для развертывания моделей, Evidently для мониторинга в реальном времени и Kubeflow для оркестровки рабочих процессов.

Введение

Ландшафт машинного обучения постоянно меняется, и переход от разработки моделей к их внедрению в производство сопряжен с рядом трудностей. Хотя блокноты Jupyter и изолированные скрипты полезны для экспериментов, им часто не хватает функций, необходимых для системы производственного уровня. Эта статья призвана помочь вам справиться с этими проблемами, познакомив с концепцией MLOps и набором инструментов с открытым исходным кодом, которые могут облегчить создание готового к производству ML-конвейера.

Независимо от того, являетесь ли вы специалистом по исследованию данных, желающим перейти к производственной деятельности, или инженером ML, стремящимся оптимизировать существующие рабочие процессы, эта статья призвана дать целенаправленный обзор основных практик и инструментов MLOps.

Читать дальше →

+24

ITSumma 14 дек 2023 в 15:57

Переход с ETL на ELT

Средний

6 мин

7.4K

Блог компании ITSummaХранение данных*Программирование*Анализ и проектирование систем*DevOps*

Перевод

ETL (Извлечение-Трансформация-Загрузка) и ELT (Извлечение-Загрузка-Трансформация) — два термина, которые часто используются в области дата-инжиниринга, особенно в контексте захвата и преобразования данных. Хотя эти термины часто используются как взаимозаменяемые, они относятся к немного разным концепциям и имеют различные последствия для проектирования конвейера данных.

В этом посте мы проясним определения процессов ETL и ELT, обозначим различия между ними и обсудим преимущества и недостатки, которые они предлагают инженерам и командам по работе с данными в целом. И самое главное, я опишу, как недавние изменения в формировании современных команд по работе с данными повлияли на ландшафт борьбы ETL против ELT.

Понимание Извлечения (Extract), Загрузки (Load) и Трансформации (Transform) независимо друг от друга

Главный вопрос при сравнении ETL и ELT, очевидно, последовательность выполнения шагов Извлечения, Загрузки и Трансформации в рамках данных.

Читать дальше →

+22

ragequit 20 ноя 2023 в 13:27

Почему OpenAI уволило Альтмана и что будет дальше с GPT

Простой

6 мин

49K

Блог компании ITSummaIT-компанииБизнес-модели*Искусственный интеллектФинансы в IT

Мнение

Последние дни сеть сотрясает новость об увольнении Сэма Альтмана, руководителя коммерческого подразделения OpenAI. Спикеры наперебой упражняются в красноречии и нагоняют тумана, чтобы собирать трафик и по десять раз перепечатывать одни и те же новости под видом новых публикаций. Почему уволили Альтмана? Что за конфликты внутри OpenAI? Что происходит?

Человек, который не следил за этим увольнением с самого начала, справедливо подумает, что в рядах разработчиков произошел внутренний переворот, но на самом деле все немного проще и очевиднее, если знать один факт: OpenAI, компания-разработчик GPT, которая получила 13 млрд инвестиций только от Microsoft и которая продает подписку на ChatGPT за 20$ в месяц, формально до сих пор является частью некоммерческой организации. И из этого факта проистекают все проблемы, с которыми столкнулся Альтман. А дальше давайте разбираться вместе.

Читать дальше →

+113

281

ITSumma 17 ноя 2023 в 13:57

Главные проблемы сайта, которые показывает нагрузочное тестирование

9 мин

4.5K

Блог компании ITSummaDevOps*Системное администрирование*

Туториал

Всем привет! На связи ITSumma.За 15 лет, что мы делаем нагрузочное тестирование, у нас накопился список самых распространенных ошибок, которые совершают, когда строят и отлаживают инфраструктуру.

Ну список и список скажете вы, но в этой статье мы хотим поделиться не только самими ошибками, но и инструкциями, как их найти. Так что не будем затягивать предисловие и сразу перейдем к делу.

+17

ITSumma 16 окт 2023 в 14:27

Потоковая обработка данных: анализ альтернативных решений

8 мин

4.3K

Блог компании ITSummaАдминистрирование баз данных*Apache*Big Data*Data Engineering*

Обзор

Всем привет! Я Алексей Пономаревский, разработчик решений для платформ сбора и обработки больших данных.

Два года назад мы в ITSumma создали решение для потоковой обработки данных с помощью Apache Spark и базы данных Greenplum — spark-greenplum-connector. Это многофункциональный плагин для Spark, на его основе инженеры могут строить ETL-решения и анализировать данные in-memory.

Изначально мы разработали его, как часть клиентской платформы потоковой обработки данных. Но со временем он прирос одной интересной функциональностью, которая недоступна сейчас в других подобных решениях. В этой статья я хочу сделать краткое сравнение между двумя opensource-продуктами Apache Spark и Flink, а также рассказать об одной интересной особенности Spark, которую мы реализовали в коннекторе.

+21

ITSumma 12 окт 2023 в 11:21

Как мы перевезли на новый сайт 700 тысяч рецептов и 6 миллионов фото пирогов, сырников и овсяноблинов

Простой

6 мин

3.2K

Блог компании ITSummaХранение данных*Обработка изображений*Веб-разработка*

Кейс

На рынке частой историей является поглощение глобальными игроками локальных интернет-сервисов и ресурсов, которые дублируют их функции. Так произошло в 2017 году и с парой «Овкусе» и Cookpad, когда последний решил зайти в русскоязычный сегмент. Тогда слияние произошло успешно: российский проект был куплен и органично влился в инфраструктуру кулинарного ресурса японского происхождения, где активно развивался все эти годы. Ровно до момента, пока головной офис не принял решение уйти из региона, полностью удалив русскоязычную часть Cookpad вместе со всем имеющимся контентом.

Сегодня мы расскажем о том, как нашей команде пришлось переносить данные целого проекта на новую платформу и с чем нам пришлось столкнуться при переезде 6 миллионов фото блюд из 700 тысяч рецептов, которые создали пользователи платформы за 15 лет.

Читать дальше →

+23

eapotapov 28 сен 2023 в 11:56

Как не превратить облако в денежную дыру

5 мин

3.7K

Блог компании ITSummaСистемное администрирование*DevOps*Облачные сервисы*

Туториал

Если сейчас запускать проект, то другие идеи, кроме того, чтобы разместиться в облаке не приходят. Облачная инфраструктура дает много преимуществ, но есть проблема — легко не уследить за тратами, забыв про выделенные ресурсы, закупив мощности больше необходимых или используя не самые эффективные решения.

Поэтому мы хотим поделиться советами, как сократить расходы в облаке, они помогут не наступить на грабли тем, кто сейчас в облако переходит и тем, кто уже работает с облачной инфраструктурой. Рекомендации, которые приведены ниже, мы даем нашим клиентам, основываясь на большом опыте работы со множеством облачных провайдеров. Поэтому эти советы вполне можно назвать универсальными.

+24

ItsPavel 5 сен 2023 в 12:43

Data больше не Big: как данные перестали быть большими и почему это полезно для бизнеса

Простой

3 мин

11K

Блог компании ITSummaBig Data*Data Engineering*Open source*

Мнение

Большие данные мертвы. В той их части, которая характеризуется как “большие”. Так считает Джордан Тигани, инженер-основатель Google BigQuery, человек, который больше 10 лет рассказывал всем о пользе big data. Что он имеет в виду и что это значит для бизнеса? Давайте разбираться.

+35

ITSumma 17 мая 2023 в 12:01

Как перевезти интернет-магазин на Spree и RoR в облако и улучшить стабильность сайта в 4 раза?

Средний

12 мин

2.5K

Блог компании ITSummaKubernetes*Облачные сервисы*PostgreSQL*Системное администрирование*

Кейс

Всем привет! Меня зовут Сергей Спорышев, я директор направления DevOps-продуктов в ITSumma. В этом тексте я хочу рассказать, как задача по переносу в облако простого на первый взгляд проекта оказалась не такой уж простой и превратилась в целый квест.

+28

ITSumma 24 мар 2023 в 10:36

Переход в SRE — лучший способ сохранить работу в условиях рецессии для DevOps-инженера

Простой

5 мин

4.5K

Блог компании ITSummaDevOps*Карьера в IT-индустрииСистемное администрирование*Финансы в IT

Мнение

В ноябре прошлого года мы публиковали статью с мнением о том, что сокращения в Twitter — первая ласточка грядущего схлопывания рынка труда в IT. Тогда мнения аудитории разделились: одни соглашались с тем, что сектор вот-вот провалится в глобальную рецессию наравне с прочими сферами деятельности, другие замечали, что инженерам ничего не грозит.

Спустя пять месяцев можно подвести промежуточный итог: как это ни печально, но скептики (и мы в их числе) оказались правы. Рынок труда в IT-сегменте по всему миру начал если не схлопываться, то серьезно сжиматься.

Пока весь мир обсуждает, что отрицательный рост Sillcon Valley Bank не обрушит мировую банковскую систему и является локальной проблемой, IT-сегменту стоит все же напрячься. Напомним, еще в мае 2022 года Y Combinator рассылал своим участникам письма о том, что инвестиций в стартапы без 100% гарантий окупаемости, де-факто, больше не будет.

Читать дальше →

+17

Lleortea 22 дек 2022 в 16:04

Как нагрузочное тестирование помогло Fix Price переехать на собственную платформу

4 мин

4.6K

Блог компании Fix PriceБлог компании ITSummaIT-инфраструктура*Высокая производительность*Тестирование IT-систем*

В IT-среде до сих пор живуч стереотип, что нагрузочное тестирование нужно исключительно, чтобы узнать максимальную пропускную способность инфраструктуры. И что нагрузочное делается либо перед масштабной акцией типа Чёрной пятницы, либо после того, как сайт всё-таки не выдержал и упал — чтобы узнать, при каком RPS это произошло.

Однако само по себе знание текущего предельного RPS не даст вам ничего. Да и смысл проводить нагрузочное тестирование ПОСЛЕ аварии, конечно, есть, но гораздо рациональнее сделать его ДО неё. Чтобы она даже не случилась. А уж когда речь идёт не просто об ожидаемой лавине трафика, а о том, что эта лавина хлынет на новую инфраструктуру… Словом, вот в меру захватывающая история о том, как нагрузочное тестирование помогло одному из крупнейших ритейлеров, компании Fix Price, переехать без боли, пожара и бессонных ночей.

Для начала несколько слов про саму компанию. У неё почти 5,5 тысячи розничных магазинов в России и странах СНГ, так что название и логотип знакомы, без преувеличения, каждому читателю этой статьи. Но помимо оффлайновой сети есть сайт с доставкой, личным кабинетом пользователя и электронным каталогом. До недавнего момента основная нагрузка лежала на платформе Битрикс (fix-price.ru), но в 2020 году начались работы по созданию собственной платформы fix-price.com.

Читать дальше →

+28

ITSumma 20 дек 2022 в 11:42

Как решить техническую проблему у медицинской компании за несколько часов с перерывом на кофе

5 мин

3.8K

Блог компании ITSummaТестирование IT-систем*Системное администрирование*Высокая производительность*IT-инфраструктура*

Недавно у нас случился медицинский детектив. Технико-медицинский. Почти в духе доктора Хауса. К нам обратилась компания, которая разрабатывает ПО для автоматизации процессов в медицинских учреждениях — радиологические информационные системы. В частности, софт для лучевой диагностики. Эти системы могут использовать как отдельные медицинские организации, так и целые регионы.

На одном из таких объектов, где работала система, регулярно возникали проблемы с быстродействием, особенно в часы пиковой нагрузки. При этом на других аналогичных объектах, где было установлено такое же ПО и была схожая нагрузка, этих проблем не было.

«Изначально клиент пришел с запросом на нагрузочное тестирование. Но мы предложили сначала провести аудит и починить проблемы со скоростью работы, а после уже — сделать нагрузочное (если потребуется)».
Алексей Алексеенко, главный системный администратор ITSumma.

И вот как мы ставили диагноз…

Читать дальше →

+22

ITSumma 6 дек 2022 в 13:09

Как мы в 3 раза снизили время, которое менеджеры тратили на рутинные задачи

5 мин

8.1K

Блог компании ITSummaBig Data*Визуализация данных*Управление персоналом*DIY или Сделай сам

Для бизнеса, который планирует развиваться и расти, а не извлекать сиюминутную выгоду, система аналитики практически мастхэв. Она помогает строить бизнес-планы, дает более реальное представление о том, как чувствует себя компания; с её помощью можно принимать решение, основываясь на фактах, а не на догадках. В этой статье мы рассказываем о своем опыте внедрения системы аналитики и той пользе, которую она приносит.

Началось все с того, что мы стали собирать данные из разных источников...

+15

2 3 ...

10 11

Инхаус и аутсорс DevOps. Плюсы, минусы, подводные камни

Инхаус – бестпрактиc в DevOps?

Как построить эффективную стратегию мониторинга с высокой наблюдаемостью

Соединяя лучшее из двух миров: как мы построили мост между Spark и Greenplum в ITSumma

Мы шутили над «опытными пользователями ПК», а ведь они вымирают

Сборник советов, как упростить работу с YAML-файлами

Вакуумируй это: сбор и удаление мусора в базе данных Greenplum

Как проводят оценку качества данных в Airbnb

Создание сквозного конвейера MLOps с помощью Open-source инструментов

Введение

Переход с ETL на ELT

Понимание Извлечения (Extract), Загрузки (Load) и Трансформации (Transform) независимо друг от друга

Почему OpenAI уволило Альтмана и что будет дальше с GPT

Главные проблемы сайта, которые показывает нагрузочное тестирование

Потоковая обработка данных: анализ альтернативных решений

Как мы перевезли на новый сайт 700 тысяч рецептов и 6 миллионов фото пирогов, сырников и овсяноблинов

Как не превратить облако в денежную дыру

Data больше не Big: как данные перестали быть большими и почему это полезно для бизнеса

Как перевезти интернет-магазин на Spree и RoR в облако и улучшить стабильность сайта в 4 раза?

Переход в SRE — лучший способ сохранить работу в условиях рецессии для DevOps-инженера

Как нагрузочное тестирование помогло Fix Price переехать на собственную платформу

Как решить техническую проблему у медицинской компании за несколько часов с перерывом на кофе

Как мы в 3 раза снизили время, которое менеджеры тратили на рутинные задачи

Информация

zproxy.org