Как стать автором
Обновить

Пару дней назад я провел небольшое исследование о новом ИИ-решении от китайской компании DeepSeek, которое вызвало настоящий информационный бум в СМИ и эмоциональную реакцию истерику со стороны американских ИИшных корпораций, как я уже упоминал в своей новости на Хабре. Причины этого события коренятся в экономических и технологических аспектах. Пока другие обсуждают выдающиеся достижения DeepSeek, я постараюсь заглянуть в будущее этой ИИ-гонки...

📊 С точки зрения экономики, есть такой парадокс, который называется в честь одного английского экономиста Джевонса. Его суть в том, что технологический прогресс, улучшающий эффективность использования определенного ресурса, зачастую приводит к увеличению его потребления, а не к снижению. Яркий пример — появление более экономичных двигателей, которые не только не сократили расход топлива, но и способствовали росту количества автомобилей на дорогах, таким образом увеличив общий объем потребляемого бензина. Поэтому будут пользоваться не только одним ИИ инструментом, а всеми ведь у каждого уже сформированная аудитория.

😉 С точки зрения технологий, успех компании DeepSeek во многом стал возможен благодаря новой архитектуре Multi-head Latent Attention (MLA). Эта инновация позволила снизить затраты на обучение моделей на целых 90%, при этом игнорируя 95% несущественных данных. В отличие от OpenAI и Nvidia, которые используют весь массив данных, что делает их обработку информации значительно более затратной. Ленивый или гениальный подход алгоритма к обработке информации? Этот вопрос оставим до следующего новостного бума. Более того, DeepSeek применяет открытый исходный код, что также ускоряет процесс обучения.

Но что же будет дальше?

😎 Я предполагаю, что теперь все компании в области ИИ пересмотрят свои алгоритмы, внося необходимые поправки. Это, в свою очередь, приведет к удешевлению услуг и повышению доступности для обычных пользователей и компаний. Также стоит ожидать пересмотра аппаратного обеспечения, в частности видеокарт. Многие из компаний, вероятно, начнут внедрять менее мощные видеокарты для обработки основной информации, в то время как для анализа данных с множеством параметров будут использоваться высокопроизводительные чипы, такие как Blackwell B200 от Nvidia. Все будут стараться удешевить инфраструктуру, как это было в 21 веке с автомобилями.

В заключении, хотел бы отметить, что главная цель инноваций — это создание продуктов максимально доступных для пользователей, а не просто ради самих новшеств. Об инновациях рассказываю в своем тг-канале и пишу статьи про ИИ и дата-центры на Хабр.

Теги:
Всего голосов 2: ↑0 и ↓2-2
Комментарии2

Публикации

Истории

Ближайшие события

8 апреля
Конференция TEAMLY WORK MANAGEMENT 2025
МоскваОнлайн
25 – 26 апреля
IT-конференция Merge Tatarstan 2025
Казань
20 – 22 июня
Летняя айти-тусовка Summer Merge
Ульяновская область