Comments 20
Спасибо. Считаю, что публикация очень полезная. Непонятно, за что её минусовали.
Видимо за чрезмерную "судьбоносность" и тп.
Разве не все новые статьи минусуют?
Время публикации. Ночью в пятницу в сети зачастую остаются хейтеры и неудачники, которым некуда себя деть - ни девушки, ни друзей, ни семьи. По моему опыту, лучшее время публикации - рабочие дни, до обеда. Вечерние или ночные публикации получают больше минусов.
Почему не спросили, на каких данных тренировали свою LLM?
Конечным пользователям, вроде меня, не так важно, на каких данных обучаются модели. Но очевидно, что источником данных служит все до чего дотянется парсер не обращая внимание на авторское право.
В одном из моих проектов GPTBot генерирует более 50 тысяч запросов в сутки, что, по сути, является агрессивным веб-скрапингом. При этом я нигде не давал разрешения на такое использование данных. Дополнительная проблема в том, что бот существенно нагружает базу данных, а механизмы кэширования оказываются неэффективными, поскольку он запрашивает постоянно новые страницы.
У меня есть целый список таких ботов, в т.ч Amazon, Meta и т.д.
Но очевидно, что источником данных служит все до чего дотянется парсер
Мне не очевидно. Подготовка датасета - огромная работа. Собрать свой или взять готовый - существенная разница как в затратах, так и в результатах. А есть еще, к примеру, distilled, когда модель "улучшается" с помощью другой модели, а не пылесосит веб.
Так что мне очень интересны подробности, на чем учили R1.
Ну, не знаю. Обычного пользователя вряд ли заинтересовало это интервью. А энтузиастам очень интересно, на каких текстах обучают модель. Готовят ли они сами датасеты, или используют готовые. Разработчики ChatGPT раньше указывали %% разных датасетов в обучающей выборке, потом начали скрывать.
Что все китайцы игнорируют авторское право при обучении LLM, так это понятно. И тут я их поддерживаю - пока LLM не цитирует источники большими кусками, что можно было бы расценить как нарушение, использование любых текстов для обучения, будь то LLM или человеков, не является нарушением авторских прав.
Хорошая статья, спасибо автору!
Судя по ответам этого парня он реально крут. А если еще учесть его патриотическую риторику, то скоро он станет национальным героем и технологическим лицом Китая.
Хватит уже. "Судьбоносное интервью". "Тектонический сдвиг". "Эффект разорвавшейся бомбы".
Уже наелись этого всего за последнюю неделю
А ещё сейчас каждый второй фильм называют культовым. Такое вот обесценивание терминов.
Вижу "силиконовую долину" в тексте - добавляю автора в игнор-лист. HabroSanitizer мне в этом помогает.
Чем это отличается от интервью политических деятелей?
Там пафоса ничуть не меньше. Современный стиль пиара и вообще журналистики.
А тут еще и культурные особенности.
Как же я люблю сказки... Я не знаю, какой там ИИ у китайцев. Но всегда говорил, что это афёра. Что китайцы убедительно и показали. Создание программных вычислительных единиц не стоит миллиарды долларов, как это втирали всем товарищи Альтман и Суцвекер. Думаю, что последствия появления китайского ИИ с открытым кодом, где можно посмотреть, что из чего состоит, даст много работы американской прокуратуре и лично товарищу Трампу в борьбе с цифровиками. Да и инвесторы, которые давали Альтману деньги, а тройка Альтман-Суцвекер-Сатия их радостно пилила, обидятся и тройка эта вполне может получить чуток по щам. Это всё не имеет никакого отношения к компьютерам и технологиям. Просто попил бабла и борьба группировок за власть.
Одно из самых вдохновляющих интервью, которые я читал за последнее время. Лю Цысинь и ода знаниям VS Талеб c антихрупким таксистом.
«Будущее за узкой специализацией»: судьбоносное интервью Ляна Вэньфэна, основателя DeepSeek, посвящённое v2