Как стать автором
Обновить

Комментарии 6

При этом я всё ещё планирую провести эксперимент по воссозданию всей инфраструктуры, которая есть в OpenAI, с помощью LangChain. Напишу об этом отдельную статью, когда всё будет готово.

Вот это будет очень интересно, жду. Т.к. на объёмах (когда у нас не пара тысяч статей, а пара сотен тысяч толстых PDFок), как я понимаю, на оплате OpenAI можно и разориться. Да и вообще привязка к единственному сервису не импонирует.

Ну, тут нужно посчитать. Ведь если использовать OpenAI VectorStore, то загрузка данных туда бесплатная. А за использование этих данных (а именно выборку топ 5-50 векторов) нужно будет платить в два раза меньше, чем если передавать эти данные каждый раз при использовании локальной векторной базы. Есть еще косты за хранение данных там, но они совсем копеечные. Поэтому у нас в итоге должно получиться дешевле, чем например с Gemini.

В любом случае глянуть, как оно делается ручками, было бы полезно в т.ч. и для понимания, как это считать в деньгах (как с API, так и с локальными моделями).

Отличный проект! Не тяните с GitHub, выкладывайте!

Надо почистить repo и все описать, сейчас там набор random скриптов ) Но я сделаю чуть позже.

Очень круто получается.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории