Как стать автором
Обновить

Комментарии 4

А что мешает просто научить ее пользоваться продвинутым калькулятором для начала?

Чтобы больше не выскакивало 9.11 > 9.9

Это кстати вопрос распознания контекста, а не математики. Если речь идёт о версиях, то 9.11 действительно больше чем 9.9.

(Хотя, имхо, целенаправленно использовать LLM для математических задач - это как закручивать шуруп ножницами. Просто возьмите отвёртку...)

Использовать ИИ для математики крайне интересно, но нужно делать это с умом. К примеру обучать не на всём мусоре из интернета, а ТОЛЬКО на математическом контенте. А желательно еще и записанном в единой стандартной нотации, исключающей неоднозначности в интерпретации. Вот тогда вполне можно ждать от ИИ интересных результатов, в том числе и научных открытий.

Нашли способ?

Довольно очевидно, что подкрепление в мелочах значительно эффективнее, чем подкрепление только за ответ. Проблема в том, что для большинства задач крайне сложно сделать такие обучающие данные.

Проблема-то в обратном, как эффективно обучать при sparse rewards, что бы сэкономить на разметке данных.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий