Комментарии 4
А что мешает просто научить ее пользоваться продвинутым калькулятором для начала?
Чтобы больше не выскакивало 9.11 > 9.9
Это кстати вопрос распознания контекста, а не математики. Если речь идёт о версиях, то 9.11 действительно больше чем 9.9.
(Хотя, имхо, целенаправленно использовать LLM для математических задач - это как закручивать шуруп ножницами. Просто возьмите отвёртку...)
Использовать ИИ для математики крайне интересно, но нужно делать это с умом. К примеру обучать не на всём мусоре из интернета, а ТОЛЬКО на математическом контенте. А желательно еще и записанном в единой стандартной нотации, исключающей неоднозначности в интерпретации. Вот тогда вполне можно ждать от ИИ интересных результатов, в том числе и научных открытий.
Нашли способ?
Довольно очевидно, что подкрепление в мелочах значительно эффективнее, чем подкрепление только за ответ. Проблема в том, что для большинства задач крайне сложно сделать такие обучающие данные.
Проблема-то в обратном, как эффективно обучать при sparse rewards, что бы сэкономить на разметке данных.
AI лучше учится математике с новым подходом, использующим лишь долю данных