День 2/12: Файнтюнинг с подкреплением

Day2/12: Reinforcement FIne-Tunning

Кажется OpenAI добавляет новые возможности файнтюнить модели. Но стоит признать, что в принципе фаунтюнинг штука дорога и сложная и для большинства задач и не нужная.

По факту шаги выглядят так:

1) Пропмтинг
2) RAG
3) Fine-tunning - только если все до этого не помогло.

Ну будем наблюдать что там в деталях.

Прямая трансляция https://www.youtube.com/watch?v=fMJMhBFa_Gc