Day2/12: Reinforcement FIne-Tunning
Кажется OpenAI добавляет новые возможности файнтюнить модели. Но стоит признать, что в принципе фаунтюнинг штука дорога и сложная и для большинства задач и не нужная.
По факту шаги выглядят так:
1) Пропмтинг
2) RAG
3) Fine-tunning - только если все до этого не помогло.
Ну будем наблюдать что там в деталях.
Прямая трансляция https://www.youtube.com/watch?v=fMJMhBFa_Gc
