EN / RU / 🤖
← К эссе
· Эссе · 1 мин

День 2/12: Файнтюнинг с подкреплением

OpenAI добавляет новые возможности файнтюнить модели, но это сложный и дорогой процесс.

Day2/12: Reinforcement FIne-Tunning

Кажется OpenAI добавляет новые возможности файнтюнить модели. Но стоит признать, что в принципе фаунтюнинг штука дорога и сложная и для большинства задач и не нужная.

По факту шаги выглядят так:

1) Пропмтинг
2) RAG
3) Fine-tunning - только если все до этого не помогло.

Ну будем наблюдать что там в деталях.

Прямая трансляция https://www.youtube.com/watch?v=fMJMhBFa_Gc

День 2/12: Файнтюнинг с подкреплением — illustration