🦙 Meta and Microsoft представили LLAMA 2
Авторы модели Llama 2 сделали огромный шаг вперед, обновив обучающий датасет, увеличив его чистоту и объем до 2 триллионов токенов. Они также внесли улучшения в архитектуру модели, добавив более быструю grouped-query attention. Теперь контекст модели увеличен до 4 тысяч токенов. Обучение проходило в несколько этапов: предварительное обучение, надзорная настройка и обучение с подкреплением.
Интересным наблюдением стало то, что обучение с подкреплением (RL) не только влияет на калибровку вероятностей (как отметили исследователи OpenAI), но и регулирует температуру модели, достигая баланса между фактологической точностью и креативностью, в зависимости от вводных данных.
Самое важное - обновление Llama- 2 вышло с открытым исходным кодом и лицензией, позволяющей коммерческое использование!
📝 Paper: https://ai.meta.com/research/publications/llama-2-open-foundation-and-fine-tuned-chat-models/
👨💻 Github: https://github.com/a16z-infra/llama2-chatbot
