О чем думаю сегодня: GPT-4 API где-то в 30 раз дороже и сильно медленнее чем GPT-3.5, при этом ощутимо качественнее на сложных вопросах (как минимум вижу принципиальную разницу в задачах по программированию, по химии, работе с языками отличными от английского и испанского.
Гипотеза: предварительно по промпту и предыдущему разговору (например когда юзер обозначает ошибку) можно выбирать какой моделью воспользоваться и динамически переключаться между ними.
Вопрос: как эффективно это сделать? Возможно уже есть что-то опенсорсное?