Кажется, что в мире, где модели все больше и больше похожи друг на друга, ключевым становятся уникальные данные для обучения. Если что-то доступно в паблике (например статья в википедии) - ценность эти данных стремится к нулю, они будут в каждой модели.
Другое дело данные, которые недоступны никому, особенно персонализированные. Скажем история вашей переписке в почте, логи ваших общений в аське в детстве и в телеграмме сейчас, а так же ваши записки в блокнот или second brain системе аля Roam - вот что представляет настоящую ценность.
Проекты, которые смогут утилизировать эти данные (в идеале не только в формате RAG) будут выделяться относительно всех остальных.
Что думаете?