🤖 LLM начинают менять язык, на котором мы говорим - и это уже происходит.

Самый известный пример - английское "delve" (углубиться). После запуска ChatGPT это слово стало встречаться в научных статьях на PubMed в 10-100 раз чаще, чем раньше. Журналист Alex Hern предположил, что дело в RLHF: OpenAI и другие компании отдают разметку аннотаторам в Нигерии, где "delve" в формальном английском - обычное слово. Они выше оценивали ответы с ним, модель стала его приоритезировать, и "delve" просочилось обратно в речь людей. Академическая работа конца 2024 года конкретно "нигерийскую" версию подтвердить не смогла, но согласилась, что RLHF как механизм с данными согласуется.

В русском похожим путем идет "оптика" - "через оптику пользователя", "сменить оптику", "интересная оптика". В обычной речи слово встречалось редко, сейчас - заметно чаще.

Самое заметное - конструкция "это не А, а Б". LLM ее обожают и вставляют в каждый второй ответ. И она уже видна в постах, докладах, презентациях живых людей, которые ничего не размечали.

Люди жалуются, что AI пишет неестественно, "не по-человечески". Забавно, что скоро эта претензия отпадет - не потому, что AI начнет писать иначе, а потому, что человек постепенно начнет писать как AI.

https://simonwillison.net/2024/Apr/18/delve/

https://arxiv.org/abs/2412.11385