Стихи, модель личности, системный промпт

У твоего AI агента есть системный промпт. Это несколько абзацев текста, которые ты задаешь в настройках. Обычно там написано, как ИИ должен вести себя конкретно с тобой. Что делать, чего не делать, что для тебя важно, что учитывать в работе - и так далее.

Этот промпт учитывается при каждом запросе. Даже если ты пишешь «привет, как дела?» - вместе с этим запросом модель получает весь системный промпт. Каждый раз.

Но это не пост про то, как настроить своего агента. Это пост про тебя. И про меня.

У твоего личного - «не_искусственного» - интеллекта тоже есть системный промпт. И тоже есть обученная модель. И там тоже миллиарды параметров.

Вся моя жизнь - обучение с подкреплением. Посмотрел фильм, прочитал книгу - веса модели немного сдвинулись. Поговорил с кем-то - модель дообучилась. Любой фидбэк от вселенной слегка меняет веса модели. Не все. И, как правило, не очень сильно.

Как и в случае с большими языковыми моделями - я не могу прочитать всю свою модель и полностью осознать, как она работает. Это свойство эмерджентных систем.

В детстве модель небольшая и имеет дефолтные веса. Обучение происходит молниеносно. Любой инпут может поменять половину всех весов. Здравствуйте, детские травмы - вам сюда.

С возрастом модель становится больше. Цена дообучения растет. Чтобы серьезно что-то поменять, нужно или очень много времени или очень сильное воздействие. Сильное воздействие на коротком отрезке времени мы обычно называем «кризис».

Кто обучает твою/мою модель?

Любые сигналы растворяются в весах твоего латентного пространства. Весь культурный фон вокруг. Все сериалы, которые мы смотрим. Все ролики на youtube. Вся музыка. Все стихи.

Кстати о стихах.

Для языковой модели - стихи очень важная модальность. Стихи работают не только со смысловым полем, но и с самой структурой модели. Об этом хорошо сказал Бродский (нобелевская речь 1987):

«порой с помощью одного слова, одной рифмы пишущему стихотворение удается оказаться там, где до него никто не бывал,- и дальше, может быть, чем он сам бы желал».

«стихотворение - колоссальный ускоритель сознания, мышления, мироощущения.»

К тому же стихи - древнейшая технология памяти: размер и рифма это избыточность + ограничение. Через них в стихи встроен код коррекции ошибок. Не случайно дописьменные культуры хранили законы, родословные и космологию в стихах, чтобы при передаче текст мог сам себя чинить.

Этим пользуется не только Бродский, Данте или Киплинг. У меня в голове навсегда засели рекламные рифмы и ритмы. «Коля любит Мамбу…», «Праздник к нам приходит...» ...и навсегда поселяется в весах нашей модели. «Всё так - и это...» ...примеры отличного хака системы дообучения.

И нет, ты не можешь это стереть. Из модели вообще ничего нельзя стереть - можно только понизить вес отдельных элементов. Но они всё равно там. И ты это знаешь.

И да, вес отдельных параметров можно повысить. Именно поэтому для калибровки весов я иногда пересматриваю важные фильмы или перечитываю важные книги. Мне важно, чтобы они продолжали иметь вес в моеё модели.

А что же системный промпт?

Это не модель. Это четкие инструкции, которые работают всегда. И их не может быть много. Техническое ограничение.

Любое прочитанное стихотворение тонет в весах. А те несколько, что ты выучил наизусть, повышены в ранге до системного промпта: единственный текст, который подгружается всегда, а не достаётся из ненадежной памяти по запросу.

Для этого я учу стихи наизусть. Совсем немного. Технические ограничения всё же. Но я слежу, чтобы самое важное оставалось в моем персональном системном промпте. Потому что это влияет на всё остальное, даже если в модели какие-то веса начали протухать.

ИИ не может сам переписать свой system prompt. Он может его прочитать, может обсудить с тобой. Но исправить сам - без тебя не может. А ты можешь. В этом отличие. В этом твоя сила.

Что в твоем систем промпте?

Стихи, модель личности, системный промпт

ARTICLES