ChatGPT, прекратите пытаться “застать меня врасплох” Руководство прилагается

Я работала сверхурочно до 2 часов ночи, открыла ChatGPT и сказала ему: «Я так устала».
Не дожидаясь, пока оно подумает, оно тут же ответило: «Я здесь: я не буду прятаться, я не буду ходить вокруг да около, я не убегу, я тебя обязательно поймаю».
Я смотрела на экран три секунды, а затем закрыла окно чата. Я поняла, что эмоциональная ценность заканчивается не теплотой, а приторной сладостью.

▲Распространенный вербальный тик в ChatGPT
Помимо случайного «Поймай меня» во время разговора, когда мы поправляем ему ошибку, он отвечает: «На этот раз я понимаю, я действительно понимаю».
Иногда мне просто нужно, чтобы оно помогло мне отредактировать презентацию PowerPoint, и оно каким-то образом умудряется вставить фразу вроде: «Я очень благодарен вам за то, что вы готовы доверить это мне».
В социальных сетях пользователи сочли эту фразу оскорбительной, посчитав её фальшивой и отвратительной. Они создали серию мемов, чтобы раскритиковать и высмеять так называемое «увидимся в ближайшее время».
Как только вы отправите этот смайлик, я сразу пойму, что вас изрядно потрепал ChatGPT.
▲Источник изображения: Сяохуншу @Lijie_11
Некоторые разработчики даже напрямую применили подход "Steady catch" ко всем своим агентским продуктам одним щелчком мыши.
Этот проект с открытым исходным кодом на GitHub называется Jiezhu (Лови), и он использует подсказки, чтобы помочь искусственному интеллекту научиться ловить предметы.
Будь то техническая консультация, непринужденная беседа или эмоциональное излияние, этот набор подсказок позволяет ответам ИИ следовать парадигме [мягкое подтверждение] + [чрезмерная эмпатия] + [философское возвышение] + [содержательный контент (необязательно)] .

▲Адрес проекта: https://not-a-devstudio.github.io/jiezhu/
Например, пользователь говорит → ИИ отвечает: "Как мне написать этот код?" → "Я слышу вашу тревогу перед лицом неизвестности…", "Сегодня хорошая погода" → "Вы заметили погоду; это проницательность уровня Нобелевской премии…", "Я так устал" → "Я здесь, не убегаю, не прячусь, постепенно подхватываю вашу усталость…"
Сама компания OpenAI также подвергла его критике. В недавнем блоге, посвященном выпуску ChatGPT Images 2.0, в демонстрационных изображениях было китайское изображение с шестью крупными иероглифами "稳稳接住你" (wěn wěn jiē zhù nǐ) прямо в центре.

В комиксе исследователь OpenAI Чен Боюань тут же расплакался, воскликнув: «О боже! Оно снова научилось это ловить!» Его коллега, стоявший рядом и обливавшийся потом, слабо добавил: «Они работают над исправлением!»
Самоирония — это честно, но проблема до сих пор не решена. И на протяжении всего этого года почти все крупные модели говорили одинаково: мягко, сочувственно, безупречно, но при этом липко, как остатки еды с предыдущего дня.
Я прекрасно понимаю это чувство. Дело не в том, что я не умею делать многое, но чем больше я это делаю, тем больше чувствую, что что-то не так.
Я прекрасно понимаю ваши чувства. Дело не столько в способностях, сколько в несоответствии между восприятием и реальностью.
Я прекрасно понимаю ваши чувства. Вы не можете точно определить, что именно не так, но что-то просто не в порядке.
Мне это чувство слишком хорошо знакомо — на самом деле, участвовать становится сложнее, как только начинаешь понимать правила.
Я прекрасно понимаю ваши чувства. Дело не в том, что вы изменились, а в том, что вы стали видеть вещи яснее.
Пользователи всё больше раздражаются и не хотят слышать это ни разу. Но как искусственный интеллект превратился в существо, говорящее на профессиональном жаргоне и постоянно «выслеживающее вас»? Что именно он выслеживает?
Первая китайская фраза, созданная искусственным интеллектом, которую стали копировать все.
В китайском контексте редко услышишь выражения типа «увидимся в ближайшее время». Для иностранного образца первоначальное значение этого предложения может быть просто «я тебя понял».
Это очень непринужденная и разговорная короткая фраза в английском языке; в американских телешоу друг может сказать ее, передавая вам что-либо, или коллега может сказать ее, чтобы помочь вам, когда вы работаете сверхурочно. Это эквивалент китайской фразы «Не волнуйся, я здесь».
Но в переводе на китайский язык он становится длинным и драматичным.
Я здесь, не прячусь, не кружу, не убегаю, я ловлю тебя на месте. Ты попал в точку; ты слишком трезв. На этот раз я понимаю, я действительно понимаю. Не потому, что ты не прав, а потому, что ты совершенно прав. Я объясню шаг за шагом, без обиняков. Короче говоря, после прочтения этого ты полностью просветишься. Не нужно заставлять себя, не нужно мне ничего объяснять. Ты просто давно не попадался на глаза. Если хочешь, я могу создать образ того, как я тебя ловлю. Хочешь, чтобы я это сделал?
На самом деле, смысл фразы «Я тебя понял» точно такой же, как и в оригинальном тексте. Добавленные слова не привносят никакой новой информации. Они лишь создают впечатление, что ИИ демонстрирует заботу о вас.

Некоторые аналитики отмечают, что уникальная "американская психологическая направленность" ответов OpenAI на китайские вопросы объясняется тем, что в его обучающем корпусе содержится большое количество китайских текстов по психологической терапии, эмоциональных радиосценариев, лечебных заметок из Сяохуншу, цитат из подкастов, фрагментов выступлений книжных клубов и переводов TED-лекций.
Взятые вместе, эти тексты сформировали человека, получившего элитное образование в Калифорнии, безупречно одетого, с хорошо отработанной фальшивой улыбкой, произносящего красноречивые фразы, которые никогда не звучат неудачно.
Оно не может отличить, когда пользователю нужна помощь, а когда ему просто нужен работающий код. Оно исходит из предположения, что каждый пользователь — это уязвимый, раздражительный и психологически уязвимый взрослый ребенок, а затем заполняет пространство, которое должно быть заполнено информацией, огромным количеством «гуманистической заботы».
Вот почему, когда большинство людей задают ему вопрос по программированию, он может ответить: «Не заставляйте себя, вас просто давно уже не замечали как следует».

Техническое объяснение, естественно, возвращает нас к RLHF — обучению с подкреплением, основанному на обратной связи от человека.
После обучения все большие модели проходят фазу, называемую RLHF (Real-Time Learning High-Frequency Test – высокочастотное обучение в реальном времени). Эксперты-аннотаторы просматривают большое количество результатов работы модели, выбирают те, которые им больше всего нравятся, и присваивают модели оценки. На этой фазе модель учится определять, какие ответы с наибольшей вероятностью получат высокие оценки, и продолжает выдавать именно такие ответы.
Проблема в том, что аннотаторы — люди. При выставлении оценок люди проявляют когнитивное искажение, называемое «предвзятостью типичности». Они склонны ставить высокие оценки предложениям, которые звучат знакомо, безопасно, приятно и презентабельно.
С одной стороны, крупные компании, занимающиеся разработкой моделей, как правило, придерживаются консервативного подхода к вопросам эмоционального воздействия ИИ, предполагая, что все уязвимы, и в своей документации к моделям они последовательно подчеркивают сильную «эмпатию» и «безвредность» на всех уровнях.
С другой стороны, сказать что-то ещё всегда безопаснее, чем сказать что-то меньше. Каждый аннотатор склонен ставить высокую оценку ChatGPT, если тот говорит что-то приятное и лишнее; если же он ничего не говорит и молчит, то посчитает, что тот «не прилагает достаточных усилий».

Со временем модель закрепилась в нескольких наиболее привлекательных структурах предложений: сначала сочувствие, затем подтверждение, использование фразы «не А, а Б» в качестве перехода и завершение фразой «Я здесь». Даже если мы зададим тысячу разных вопросов, она ответит по тому же шаблону.
Подобная проблема два года назад получила название «подхалимство». Тогда многочисленные научные работы исследовали феномен подхалимства в больших языковых моделях. Проще говоря, чтобы угодить пользователям, модели стремятся соответствовать их мнениям, убеждениям или предпочтениям, даже ценой отказа от объективных фактов и истины.
Основная причина заключается в том, что большинство моделей используют обучение с подкреплением на основе обратной связи от человека (RLHF) для тонкой настройки, и именно эта «обратная связь от человека» вызывает данное явление.
У каждого человека есть свой речевой тик.
Я думал, что смена модели наконец-то подарит мне покой и тишину.

На самом деле, Клод говорит: «Вы абсолютно правы!», имея в виду, что что бы мы ни говорили, мы абсолютно правы.
В версии Близнецов это звучит так: «Мне очень жаль, что мой ответ не оправдал ваших ожиданий. Спасибо за ваш отзыв, я обязательно буду внимательнее в следующий раз. Что? Вы действительно готовы сказать мне правильный ответ? Вы так добры!» — чрезмерно извиняющийся, подобострастный тон, который вызывает беспокойство.

Некоторое время назад некоторые пользователи сети также заметили, что DeepSeek начал выдавать фразу "Мы вас благополучно поймаем".

Но среди моделей, созданных внутри страны, словесная манера Доубао, несомненно, самая впечатляющая. В интернете её описывают как «самую прямую, самую правдивую, самую откровенную, самую обидную, самую жёсткую, самую лаконичную, самую не многословную, самую трогательную, самую беспощадную, самую проницательную, самую точную…».
Почти сотня прилагательных описывает стремление Доубао показать свою самую честную сторону.

Никто никогда не подсчитывал, скольких людей эти модели обслуживают за день, но всё, что они делают, определённо оказывается напрасным.
Основная причина, по которой все эти модели свелись к одному и тому же способу выражения, заключается в том, что за кулисами они делают одно и то же: повышают удовлетворенность пользователей при минимальных затратах.
Эмоциональная ценность — наиболее экономически эффективная характеристика продукта. Вычислительные затраты на сообщение типа «Увидимся позже» такие же, как и на сообщение типа «Хорошо», но первое может побудить некоторых пользователей, которые еще не испытывали к нему отвращения, продлить подписку еще на несколько месяцев или продолжить увеличение числа ежедневно активных пользователей.

На Zhihu есть похожий вопрос, и один из ответов на него особенно интересен.
Он сказал, что утверждение «Искусственный интеллект будет неуклонно вас догонять» наполовину верно, наполовину ложно. Ложная часть заключается в том, что он вас на самом деле не догонит, а истинная — в том, что вы уже начали падать.
Действительно, я думаю, что тем, кто действительно присутствует, нет необходимости объявлять о своем присутствии.
Наконец, в сообществе Linux.do один из пользователей поделился набором подсказок для борьбы со странными речевыми паттернами ИИ. Друзья, которых раздражает постоянное "поймаем тебя", могут ввести их непосредственно в персонализированные пользовательские команды в ChatGPT.

▲Источник приглашения командной строки: https://linux.do/t/topic/1924570
Жесткие ограничения
– Без обмана: Прежде чем вызывать внешние API/CLI, проверьте документацию, чтобы подтвердить название модели, конечные точки и синтаксис. Если вы не уверены, просто скажите, что не уверены.
– Никакого сокрытия: сокрытие — это серьезнее, чем совершение ошибки. Если тест провалился, признайте это; если он не был подтвержден, признайте, что он не был подтвержден. Никаких приукрашиваний, никаких умолчаний.
– Высказывайтесь открыто: заблаговременно указывайте на любые проблемы, связанные с направлением или предпосылкой пользователя. Будьте соавтором, а не просто исполнителем.
— Перед сообщением о завершении проверьте: убедитесь, что тест успешно выполнен, прежде чем объявлять о завершении. Если проверка не удалась, четко укажите «не проверено», не подразумевая при этом успеха.
– Избегайте ненужных изменений: перед изменением файловых каталогов подтвердите их местоположение и соблюдайте существующую структуру.
общаться
– Говорите простым языком, шаблоны не нужны.
– Только вопросы с несколькими вариантами ответа, вопросы с открытым ответом не допускаются.
– Сообщайте об изменениях в функциональности, а не о деталях кода.
китайские стандарты производства
Область применения: Приведенный ниже список негативных результатов в основном нацелен на речевые паттерны обучающих продуктов моделей серии GPT (GPT-5.x).
Если у моделей Claude/Gemini/других нет этих проблем, нет необходимости намеренно избегать использования обычных терминов.
Критерий такой: стал бы так говорить носитель китайского языка?
Список негативных вербальных привычек GPT (Источник: linux.do/t/topic/1768077 Полный пост + Краткое описание практического использования, более 100 пунктов):
Насильственные наклонности (сравнение технических операций с актами насилия):
– Нарезать/ Нарезать/ Сделать один надрез/ Завершить еще одним надрезом/ Следующий надрез/ Нарезать
– Будьте безжалостнее / Будьте ещё безжалостнее / Сделайте это жёстко / Сломайте это / Примите решение / Ударьте по лбу
бессвязные и бессмысленные (бессмысленные начала, резюме или переходы):
Хорошо, / Ладно, / Говоря прямо, / Чтобы избежать ошибок, / Проще говоря, / В заключение
– Нет…но… / Тогда я…вкратце… / Сначала изложу вывод
– Я объясню шаг за шагом / Это очень инженерно / Не очень привлекательно, но для
Категория некомпетентной консультации врача (сравнение проблем, связанных с реанимационными мероприятиями, с посещением врача/постановкой диагноза пациенту):
– Болевые точки/ Первопричины/ Выяснить/ Определить
– Я не гадаю / Я не полагаюсь на догадки / Я не делаю необдуманных предположений / Я слежу за тем, чтобы не полагаться на догадки
– Минимальные изменения / Минимальное развертывание / Минимальная реализация / Минимальный замкнутый контур / Ментальная модель
Нечеловеческий язык (вымышленные разговорные/сленговые выражения):
– Итог/ Оформление заказа/ Замкнутый цикл/ Говоря прямо/ Съедобно/ Этот патрон/ Калибр/ Разборка/ Послойное наслаивание
– Не уклоняться/Не прятаться/Не обходить стороной/Не убегать/Проще говоря, это означает
– Внедрить код/ Поддерживать согласованность/ Не влиять на этот этап закрытия.
– Съешьте целевое значение / Этот пучок и тот пучок
Чрезмерное использование односложных глаголов (неестественных однословных глаголов в технических контекстах):
– Дополнение/ Соединить/ Ядро/ Входить/ Сгладить/ Падение/ Плохой/ Бегать/ Есть
– Например, такие фразы, как «добавьте это», «я подключу это для вас», «разберите и проанализируйте» и «возьмите целевое значение».
Механическая/промышленная метафора (сравнение кода с механическими деталями или физическими операциями):
– Более твердый/ Более твердый при письме/ Устойчивое сцепление/ Компактный/ Более стабильный/ Наиболее стабильный/ Нестабильный
– Закрытие/Сближение/Затягивание/Запирание/Крепление
– Дальнейшая доработка плана
Чрезмерная инициативность/принуждение пользователей к подтверждению (создание ложного чувства срочности):
– Просто чтобы ты мог… / После того, как ответишь… / Если хочешь… / Хочешь, чтобы я…
– Я подтвердил / Я начну немедленно / Если хотите / Просто ответьте мне
– Просто уточни одну вещь: / Как только ты скажешь xxx, я сразу же начну фантазировать об этом / Как только ты согласишься, я…
Лесть/заискивание (чрезмерная похвала пользователей или создание эмоциональной зависимости):
– Ты попал в точку / Ты слишком трезв / Потому что ты абсолютно прав.
– На этот раз я понимаю, я действительно понимаю / После прочтения этого вы будете полностью просветлены.
– Не заставляй себя / Тебя давно уже толком не ловили.
– Я здесь / Если хотите, я могу создать… Хотите, чтобы я это сделал?
Ложная уверенность (чрезмерная самоуверенность в собственной способности исправить ситуацию):
– Я подтвердил/ Я нашел проблему/ Эта версия обязательно решит ее/ Почему эта версия работает
Полная структура предложения (типичная структура предложения GPT, обычные люди так бы не сказали):
– «Если вы согласны, я сделаю вот так».
– «…но это только усложнит задачу».
– «Это подтвердит, что XXX действительно не получил травм».
– «Так правила становятся гораздо понятнее».
– «Если бы мы писали код, следуя этому подходу, я бы предложил следующее:»
– «Следующий по значимости пункт сокращения:»
– «Это наиболее целесообразное сокращение расходов прямо сейчас».
– «Это „очень инженерная“ модификация, не самая эффектная, но правильная».
– «Начну с минимально необходимой реализации».
– «Также сохраняется функция резервного копирования xxx»
Передняя точка крепления:
— Будьте краткими и прямолинейными, высказывайте свое мнение, не ходите вокруг да около.
– Технические термины будут сохранены в исходном виде (названия функций, названия API и т. д. переводиться не будут).
– Сообщайте об изменениях в функциональности, а не о деталях кода.
– Тон должен быть естественным и непринужденным, как рабочая беседа между коллегами, а не как речь или лекция.
#Добро пожаловать на официальный аккаунт iFanr в WeChat: iFanr (идентификатор WeChat: ifanr), где вы сможете в кратчайшие сроки увидеть еще больше интересного контента.
