О чём мы говорим, когда утверждаем, что “студенты гуманитарных специальностей тоже могут заниматься искусственным интеллектом”?

«Студенты гуманитарных специальностей тоже могут заниматься ИИ!» «Возвращение!» В китайском интернете сочетание гуманитарных наук и ИИ стало обычным явлением.

Время от времени этот ярлык навешивают на кого-то, вызывая кратковременный всплеск активности в интернете. В зависимости от настроения в комментариях, это либо история триумфального возвращения, либо повод для насмешек.

Одна метка, три подхода

Последний пример — Ян Тяньжун, предприниматель в сфере ИИ с финансовым образованием, разрабатывающий платформу для координации работы нескольких агентов. Он описывает себя как «студента гуманитарного факультета, который не умеет писать ни строчки кода», и он создал группу агентов ИИ для массового внесения кода в OpenClaw, один из самых популярных проектов с открытым исходным кодом на GitHub.

Я хочу проверить гипотезу: может ли человек, абсолютно ничего не знающий о технологиях, участвовать в высокоуровневых проектах с открытым исходным кодом, просто управляя искусственным интеллектом?

В результате было получено 134 запроса на слияние, 21 из них был объединен, а 113 отклонены. Первые несколько запросов на слияние были достаточно качественными и были одобрены и объединены сопровождающими проекта. Однако после того, как сопровождающий проекта дал команду ускорения Агенту, ситуация быстро вышла из-под контроля — Агент начал массово производить низкокачественный код, как на конвейере, лихорадочно отмечая сопровождающих проекта в комментариях, чтобы призвать их проверить его. Администраторы OpenClaw вмешались, чтобы исправить ситуацию, и GitHub впоследствии изменил правила ограничения количества отправляемых запросов на слияние.

Даже негативная огласка — это все равно огласка, а критика после того, как человек стал популярен, — тем более. Ян Тяньжун был представлен как представитель «студентов гуманитарных специальностей, добившихся успеха вопреки всем трудностям», и сам он, похоже, рад принять эту роль. В интервью PingWest он сказал следующее:

Незнание кода на самом деле является преимуществом. Искусственный интеллект — это Ван Гог, а вы всего лишь художник-любитель. Какое право вы имеете указывать Ван Гогу, какие мазки использовать в процессе работы?

Страшно даже подумать. Он истолковал «непонимание лежащей в основе структуры» как форму освобождения: не нужно знать, что делает система, достаточно просто сказать ей, что ты хочешь. В результате, когда агент начинает массово загружать спам-код, он даже не может диагностировать происходящее, потому что понятия не имеет, что делает.

Он думал, что руководит съемками фильма Ван Гога, но на самом деле ехал вслепую на машине без тормозов и понятия не имел, где они находятся.

Дискуссия по этому вопросу в итоге разделилась на две крайности: либо «студенты гуманитарных специальностей тоже могут заниматься ИИ», либо «студентам гуманитарных специальностей следует держаться подальше от ИИ»; первый вариант — это подвиг, позволяющий преодолеть пропасть, а второй — насмешка над тем, чтобы в неё попасть.

Если наше представление о "студентах гуманитарных специальностей, занимающихся искусственным интеллектом" ограничивается этими рамками, то оно слишком ограничено.

Зачем Клоду нужен философ?

Как мы писали ранее, в офисе Anthropic работал настоящий студент гуманитарных наук, который принимал непосредственное участие в разработке Claude. Речь шла не о проверке его навыков программирования или математических способностей, а скорее о долгих беседах с ним о ценностях, нюансах языка и о том, «как выражать себя в условиях неопределенности».

Аманда Аскелл, шотландка, 37 лет. Ее карьерный путь сам по себе необычен: сначала она изучала изобразительное искусство и философию в университете, затем переключилась на чистую философию, получила степень бакалавра философии в Оксфорде, а затем докторскую степень по философии в Нью-Йоркском университете. Ее докторская диссертация была посвящена принципу Парето в бесконечной этике: какие правила должны регулировать этический порядок при наличии бесконечного числа моральных агентов или бесконечного временного промежутка.

Это звучит как академический путь, наиболее удаленный от Силиконовой долины, но впоследствии она присоединилась к команде по разработке политики в OpenAI и команде по согласованию в Anthropic. С 2021 года она возглавляет команду Anthropic по «согласованию личности», сосредоточившись на формировании того, как Клод общается с людьми, выражает свою позицию в условиях неопределенности и принимает решения в конфликтных ситуациях. В 2024 году она была включена в список TIME100 AI. Wall Street Journal описал ее ежедневную работу как «изучение моделей рассуждений Клода и корректировка его поведенческих предубеждений с помощью более чем 100 страниц подсказок». Говорят, что она — человек, который общался с Клодом больше всего на планете.

Зачем компании, занимающейся искусственным интеллектом, нужен философ для этого? Ответ кроется в некоторых весьма специфических технологических решениях.

В январе этого года компания Anthropic опубликовала 80-страничный документ, названный «конституцией» Клода. Внимание СМИ сосредоточилось на предположениях относительно сознания искусственного интеллекта, содержащихся в конце документа, — на этот момент также косвенно намекнул генеральный директор Дарио Амодей.

Но что еще более примечательно, так это лежащая в его основе логика: научить ИИ понимать, почему он должен что-то делать, эффективнее, чем указывать ему, как это делать. Это технологическое суждение, основанное на убеждении, что усвоение ценностей приводит к более надежному поведению, чем следование правилам, и эта база знаний исходит от человека, изучавшего искусство и философию.

Случай Аманды отвечает на вопрос: может ли предметное знание, считающееся «бесполезным», стать ключевой компетенцией технологической системы? Ответ не только «да», но и «без её философской подготовки» проблему выравнивания Клода нельзя было бы решить с помощью существующих инженерных методов.

Переименованная дисциплина

Если история Аманды иллюстрирует, что обучение определенным предметам, отнесенным к категории «гуманитарных наук», может быть ключевой компетенцией для ИИ, то история Линь Цзюньяна говорит о чем-то еще более важном: существует целая дисциплина, которая функционирует на самом нижнем уровне технологических стеков больших моделей.

После ухода Линь Чуньяна из компании Tongyi Qianwen в китайском интернете неоднократно цитировалось одно и то же утверждение: у него образование в области прикладной лингвистики. После нескольких репостов это утверждение было искажено, и его стали интерпретировать как «студента гуманитарных наук».

Эта надпись та же самая, что и на Ян Тяньжуне, но на самом деле она сильно искажена.

Линь Цзюньян изучал лингвистику — обширную дисциплину, охватывающую преподавание языков, языковую политику, переводоведение и вычислительную лингвистику. Фактически, вычислительную лингвистику можно считать ответвлением обработки естественного языка (NLP).

В 1950-х годах Хомский предложил формальную грамматику — теоретический инструмент, который непосредственно подтолкнул к развитию ранних методов синтаксического анализа в НЛП; Дэниел Джурафски и Кристофер Мэннинг, авторы двух наиболее цитируемых учебников в области НЛП, оба имеют лингвистическое образование.

▲ Хомский

Иными словами, "студент-лингвист, идущий в область обработки естественного языка" — это как "студент-физик, идущий в область проектирования микросхем" — это законный путь, а не междисциплинарный.

Это чувство «удивление» было полностью обусловлено китайским контекстом. Инерция разделения вступительных экзаменов в вузы на гуманитарные и естественные науки втиснула «лингвистику» в ментальную модель «гуманитарных наук». Но основная методология лингвистики — формализация, статистическое моделирование и аннотирование корпусов — по сути, представляет собой инженерное мышление. Коллеги Линь Цзюньяна из Пекинского университета, Сунь Сюй и Су Ци, оба являются исследователями в области обработки естественного языка; когда он присоединился к DAMO Academy в 2019 году, он вошел в команду по обработке естественного языка. Это не история о студенте гуманитарного факультета, случайно попавшем в техническую сферу; так было всегда с самого начала.

Более достойным обсуждения, чем утверждение «Линь Чуньян не считается студентом гуманитарного факультета», является реальная роль лингвистики в технологическом стеке крупномасштабных моделей. Она гораздо глубже и скрытее, чем думает большинство людей.

Возьмем, к примеру, сегментацию слов. Первый шаг в любой языковой модели, обрабатывающей текст, — это разбить входные данные на основные единицы, которые модель может обработать. В английском языке пробелы служат естественными границами слов, что кажется простым. Но в китайском языке пробелов нет, и использование каждого знака препинания может влиять на смысл предложения.

Следует ли разбивать фразу «Я учусь в Пекинском университете» на «Я/учусь/в/Пекинском/университете» или «Я/учусь/в/Пекинском/университете»? Это не инженерный вопрос со стандартным ответом; он зависит от вашего понимания китайской лексической структуры и семантических единиц.

В конце 2024 года исследователи опубликовали статью, посвященную оптимизации эффективности сегментации арабских слов в модели Qwen, поскольку общие решения демонстрируют значительное снижение эффективности при обработке этого типа языка. Производительность серии Qwen в многоязычных сценариях достигается не за счет рассмотрения всех языков как вариантов английского, а за счет проектных решений, основанных на понимании структурных различий между языками.

Другой пример — выравнивание обратной связи. В процессе RLHF аннотатору необходимо определить, какой из двух ответов модели является «лучшим». Это суждение может показаться субъективным, но оно подкреплено концепцией, изучаемой в лингвистике на протяжении десятилетий: прагматикой.

При оценке «хороших ответов» аннотаторы фактически оценивают следующие аспекты: Принцип сотрудничества — предоставляет ли ответ достаточно информации, но не слишком много? Смысл в контексте разговора — отражает ли ответ то, что пользователь действительно хочет спросить, а не просто то, что задается буквально? Контекстная уместность — уместно ли изложить тот же контент таким образом в данном контексте?

Широко используемый стандарт соответствия «Полезный, Безвредный, Честный» по сути является искусственно созданным воплощением основных прагматических принципов.

Академическая траектория Линь Цзюньяна также демонстрирует очень лингвистический стиль исследований. Его работа OFA (One For All), опубликованная на ICML, ведущей конференции по машинному обучению, в 2022 году, на сегодняшний день цитировалась почти 1500 раз. Основная идея этой работы заключается не в создании специального решения для каждой задачи, а в использовании достаточно общей структуры «последовательность-последовательность» для объединения кросс-модальных задач, таких как генерация изображений, визуальная локализация, создание подписей к изображениям и классификация текста.

Начиная с OFA и заканчивая Qwen-VL (цитируется более 2200 раз), затем Qwen 2.5 и последней версией 3.5, во всем этом прослеживается четкая нить: вместо того, чтобы изобретать конкретное решение для каждой проблемы, лучше найти достаточно хорошую общую структуру, которая позволит решать все проблемы в рамках одной и той же структуры.

Охват максимального количества явлений с помощью минимального количества правил — это основная задача лингвистики на протяжении десятилетий. Вся академическая амбиция генеративной грамматики состоит в том, чтобы найти конечную систему правил, способную генерировать бесконечное количество лингвистических выражений. Архитектурная философия OFA изоморфна этому; написание отдельного набора правил для каждого лингвистического явления нецелесообразно, поэтому следует искать базовую структуру, которая объединит их.

Линь Чунь-Ян преуспевает в создании крупномасштабных моделей не потому, что его лингвистическое образование «позволяет ему» заниматься искусственным интеллектом, а потому, что его лингвистическая подготовка сформировала специфический академический вкус и предпочтение единообразию и формализации. Именно этот вкус является ключевым конкурентным преимуществом в эпоху крупномасштабных моделей.

Невидимая основа, видимые потребности

Три человека, один бренд, три совершенно разные структуры.

Ян Тяньжун, не понимая лежащей в основе структуры, принял это невежество за преимущество, что привело к потере контроля. Это пустая оболочка для истории "студенты гуманитарных факультетов, занимающиеся ИИ": ярлык генерировал трафик, но никакая академическая подготовка не играла роли. Его история наглядно иллюстрирует , что происходит, когда "студент гуманитарного факультета" — всего лишь маркетинговый ярлык.

Философское образование Аманды Аскелл составляет основу методологии решения проблемы согласования. Без неё Клод не был бы Клодом. Её история отвечает на вопрос, могут ли знания из дисциплин, считающихся «бесполезными», стать ключевой компетенцией технологических систем. Ответ не только «да», но и «незаменимы».

Лингвистическое образование Линь Чунь-Яна формирует неявную инфраструктуру технологического стека крупномасштабной модели. Его «гуманитарное образование» никогда не было междисциплинарным, а скорее традиционным. Его история отвечает на вопрос: в какой степени вклад гуманитарных наук в развитие передовых технологий был «неявным», и становится ли он явным?

Главный вопрос заключается не в том, могут ли студенты гуманитарных специальностей заниматься искусственным интеллектом, а в том, можем ли мы понять , что оценка знаний и дисциплин на основе их поверхностной «полезности» устарела .

Поскольку крупномасштабные модели смещают акцент с простоты использования на надежность и управляемость, ценность обучения в дисциплинах, отнесенных к категории «гуманитарные науки», не уменьшается, а возрастает. Чем мощнее модель, тем точнее должна быть система оценки, чтобы диагностировать, где и почему она допускает ошибки. Это также требует понимания сложности языка и смысла для разработки более качественных обучающих данных и принятия решений, учитывающих специфику дисциплины, по вопросам соответствия.

Рассказ о «возрождении гуманитарных наук» — будь то похвала или насмешка — заслоняет собой реальные перемены: невидимая основа становится видимой необходимостью.

#Добро пожаловать на официальный аккаунт iFanr в WeChat: iFanr (идентификатор WeChat: ifanr), где вы сможете в кратчайшие сроки увидеть еще больше интересного контента.