Только что Маск опубликовал исходный код алгоритма рекомендаций для платформы .

Только что Маск официально объявил об открытом доступе к исходному коду алгоритма рекомендаций для платформы Twitter.
Тем временем команда разработчиков XEng подтвердила, что новый алгоритм завершил свою базовую реконструкцию и полностью перенял ту же архитектуру Transformer, что и модель Grok от xAI. Это также означает, что XEng стала первой массовой социальной платформой, сделавшей свою основную логику распределения трафика полностью прозрачной.

После публикации контента в открытом доступе Маск заявил:
«Мы знаем, что этот алгоритм неуклюжий и нуждается в существенной доработке, но, по крайней мере, вы можете видеть, как мы прозрачно и в режиме реального времени работаем над его улучшением. Ни одна другая социальная сеть этого не делает».
Согласно документации с открытым исходным кодом, ключевым проектным решением новой системы рекомендаций является «нулевая разработка признаков человеком».
В частности, отказывается от традиционной системы рекомендаций, основанной на правилах, написанных вручную, и эвристических алгоритмах, и полностью полагается на модель Transformer на основе Grok.
Система больше не определяет субъективно, что constitutes хороший контент; вместо этого она позволяет модели автоматически определять релевантность, обучаясь на истории взаимодействия пользователей (лайки, ответы, репосты и т. д.).
В частности, процесс создания ленты рекомендаций пользователя в основном делится на два ключевых этапа: «запоминание» и «оценка».
На первом этапе процесса «восстановления» контент первоначально поступал из двух источников: внутренняя сетевая система под кодовым названием «Thunder» отвечала за получение последних обновлений из учетных записей, на которые подписаны пользователи, за миллисекунды.
Внешняя сетевая система под кодовым названием «Phoenix Retrieval» использует машинное обучение для поиска потенциально интересного контента в глобальном корпусе данных, который может быть неинтересен пользователям, но может представлять для них интерес. Огромное количество потенциальных публикаций, успешно «отобранных» после первоначального отбора, затем отправляются в ядро второго этапа — систему оценки Phoenix.

Это крупная модель, основанная на модифицированной версии Grok-1. Она не использует предустановленные метки, а напрямую предсказывает вероятность совершения пользователем определенного действия в отношении публикации с помощью «механизма внимания». Это включает в себя как позитивные действия, такие как лайк, ответ и клик, так и негативные, такие как блокировка и отсутствие интереса.
После того как модель рассчитает вероятность, окончательное решение о том, появится ли сообщение на экране пользователя, принимается на основе строгой формулы взвешенного расчета.
Система умножит вероятности различных действий, предсказанных моделью, на соответствующие им веса — например, лайки и пересылка приносят положительные результаты, а блокировка и жалобы приводят к отрицательным оценкам — и, наконец, суммирует их для получения итогового балла, при этом сначала будут отображаться действия с более высокими баллами.

Для обеспечения комфортного чтения и безопасности система использует строгие «фильтры» до и после оценки: до оценки она удаляет дубликаты, прочитанный контент или контент из черных списков; после оценки она выполняет фильтрацию видимости для удаления удаленной или незаконной информации и вводит механизм «разнообразия авторов», чтобы предотвратить постоянное заполнение экрана контентом от одного и того же автора.
Текущая версия с открытым исходным кодом включает в себя основную логику рекомендаций, конвейер обработки кандидатов, написанный на Rust, и подробную архитектурную документацию.
Стоит отметить, что это только начало. Ранее Маск обещал продолжать оптимизировать платформу на основе отзывов сообщества и поддерживать график обновлений с открытым исходным кодом — раз в четыре недели, с подробными примечаниями для разработчиков, которые помогут пользователям понять, какие изменения были внесены.

Вот адрес проекта с открытым исходным кодом на GitHub:
https://github.com/xai-org/x-algorithm
#Добро пожаловать на официальный аккаунт iFanr в WeChat: iFanr (идентификатор WeChat: ifanr), где вы сможете быстро найти еще больше интересного контента.
ifanr | Оригинальная ссылка · Посмотреть комментарии · Sina Weibo