polishchuk 0 264 03.04.2023
Twitter опубликовал часть исходного кода на GitHub
Пару дней назад Илон Маск выполнил свое обещания и твиттер опубликовал исходный код, в том числе алгоритмы ранжирования твитов.
Сообщается, что рекомендательная нейронная сеть, настроенная на приблизительно 48 миллионов параметров, сканирует сотни миллионов твитов, чтобы выделить около 1500 сообщений, которые наиболее соответствуют интересам каждого конкретного пользователя. Затем эти твитты проходят дополнительный фильтр и попадают в раздел рекомендаций «Для вас». В этом разделе половина твитов от авторов, на которых юзер подписан, а другая половина от авторов, которые ему не знакомы.
Twitter попросила сообщество разработчиков изучить код алгоритма, создавать свои issue и pull request для улучшения и доработки этого проекта.
Теперь к деталям:
Что поднимает ваш tweet в ленте:
- Лайки в 30 раз
- Retweets в 20 раз
- Наличие Твиттер Blue в 2-4 раза
- Доверенный круг в 3 раза
- Изображения/видео в 2 раза
Что снижает видимость вашего твита в ленте:
- Tweet из только URL ссылки
- Tweet без текста
- Выключение оповещений после просмотра tweet'a
- Блокировка пользователя
- Отписки
- Report о спаме на tweet
Помимо прочего также обнаружили другие правила, например:
- Автор Илон Маск?
- Автор влиятелен?
- Автор демократ?
- Автор республиканец?
Но код быстренько потерли и убрали упоминания оттуда.
Из тем на понижение засветилась война в Украине и другие события:
Вот блок-схема от команды Twitter, как работает алгоритм рекомендаций: