Только что OpenAI выпустила o3-pro, модель с открытым исходным кодом была отложена, а Ultraman опубликовал длинную статью: Gentle Singularity

ChatGPT был недоступен целую ночь, и пользователи сети по всему миру пребывали в хаосе.
Решение OpenAI также было несколько нетрадиционным. Пока он был занят исправлением ошибок, он внезапно запустил модель o3-pro.

Начиная с сегодняшнего дня, o3-pro станет доступен в первую очередь пользователям Pro и Team, заменив оригинальный o1-pro в селекторе моделей, а пользователям Enterprise и Edu придется подождать до следующей недели.
Все, что я могу сказать, это то, что жизни пользователей Plus — это тоже жизни.
o3-pro уже здесь, мощнее, но и медленнее
Являясь усовершенствованной версией модели рассуждений o3, o3-pro лучше справляется с решением сложных задач и дает более точные ответы, особенно в таких сценариях, как научные исследования, программирование, образование и письмо, где она имеет очевидные преимущества.
Кроме того, он также поддерживает вызов полного набора инструментов ChatGPT, таких как веб-поиск, анализ файлов, обработка изображений, программирование на Python, персонализация памяти и т. д., с более эффективными общими возможностями выполнения и интеграции.

Конечно, с появлением большего количества функций скорость отклика также немного снизилась.
Поскольку планирование задач и вызовы цепочки инструментов сложнее, скорость отклика o3-pro, как правило, выше, чем у o1-pro, поэтому он больше подходит для использования в сценариях, где требуется тщательное мышление или высокие требования к точности ответа.
В официальной экспертной оценке рецензенты в целом пришли к выводу, что o3 Pro идет на шаг дальше, чем модель o3 с точки зрения ясности выражения, полноты ответов, способности выполнять инструкции и логической точности, и особенно подходит для задач, требующих углубленного вывода, таких как наука, образование, программирование, бизнес и письмо.

Академические оценки также подтвердили это: общая производительность o3-pro неизменно превосходит o1-pro и o3.

Для более научной оценки стабильности модели OpenAI ввела стандарт оценки «четыре правильных ответа» — только если модель дает правильный ответ четыре раза подряд, она считается успешной.

Можно сказать, что этот механизм значительно повысил требования к последовательности рассуждений.
Стоит отметить, что на этот раз o3 Pro не выпустила отдельную системную карту. OpenAI заявила, что поскольку o3-pro и o3 используют одну и ту же базовую модель, ее полное описание безопасности можно найти в системной карте o3.
Однако o3 Pro все еще имеет некоторые функциональные ограничения, такие как отсутствие поддержки временных разговоров, генерации изображений и функций Canvas. Для генерации изображений пользователям по-прежнему необходимо использовать модели GPT-4o, o3 или o4-mini.
В преддверии официального запуска некоторым разработчикам был предоставлен ранний доступ к o3 Pro.
Бен Хилак, бывший инженер-программист SpaceX и дизайнер Apple VisionOS, на прошлой неделе получил ранний доступ к o3-pro, а его впечатления также были опубликованы в социальных сетях генеральным директором OpenAI Сэмом Альтманом.

В частности, Бен и его соучредитель Алексис потратили время на то, чтобы собрать все заметки с прошлых совещаний по планированию Raindrop, цели и даже голосовые заметки, а затем попросили o3-pro попытаться создать документ по стратегическому планированию.
Результаты, полученные с помощью финальной модели, их шокировали: содержание было понятным, а структура — полной. Она не только охватывала цели и сроки, но и автоматически расставляла приоритеты и даже четко указывала, какой контент следует вырезать.
По мнению Бена, какой бы мощной ни была модель, если ее невозможно интегрировать в реальную рабочую среду, ей будет сложно стать по-настоящему полезным «участником».
o3 Pro значительно улучшил понимание сложных сред, выражение возможностей инструмента, постановку соответствующих вопросов и разумное распределение ресурсов. Хотя модель иногда имеет проблему «переосмысления» при отсутствии контекста, общая производительность значительно лучше, чем у предыдущей версии.

▲o3 pro (слева) против o3 (справа): o3 pro явно лучше понимает свои ограничения и возможности.
Сравнивая с аналогичными моделями, Бен похвалил то, что, хотя Claude Opus имеет сильное ощущение размера, его фактическая производительность посредственная; в то время как o3-pro более практичен и принадлежит «совершенно другому измерению».
В классической улучшенной версии челленджа с шестиугольным прыгающим мячом блогер @flavioAd полагает, что o3-pro — это первая модель, которая может почти идеально справиться с реальным эффектом столкновения мяча со стеной.

ARC-AGI — это эталонная среда, используемая для оценки того, обладают ли языковые модели способностями к рассуждениям, подобными возможностям искусственного интеллекта (AGI).
Он предназначен для проверки способностей системы искусственного интеллекта к абстрактному рассуждению и решению проблем при столкновении с новыми проблемами, аналогично способности людей быстро адаптироваться и находить решения в новых ситуациях.
Результаты последних испытаний следующие:

Как видите, o3-pro немного лучше справляется со сложными задачами, но улучшение незначительное, а стоимость увеличивается с увеличением сложности.
Enterprise — вторая кривая, o3-pro — новый краеугольный камень
Когда o3-pro был выпущен, генеральный директор OpenAI Сэм Альтман также объявил на социальной платформе важную новость: цена модели o3 снизилась на 80%.
В настоящее время модель o3 взимает 2 доллара за миллион входящих токенов и 8 долларов за миллион исходящих токенов.
Директор по продуктам OpenAI Кевин Вайль написал, что благодаря положительным отзывам пользователей лимит использования модели o3 для пользователей Plus будет увеличен вдвое, и корректировка будет внедряться постепенно.
Для сравнения, o3-pro взимает 20 долларов за миллион вводимых токенов и 80 долларов за миллион выводимых токенов, что на 87% дешевле, чем o1-pro.

OpenAI рекомендует включить «фоновый режим» при использовании o3-pro: задачи, выполнение которых занимает много времени, будут запускаться асинхронно, чтобы избежать проблем с тайм-аутом запроса.
Чиновники заявили, что причиной такого большого снижения цен является комплексная оптимизация OpenAI архитектуры сервиса вывода. Модель не изменилась, но вывод стал более эффективным, поэтому цена была скорректирована соответственно.
С другой стороны, это может быть неотделимо от новых разработок OpenAI в области вычислительных ресурсов.
С момента выхода ChatGPT ограничение вычислительных ресурсов всегда было «сложной проблемой» для OpenAI. Из-за ограничений обязывающего соглашения Microsoft облачный сервис Azure был единственным поставщиком инфраструктуры ЦОД для ChatGPT.

По данным агентства Reuters, полученным рано утром со ссылкой на трех человек, знакомых с ситуацией, в целях снижения вычислительной нагрузки OpenAI в прошлом месяце достигла соглашения о сотрудничестве с Alphabet (материнской компанией Google) о представлении Google Cloud в качестве дополнительного поставщика облачных услуг.
Такое сотрудничество одновременно и неожиданно, и разумно.
С одной стороны, ChatGPT представляет собой одну из самых больших угроз поисковому бизнесу Google за последние годы, и Google Cloud теперь стал ее новым покровителем.
С другой стороны, продажи Google Cloud в 2024 году достигнут $43 млрд, что составит 12% от выручки Alphabet. Поэтому, чтобы превзойти Amazon и Microsoft на рынке облачных вычислений, Google Cloud взяла на себя обязательство играть роль «нейтрального поставщика вычислительной мощности».
Заключение этого сотрудничества станет большой выгодой для Google Cloud. На момент публикации OpenAI, Google и Microsoft не прокомментировали этот отчет.

В то же время OpenAI ускоряет развертывание сетей инфраструктуры ИИ по всему миру.
Ранее в этом году OpenAI также продвинула проект Stargate стоимостью 500 миллиардов долларов совместно с SoftBank и Oracle, а также подписала многомиллиардное соглашение о закупке вычислительной мощности с CoreWeave.
Высокие инвестиции предполагают высокую отдачу. Согласно сообщениям зарубежных СМИ на этой неделе, в прошлом году ARR OpenAI составляла около 5,5 млрд долларов США, а сейчас она превысила 10 млрд долларов США, увеличившись почти на 80%.
Следует отметить, что $10 млрд включают только ориентированные на потребителя продукты, платные продукты ChatGPT и доход от API, и не включают доход от лицензирования Microsoft и другие крупные транзакции. В сфере бизнеса ARR относится к ежегодному повторяющемуся доходу, который компания получает от услуг подписки или долгосрочных контрактов. Он отражает предсказуемый и непрерывный поток доходов и часто используется для измерения здоровья и потенциала роста бизнеса с подписной моделью.
Проще говоря, компания, предоставляющая программное обеспечение как услугу (SaaS), имеет договор подписки с клиентом, который платит 1000 юаней в год. Если таких клиентов 100, то ARR компании составляет 1000 юаней × 100 = 100 000 юаней.

На прошлой неделе главный операционный директор OpenAI Брэд Лайткап также сообщил, что в настоящее время OpenAI имеет 3 миллиона платящих коммерческих пользователей, что выше 2 миллионов, о которых сообщалось в феврале. Можно сказать, что в настоящее время OpenAI находится в очень хорошей ситуации.
Снижая стоимость базовых моделей с помощью o3 и улучшая способность решать сложные задачи с помощью o3-pro, OpenAI ориентируется на высокоценные сценарии и пытается открыть путь между двумя концами к следующей кривой роста: корпоративным сервисам.
Самые мощные в мире модели выпускаются одна за другой, и OpenAI также является одной из них в этой волне ИИ.

Благодаря более мощным моделям, более стабильной вычислительной мощности и более обильным вызовам инструментов ChatGPT теперь не просто чат-бот, а партнер по повышению производительности, призванный взять на себя самую продуктивную сферу применения — рабочее место.
o3-pro — новый краеугольный камень на этом пути.
Сможет ли он поддержать амбиции OpenAI, покажет время. Но, по крайней мере, сейчас он заставил людей переосмыслить его.
Модель будет доступна с открытым исходным кодом, но не в июне.
Только что Сэм Альтман сообщил в социальных сетях, что OpenAI рассчитывает выпустить модель с открытым исходным кодом и публичными весами уже этим летом, а не в июне.

Кроме того, Альтман только что запустил свой новый личный блог The Gentle Singularity, в котором исследует влияние развития ИИ на человеческое общество, и отмечает, что это может быть последняя статья, которую он напишет без помощи ИИ.
По его словам, с точки зрения теории относительности сингулярности возникают постепенно, тогда как слияние происходит медленно.
Прилагаю оригинальный адрес блога: https://blog.samaltman.com/the-gentle-singularity

Нежная Сингулярность
Мы пересекли горизонт событий, взлет начался, человечество близко к созданию цифрового сверхразума, и, по крайней мере, пока это не так странно, как кажется.
Роботы пока не вездесущи на улицах, и большинство людей не взаимодействуют с ИИ целый день. Люди все еще умирают от болезней, полеты в космос все еще затруднены, а наше понимание вселенной все еще очень ограничено.
Тем не менее, мы недавно построили системы, которые во многих отношениях умнее людей и которые могут значительно усилить человеческий результат. Самые невероятные части уже достигнуты — научные прорывы, которые позволили создать такие системы, как GPT-4 и o3, были завоеваны с трудом, но они продвинут нас гораздо дальше.
ИИ внесет свой вклад в мир многими способами, но улучшения в качестве жизни, которые ИИ принесет за счет ускорения научного прогресса и повышения производительности, будут колоссальными; будущее обещает быть намного лучше настоящего. Научный прогресс является важнейшим двигателем общего прогресса; волнительно думать о том, насколько больше мы можем достичь.
В каком-то смысле ChatGPT уже более мощный, чем кто-либо в истории. Сотни миллионов людей полагаются на него каждый день, и задачи становятся все более и более важными; небольшая дополнительная возможность может иметь огромное положительное влияние, в то время как крошечное несоответствие может также вызвать огромное отрицательное влияние при использовании сотнями миллионов людей.
В 2025 году мы увидим интеллектуальных агентов, которые смогут выполнять настоящую когнитивную работу; способ написания компьютерного кода претерпит революцию. В 2026 году мы, вероятно, увидим системы, которые смогут генерировать оригинальные идеи. В 2027 году, возможно, роботов, которые смогут выполнять задачи в реальном мире.
Больше людей смогут создавать программное обеспечение и искусство. Но спрос на то и другое в мире также резко возрастет. Эксперты, которые используют эти новые инструменты, скорее всего, все еще будут намного лучше новичков. В целом, один человек добьется гораздо большего в 2030 году, чем в 2020 году, и изменение будет кардинальным, и многие люди научатся извлекать из этого пользу.
В наиболее важных отношениях 2030-е годы, возможно, не станут радикальными переменами. Люди по-прежнему будут любить свои семьи, давать волю своему творчеству, играть в игры и плавать в озерах.
Но в других отношениях, которые все еще будут иметь значение, 2030-е годы, вероятно, будут сильно отличаться от любой предыдущей эпохи. Мы не знаем верхних пределов человеческого интеллекта, но мы собираемся это выяснить.
К 2030-м годам интеллект и энергия — идеи и способность их реализовывать — станут чрезвычайно обильными. Эти два фактора долгое время были фундаментальными ограничениями человеческого прогресса; если бы интеллект и энергия были в изобилии (плюс хорошее управление), мы теоретически могли бы достичь чего угодно.
Сейчас мы живем с удивительным цифровым интеллектом, и после первоначального шока большинство людей привыкли к нему. Скоро мы перейдем от восхищения способностью ИИ писать прекрасные абзацы к ожиданию, что он напишет целые романы; от изумления его способностью диагностировать болезни к ожиданию, что он разработает лекарства; от изумления его способностью писать небольшие программы к надежде, что он сможет создавать целые компании. Таков путь Сингулярности: чудеса становятся обыденностью, а затем становятся отправной точкой.
Ученые сообщили нам, что они работают в два-три раза эффективнее, чем раньше. Одна из важнейших причин, по которой продвинутый ИИ так важен, заключается в том, что мы можем использовать его для ускорения самого исследования ИИ. Мы можем открыть новые вычислительные материалы, лучшие алгоритмы и даже больше неизвестных возможностей. Если мы сможем завершить десять лет исследований за один год или даже за один месяц, скорость прогресса, очевидно, будет совсем другой.
Отныне имеющиеся у нас инструменты помогут нам открыть больше научных идей и помогут нам в создании более продвинутых систем ИИ. Конечно, это еще не полностью автономно обновляющий свой код ИИ, но это действительно начальная форма «рекурсивного самосовершенствования».
Происходят и другие самоусиливающиеся циклы. Экономическая ценность ИИ приводит в движение маховик строительства инфраструктуры, и все больше ресурсов используется для работы этих мощных систем ИИ. И роботы, которые могут строить других роботов (и, в некотором смысле, центры обработки данных, которые могут строить другие центры обработки данных), уже не за горами.
Если бы нам пришлось построить первый миллион человекоподобных роботов традиционным способом, но затем они могли бы взять на себя всю цепочку поставок — добычу и переработку полезных ископаемых, вождение грузовиков, управление заводами и т. д. — и построить больше роботов, заводов по производству микросхем и центров обработки данных, темпы прогресса были бы совсем другими.
Поскольку производство в центрах обработки данных становится все более автоматизированным, стоимость интеллекта в конечном итоге должна приблизиться к стоимости электроэнергии. (Многие люди обеспокоены тем, сколько энергии ChatGPT использует на запрос; средний запрос потребляет около 0,34 ватт-часов, что примерно равно работе духовки в течение чуть более секунды или использованию эффективной лампочки в течение нескольких минут. Кроме того, каждый запрос использует около 0,000085 галлона воды, что составляет примерно одну пятнадцатую чайной ложки.)
Темпы технологического прогресса будут продолжать ускоряться, а люди очень легко приспосабливаются. Хотя будут сложные проблемы, такие как исчезновение целых категорий рабочих мест, с другой стороны, богатство мира будет расти так быстро, что у нас будет возможность серьезно рассмотреть новые политики, которые раньше были невозможны. Мы не можем установить новый общественный договор сразу, но мы оглянемся назад десятилетия спустя и увидим, что накопление постепенных изменений привело к огромной трансформации.
Если судить по истории, мы всегда найдем новые занятия, новые желания и быстро приспособимся к новым инструментам (хорошим примером служат изменения в профессиях после промышленной революции). Ожидания людей возрастут, но их способности также быстро возрастут, и мы будем жить лучше. Мы будем создавать все больше и больше прекрасных вещей друг для друга. У людей есть долгосрочное и важное преимущество перед ИИ: мы естественным образом обеспокоены другими людьми и тем, как они думают и действуют, в то время как у нас нет никаких чувств к машинам.
Если бы фермер, живущий натуральным хозяйством, тысячу лет назад увидел, как мы живем сейчас, он бы подумал, что мы делаем «фальшивую работу», как будто мы просто развлекаемся, потому что у нас много еды и невообразимая роскошь. Я надеюсь, что мы будем видеть эту работу в том же свете и через тысячу лет — как «совершенно фальшивую», но, без сомнения, эти люди будут считать свою работу чрезвычайно важной и приносящей удовлетворение.
В будущем нас ждет много новых чудес. Трудно представить, каких прорывов мы достигнем к 2035 году. Возможно, в этом году мы решим проблемы физики высоких энергий, а в следующем — колонизуем космос. Или же мы можем совершить крупный прорыв в материаловедении в этом году и реализовать в следующем году действительно высокоскоростной интерфейс мозг-компьютер. Многие люди выберут продолжать жить так, как они живут сейчас, но обязательно найдутся люди, которые выберут «подключиться к системе».
Заглядывая вперед, эти вещи сейчас могут показаться невообразимыми. Но когда вы действительно их испытаете, они могут быть удивительными, но все еще под контролем. С точки зрения относительности, сингулярность происходит постепенно, а конвергенция постепенна. Мы поднимаемся по этой длинной дуге экспоненциального роста технологий; она всегда ощущается как крутая вертикаль, когда вы смотрите вперед, и выглядит как ровная линия, когда вы оглядываетесь назад, но на самом деле это плавная кривая. (Оглядываясь на 2020 год, если бы мы сказали тогда, что будем близки к AGI в 2025 году, это прозвучало бы безумно, но по сравнению со всем, что произошло за последние пять лет, возможно, нынешний прогноз не такой уж безумный.)
Конечно, перед нами еще много серьезных проблем. Нам нужно решить вопросы безопасности на техническом и социальном уровнях, но после этого самое главное — обеспечить широкую доступность сверхразума, поскольку он связан с экономической структурой. Лучший путь вперед может включать следующие шаги:
Во-первых, нам необходимо решить «проблему согласования», то есть мы можем гарантировать, что система ИИ сможет учиться и реализовывать наши коллективные истинные желания в долгосрочной перспективе (социальные сети являются примером нарушения согласования: алгоритмы рекомендаций очень хорошо заставляют вас продолжать прокручивать страницу, но они делают это, эксплуатируя краткосрочные предпочтения мозга, чтобы подавлять ваши долгосрочные цели).
Далее сосредоточьтесь на том, чтобы сделать сверхинтеллект дешевым, вездесущим и далеким от централизованного контроля одного человека, компании или страны. Общество устойчиво, креативно и способно быстро адаптироваться. Если мы сможем высвободить коллективную волю и мудрость, мы будем учиться и быстро приспосабливаться, несмотря на ошибки и сбои, чтобы максимизировать выгоды и минимизировать риски. Предоставление пользователям большей свободы в широких рамках, установленных обществом, будет иметь решающее значение. Чем раньше мир начнет обсуждение этих рамок и того, как определить «коллективное выравнивание», тем лучше.
Мы (вся индустрия, а не только OpenAI) создаем «мозг» для мира. Этот мозг будет высоко персонализированным и простым в использовании для всех; его пределы будут определяться нашими хорошими идеями. Долгое время технологическое сообщество смеялось над этими «идейными людьми» — теми, у кого есть идея, но они не могут ее воплотить. Теперь, похоже, их время наконец пришло.
OpenAI сегодня — это много чего, но по сути это все еще компания по исследованию сверхинтеллекта. Нам еще предстоит много работы, но путь освещен, и тьма быстро отступает. Мы невероятно благодарны за то, что можем это сделать.
«Смартфоны почти бесплатны» уже почти здесь. Это может показаться безумием, но если бы мы сказали вам в 2020 году, что доберемся до этого в 2025 году, это прозвучало бы безумнее, чем если бы мы предсказывали 2030 год сейчас.
Давайте плавно, экспоненциально и уверенно перейдем в эпоху сверхразума.
#Добро пожаловать на официальный публичный аккаунт WeChat iFanr: iFanr (WeChat ID: ifanr), где вам будет представлен еще более интересный контент как можно скорее.
iFanr | Исходная ссылка · Просмотреть комментарии · Sina Weibo