Запуск ChatGPT 5.0: шесть раз я сказал «вау» и три раза — «хмммм»

Команда OpenAI под руководством Сэма Альтмана представила ChatGPT 5.0 сегодня утром в прямом эфире на YouTube . За запуском в прямом эфире или в течение первых трёх часов наблюдали около 600 000 человек. Хотя это и отстаёт от некоторых космических трансляций и мероприятий Чемпионата мира по футболу, аудитория демонстрирует огромный интерес к новой версии ChatGPT. YouTube не раскрывает данные о количестве просмотров, но только два или три мероприятия Apple привлекли значительно больше зрителей в прямом эфире.

Я написал эту статью вчера, предваряя ChatGPT 5.0, и практически всё, чего мы ожидали, было анонсировано. Вот ссылка на эту статью . Ниже я расскажу о том, что меня удивило/впечатлило, а что заставило почесать голову.

Вау, №1. Они прошли долгий путь за два с половиной года.

Многие авторы, включая меня, жаловались на галлюцинации, ошибки и прочие недоработки. Всё это правда. Но нам также нужно глубоко вздохнуть и признать огромный прогресс, достигнутый OpenAI с момента выхода первой публичной версии ChatGPT. Та версия была скорее игрушкой, чем инструментом. Текущие версии — 4.0, 4.1 и 4.5 — очень мощные и более полезные. Если ChatGPT 5.0 оправдает хотя бы половину своих сегодняшних обещаний, это будет огромным шагом вперёд. Wow! 1.5 вышла, когда Сэм Альтман заявил, что у них теперь 700 миллионов пользователей. Я аплодирую их амбициям и вспоминаю цитату Лео Бернетта, который, как говорится, находится на горе Рашмор: « Когда ты тянешься к звёздам, ты можешь их не получить, но и не найдешь горсти грязи». OpenAI явно стремится к звёздам.

Вау #2: Они закрывают старые модели и переводят всех на версию 5.0

Если взглянуть на меню в верхней части страницы ChatGPT, вы увидите несколько вариантов для разных моделей. Там есть пара слов о том, для чего предназначена каждая модель. Это всегда сбивало с толку, по крайней мере, для меня. Теперь они переводят всех на GPT-5 и отключают старые модели. Эта таблица суммирует различия между GPT-4 и GPT-5. Альтман сказал, что если GPT-3 был учеником старшей школы, а GPT-4 — студентом колледжа, то GPT-5 будет работать на уровне доктора наук. Эта версия скоро станет доступна всем коммерческим пользователям (корпоративным и образовательным позже). Бесплатные пользователи будут ограничены в использовании и будут переведены на менее мощную модель, когда они превысят лимит.

Особенность ГПТ-4 GPT-5 (ожидается)
Способность рассуждать Сильные, эпизодические логические пробелы Рассуждения на уровне доктора наук
Мультимодальность Текст, изображения, голос Текст, изображения, голос, видео
Контекстная память До ~128 тыс. токенов До ~1 миллиона токенов
Автономия агента Ограничено, требует частого ввода Более независимые, многошаговые задачи
Параметры скорости Одна основная модель Версии Flagship, Mini, Nano
Поддержка СМИ Нет поддержки видео Полное понимание и генерация видео

Вау #3: Меньше галлюцинаций

Они подчеркнули, что GPT-5 будет проводить меньше времени в Стране Фантазии, чем предыдущие версии. Это хорошая новость, если это правда. Они указали на улучшение процентных показателей, но не продемонстрировали свою работу. Чутьё подсказывает, что в плане направленности (и, вероятно, значительно) всё будет лучше, но пока не идеально.

Вау #4: Гораздо более эффективная интеграция с голосовыми функциями

Некоторые пользователи использовали голосовой доступ для доступа к ChatGPT в предыдущих версиях. Очевидно, были предприняты значительные усилия, чтобы поднять голосовой ввод до уровня текстового. Я пока не знаю, насколько это будет распространено, но это определённо отличный вариант. Мой скептицизм отчасти основан на чрезмерном оптимизме по поводу того, насколько быстро Alexa произведёт революцию в сфере торговли на Amazon. Я представлял себе мир, в котором люди на кухне будут заказывать продукты, пока готовят, но пока этого не произошло. Возможно, для многих людей набор текста по-прежнему остаётся предпочтительным способом ввода.

Вау #5: Более мощная разработка кода

Это относится к обеим категориям. Они пытались продемонстрировать, насколько легко разрабатывать веб-приложения с использованием GPT-5. Один парень «разработал» приложение, чтобы научить свою девушку говорить по-французски с семьёй. Оно вроде бы работало, но выглядело как школьный проект. Они утверждают, что программисты предпочитают работать с GPT-5, но не показали ни свою работу, ни исходники. Они также показали, как GPT-5 может помочь в отладке. Отнесите это в категорию «Здорово, если это действительно сработает».

Вау #6: Большие успехи в борьбе с недобросовестными игроками

Во-первых, не навреди. Похоже, OpenAI серьёзно относится к своим обязанностям перед обществом. Обсуждалось, как GPT-5 будет реагировать на проблемные поисковые запросы. Это даст больше информации о том, почему что-то неправильно, неэтично или опасно. Они называют это «безопасным завершением». Стоит продолжать следить за развитием событий.

Хммм #1: Это было похоже на презентацию класса, а не на запуск продукта крупной компании.

Возможно, Apple и другие нас разбаловали, но сама презентация была по-дилетантски. Они заставляли нервных специалистов по продукту подниматься и уходить со сцены по три минуты. Многие «шутки» казались неподготовленными и неловкими. Я понимаю, что дело в самом продукте, а не в упаковке, но, похоже, им пора поднять планку.

Хммм #2: Им нужна помощь в переводе их волнения и мыслей на английский язык.

Один очень интересный пример показал, как родитель может помочь своему старшекласснику с научным докладом об эффекте Бернулли. Пока всё идёт хорошо. Затем ведущий спросил: «Было бы здорово увидеть анимацию, демонстрирующую это?» Да! И если бы она продолжила на простом английском, было бы очень здорово. Вместо этого она сказала: «Создайте SVG с помощью Canva» и показала кучу кода на Python. Ещё есть возможность сделать возможности ChatGPT 5.0 более доступными для обычного пользователя, но им нужно улучшить свой английский.

Хммм #3: Они утверждают, что опередили эволюцию ИИ на два-три года

Одним из ведущих специалистов в области искусственного интеллекта является Даниэль Кокотайло . До ухода из компании он был ведущим инженером OpenAI. Он также является основным автором книги «AI 2027» — тщательно документированного и аргументированного исследования путей развития ИИ. Согласно этой работе, ИИ потребуется ещё два-три года, чтобы действительно взять на себя большую часть работы разработчика. OpenAI практически заявила, что уже достигла этого уровня с GPT-5. Не уверена, что верю в это. Опять же, возможно, это направленный подход. Полностью? Нет, пока не увижу больше.