Запуск GPT-5: шесть раз я сказал «вау», но три раза «хмммм»
Команда OpenAI под руководством Сэма Альтмана наконец-то представила GPT-5. Прямую трансляцию запуска, как в прямом эфире, так и в течение первых трёх часов после него, посмотрели около 600 000 человек ( и вы тоже можете сделать то же самое, если пропустили). Хотя это отстаёт от некоторых космических снимков и мероприятий Чемпионата мира, аудитория демонстрирует огромный интерес к новейшей версии ChatGPT. YouTube не раскрывает данные о количестве просмотров, но только два или три мероприятия Apple привлекли значительно больше зрителей.
Я ознакомился с GPT-5 перед запуском, и практически всё, чего мы ожидали, было анонсировано. Ниже я расскажу о том, что меня удивило/впечатлило, а что заставило почесать голову.
Вау, №1. Они прошли долгий путь за два с половиной года.
Многие авторы, включая меня, жаловались на галлюцинации, ошибки и прочие недоработки. Всё это правда. Но нам также нужно глубоко вздохнуть и признать огромный прогресс, достигнутый OpenAI с момента выхода первой публичной версии ChatGPT. Та версия была скорее игрушкой, чем инструментом. Текущие версии — 4.0, 4.1 и 4.5 — очень мощные и более полезные. Если GPT-5 оправдает хотя бы половину своих сегодняшних обещаний, это будет огромным шагом вперёд. Вот это да! 1.5 вышла, когда Сэм Альтман заявил, что у них теперь 700 миллионов пользователей. Я аплодирую их амбициям и вспоминаю цитату Лео Бернетта (который находится на вершине горы Рашмор в рекламе): « Когда ты тянешься к звёздам, ты можешь не дотянуться до них, но и не найдешь горсти грязи». OpenAI явно стремится к звёздам.
Вау #2: Они закрывают старые модели и переводят всех на GPT-5
Если бы вы взглянули на меню в верхней части страницы ChatGPT перед запуском, вы бы увидели несколько вариантов для разных моделей. Там было пару слов о том, для чего предназначена каждая модель. Это всегда сбивало с толку, по крайней мере, мне. Теперь они переводят всех на GPT-5 и закрывают старые модели. Эта диаграмма суммирует различия между GPT-4 и GPT-5. Альтман сказал, что если GPT-3 был учеником старшей школы, а GPT-4 — студентом колледжа, то GPT-5 будет работать на уровне доктора философии. Эта версия скоро станет доступна всем коммерческим пользователям (корпоративным и образовательным позже). Бесплатные пользователи будут иметь ограниченный объем использования и будут переведены на менее мощную модель, когда они превысят лимит.
| Особенность | ГПТ-4 | GPT-5 (ожидается) |
|---|---|---|
| Способность рассуждать | Сильные, эпизодические логические пробелы | Рассуждения на уровне доктора наук |
| Мультимодальность | Текст, изображения, голос | Текст, изображения, голос, видео |
| Контекстная память | До ~128 тыс. токенов | До ~1 миллиона токенов |
| Автономия агента | Ограничено, требует частого ввода | Более независимые, многошаговые задачи |
| Параметры скорости | Одна основная модель | Версии Flagship, Mini, Nano |
| Поддержка СМИ | Нет поддержки видео | Полное понимание и генерация видео |
Вау #3: Меньше галлюцинаций
OpenAI подчеркнула, что GPT-5 будет проводить меньше времени в Стране Фантазии, чем предыдущие версии. Это хорошая новость, если это правда. Они указали более точное соотношение процентов, но не продемонстрировали свою работу. Чутьё подсказывает, что система будет лучше направленно (и, вероятно, значительно), но пока не идеальна.
Вау #4: Гораздо более эффективная интеграция с голосовыми функциями
Некоторые пользователи использовали голосовой доступ для доступа к ChatGPT в предыдущих версиях. Очевидно, были предприняты значительные усилия, чтобы поднять голосовой ввод до уровня текстового. Я пока не знаю, насколько это будет распространено, но это определённо отличный вариант. Мой скептицизм отчасти основан на чрезмерном оптимизме по поводу того, насколько быстро Alexa произведёт революцию в сфере торговли на Amazon. Я представлял себе мир, в котором люди на кухне будут заказывать продукты, пока готовят, но пока этого не произошло. Возможно, для многих людей набор текста по-прежнему остаётся предпочтительным способом ввода.
Вау #5: Более мощная разработка кода
Это относится к обеим категориям. Они пытались продемонстрировать, насколько легко разрабатывать веб-приложения с использованием GPT-5. Один парень «разработал» приложение, чтобы научить свою девушку говорить по-французски с семьёй. Оно вроде бы работало, но выглядело как школьный проект. Они утверждают, что программисты предпочитают работать с GPT-5, но не показали ни свою работу, ни исходники. Они также показали, как GPT-5 может помочь в отладке. Отнесите это в категорию «Здорово, если это действительно сработает».
Вау #6: Большие успехи в борьбе с недобросовестными игроками
Во-первых, не навреди. Похоже, OpenAI серьёзно относится к своим обязанностям перед обществом. Обсуждалось, как GPT-5 будет реагировать на проблемные поисковые запросы. Это даст больше информации о том, почему что-то неправильно, неэтично или опасно. Они называют это «безопасным завершением». Стоит продолжать следить за развитием событий.
Хммм #1: Это было похоже на презентацию класса, а не на запуск продукта крупной компании.
Возможно, Apple и другие нас разбаловали, но сама презентация была по-дилетантски. Они заставляли нервных специалистов по продукту подниматься и уходить со сцены по три минуты. Многие «шутки» казались неподготовленными и неловкими. Я понимаю, что дело в самом продукте, а не в упаковке, но, похоже, им пора поднять планку.
Хммм #2: Им нужна помощь в переводе их волнения и мыслей на английский язык.
Один очень интересный пример показал, как родитель может помочь своему старшекласснику с научным докладом об эффекте Бернулли. Пока всё идёт хорошо. Затем ведущий спросил: «Было бы здорово увидеть анимацию, демонстрирующую это?» Да! И если бы она продолжила объяснять это простым языком, было бы очень здорово. Вместо этого она сказала: «Создайте SVG с помощью Canva» и показала фрагмент кода на Python. Ещё есть возможность сделать возможности ChatGPT 5.0 более доступными для обычного пользователя, но это нужно сделать на этом уровне.
Хммм #3: Они утверждают, что опередили эволюцию ИИ на два-три года
Одним из ведущих специалистов в области искусственного интеллекта является Даниэль Кокотайло . До ухода из компании он был ведущим инженером OpenAI. Он также является основным автором книги «AI 2027» — тщательно документированного и аргументированного исследования путей развития ИИ. Согласно этой работе, ИИ потребуется ещё два-три года, чтобы действительно взять на себя большую часть работы разработчика. OpenAI практически заявила, что движется к этому с GPT-5. Не уверена, что верю в это. Опять же, возможно, это направленный подход. Полностью? Нет, пока не увижу больше.