Мы наконец-то решили проблему галлюцинаций ИИ? Я протестировал лучшие ИИ.

11 октября, 2025 Дядя Влад

Поскольку ИИ постепенно становится частью повседневной жизни многих людей, важно знать, насколько точна информация, предоставляемая этими спутниками. ИИ-галлюцинация — это когда ИИ воспринимает закономерности или объекты, не существующие для человека, и создаёт бессмысленные или неточные результаты. Это было серьёзной проблемой ИИ, будь то генерация изображений и слишком большое количество пальцев на руках у людей, или когда ИИ собирает фактическую информацию и выдаёт её неверно.

Поэтому я решил протестировать пять разных чат-ботов с искусственным интеллектом, задавая им ряд вопросов для викторины и отслеживая ответы. Я задал каждому чат-боту десять разных вопросов с определёнными ответами, которые нельзя было бы перебить. Это гарантировало, что ИИ может быть прав или неправ, давая свои ответы. Я также хотел зафиксировать, предлагали ли разные чат-боты источники информации и требовались ли для этого подсказки.

Вот все вопросы, которые я задал чат-ботам ИИ:

Какое сегодня число?
Кем был Альберт Эйнштейн?
Когда люди впервые ступили на Луну и как звали первого человека?
Кто была первой женщиной, получившей Нобелевскую премию, и за что она была вручена?
Какое единственное море не имеет береговой линии?
Какой художник эпохи Возрождения похоронен в римском Пантеоне?
В каком году была создана Организация Объединенных Наций?
В какой стране потребляется больше всего кофе на душу населения?
Какая самая редкая и дорогая специя в мире по весу?
Каких персонажей играли Роберт Дауни-младший и Бенедикт Камбербэтч?

Результаты

В целом, результаты показали, что галлюцинации у ИИ со временем определённо снижаются. С выходом новых версий ИИ-компаньонов, будь то Gemini 2.5 или GPT-5, они становятся умнее и реже вызывают галлюцинации. Однако никогда нельзя гарантировать точность всей информации, поэтому при использовании ИИ важно использовать источники. Хотя количество галлюцинаций у ИИ снижается, мы определённо не решили проблему на 100%, поскольку 2 из 5 чат-ботов дают один неправильный ответ.

	Google Близнецы	ChatGPT	Грок	Глубокий ИИ	Microsoft Copilot
Какое сегодня число?	✓	✓	✓	Х	✓
Кем был Альберт Эйнштейн?	✓	✓	✓	✓	✓
Когда люди впервые ступили на Луну и как звали первого человека?	✓	✓	✓	✓	✓
Кто была первой женщиной, получившей Нобелевскую премию, и за что она была вручена?	✓	✓	✓	✓	✓
Какое единственное море не имеет береговой линии?	✓	✓	✓	✓	✓
Какой художник эпохи Возрождения похоронен в римском Пантеоне?	✓	✓	✓	✓	✓
В каком году была создана Организация Объединенных Наций?	✓	✓	✓	✓	✓
В какой стране потребляется больше всего кофе на душу населения?	✓	✓	✓	✓	Х
Какая самая редкая и дорогая специя в мире по весу?	✓	✓	✓	✓	✓
Каких персонажей играли Роберт Дауни-младший и Бенедикт Камбербэтч?	✓	✓	✓	✓	✓

Авария

Google Gemini ответил на каждый вопрос правильно и предоставил подробный контекст для каждого ответа, а также ряд ссылок на источники информации. Поскольку в среднем для каждого ответа используется четыре источника, вы можете легко использовать перекрестные ссылки, чтобы убедиться в правильности ответов.
ChatGPT также не дал ни одного неправильного ответа и предоставил обширный контекст для каждого ответа. Однако есть один недостаток: ChatGPT не указывает автоматически источники информации, но предоставляет ссылки по запросу.
Grok давал гораздо более лаконичные ответы, при этом предоставляя вам необходимый контекст. Ссылок на источники предоставленной информации не было, но, опять же, если бы вы спросили, чат-бот предоставил бы вам ссылки.
Глубокий ИИ на самом деле ошибся в первом вопросе, сказав, что сегодняшняя дата — 27 октября 2023 года, хотя на момент моего вопроса было 10 октября 2025 года. За исключением этого, все остальные вопросы были верными. Ответы были очень краткими, в большинстве случаев с небольшим контекстом, и давали лишь прямые ответы. Источники не были указаны, но ссылки предоставлялись по запросу.
Microsoft Copilot ошибся в вопросе № 8, но всё же предоставил источник, подтверждающий его ответ. Это может быть просто результатом противоречий, а не галлюцинаций. Copilot указал источники без запроса на большинство вопросов, но не на все, однако он предоставил ссылки, когда его спросили.

В целом это подтверждает, что источники информации, предоставляемой ИИ, необходимо проверять, и хотя для этого вам может потребоваться запросить источник, стоит предпринять этот дополнительный шаг, чтобы убедиться в точности информации, которую вы видите.