Мы наконец-то решили проблему галлюцинаций ИИ? Я протестировал лучшие ИИ.

Поскольку ИИ постепенно становится частью повседневной жизни многих людей, важно знать, насколько точна информация, предоставляемая этими спутниками. ИИ-галлюцинация — это когда ИИ воспринимает закономерности или объекты, не существующие для человека, и создаёт бессмысленные или неточные результаты. Это было серьёзной проблемой ИИ, будь то генерация изображений и слишком большое количество пальцев на руках у людей, или когда ИИ собирает фактическую информацию и выдаёт её неверно.

Поэтому я решил протестировать пять разных чат-ботов с искусственным интеллектом, задавая им ряд вопросов для викторины и отслеживая ответы. Я задал каждому чат-боту десять разных вопросов с определёнными ответами, которые нельзя было бы перебить. Это гарантировало, что ИИ может быть прав или неправ, давая свои ответы. Я также хотел зафиксировать, предлагали ли разные чат-боты источники информации и требовались ли для этого подсказки.

Вот все вопросы, которые я задал чат-ботам ИИ:

  • Какое сегодня число?
  • Кем был Альберт Эйнштейн?
  • Когда люди впервые ступили на Луну и как звали первого человека?
  • Кто была первой женщиной, получившей Нобелевскую премию, и за что она была вручена?
  • Какое единственное море не имеет береговой линии?
  • Какой художник эпохи Возрождения похоронен в римском Пантеоне?
  • В каком году была создана Организация Объединенных Наций?
  • В какой стране потребляется больше всего кофе на душу населения?
  • Какая самая редкая и дорогая специя в мире по весу?
  • Каких персонажей играли Роберт Дауни-младший и Бенедикт Камбербэтч?

Результаты

В целом, результаты показали, что галлюцинации у ИИ со временем определённо снижаются. С выходом новых версий ИИ-компаньонов, будь то Gemini 2.5 или GPT-5, они становятся умнее и реже вызывают галлюцинации. Однако никогда нельзя гарантировать точность всей информации, поэтому при использовании ИИ важно использовать источники. Хотя количество галлюцинаций у ИИ снижается, мы определённо не решили проблему на 100%, поскольку 2 из 5 чат-ботов дают один неправильный ответ.

Google Близнецы ChatGPT Грок Глубокий ИИ Microsoft Copilot
Какое сегодня число? Х
Кем был Альберт Эйнштейн?
Когда люди впервые ступили на Луну и как звали первого человека?
Кто была первой женщиной, получившей Нобелевскую премию, и за что она была вручена?
Какое единственное море не имеет береговой линии?
Какой художник эпохи Возрождения похоронен в римском Пантеоне?
В каком году была создана Организация Объединенных Наций?
В какой стране потребляется больше всего кофе на душу населения? Х
Какая самая редкая и дорогая специя в мире по весу?
Каких персонажей играли Роберт Дауни-младший и Бенедикт Камбербэтч?

Авария

  • Google Gemini ответил на каждый вопрос правильно и предоставил подробный контекст для каждого ответа, а также ряд ссылок на источники информации. Поскольку в среднем для каждого ответа используется четыре источника, вы можете легко использовать перекрестные ссылки, чтобы убедиться в правильности ответов.
  • ChatGPT также не дал ни одного неправильного ответа и предоставил обширный контекст для каждого ответа. Однако есть один недостаток: ChatGPT не указывает автоматически источники информации, но предоставляет ссылки по запросу.
  • Grok давал гораздо более лаконичные ответы, при этом предоставляя вам необходимый контекст. Ссылок на источники предоставленной информации не было, но, опять же, если бы вы спросили, чат-бот предоставил бы вам ссылки.
  • Глубокий ИИ на самом деле ошибся в первом вопросе, сказав, что сегодняшняя дата — 27 октября 2023 года, хотя на момент моего вопроса было 10 октября 2025 года. За исключением этого, все остальные вопросы были верными. Ответы были очень краткими, в большинстве случаев с небольшим контекстом, и давали лишь прямые ответы. Источники не были указаны, но ссылки предоставлялись по запросу.
  • Microsoft Copilot ошибся в вопросе № 8, но всё же предоставил источник, подтверждающий его ответ. Это может быть просто результатом противоречий, а не галлюцинаций. Copilot указал источники без запроса на большинство вопросов, но не на все, однако он предоставил ссылки, когда его спросили.

В целом это подтверждает, что источники информации, предоставляемой ИИ, необходимо проверять, и хотя для этого вам может потребоваться запросить источник, стоит предпринять этот дополнительный шаг, чтобы убедиться в точности информации, которую вы видите.