Google AI выдает миллионы неверных ответов
Большинство современных поисковых систем по умолчанию показывают пользователям сводки, сгенерированные искусственным интеллектом. Эта практика вызывает немало споров — в первую очередь из-за сомнений в достоверности информации и из-за того, что сайты начинают терять переходы по своим ссылкам. И хотя тесты показывают: сводки Google AI в большинстве случаев точны, колоссальный объём запросов, которые обрабатывает поисковик каждый день, почти наверняка оборачивается миллионами ошибочных ответов.
Как сообщает The New York Times со ссылкой на тестирование, примерно каждый десятый ответ в сводках Google AI содержит ложные сведения. Учитывая, что поисковая система обрабатывает около 5 триллионов запросов в год, пользователи ежечасно могут сталкиваться с более чем 57 миллионами неточных ответов — почти миллионом в минуту.
Эти цифры приводит ИИ-стартап Oumi, которому издание поручило оценить точность работы модели Gemini с помощью SimpleQA — широко распространённого тестового набора для генеративных нейросетей. Проанализировав 4326 поисковых запросов в Google, Oumi выяснил: в октябре ассистент Google на базе Gemini версии 2 выдавал точные сводки в 85% случаев. К февралю Gemini 3 улучшил этот показатель до 91%.
Правда, у метода есть ограничения. Oumi может оценивать большие объёмы результатов только с помощью других ИИ-инструментов, а те тоже способны ошибаться. Кроме того, на один и тот же запрос Google иногда генерирует разные сводки, даже если повторить его с интервалом в несколько секунд.
Представитель Google назвал тестирование Oumi некорректным, заявив, что оно не отражает реальное поведение пользователей в поиске. Внутренние тесты компании показывают: когда Gemini 3 работает независимо от поисковой системы Google, она «галлюцинирует» (выдаёт ложную информацию как факт) в 28% случаев.
Отдельная головная боль — источники. Google AI пытается подкреплять свои ИИ-сводки ссылками на релевантные материалы, но эти источники часто не подтверждают утверждения Gemini — независимо от того, верны они или нет.
Бывает так, что следом за неверной ИИ-сводкой идёт ссылка с правильной информацией. В других случаях точная сводка ссылается на источник с недостоверными данными. А иногда на связанных страницах вообще нет никакой информации по теме. Примечательно, что расхождения между ИИ-сводками и их источниками участились после февральского обновления: доля запросов, где наблюдались несоответствия, выросла с 37% для Gemini 2 до 56% для Gemini 3.
Исследователи также обнаружили, что ИИ-сводки легко поддаются манипуляции. В одном из примеров журналист BBC опубликовал в своём блоге заведомо ложную информацию, а на следующий день Google уже повторял эти утверждения в своих сводках.
Показательно, что Google AI и другие ИИ-компании сами признают шаткость отношений своей технологии с истиной — но только в мелком шрифте пользовательских соглашений. В условиях предоставления услуг Microsoft говорится, что их ИИ-инструмент Copilot предназначен для развлечения, а не для принятия важных решений. В сводках Google AI пользователей призывают перепроверять ответы. А компания xAI (разработчик нейросети Grok) открыто признаёт, что «галлюцинации» возможны.
Системные требования (для ПО не указаны, добавлены общие для работы с веб-сервисами Google):
Стабильное подключение к интернету (от 5 Мбит/с)
Современный веб-браузер: Google Chrome, Mozilla Firefox, Safari, Microsoft Edge (последние версии)
Операционная система: Windows 10/11, macOS 11 и новее, Linux (современные дистрибутивы), Android 10+, iOS 15+
Оперативная память: от 2 ГБ для работы браузера
Наличие аккаунта Google (для персонализированных сводок)