В октябре прошлого года KPMG опубликовала отчёт под названием Total Experience: Redefining Excellence in the Age of Agentic AI, посвящённый тому, как компании используют искусственный интеллект для обслуживания клиентов. Документ обобщал результаты ежегодного глобального исследования качества клиентского опыта. KPMG входит в «Большую четвёрку» крупнейших аудиторских и консалтинговых фирм мира наряду с Deloitte, PricewaterhouseCoopers и Ernst & Young. Однако, как выяснилось, отчёт был полон сгенерированных нейросетью выдумок и содержал примеры агентного ИИ, которые либо не существовали, либо не обладали приписанными им возможностями. Неточности и поддельные сноски по всему документу обнаружили исследователи GPTZero — разработчика инструмента для выявления текстов, написанных нейросетями. Их выводы подтвердила и газета Financial Times.

Junayed graphics/ShutterstockИсточник изображения — Junayed graphics/Shutterstock

Только пять ссылок из 45 вели на реальные источники

В отчёте о расследовании GPTZero сообщила, что лишь пять из 45 ссылок в документе корректно указывали на настоящие, неискажённые источники. Заголовки остальных 40 оказались сфабрикованы: 28 ссылок содержали перефразированные названия или вымышленные элементы реальных публикаций, а ещё 12 были сформулированы слишком расплывчато, чтобы определить, существуют ли источники вообще. Создание нейросетями поддельных ссылок GPTZero назвала «виб-цитированием» (vibe citing) — по аналогии с «виб-кодингом», когда модель на ходу сшивает обрывки реальных источников, придумывает заголовки или искажает их до неузнаваемости.

По наблюдению исследователей, отчёт демонстрировал характерные машинные ошибки, которые человек бы не допустил: модель раз за разом путала тему публикации с её автором. Так, запись в блоге про лондонский транспорт (Transport for London), написанная блогером из графства Суррей, была приписана самой TfL, а материал издания о ретейле про бренд UNIQLO — приписан компании UNIQLO. В качестве доказательства использования ИИ-агентов в одном случае приводился даже пресс-релиз железнодорожной компании от 2019 года, хотя само понятие «агентного ИИ» вошло в широкий оборот лишь в 2024 году.

Половина утверждений оказалась ложной или приписана не тем компаниям

Помимо поддельных и неточных ссылок, исследователи установили, что около половины утверждений в документе были ложными либо приписаны не тем источникам. Как отметила GPTZero, это, «вероятно, стало результатом того, что инструмент ИИ чрезмерно усердно отработал запрос найти примеры „агентного ИИ“ в реальной практике».

В одном из примеров KPMG утверждала, что авиакомпания Emirates запустила мобильного чат-бота Sara, способного общаться с пассажирами и менять их рейсы. На деле Sara — это мобильный помощник, запущенный ещё в 2023 году, а не построенный на нейросети чат-бот, и менять бронирования за пассажиров он не умел.

KPMG также заявила, что швейцарский транснациональный инвестиционный банк UBS внедрил агентный ИИ в «инвестиционное консультирование, управление рисками и контроль соблюдения требований». В банке сообщили Financial Times, что эти сведения «фактически неверны». В другом примере KPMG утверждала, что Швейцарские федеральные железные дороги (SBB) используют ИИ-агентов, помогающих пассажирам планировать, бронировать и оптимизировать поездки с учётом предпочтений, данных в реальном времени и углеродного следа. Представитель SBB назвал это утверждение «не соответствующим действительности». О недостоверных или вводящих в заблуждение упоминаниях своей работы с ИИ заявили Financial Times также британский оператор Transport for London и Национальная служба здравоохранения Великобритании (NHS).

Почему это опасно для всей отрасли

Документы таких фирм, как KPMG, обычно цитируются в других исследованиях и статьях, поскольку считаются особо надёжными источниками. Генеральный директор GPTZero Эдвард Тянь пояснил, что переполненные ошибками публикации «Большой четвёрки» способны «отравить информационный колодец» и привести к вторичным галлюцинациям ИИ, когда уже другие нейросети начнут опираться на ложные сведения. Само расследование стало вторым в серии проверок GPTZero: ранее похожие проблемы инструмент компании выявлял в государственных отчётах, научных работах для конференций по машинному обучению, а также в материалах Deloitte и Ernst & Young.

KPMG — уже не первая консалтинговая фирма, уличённая в подобном. Годом ранее Deloitte вернула австралийскому правительству часть оплаты после того, как в подготовленный за бюджетные средства отчёт просочился сгенерированный нейросетью текст. Представитель KPMG заявил Financial Times, что компания «серьёзно относится к точности и достоверности публикуемого контента». Документ уже отозван, и сейчас в фирме «изучают обстоятельства его выхода».