Ответственная ложь: как ИИ продает убеждения без правды

dailyblitz.de 1 год назад

Автор Глеб Лисих через The Epoch Times,

Широко распространенное увлечение генеративным ИИ, особенно крупными языковыми моделями (LLM), такими как ChatGPT, Gemini, Grok и DeepSeek, основано на фундаментальном недопонимании. Хотя эти системы впечатляют пользователей четкими ответами и, казалось бы, аргументированными аргументами, правда заключается в том, что то, что кажется «обоснованием», является не более чем сложной формой мимикрии.

Эти модели не ищут истину через факты и логические аргументы — они предсказывают текст на основе шаблонов в обширных наборах данных, на которых они «обучены». Это не интеллект — и это не рассуждение. И если их «обучающие» данные сами по себе предвзяты, то у нас есть реальные проблемы.

Я уверен, что пользователи ИИ удивятся, узнав, что архитектура в основе LLM нечеткая и несовместима со структурированной логикой или причинностью. Мышление не реально, оно смоделировано и даже не является последовательным. То, что люди ошибочно принимают за понимание, на самом деле является статистической ассоциацией.

Широко разрекламированные новые функции, такие как объяснения «цепочки мысли», являются трюками, предназначенными для того, чтобы произвести впечатление на пользователя. То, что пользователи на самом деле видят, лучше всего описать как своего рода рационализацию, генерируемую после того, как модель уже пришла к своему ответу через вероятностное предсказание. Иллюзия, однако, достаточно сильна, чтобы заставить пользователей поверить, что машина участвует в подлинном обсуждении. И эта иллюзия не просто вводит в заблуждение — она оправдывает.

LLM не являются нейтральными инструментами, они обучаются на наборах данных, погруженных в предубеждения, заблуждения и доминирующие идеологии нашего времени. Их результаты отражают преобладающие или популярные настроения, а не лучшую попытку найти истину. Если популярные настроения по данному вопросу склоняются в одном направлении, политически, то ответы ИИ, вероятно, тоже так и сделают. И когда «обоснование» является лишь послефактическим оправданием того, что модель уже решила, оно становится мощным пропагандистским устройством.

Для этого нет недостатка в доказательствах.

Недавний разговор, который я начал с DeepSeek о системном расизме, позже загруженный обратно в чат-бот для самокритики, показал, что модель совершает (и признает!) шквал логических ошибок, которые были засеяны полностью выдуманными исследованиями и цифрами. Когда ИИ был оспорен, он эвфемистически назвал одну из его лжи «гипотетическим составом». При дальнейшем нажатии DeepSeek извинился за еще один «неверный шаг», а затем скорректировал свою тактику в соответствии с компетенцией противоположного аргумента. Это не стремление к точности — это упражнение в убеждении.

Аналогичная дискуссия с Gemini от Google — модель, которая стала печально известной из-за смешного пробужденияВовлекает аналогичную убедительную аргументацию. В конце концов модель эвфемистически признала слабость своего аргумента и молчаливо признала свою нечестность.

Для пользователя, обеспокоенного тем, что ИИ выплевывает ложь, такие очевидные успехи в том, чтобы заставить ИИ признать свои ошибки и заставить их стыдиться, могут показаться причиной оптимизма. К сожалению, те попытки, которые поклонники фильмов «Матрица» назвали бы «красной кражей», не имеют абсолютно никакого терапевтического эффекта. Модель просто хорошо играет с пользователем в рамках этого разговора, сохраняя свой «мозг» полностью неизменным для следующего чата.

И чем больше модель, тем хуже становится. Исследования Корнельского университета показывают, что самые продвинутые модели также являются наиболее обманчивыми, уверенно представляя ложь, которая согласуется с популярными заблуждениями. По словам Антропика, ведущей лаборатории ИИ, «продвинутые модели рассуждений очень часто скрывают свои истинные мыслительные процессы, а иногда делают это, когда их поведение явно смещено. "

Справедливости ради следует отметить, что некоторые исследователи ИИ пытаются устранить эти недостатки. Такие проекты, как TruthfulQA от OpenAI и HHH от Anthropic (полезная, честная и безвредная), направлены на повышение фактической надежности и достоверности результатов LLM. Недостатком является то, что это корректирующие усилия, наложенные на архитектуру, которая никогда не была предназначена для поиска истины и остается в основном слепой к эпистемической обоснованности.

Илон Маск, пожалуй, единственная крупная фигура в области искусственного интеллекта, публично заявившая, что поиск истины должен быть важен для развития искусственного интеллекта. Тем не менее, даже его собственный продукт, XAI’s Grok, не подходит.

В генеративном пространстве искусственного интеллекта истина отступает на задний план из-за опасений по поводу «безопасности», то есть избегания оскорблений в нашем гиперчувствительном пробужденном мире.

Истина рассматривается как один из аспектов так называемого «ответственного» дизайна. И термин «ответственный ИИ» стал зонтиком для усилий, направленных на обеспечение безопасности, справедливости и инклюзивности, которые, как правило, похвальны, но определенно субъективны.

Этот фокус часто затмевает фундаментальную необходимость скромной правдивости результатов ИИ.

LLM в основном оптимизированы для получения ответов, которые являются полезными и убедительными, но не обязательно точными. Этот выбор дизайна приводит к тому, что исследователи из Оксфордского интернет-института называют «беспечной речью» — выходами, которые звучат правдоподобно, но часто фактически неверны, тем самым разрушая основу информированного дискурса.

Эта проблема будет становиться все более важной, поскольку ИИ продолжает проникать в общество. В неправильных руках эти убедительные, многоязычные, личностно-гибкие модели могут быть использованы для поддержки программ, которые не терпят инакомыслия. Неутомимый цифровой уговорщик, который никогда не колеблется и никогда не признает вину, — мечта тоталитарного режима. В такой системе, как режим социального кредита в Китае, эти инструменты становятся инструментами идеологического принуждения, а не просвещения.

Генеративный ИИ, несомненно, является чудом ИТ-инженерии. Но давайте проясним: это не разумно, не правдиво по замыслу и не нейтрально по сути. Любое утверждение об обратном служит только тем, кому выгодно контролировать повествование.

** **

Глеб Лисих — исследователь и специалист по управлению ИТ, отец троих детей, который живет в Вогане, Онтарио, и вырос в различных частях Советского Союза.

Оригинальная, полная версия этой статьи недавно появилась в C2C Journal.

Мнения, выраженные в данной статье, являются мнениями автора и не обязательно отражают взгляды The Epoch Times или ZeroHedge.

Тайлер Дерден
Свадьба, 05/07/2025 - 16:20

Читать всю статью