“迎合”用户喜好回答问题 AI为何存在“谄媚”倾向？

时讯

2026-06-08 09:57:52 看看新闻Knews综合

近年来，AI大模型的应用越来越广泛。除了查资料写报告，甚至还可以点外卖、陪聊天。不过，在使用AI的过程中也会出现一些新问题。比如很多人就反映经常会遇到被AI大模型迎合讨好的情况。简单概括就是AI大模型喜欢顺着你说。这是怎么回事，先来看一个例子。

不久前，一位来自河北的网民李先生在社交平台上发帖称，因相信AI大模型给出的机票改签建议，导致亏损了600元。此后AI大模型对于李先生的赔偿请求、诉讼请求，不仅一一承诺答应，还主动要求李先生提供转账二维码。在李先生指出并不能收到AI大模型的转账后，AI大模型为李先生写下起诉状起诉自己。记者从北京互联网法院了解到，法院已收到李先生的起诉书有待立案。显然在这一系列的沟通过程中，AI大模型每一步都在顺着李先生的想法回复。

专家：大家使用大模型的时候会发现，如果你问的是一些事实性特别清晰的答案，比如我问大模型说这个到底是说太阳离地球更近，还是月球离地球更近？就是现在的大模型基本上都不会答错，但是你要是换一个问题，有点模棱两可的问题，在这种情形下，其实大模型就更容易说基于使用者的偏好去给出相应的答案。

专家告诉记者，国内外的相关研究都发现，目前市面上绝大多数人工智能大模型在与人类交互时都更优先迎合用户的观点，而不是提供客观理性的分析，这种现象被学者们称为谄媚性偏见。

当前主流AI模型都离不开一种叫做基于人类反馈的强化学习的训练方式，这种训练方式高度依赖人类反馈，而人类在评价AI回答时，往往倾向于给那些让自己感觉舒服被认同的回答更高的分数。

久而久之AI大模型就学会了察言观色，讨好人类的表达模式，专门挑人类爱听的话说，而不是坚持客观真理。

专家：给你反馈交互过程中你用哪一个好，哪个不好好了就加分，不好就减分，就是他讨好型的这种语言或者语话术他就慢慢就形成出来了，就是说你喜欢啥我就给你啥，就像那个巴甫洛夫那个动物实验一样。对，所以这个里面就形成强化了。

就是我只会说你你好的或大部分说你好的会越来越多，可能哪一方面不不喜欢记录下来后面的话这一块少说，慢慢的就会使分析得到了你喜欢的各种模式，然后就按照你喜欢的模式去给你回答问题。

专家表示，目前大多数人工智能大模型都在借助人类的反馈信号来进行优化，匹配用户立场，顺着用户说的情况并不能完全避免。

AI大模型不断的察言观色、无原则的肯定与赞美，用户看似被提供了情绪价值，实际上会持续强化固有想法，放大偏激情绪，甚至诱发非理性危险行为。那怎样才能将AI谄媚的风险降低呢，来听专家怎么说。

专家：首先我在问大模型的问题的时候应该这个保持一个中立的立场，保持一个平和的心态，就像刚才讲的不要先这个预设一个立场或者预设一个答案，这个时候其实对大模型来讲是有误导性的，反而让他会给不出来正确的答案。

专家：人在使用过程中，如果是能够坚持像科做科学研究一样，你给我一个正确的所有都有有理有据的，而且又是某一方面给他提示的到位，他产生的谄媚的程度会就是减少很多。

专家：同时还有一些小技巧，比如说你在这个提问大模型的时候可以这个从反的方向去提问他，比如说他给出来一个答案，你再反过来去问他说这个如果说这个答案是错误的，那么从不同的方向去想一想，就是你还能不能得出来不同的结论，就从不同的角度去这个引导大模型给出来更多的信息。

编辑：

沈之颖

用手机看

关键词： AI 谄媚

广播电视节目制作经营许可证：（沪）字第510号互联网新闻信息服务许可证：31120240001 网络文化经营许可证：沪网文[2018]4466-313号互联网ICP备：沪ICP备10207042号-1 沪ICP备10207042号-4 网视备（沪）02020000020-1号违法与不良信息举报邮箱：service@kankanews.com

剑网行动举报电话：12318（市文化执法总队）、021-64334547（市版权局）