AI聊天机器人为什么能骗过人类？

00:00

{"text":[[{"start":8.05,"text":"马拉松比赛日。乘早班火车去伦敦，然后要从帕丁顿(Paddington)去布莱克希斯(Blackheath)，一切都要往前赶，不能误了起跑时间。这段路途我不熟，伦敦的交通还被马拉松比赛弄得乱七八糟的。我当然很紧张，但看到另一位佩戴号码布的跑者让我心情放松下来——他跑马拉松的经验比我丰富，但对伦敦不如我熟悉。"}],[{"start":32.8,"text":"我问：“你打算怎么去起跑线？”"}],[{"start":36.279999999999994,"text":"他答道：“我问过ChatGPT了。它说坐伊丽莎白线(Elizabeth Line)到利物浦街(Liverpool Street)，然后换火车去布莱克希斯。”"}],[{"start":45.21999999999999,"text":"听起来不太对劲。利物浦街有去布莱克希斯的火车吗？谷歌地图(Google Maps)和Citymapper都建议从查令十字站(Charing Cross)或滑铁卢站(Waterloo)前往布莱克希斯。"}],[{"start":57.349999999999994,"text":"我问：“你确定吗？我建议坐环线(Circle Line)，或者坐贝克卢线(Bakerloo Line)到查令十字站。”"}],[{"start":64.41,"text":"他皱了下眉，掏出手机。“不，ChatGPT说：‘环线在马拉松比赛日不是个好选择。会太挤。停的站太多，台阶也太多。那是给游客走的路线，不适合跑者。’”"}],[{"start":79.85,"text":"我查了下谷歌地图。果然，利物浦街根本没有去布莱克希斯的火车。ChatGPT 的建议会把他带坑里，他到时候得想办法搭上一辆马拉松路线上的公交车，然后尝试在拥挤的伦敦桥站(London Bridge)挤上从查令十字站开出的火车。我告诉他这听起来像个馊主意。他再次皱眉，在手机里又输入了一条问题。“噢，你是对的。ChatGPT说：‘修正一下：直接坐伊丽莎白线去伦敦桥。’”"}],[{"start":111.21,"text":"我说：“伊丽莎白线没有伦敦桥这一站。”"}],[{"start":114.67999999999999,"text":"你以前肯定听过关于人工智能(AI) “幻觉”的故事，但这里让我觉得有意思的不是AI，而是人。"}],[{"start":121.6,"text":"谷歌地图的路径规划算法是一个小小的奇迹。它能解决“在多种交通方案中找到最优解”的复杂问题，将实时的拥堵或延误都考虑进去，而且从好多年前开始我们就可以在智能手机和浏览器上使用它了。它是AI付诸实践的一个经过验证的、实用的案例。那么，在马拉松比赛日这种大日子、在时间紧迫的情况下，为什么还会有人不用谷歌地图、反而求助于像ChatGPT这样的精致“猜词机器”呢？"}],[{"start":153.31,"text":"或许是因为ChatGPT太像人了。它表现得好像一个友善又博学的当地导游。环线？不是吧，那是给游客坐的，你可是马拉松跑者：那么多要命的台阶！（没错，老旧的环线确实有很多台阶。）"}],[{"start":171.57,"text":"ChatGPT的有些话让我想起了那种全大写、骗人点进去的广告：保险公司最恨这个漏洞！(INSURANCE COMPANIES HATE THIS LOOPHOLE!) ChatGPT不仅仅是提供路线，它还在劝说你，甚至在向你解释为什么不该听信谷歌地图的“主流”建议。这完全是骗子的套路。"}],[{"start":190.39,"text":"心理学家玛丽亚•孔尼科娃(Maria Konnikova)在她的《信心游戏》(The Confidence Game)一书引言中解释道：“真正的骗子从不强迫我们做任何事：他让我们被卖了还帮着他数钱……我们相信，是因为我们想要相信。”骗子与大语言模型(LLM)的区别是，骗子知道真相是什么并试图隐瞒真相；而两者的相似之处在于，他们都善于让自己看起来可信。"}],[{"start":212.14999999999998,"text":"最近发表在《自然》(Nature)杂志上的一篇论文发现，当大语言模型被训练得热心友善时，它们给出答案的准确率也会显著下降，“会宣扬阴谋论、提供跟事实有偏差的信息，并给出错误的医疗建议”。这听起来很糟。但我认为现实可能更糟：这种谄媚的AI不仅会犯错，还会说服我们相信它。"}],[{"start":233.99999999999997,"text":"1950年，计算机时代的预见者、数学家艾伦•图灵(Alan Turing)构思了著名的“模仿游戏”，即一名人类裁判通过电传打字机跟一个人和一台计算机交流。计算机的任务是在对话中极力模仿人类，让裁判相信它是人。"}],[{"start":251.26999999999998,"text":"图灵测试至今仍引人入胜，但它存在一个长久以来的难点：裁判是会犯错的。20世纪60年代开发出来的那个粗糙的聊天机器人Eliza，它在回复时就像一个蹩脚的心理医生（“这让你产生什么感觉？”“你为什么感到悲伤？”“请继续说。”）。大家却很买账；被倾听的感觉真好。80年代那个聊天机器人MGonz满嘴脏话，却也轻松通过测试，部分原因是骂人很容易，主要原因则是它调动起人类裁判的愤怒情绪、而不是促使这个人深思。图灵测试专家罗伯特•爱泼斯坦(Robert Epstein)曾写过一段有趣的经历，讲他如何被误导，以为自己跟一位“性感的俄罗斯女士”通信了四个月，实际上跟他通信的是一个2006年代的聊天机器人。这些机器人的先进程度都不及现代大语言模型的千分之一，但它们不需要很先进：当人类悲伤、愤怒或起了色心时，我们的判断力也不是很高。"}],[{"start":311.92999999999995,"text":"在未来的岁月里，我们都会发现自己身处图灵测试的各种奇怪变体中，我不知道我们是否做好了准备。不仅是我们，还有那些对我们拥有权力的人。正如《垃圾化》(Enshittification)一书作者科里•多克托罗(Cory Doctorow)常说的：你不会因为AI能干你的活儿而被取代，你被取代是因为推销AI的人说服了你的老板它能干你的活儿。如果我为参加伦敦马拉松规划路线的经历能说明什么的话，那就是推销AI的人不用费太大力气。"}],[{"start":342.84999999999997,"text":"现代AI的能力令人印象深刻。但决定我们是否使用它的，不是它的“能力”(capability)，而是它制造的“印象”(impressiveness)。两者相关，但不是同一回事。"}],[{"start":354.29999999999995,"text":"有个关于法国诗人雅克•普雷韦(Jacques Prévert)的故事。他在威尼斯街头看到一个乞丐，身前的牌子上写着“盲人，无养老金”。"}],[{"start":364.52,"text":"普雷韦停下来和他聊天；没什么人愿意施舍他。普雷韦提议帮他写个新牌子。"}],[{"start":371.43,"text":"第二天，他回到那里，发现那个乞丐高兴坏了。“不可思议，我这辈子没收到过这么多钱。”"}],[{"start":379.26,"text":"普雷韦写的是：“春天快到了，但我看不见它。”"}],[{"start":383.18,"text":"新牌子并没有包含更多新消息——事实上，它提供的信息比旧牌子还少。但它讲了一个故事。谷歌地图就是第一个牌子：它告诉我该在哪里上火车。ChatGPT则是第二个牌子：它不仅告诉我的马拉松同伴该怎么坐车，还告诉他应该庆幸自己选了条聪明的路线。"}],[{"start":404.93,"text":"我在帕丁顿站告别了他，叮嘱他千万别尝试坐伊丽莎白线去伦敦桥——伊丽莎白线没那个站。我不确定自己的说服力有没有ChatGPT大。"}],[{"start":416.77,"text":"蒂姆•哈福德(Tim Harford)为支持青少年癌症信托基金会(Teenage Cancer Trust)参跑伦敦马拉松(London Marathon)，点击此链接为该基金会捐款：tinyurl.com/HarfordMarathon"}],[{"start":427.03999999999996,"text":"译者/石头"}]],"url":"https://audio.ftcn.net.cn/album/a_1779022178_6034.mp3"}

尊敬的用户您好，这是来自FT中文网的温馨提示：如您对更多FT中文网的内容感兴趣，请在苹果应用商店或谷歌应用市场搜索“FT中文网”，下载FT中文网的官方应用。

AI聊天机器人为什么能骗过人类？

卧底经济学家

相关话题

宁德时代扩张电池版图，瞄准AI、电网和船舶

扎克伯格：美国不应禁止中国人工智能

FT社评：美国应对开放权重人工智能持开放态度

欧洲风机制造商探讨合并，抗衡中国对手

特朗普压低油价的能力受到考验

朝韩竞相建造核动力潜艇