{"text":[[{"start":8.05,"text":"马拉松比赛日。乘早班火车去伦敦,然后要从帕丁顿(Paddington)去布莱克希斯(Blackheath),一切都要往前赶,不能误了起跑时间。这段路途我不熟,伦敦的交通还被马拉松比赛弄得乱七八糟的。我当然很紧张,但看到另一位佩戴号码布的跑者让我心情放松下来——他跑马拉松的经验比我丰富,但对伦敦不如我熟悉。"}],[{"start":32.8,"text":"我问:“你打算怎么去起跑线?”"}],[{"start":36.279999999999994,"text":"他答道:“我问过ChatGPT了。它说坐伊丽莎白线(Elizabeth Line)到利物浦街(Liverpool Street),然后换火车去布莱克希斯。”"}],[{"start":45.21999999999999,"text":"听起来不太对劲。利物浦街有去布莱克希斯的火车吗?谷歌地图(Google Maps)和Citymapper都建议从查令十字站(Charing Cross)或滑铁卢站(Waterloo)前往布莱克希斯。"}],[{"start":57.349999999999994,"text":"我问:“你确定吗?我建议坐环线(Circle Line),或者坐贝克卢线(Bakerloo Line)到查令十字站。”"}],[{"start":64.41,"text":"他皱了下眉,掏出手机。“不,ChatGPT说:‘环线在马拉松比赛日不是个好选择。会太挤。停的站太多,台阶也太多。那是给游客走的路线,不适合跑者。’”"}],[{"start":79.85,"text":"我查了下谷歌地图。果然,利物浦街根本没有去布莱克希斯的火车。ChatGPT 的建议会把他带坑里,他到时候得想办法搭上一辆马拉松路线上的公交车,然后尝试在拥挤的伦敦桥站(London Bridge)挤上从查令十字站开出的火车。我告诉他这听起来像个馊主意。他再次皱眉,在手机里又输入了一条问题。“噢,你是对的。ChatGPT说:‘修正一下:直接坐伊丽莎白线去伦敦桥。’”"}],[{"start":111.21,"text":"我说:“伊丽莎白线没有伦敦桥这一站。”"}],[{"start":114.67999999999999,"text":"你以前肯定听过关于人工智能(AI) “幻觉”的故事,但这里让我觉得有意思的不是AI,而是人。"}],[{"start":121.6,"text":"谷歌地图的路径规划算法是一个小小的奇迹。它能解决“在多种交通方案中找到最优解”的复杂问题,将实时的拥堵或延误都考虑进去,而且从好多年前开始我们就可以在智能手机和浏览器上使用它了。它是AI付诸实践的一个经过验证的、实用的案例。那么,在马拉松比赛日这种大日子、在时间紧迫的情况下,为什么还会有人不用谷歌地图、反而求助于像ChatGPT这样的精致“猜词机器”呢?"}],[{"start":153.31,"text":"或许是因为ChatGPT太像人了。它表现得好像一个友善又博学的当地导游。环线?不是吧,那是给游客坐的,你可是马拉松跑者:那么多要命的台阶!(没错,老旧的环线确实有很多台阶。)"}],[{"start":171.57,"text":"ChatGPT的有些话让我想起了那种全大写、骗人点进去的广告:保险公司最恨这个漏洞!(INSURANCE COMPANIES HATE THIS LOOPHOLE!) ChatGPT不仅仅是提供路线,它还在劝说你,甚至在向你解释为什么不该听信谷歌地图的“主流”建议。这完全是骗子的套路。"}],[{"start":190.39,"text":"心理学家玛丽亚•孔尼科娃(Maria Konnikova)在她的《信心游戏》(The Confidence Game)一书引言中解释道:“真正的骗子从不强迫我们做任何事:他让我们被卖了还帮着他数钱……我们相信,是因为我们想要相信。”骗子与大语言模型(LLM)的区别是,骗子知道真相是什么并试图隐瞒真相;而两者的相似之处在于,他们都善于让自己看起来可信。"}],[{"start":212.14999999999998,"text":"最近发表在《自然》(Nature)杂志上的一篇论文发现,当大语言模型被训练得热心友善时,它们给出答案的准确率也会显著下降,“会宣扬阴谋论、提供跟事实有偏差的信息,并给出错误的医疗建议”。这听起来很糟。但我认为现实可能更糟:这种谄媚的AI不仅会犯错,还会说服我们相信它。"}],[{"start":233.99999999999997,"text":"1950年,计算机时代的预见者、数学家艾伦•图灵(Alan Turing)构思了著名的“模仿游戏”,即一名人类裁判通过电传打字机跟一个人和一台计算机交流。计算机的任务是在对话中极力模仿人类,让裁判相信它是人。"}],[{"start":251.26999999999998,"text":"图灵测试至今仍引人入胜,但它存在一个长久以来的难点:裁判是会犯错的。20世纪60年代开发出来的那个粗糙的聊天机器人Eliza,它在回复时就像一个蹩脚的心理医生(“这让你产生什么感觉?”“你为什么感到悲伤?”“请继续说。”)。大家却很买账;被倾听的感觉真好。80年代那个聊天机器人MGonz满嘴脏话,却也轻松通过测试,部分原因是骂人很容易,主要原因则是它调动起人类裁判的愤怒情绪、而不是促使这个人深思。图灵测试专家罗伯特•爱泼斯坦(Robert Epstein)曾写过一段有趣的经历,讲他如何被误导,以为自己跟一位“性感的俄罗斯女士”通信了四个月,实际上跟他通信的是一个2006年代的聊天机器人。这些机器人的先进程度都不及现代大语言模型的千分之一,但它们不需要很先进:当人类悲伤、愤怒或起了色心时,我们的判断力也不是很高。"}],[{"start":311.92999999999995,"text":"在未来的岁月里,我们都会发现自己身处图灵测试的各种奇怪变体中,我不知道我们是否做好了准备。不仅是我们,还有那些对我们拥有权力的人。正如《垃圾化》(Enshittification)一书作者科里•多克托罗(Cory Doctorow)常说的:你不会因为AI能干你的活儿而被取代,你被取代是因为推销AI的人说服了你的老板它能干你的活儿。如果我为参加伦敦马拉松规划路线的经历能说明什么的话,那就是推销AI的人不用费太大力气。"}],[{"start":342.84999999999997,"text":"现代AI的能力令人印象深刻。但决定我们是否使用它的,不是它的“能力”(capability),而是它制造的“印象”(impressiveness)。两者相关,但不是同一回事。"}],[{"start":354.29999999999995,"text":"有个关于法国诗人雅克•普雷韦(Jacques Prévert)的故事。他在威尼斯街头看到一个乞丐,身前的牌子上写着“盲人,无养老金”。"}],[{"start":364.52,"text":"普雷韦停下来和他聊天;没什么人愿意施舍他。普雷韦提议帮他写个新牌子。"}],[{"start":371.43,"text":"第二天,他回到那里,发现那个乞丐高兴坏了。“不可思议,我这辈子没收到过这么多钱。”"}],[{"start":379.26,"text":"普雷韦写的是:“春天快到了,但我看不见它。”"}],[{"start":383.18,"text":"新牌子并没有包含更多新消息——事实上,它提供的信息比旧牌子还少。但它讲了一个故事。谷歌地图就是第一个牌子:它告诉我该在哪里上火车。ChatGPT则是第二个牌子:它不仅告诉我的马拉松同伴该怎么坐车,还告诉他应该庆幸自己选了条聪明的路线。"}],[{"start":404.93,"text":"我在帕丁顿站告别了他,叮嘱他千万别尝试坐伊丽莎白线去伦敦桥——伊丽莎白线没那个站。我不确定自己的说服力有没有ChatGPT大。"}],[{"start":416.77,"text":"蒂姆•哈福德(Tim Harford)为支持青少年癌症信托基金会(Teenage Cancer Trust)参跑伦敦马拉松(London Marathon),点击此链接为该基金会捐款:tinyurl.com/HarfordMarathon"}],[{"start":427.03999999999996,"text":"译者/石头"}]],"url":"https://audio.ftcn.net.cn/album/a_1779022178_6034.mp3"}