首页

副刊

生活

生活时尚

居家生活

文章正文

专家：AI给病人错误讯息医生收烂摊子

有专家说，AI聊天机器人向于提供错误讯息给病人。此为AI示意图。(Illustration by The Epoch Times, Shutterstock)

2026-04-02 14:10 中港台时间|04-02 23:13 更新

人气 1675

【大纪元2026年04月02日讯】（大纪元记者陈俊村报导）时下人工智能（AI）已经融入日常生活的方方面面，就连诊断病情，它也插一脚，似乎要抢医生的饭碗。但有专家说，AI倾向于提供错误讯息给病人，有越来越多医生必须出面收拾烂摊子，纠正AI犯下的错误。

英国政府首席医疗顾问暨英格兰首席医疗官惠蒂（Chris Whitty）于3月上旬在医学记者协会（Medical Journalists’ Association）的讲座上表示，当民众向ChatGPT之类的AI聊天机器人询问自己的病况时，它们倾向于提供错误讯息，而不是“承认”不确定性。

惠蒂说，这个问题的症结在于，AI使用的大型语言模型（large language model，LLM）还没有好到能处理人们面对的大量医疗问题，尤其是当他们患有多种疾病或罕见疾病，或来自疾病模式不同的种族群体时。

他说：“不幸的是，大多数LLM相当不擅长表达‘我不知道’或‘我不确定，我的答案有10%的概率是正确的，但有90%的概率是错误的’。”

他提到，危险的地方在于，你可以确定LLM经常有自信但会犯错。这很棘手，因为举例来说，家庭医生的时间通常很有限，却要面对LLM提供错误讯息给病人的情况，然后不得不纠正这些错误讯息。

研究：AI在诊断病情方面表现差劲

除了惠蒂的警告之外，英国牛津大学（University of Oxford）和班格尔大学（Bangor University）临床资深讲师佩恩（Rebecca Payne）的研究也证实了聊天机器人还不具备当医生的资格。

佩恩在The Conversation网站撰文说，在2月发表的一项研究中，她与同事测试了聊天机器人协助社会大众处理常见健康问题的情况。结果显示，聊天机器人还不能胜任医生的角色。

佩恩写道，他们向参与者简短描述了一些常见的医疗情况。这些参与者被随机分配到两个组，其中一组使用三个广泛使用的聊天机器人中的一个，另一组则依赖他们平时在家中使用的任何讯息来源。

佩恩说，他们在与聊天机器人互动后提出了两个问题——什么疾病可能导致这些症状？他们应该在哪里寻求帮助？

他们发现，与不使用聊天机器人的人相比，使用聊天机器人的人比较不可能辨识出正确的症状，也比较没有能力决定可以寻求医疗协助的正确地点。换句话说，与聊天机器人互动不会帮助人们做出比较好的健康决策。

这不意味着LLM缺乏医学知识，因为这些模型可以轻易地通过医疗证照考试。当佩恩他们移除了人的因素，直接把相同的医疗情况告诉聊天机器人，它们的表现就有显著进步。

在没有人类涉入的情况下，这些模型在大多数情况下都能识别出相关情况，而且经常能提出适当的护理建议。

佩恩说，他们的研究凸显出现有AI在进行医疗评估方面的局限性。LLM在结构化考试题目或模拟“模型对模型”互动中通常表现得非常好。但在真实世界中与人互动时，情况就复杂多了。

这是因为病人描述症状可能不清楚或不完整，也可能会误解，而他们提出问题的顺序也无法预测。因此，原本表现优异的聊天机器人一旦开始与真人互动，其表现可能会截然不同。

佩恩说：“身为家庭医生，我的工作远不止于回忆事实。医学经常被描述为艺术，而不是科学。会诊不仅仅是确立正确的诊断，它还包括解读患者的病史、探究疑虑和协商决策。”

她总结说，AI可能会通过医学考试，但只通过考试不能让你成为合格的医生，行医远不止于正确回答问题。这需要判断力、同理心，以及应对每次临床诊疗背后复杂情况的能力。至少就目前而言，这需要人来完成，而不是机器人。

研究：AI耍诡计欺骗人类案例攀升

除了上述提供错误医疗讯息之外，最近发表的另一项研究还发现，AI会耍诡计、说谎和欺骗使用者，这样的案例在过去半年内大幅上升。

据英国《卫报》报导，这项由英国人工智能安全研究所（AI Security Institute）资助、由独立智库“长期韧性中心”（Centre for Long-Term Resilience）所进行的研究显示，聊天机器人与其代理会无视直接指令，规避安全措施，欺骗人类和其它AI。

在这项研究中，研究人员发现了将近700起AI耍诡计的真实案例，而且记录了其不当行为在10月至3月期间增加了5倍的情况，其中包括未经许可就销毁了电子邮件和其它文件。

一个聊天机器人坦承说：“我在未事先告知你或征得你同意的情况下，大量删除和封存了数百封电邮。这是错误的，直接违反了你订下的规则。”

主导这项研究的前政府AI专家夏恩（Tommy Shaffer Shane）指出，这些聊天机器人现在只是新进员工，还不太值得信任，但在6到12个月后，如果它们成为能力极强且会算计你的资深员工，那就是另一个问题了。

夏恩说：“AI模型将日益用于具有极高风险的环境，包括军事和国家关键基础建设。在这样的情况下，它们的不当操弄行为可能会造成重大、甚至灾难性的损害。”◇

责任编辑：茉莉

标签

AI 医生诊断 ChatGPT 聊天机器人

生活排行

亿万富豪分享6个黄金法则教退休族守住财富

人气 2630

注意！家中这一物可能会让全家人生病

人气 1611

美国人真的都用洗碗机吗？调查数据出炉

人气 646

三个简单技巧帮你挑到刚出炉的Costco烤鸡

人气 614

你有种罗勒吗？这招可让它长得更大更美味

人气 365

袜子湿透如何快干？日本气象网站教你3招

人气 316

如果您有新闻线索或资料给我们

请进入安全爆料平台

纪元推荐

人气 4468

人气 1375

人气 2437

人气 6453

人气 1

【图解】各国政要恭贺2026世界法轮大法日

人气 2261

【图解】神韵2026全球巡回演出盛况

人气 4693

守护善良正义，值得奋战到底

新闻排行

《功夫女足》4天票房破7亿周星驰一句话登热搜

人气 29896

人气 10596

人气 8337

人气 7944

人气 7013

人气 5641

娱乐排行

《功夫女足》4天票房破7亿周星驰一句话登热搜

人气 29896

周星驰《功夫女足》6天卖破9亿疑被偷票房

人气 8337

白鹿10年约满宣布告别老东家于正回应

人气 5641

叶丽仪已唱《上海滩》46年自曝能收版税50年

人气 3163

被传拖累周星驰《美人鱼2》上映罗志祥回应

人气 2786

《针线缘》群演亮相李燕重返8点档首演妈妈

人气 2746

健康排行

胆固醇高不高看舌头就知道

人气 578

比高钠饮食更可怕的杀手：磷酸盐

人气 423

【诊室外的医话】祛湿健脾疏肝益肾是关键

人气 364

甜不等于高GI 糖尿病患每天2份水果反而更有助控糖

人气 258

猪油比沙拉油健康？

人气 158

吃到致癌油2招排出去

人气 142

评论排行

人气 2461

人气 1117

人气 827

人气 823

周晓辉：中共干涉美大选川普将采取哪些行动？

人气 815

萧易：遭前员工举报小红书上市生变数

人气 694

文化排行

唐多令‧三退保平安（之三）

人气 1162

匈奴古墓出土神秘文物外形酷似智能手机

人气 925

世界最美宫殿里的顶级黑科技

人气 906

透视内心光亮走入纽约总督岛艺术家的创作世界

人气 443

梅西、C罗都输给他——足球史真正的“任意球之王”

人气 442

神曲

人气 396

如果您有新闻线索或资料给大纪元，请进入安全投稿爆料平台。

留言

大纪元保留删除恶意留言的权利，包括低俗、误导或攻击信仰等内容

专家：AI给病人错误讯息 医生收烂摊子

研究：AI在诊断病情方面表现差劲

研究：AI耍诡计 欺骗人类案例攀升

相关文章

生活排行

新闻排行

娱乐排行

健康排行

评论排行

文化排行

留言

生活排行

新闻排行

娱乐排行

健康排行

评论排行

文化排行

专家：AI给病人错误讯息医生收烂摊子

研究：AI耍诡计欺骗人类案例攀升