AI聊天机械人 也能当医生?
2023-02-28 4365 包啟宏 澳门日报
研究显示,人工智能(AI)聊天机械人ChatGPT通过美国执业医师资格考试(USMLE),得分达到或接近及格所需的六十分。
美国期刊《PLOS数码医疗》近日发布的报告说,该研究由三个部份组成,採用USMLE试卷二○二二年六月版三百七十六道试题中的三百五十道,测试ChatGPT的多个医学学科知悉,涉及基础科学、生物化学、诊断推理和生物道德学。结果显示,ChatGPT在三个部份中取得了五十二点四至七十五分的成绩。它还在研究报告的撰写方面提供了辅助。该测试评估医学生和实习医生对大多数医学学科的知识,自一九九二年以来一直使用。USMLE Step 1通常在医学院第二年结束时进行,Step 2在第四年进行,Step 3在完成医学院和住院医师的第一年后进行。每年有超过十名学生和研究生参加考试。ChatGPT还针对其百分之八十八点九的回覆产生了“至少一个重要见解”,该见解是“新的、非显而易见的和临床有效的”。结果超过了PubMedGPT的性能,PubMedGPT是一种专门针对生物医学领域文献进行训练的对应模型,在较旧的USMLE式问题数据集上得分为 百分之五十点八。
研究员认为他们的发现表明ChatGPT可能成为医学教育中的一个有价值的工具,这标誌着临床AI成熟的一个显着里程碑。“这些成绩说明,大量的语言模型或许可以辅助医疗教育,且有可能用于临床决策。”
由加州公司OpenAI研发的ChatGPT可以在几秒之内编写论文、诗歌和程序代码。新西兰软件工程专家麦考伦说,除了ChatGPT以外,Google的人工智能医学工具Med-PaLM,或许也能为病人提供堪比专业全科医生的问诊服务。他预见社会即将发生变化,人们或将很快就能从Google医生或必应(Bing)护士获取医疗建议。
不过,一些专家强调了研究结果和人工智能使用的局限性。巴斯大学人工智能教授内洛 · 克里斯蒂亚尼尼教授说:“这并不意味着ChatGPT拥有与人类相当的知识……我们拥有一种经过训练可以生成文本的统计机制,所以我们不应该谈论理解或相关概念。”
人工智能技术还可以延续种族、性别和文化等社会偏见。包括谷歌和亚马逊在内的科技巨头此前已经承认,他们的一些试验人工智能的项目存在“道德风险”并且存在局限性。在几家公司,人类不得不介入并解决这些问题。
本文或来源网络共享或用户投稿文章,不代表澳门新闻日报立场,转载联系原作者并注明出处:https://www.yeeea.com/keji/4032/