正文

牛津大學AI研究員發警告：大語言模型對科學真相構成風險

aibase

發布於AI新閒資訊

時間 :Nov 24, 2023

閱讀 :1分鐘

牛津大學AI研究員在最新研究中發出警告，指出大型語言模型可能對科學完整性構成威脅。研究呼籲改變LLMs使用方式，建議將其作爲“零射擊翻譯器”以確保輸出的事實準確性。然而，信任LLMs作爲信息來源可能導致科學真相受損，因此呼籲負責任的LLMs使用。研究同時警告，如果LLMs在生成和傳播科學文章中被隨意使用，可能會導致嚴重危害。

相關推薦

大模型長文本迎來新突破，智譜AI正式開源旗艦模型GLM-5.2

智譜AI發佈新一代開源旗艦模型GLM-5.2，專攻長程任務，支持1M無損上下文，編程效率大幅提升。採用極寬鬆MIT協議，開發者和企業可自由下載、商用部署。

顧全全確認離職字節Seed團隊，曾主導SeedFold與Seed2.0訓練體系建設

字節跳動Seed團隊核心研究員顧全全確認離職，其在社交平臺發文回顧了三年間在AI藥物發現和大語言模型預訓練領域的研究成果。她主導研發的生物分子結構預測模型SeedFold在多個公開基準測試中表現優異。此次離職正值字節AI業務加速商業化，引發外界對AI for Science創業熱潮的關注。

告別單輪傻瓜問答！雲知聲發佈原生智能體大模型U2，自主攻克百步複雜工作流

生成式人工智能正從聊天工具向“超級數字員工”進化。6月8日，雲知聲發佈新一代通用大模型U2，專爲個人、開發者及企業設計。它突破傳統單輪對話侷限，聚焦高智能密度與高Token價值，提升實際交付能力。

騰訊與人大高瓴聯合推出開源規劃評測框架 PlanningBench

騰訊混元團隊與中國人民大學等機構聯合開源了PlanningBench，這是一個用於評測和訓練大語言模型規劃能力的框架。它系統化地抽象了任務、約束和難度，覆蓋30多種規劃任務類型，支持數據生成與驗證，旨在評估模型的實際規劃能力。

GPT 5.5 稱霸 AI 漏洞挑戰，DeepSeek 斬獲“性價比之王”

安全研究員Kasra Rahjerdi通過構建含漏洞的圖書評論應用，測試主流大語言模型的安全推理能力。他故意暴露谷歌移動端後端服務憑據，要求模型解包並識別以訪問數據庫。在每場2小時、預算10美元的嚴格條件下，評估了頂尖模型的表現。

AIBase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2026AIBase