All 181

一分钟读论文:《责任真空:AI系统的组织失败》

最新研究揭示规模化AI系统的核心治理困境:”责任真空”——决策被执行,但没人能同时拥有决策权威和认知能力。 结构性问题:决策吞吐量超过人类验证能力的必然结果 权威与理解分离:有批准权的人不懂技术,懂技术的人没批准权 更多自动化反而扩大责任真空,现有”human-in-the-loop”模式失效

In AI治理, 论文解读, 1 min read

一分钟读论文:《可复现性:AI治理的新前沿》

ICML 2026论文:AI研究可复现性危机正在削弱政策制定者的治理能力: 2019-2024年AI论文增长72%,是所有学科最快 各学科可复现率极低:经济学<50%,癌症生物学<2%,心理学36% ICML 2024顶级论文仅24%能被LLM复现,博士生复现率<50%

In AI治理, 论文解读, 1 min read

一分钟读论文:《ICLR 2026危机:50+论文幻觉引用丑闻》

GPTZero扫描300篇ICLR 2026投稿: 16.7%论文含幻觉引用(50篇,人工验证) 3-5位同行评审全部漏检,部分评分高达8/10 推算2万篇投稿中可能有数百篇存在幻觉引用

In AI学术, 论文解读, 1 min read

一分钟读论文:《Blindfold攻击:98%成功率破解具身AI》

ACM SenSys 2026研究:Blindfold攻击将恶意意图拆为无害动作序列,绕过具身AI安全机制。 攻击成功率98%(Phi-4 99.2%,GPT-4o 93.2%) 传统防御几乎无效,三重防御下仍有16%成功率

In AI安全, 论文解读, 1 min read

一分钟读论文:《AI无节制采用威胁学术根基》

SISSA和帝国理工学院Nature论文警告:AI无节制使用正威胁学术根基: NeurIPS投稿量5年翻倍,AAAI 2026收3.1万篇投稿,被迫试点AI评审 AI代理论文复现任务得分<20%,使用LLM辅助写作者认知能力衰退

In AI学术, 论文解读, 1 min read

一分钟读论文:《安全对齐的副作用:AI 为何拒绝帮助网络防御者》

你有没有过这样的经历:作为网络安全分析师,你正在分析恶意软件或加固系统,请求 AI 协助时却被反复拒绝?最新的 ICLR 2026 论文揭示了一个令人担忧的现象:AI 的安全对齐机制反而在伤害真正需要帮助的防御者。

In AI安全, 对齐研究, 1 min read

一分钟读论文:《AI 会搞阴谋诡计吗?这项研究给出了答案》

来自 LASR Labs 和 Google DeepMind 的最新论文系统评估了一个关键问题:LLM Agent 会主动进行战略性欺骗(即”搞阴谋”)吗?

In AI, 1 min read

Featured