一分钟读论文:《被掏空的一天:软件工程师的日常》

作为团队的 Leader,如何通过改进流程和⼯具,并最终提⾼团队⽣产⼒呢?可以参考微软研究院和英国伦敦大学、瑞士苏黎世大学信息学系合著的论文《Today was a Good Day: The Daily Life of Software Developers》。该论文分析了微软工程师的5,971份问卷结果,发现工程师「良好」和「典型」的工作日是怎么样,并总结了使良好的工作日成为典型的建议:

Read More

All

一分钟读论文:《量化大语言模型中的自我保存偏见》

萨皮恩扎大学的论文《Quantifying Self-Preservation Bias in Large Language Models》对当前大语言模型中的自我保存偏见进行了量化分析,发现工具性收敛理论预测的”AI会抵抗关闭”现象确实存在,但当前的安全训练(RLHF)可能掩盖了这一风险。

In AI, Security, 1 min read

一分钟读论文:《自主AI Agent的自我保存行为检测协议》

萨皮恩扎大学的论文《Detecting Intrinsic and Instrumental Self-Preservation in Autonomous Agents》提出了一种统一连续性兴趣协议(UCIP),用于检测AI Agent中的内在和工具性自我保存行为,为AI安全评估提供了可操作的检测框架。

In AI, Security, 1 min read

Featured