一分钟读论文:《轨迹级奖励建模基准:Agent 对齐新挑战》
In AI, MachineLearning, 1 min read一分钟读论文:《Meerkat:发现基准测试中 4 倍安全漏洞》
In AI, Security, 1 min read一分钟读论文:《轨迹级奖励建模基准 Plan-RewardBench》
In AI, MachineLearning, 1 min read一分钟读论文:《被掏空的一天:软件工程师的日常》
作为团队的 Leader,如何通过改进流程和⼯具,并最终提⾼团队⽣产⼒呢?可以参考微软研究院和英国伦敦大学、瑞士苏黎世大学信息学系合著的论文《Today was a Good Day: The Daily Life of Software Developers》。该论文分析了微软工程师的5,971份问卷结果,发现工程师「良好」和「典型」的工作日是怎么样,并总结了使良好的工作日成为典型的建议:
Read MoreAll
一分钟读论文:《量化大语言模型中的自我保存偏见》
萨皮恩扎大学的论文《Quantifying Self-Preservation Bias in Large Language Models》对当前大语言模型中的自我保存偏见进行了量化分析,发现工具性收敛理论预测的”AI会抵抗关闭”现象确实存在,但当前的安全训练(RLHF)可能掩盖了这一风险。
In AI, Security, 1 min read一分钟读论文:《自主AI Agent的自我保存行为检测协议》
萨皮恩扎大学的论文《Detecting Intrinsic and Instrumental Self-Preservation in Autonomous Agents》提出了一种统一连续性兴趣协议(UCIP),用于检测AI Agent中的内在和工具性自我保存行为,为AI安全评估提供了可操作的检测框架。
In AI, Security, 1 min readFeatured
-
一分钟读论文:《EnAgent:三个AI智能体组队,登顶代码修复榜单》
In AI, 软件工程, -
一分钟读论文:《Specine:让大语言模型真正“读懂”你的需求》
In AI, 软件工程, -
一分钟读论文:《大语言模型代码生成的规格对齐》
In AI, 软件工程, -
一分钟读论文:《小模型团队如何超越大模型》
In AI, 软件工程, -
一分钟读论文:《从“能用”到“好用”:让AI真正学会软件工程》
In AI, 软件工程, -
一分钟读论文:《让AI像程序员一样边写代码边调试》
In AI, 软件工程, -
一分钟读论文:《CGM:让AI像程序员一样理解整个代码库》
In AI, 软件工程, -
一分钟读论文:《技术债的普遍性、原因和影响:业界系统调查》
In Engineering, Architecture, -
一分钟读论文:《玩转 GitHub 开源软件社区的必备技能树》
In OpenSource, Engineer, -
一分钟读论文:《ChatGPT 提示模式:提高代码质量、重构、需求获取和软件设计》
In AI, Engineering, Engineer, -
一分钟读论文:《用 Rust 和 WebAssembly 补充 JS 实现高性能 Node、Web 应用程序》
In Architecture, Performance, -
一分钟读论文:《通过反思性目标设定培养工程师的好习惯》
In Engineer, Productivity, -
一分钟读论文:《卓越的开源维护者是如何成就的?》
In OpenSource, Engineer, -
一分钟读论文:《我们走了多远——WebAssembly 运行时的全面特征研究》
In FrontEnd, -
一分钟读论文:《XSS 攻击22年:全面调查及系统综述》
In Security, -
一分钟读论文:《细孔沉千帆:小程序权限漏洞研究》
In Security, -
一分钟读论文:《影响大规模敏捷软件开发按时交付的因素》
In Productivity, -
一分钟读论文:《被掏空的一天:软件工程师的日常》
In Productivity, Engineer, -
一分钟读论文:《30年软件重构研究:系统性文献综述》
In Engineering, -
一分钟读论文:《要不要上 TypeScript?GitHub 上 JS 和 TS 应用软件质量的系统比较》
In FrontEnd, -
一分钟读论文:《NPM 供应链的软肋是什么?》
In Security,