一分钟读论文：《Bug 的隐秘生命周期：大规模实证研究》

你对自己的代码保持敬畏吗？意大利菲夏诺萨勒诺大学软件工程 (SeSa) 实验室的论文《The Secret Life of Software Vulnerabilities: A Large-Scale Empirical Study》对 GitHub 上 1,096 个开源项目，来自国家漏洞数据库的 3,663 个带有公共补丁的漏洞的生命周期进行的大规模实证研究。发现：

在创建新文件后不久就产生了漏洞；
开发者在维护源码的同时造成漏洞；
工作量较大的开发者导致了大多数安全漏洞；
漏洞在源码中停留的天数方面具有很高的存活率。

论文研究的问题和结论

RQ1：漏洞如何被引入到源码中？

平均有 4.71 个 VCC（vulnerability-contributing commits，既漏洞贡献提交量）引入一个漏洞。
60.93% 引入不止一个，平均跨度超过 4 年。
SQL 注入最多 VCC (18.36) 的漏洞类型。
VCC 中涉及的文件中几乎有一半 (47.91%) 是在这些提交的上下文中创建的。

RQ2：漏洞引入到源码中的上下文是什么？

绝大多数 VCC (69.50%) 在其目标中包含至少一项维护活动（即错误修复、增强或重构）。
绝大多数漏洞 (83.99%) 在项目创建的第一年之后开始出现，通常 (59.68%) 至少在发布前 30 天发布。
`新人开发者和专家开发者的分布相当（分别为 43.24% 和 40.04%）。
超过 55% 的开发者在工作量很大时执行 VCC。

RQ3：漏洞的生存能力如何？

RQ3

至少有一半的漏洞存活了 511 天。
输入验证漏洞比其他漏洞修复得更早，而内存管理问题在代码中持续时间更长。

RQ4：如何从源码中删除已知漏洞？

修复提交通常涉及一个文件，添加的行数是删除的行数的两倍。
“清理外部输入”是修复输入验证问题的最常用方法。例如，在源码中添加缺失的检查，即使涉及大量文件和代码行也是如此。

一分钟读论文：《Bug 的隐秘生命周期：大规模实证研究》

论文研究的问题和结论

Releated

一分钟读论文：《开源软件供应链攻击分类》

一分钟读论文：《移动设备上数据的加密保密性》

一分钟读论文：《人类解决验证码有多强？大规模评估》

一分钟读论文：《寻找失去的时间：浏览器中 JavaScript 定时器的综述》

一分钟读论文：《工程师如何遵循 NPM 包安全最佳实践？》

一分钟读论文：《不经意伪随机函数 (OPRF)》

一分钟读论文：《战争与和平：世界政治对软件生态系统的影响》

一分钟读论文：《XSS 攻击22年：全面调查及系统综述》

一分钟读论文：《细孔沉千帆：小程序权限漏洞研究》

一分钟读论文：《SMASH：通过 JavaScript 触发同步多边 Rowhammer 攻击》

一分钟读论文：《Montage：基于神经网络语言模型 (NNLM) 实现 JS 引擎模糊测试器》

一分钟读论文：《NPM 供应链的软肋是什么?》