All 125
一分钟读论文:《Humanity's Last Exam:评估 AI 能力的专家级学术问题基准》
你有没有发现:现在的 AI 在各种考试中表现得越来越好了?MMLU 基准上准确率超过 90%,似乎什么都懂。但问题是,这些测试真的能衡量 AI 的真正能力边界吗?
In AI, 1 min read一分钟读论文:《没有最后一英里,人类数据市场的持久性》
你是不是觉得,现在人类做的那些数据工作——比如评估 AI 输出、审计结果、处理例外情况——只是暂时的?等 AI 越来越强,这些工作总会被自动化取代,这就是所谓的”最后一英里”问题。
In Economics, 1 min read一分钟读论文:《AlphaEvolve - 用 LLM 自动发现多智能体学习算法》
想象一下:设计一个优秀的多智能体强化学习(MARL)算法需要多少人类专家的智慧和经验?传统算法设计完全依赖人类直觉,而 DeepMind 的 AlphaEvolve 系统正在打破这个瓶颈。
In AI, 1 min read一分钟读论文:《Alien Science——让 AI 探索人类思维的盲区》
科学突破往往来自既可行又令人惊讶的想法。但现代 AI 在这方面表现得并不理想:LLM 擅长流畅地复制和插值已知内容,但很少产生真正非显而易见的研究方向。
In AI, 1 min read一分钟读论文:《HumanOrbit:从一张照片生成 360° 环绕视频,让 AI 帮你「转」着看人》
你有没有过这样的经历:看到一张精彩的人物照片,但只能看到正面,特别想看看侧面、背面是什么样子?
In AI, 计算机视觉, 3D重建, 1 min read一分钟读论文:《AI 数学家诞生?Google DeepMind 的 Aletheia 自主解决 10 个数学难题中的 6 个》
🎯 炸裂!AI 真的开始做数学研究了!
In AI, 研究论文, 1 min read一分钟读论文:《SemVideo:从大脑 fMRI 直接重建视频!读心术真的来了?》
想象一下:你坐在 fMRI 机器里看电影,科学家居然能直接从你的大脑信号里,还原出你正在看的画面!这不是《黑客帝国》,这是刚发表在 arXiv 上的真·黑科技!
In AI, 脑机接口, 神经科学, 1 min readFeatured
-
一分钟读论文:《技术债的普遍性、原因和影响:业界系统调查》
In Engineering, Architecture, -
一分钟读论文:《玩转 GitHub 开源软件社区的必备技能树》
In OpenSource, Engineer, -
一分钟读论文:《ChatGPT 提示模式:提高代码质量、重构、需求获取和软件设计》
In AI, Engineering, Engineer, -
一分钟读论文:《用 Rust 和 WebAssembly 补充 JS 实现高性能 Node、Web 应用程序》
In Architecture, Performance, -
一分钟读论文:《通过反思性目标设定培养工程师的好习惯》
In Engineer, Productivity, -
一分钟读论文:《卓越的开源维护者是如何成就的?》
In OpenSource, Engineer, -
一分钟读论文:《我们走了多远——WebAssembly 运行时的全面特征研究》
In FrontEnd, -
一分钟读论文:《XSS 攻击22年:全面调查及系统综述》
In Security, -
一分钟读论文:《细孔沉千帆:小程序权限漏洞研究》
In Security, -
一分钟读论文:《影响大规模敏捷软件开发按时交付的因素》
In Productivity, -
一分钟读论文:《被掏空的一天:软件工程师的日常》
In Productivity, Engineer, -
一分钟读论文:《30年软件重构研究:系统性文献综述》
In Engineering, -
一分钟读论文:《要不要上 TypeScript?GitHub 上 JS 和 TS 应用软件质量的系统比较》
In FrontEnd, -
一分钟读论文:《NPM 供应链的软肋是什么?》
In Security,