秋月春风学AI/DS
2025
12月
分析大模型在Temperature=0时仍产生不同输出的根本原因(浮点运算非结合性、MoE架构、硬件异构性等)。本问题的产生深切反映了没学到本质,做的偏LLM顶层,疏忽了理解原理。
整理自 https://arxiv.org/abs/2512.13564 《Memory in the Age of AI Agents》
08月
整理自 https://arxiv.org/abs/2507.21046 《A Survey of Self-Evolving Agents- On Path to Artificial Super Intelligence》
07月
整理自多篇综述与论文,以《A Survey of LLM-Driven AI Agent Communication- Protocols, Security Risks, and Defense Countermeasures》为主线。
06月
整理自 https://arxiv.org/abs/2412.14222 《A Survey on Large Language Model-based Agents for Statistics and Data Science》 & https://arxiv.org/abs/2510.23045 《A Survey of AI Scientists》
02月
整理自 https://arxiv.org/abs/2411.16594v7 《From Generation to Judgment- Opportunities and Challenges of LLM-as-a-judge》
一周速通single cell基本概念的survey
2024
03月
位置编码笔记整理 绝对位置编码、RoPE、2D/3D RoPE、M-RoPE、PI、NTK-Aware、ALiBi、YARN、位置编码外推等。
ResNet精读与整理,缓解梯度爆炸的数学原理。
Transformer模型笔记整理,参考资料已附在开头。
Page 2 / 5


