Article
发布于 2025-08-31
摘要
尝试新开一个系列,用于记录短期的论文阅读,包括对论文内容的快速总结和部分细节、发展背景的整理,以及一些个人的思考。如果能够形成一个 …
发布于 2025-08-31
摘要
本篇写于八月中上旬在甘肃、青海一带旅行的途中,首发于知乎。中国真的是地大物博,甘肃青海一带每两个目的地的距离都在百公里以上,一天有 …
发布于 2025-08-31
摘要
这是一篇类似回忆的东西,一方面或许我自己以后会看,另一方面或许也能给后来者一些参考。也是目前唯一一篇我关于自己的杂谈。 这个杂谈早 …
发布于 2025-08-30
摘要
本文是对于 Zoology 及其前作 Hyena 架构的整理。这两篇论文均在 Hazy Research 上有一份报告,以及相应的 …
发布于 2025-02-15
摘要
这篇很短,主要是记录一些神奇的技术操作。 起因是回校前临时需要打印一些材料,遂尝试用自己的电脑接家里的打印机。家里的设备都是老东西 …
发布于 2025-02-14
摘要
众所周知,LLM 的激活值因为异常值的存在而难以量化。2022年的时候,SmoothQuant 提出使用一个可调节的系数矩阵将量化 …
