发布于 6 天前
摘要
这是摘自Nested Learning中的片段。尽管整篇文章依旧很难评价,并且长篇的理论说明中不乏左右脑互搏和理论滥用的成分,但这 …
发布于 18 天前
摘要
本篇包括经典SSM从连续形式到离散形式的参数变换过程推导,Mamba2的周围架构和部分实现细节,以及SSM到经典Linear At …
发布于 2025-11-02
摘要
Lec 1. 神经解剖学 Neuroanatomy 脑的外侧是颅骨、脑膜和幕骨,脑膜又分为三层。 外界传入大脑皮层经过丘脑,其中丘 …
发布于 2025-10-18
摘要
哈哈,居然撑到第二期了.jpg 让我们用 ICLR 2026 submission 的新闻开场吧。 1. Mamba-3 标题:M …
发布于 2025-10-04
摘要
本文是对 Delta Rule 背后的数学推导的重新梳理。其实 DeltaNet 原文已经讲得很清楚了,但是有点乱,在这里从我的思 …
