reddit_machinelearning_2026-03-06

Reddit ML - 2026-03-06

1. [深度] 韩国匿名论坛数学证明:注意力机制本质是d²问题,而非n²(附PDF)

匿名作者提出“d²拉回定理”,认为注意力机制本质是d²维优化问题,并用二次核替代softmax以降低计算复杂度至O(nd³)。

作者: /u/Ok-Preparation-3042 | 发布于: 2026-03-05 05:50


2. [讨论] 开源项目OpenClaw的安全版本问答

作者因担心OpenClaw存在数据泄露等安全风险,用Rust开发了开源、注重安全的AI代理运行时IronClaw,强调其沙箱隔离和加密凭证等特性。

作者: /u/ilblackdragon | 发布于: 2026-03-05 17:36


3. [项目] 绕过CoreML,在苹果神经引擎(Orion)上原生训练110M参数的Transformer模型

作者开源了ORION系统,绕过苹果CoreML限制,直接在ANE硬件上实现稳定训练与推理,并解决了多项技术瓶颈。

作者: /u/No_Gap_4296 | 发布于: 2026-03-05 05:51


4. 有人读过布莱斯·阿圭拉·伊·阿卡斯写的《什么是智能》吗?

用户初步阅读后,认为作者可能提出重大主张,内容偏向流行哲学,但因其是联邦学习发明者而保持关注,并寻求他人意见。

作者: /u/LowStatistician11 | 发布于: 2026-03-05 17:47


5. IJCAI 2026审稿结果

用户询问是否有人收到IJCAI 2026的审稿意见,并寻求关于会议主席工具的使用帮助。

作者: /u/adi_gawd | 发布于: 2026-03-05 10:18


6. 欧盟《人工智能法案》对你的工作有何影响?

作者担忧欧盟AI法案对高风险模型(如信用评分)的严格合规要求,可能阻碍小规模测试和快速部署。

作者: /u/spdazero | 发布于: 2026-03-05 10:00


7. [R] ECCV投稿必须包含关键词吗?

首次向ECCV投稿的作者询问提交时是否必须包含关键词。

作者: /u/Training-Adeptness57 | 发布于: 2026-03-05 11:44


8. [开发中] 打造一款基于照片的卡路里追踪应用

开发者探讨用机器学习提升拍照卡路里估算精度,关注菜品识别、份量估计及移动端深度估算的可行性。

作者: /u/DinoDinac | 发布于: 2026-03-05 02:43


9. [P] DWARF:基于外差接收器物理原理的O(1)键值缓存注意力机制

DWARF通过固定约1.5GB的KV缓存和44个物理推导的偏移量计算注意力,大幅降低长上下文内存占用。

作者: /u/MariusNocturnum | 发布于: 2026-03-05 20:03