Reddit ML - 2026-01-13
1. [R] 通过舍弃位置嵌入来扩展预训练大语言模型的上下文长度
Sakana AI提出DroPE方法,无需高昂算力即可扩展预训练大模型上下文长度,挑战了Transformer位置编码的关键假设。
作者: /u/AhmedMostafa16 | 发布于: 2026-01-12 05:53
2. [讨论] 机器学习研究生/研究者必读书籍有哪些?特别是关于动力系统、神经ODE/PDE/SDE和PINN的。
研究生寻求机器学习与动力系统领域的经典书籍推荐,尤其关注神经微分方程、物理信息神经网络等交叉方向。
作者: /u/cutie_roasty | 发布于: 2026-01-12 13:06
3. 开源基于精选数据训练的人体解析模型,以解决ATR/LIP/iMaterialist数据集质量问题
开源FASHN Human Parser模型,基于SegFormer-B4架构,针对时尚图像进行人体解析,可识别18类身体部位和服饰。
作者: /u/JYP_Scouter | 发布于: 2026-01-12 14:57
4. [R] 论文:评估指纹——大语言模型评估者行为中稳定且系统性的差异
研究发现,不同大模型作为评估者时评分差异巨大,但各自内部评分却高度一致,形成了独特的“评估指纹”。
作者: /u/PromptOutlaw | 发布于: 2026-01-12 11:48
5. [D] MLSys 2026 审稿意见反驳阶段——对目前评审有何看法?
作者发起关于MLSys 2026审稿回复阶段的讨论,旨在分享审稿意见的规律与实用见解,以帮助作者更有效地进行回应。
作者: /u/TheUltimateAnswer_42 | 发布于: 2026-01-12 17:22
6. [R] 通过博弈论反馈循环引导大语言模型智能体
提出一种基于博弈论反馈的LLM智能体闭环引导方法,通过将交互日志转为图结构并求解纳什均衡,将均衡统计量作为策略信号注入系统提示。实验显示成功率显著提升。
作者: /u/Obvious-Language4462 | 发布于: 2026-01-12 18:26
7. [讨论] 如何评估混合精算/机器学习死亡率模型——神经网络是否真正提升了价值?
作者测试了精算模型与神经网络结合的混合方法预测死亡率,结果显示混合模型性能有小幅稳定提升。他询问如何评估神经网络带来的实际价值,并关注避免过拟合等问题。
作者: /u/richtnyc | 发布于: 2026-01-12 17:03