reddit_machinelearning_2026-01-13

Reddit ML - 2026-01-13

Sakana AI提出DroPE方法，无需高昂算力即可扩展预训练大模型上下文长度，挑战了Transformer位置编码的关键假设。

_{作者: /u/AhmedMostafa16 | 发布于: 2026-01-12 05:53}

研究生寻求机器学习与动力系统领域的经典书籍推荐，尤其关注神经微分方程、物理信息神经网络等交叉方向。

_{作者: /u/cutie_roasty | 发布于: 2026-01-12 13:06}

开源FASHN Human Parser模型，基于SegFormer-B4架构，针对时尚图像进行人体解析，可识别18类身体部位和服饰。

_{作者: /u/JYP_Scouter | 发布于: 2026-01-12 14:57}

研究发现，不同大模型作为评估者时评分差异巨大，但各自内部评分却高度一致，形成了独特的“评估指纹”。

_{作者: /u/PromptOutlaw | 发布于: 2026-01-12 11:48}

作者发起关于MLSys 2026审稿回复阶段的讨论，旨在分享审稿意见的规律与实用见解，以帮助作者更有效地进行回应。

_{作者: /u/TheUltimateAnswer_42 | 发布于: 2026-01-12 17:22}

提出一种基于博弈论反馈的LLM智能体闭环引导方法，通过将交互日志转为图结构并求解纳什均衡，将均衡统计量作为策略信号注入系统提示。实验显示成功率显著提升。

_{作者: /u/Obvious-Language4462 | 发布于: 2026-01-12 18:26}

作者测试了精算模型与神经网络结合的混合方法预测死亡率，结果显示混合模型性能有小幅稳定提升。他询问如何评估神经网络带来的实际价值，并关注避免过拟合等问题。

_{作者: /u/richtnyc | 发布于: 2026-01-12 17:03}