Reddit ML - 2026-01-15
1. [项目] 在单张RTX 5090上尝试打造DeepSeek风格的萌系模型
一位无机器学习背景的爱好者,在客厅用单张RTX显卡训练一个2.36B参数的MoE模型,分享了技术细节、踩坑经验(如路由初始化)和初步训练结果。
作者: /u/exhorder72 | 发布于: 2026-01-14 19:53
2. [R] 在谱球上受控的大语言模型训练
提出谱球优化器,通过严格约束权重和更新的谱范数,实现更稳定高效的大模型训练,性能优于AdamW和Muon。
作者: /u/StartledWatermelon | 发布于: 2026-01-14 15:23
3. [D] 使用深度学习对低资源语言进行分类
用户在用多语言BERT微调低资源语言分类任务时遇到严重过拟合问题,尝试调整dropout、早停和数据增强均未解决,寻求达到75%准确率的训练建议。
作者: /u/Sikandarch | 发布于: 2026-01-14 06:54
4. CVPR 2026部分研讨会已公布
作者: /u/Striking-Warning9533 | 发布于: 2026-01-14 05:44
5. TMLR审稿时间线疑问:反驳后通常多久能收到决定?
作者询问TMLR期刊在提交反驳意见后,通常需要等待多久才能收到决定,并提到目前已经等待约三周。
作者: /u/SynagogueLog | 发布于: 2026-01-14 00:08
6. [P] 服务商中断比你想象的更常见——这是我们的应对之道
开发多供应商路由时发现,仅靠权重分配不够,需结合实时健康监控、自动故障转移和动态负载均衡,以应对区域性故障和突发限流。
作者: /u/dinkinflika0 | 发布于: 2026-01-14 21:04
7. 脊柱手术决策差异巨大,回顾性机器学习难以解决。探索工作流程原生、结果导向的新方法能否破局。[D]
一位脊柱外科医生探讨如何通过改进临床工作流程,生成结构化数据来学习手术决策模式,以解决当前脊柱手术决策差异大、数据质量低的问题,并寻求机器学习角度的可行性建议。
作者: /u/LaniakeaResident | 发布于: 2026-01-14 20:25
8. [研究] 同行矩阵评估:10个前沿模型相互评判回答,消除单一评估者偏差。异步调试与概率推理任务结果揭晓。
一项对10个前沿大模型的同行互评研究,Claude Opus在代码调试和逻辑推理两项任务中均排名第一,并揭示了不同模型作为评委时的严格度差异。
作者: /u/Silver_Raspberry_811 | 发布于: 2026-01-14 20:10
9. [研究] 我和团队开发了一套能自动生成pufferlib环境的系统,现寻求算力赞助
团队正在开发一个类似蜂群思维的复杂系统,用于创建强化学习环境,目前计算资源有限,公开寻求GPU赞助或合作。
作者: /u/cobalt1137 | 发布于: 2026-01-14 06:40
10. [讨论] 机器学习与大型语言模型:CUDA工作站与苹果芯片对比
用户询问选择本地CUDA工作站还是继续使用苹果M1进行机器学习开发,主要考虑LLM推理、实时AI项目、就业竞争力及成本效益。
作者: /u/Individual-School-07 | 发布于: 2026-01-14 13:22