reddit_machinelearning_2026-04-25

Reddit ML - 2026-04-25

一篇14位作者合著的论文，提出深度学习理论正在形成，并总结了五个证据方向：可解玩具模型、极限洞察、简单经验法则、超参数理论和普适现象。

_{作者: /u/dot— | 发布于: 2026-04-24 17:58}

研究品味的关键在于选择正确的问题，先尝试简单方案，避免过度工程化，并懂得适时缩小问题范围。

_{作者: /u/Odd-Donut-4388 | 发布于: 2026-04-24 14:10}

新PyTorch优化器Rose，无状态低内存，收敛快泛化好，在MNIST和GPT训练中表现优于AdamW。

_{作者: /u/ECF630 | 发布于: 2026-04-24 11:05}

用户质疑CS会议（如ICLR）收费高但质量低，出现空海报板、虚拟演讲敷衍等问题，缺乏严格标准。

_{作者: /u/casualcreak | 发布于: 2026-04-24 17:48}

数据科学家角色正从模型开发转向AI工程，核心价值被忽视，行业更重视应用而非基础研究。

_{作者: /u/The-Silvervein | 发布于: 2026-04-24 11:55}

讨论ICML 2026录取的平均分数阈值预测，作者通知日为4月30日。

_{作者: /u/Fit_Scale_1464 | 发布于: 2026-04-24 07:29}

DharmaOCR 开源，基于3B/7B模型微调，性能超越GPT-5等，DPO降低87.6%失败率，AWQ量化降低22%成本。

_{作者: /u/augusto_camargo3 | 发布于: 2026-04-24 17:59}

开源了首个血液检测模型BloodshotNet，含2.3万标注图像和YOLO26权重，用于内容审核，CPU上可达40+FPS。

_{作者: /u/PeterHash | 发布于: 2026-04-24 15:00}

用户询问在历史数据训练项目中，应选择Nanochat还是Llama架构，因Nanochat缺乏Transformers兼容性，而Llama更开放。

_{作者: /u/centerstate | 发布于: 2026-04-24 04:31}

用户训练大型ML模型时，因全训练耗时一天，用缩短epoch的HPO和剪枝加速，但担心参数漂移，并询问剪枝是否惩罚慢收敛模型。

_{作者: /u/Counter-Business | 发布于: 2026-04-24 17:52}

一种轻量级减少LLM幻觉的方法，通过对比采样仅用10%数据训练，在事实性上优于DPO和SFT。

_{作者: /u/Round_Apple2573 | 发布于: 2026-04-24 13:46}