reddit_machinelearning_2026-04-11

Reddit ML - 2026-04-11

1. [D] RTX 5090 上 cuBLAS 的 MatMul 性能存在 60% 缺陷 [D]

cuBLAS在RTX GPU上存在性能缺陷,批量矩阵乘法效率仅约40%。作者自研内核性能提升最高达70%,并分析了问题根源与优化方案。

作者: /u/NoVibeCoding | 发布于: 2026-04-10 17:51


2. [讨论] 大规模OCR技术探讨

用户需要在一周内以最低成本对5000万页法律文档进行OCR,主要提取文本内容,不关注排版。

作者: /u/vroemboem | 发布于: 2026-04-10 07:55


3. [P] ibu-boost:一个严格拒绝分裂而非相对排序的GBDT库

作者基于一篇论文的核心思想,开发了一个名为ibu-boost的梯度提升树库。它用筛选变换自动决定是否分裂节点,取代了需要手动调优的min_gain_to_split参数,旨在减少过拟合。

作者: /u/Pleasant_Yard_8879 | 发布于: 2026-04-10 15:12


4. 目前最难找的图像/视频训练数据是什么?

作者在构建一个众包图片平台,询问用户最需要但目前缺失的图像数据集,例如欧洲街景、超市货架价格、电表等。

作者: /u/DrinkConscious9173 | 发布于: 2026-04-10 10:08


5. 发布系列视频:构建LLM训练后编排层 [P]

作者分享其重构verl框架编排层的经历,并制作视频系列讲解RL后训练中的编排问题及基于Ray的实践。

作者: /u/ReinforcedKnowledge | 发布于: 2026-04-10 00:24


6. 诚寻AI/计算机视觉研究团队(目标发表论文)[R]

一名在校研究助理寻求加入AI/计算机视觉研究团队,以参与更深入的项目并发表论文。

作者: /u/Strict_Peanut_8025 | 发布于: 2026-04-10 22:37


7. AI发展的新思路 [P]

作者分享了在AI多个领域开发的开源系统,包括让AI自创词汇、用图记录思考过程、通过“良心旁白”对齐模型、利用未来信息微调预测,以及系统化激发创意和问题解决的方法。

作者: /u/transitory_system | 发布于: 2026-04-10 22:41


8. 谷歌DeepMind会无故拒绝求职者吗?

用户询问DeepMind是否会在拒绝时通知申请人,还是直接无回复,并分享了自己申请后未获进一步消息的经历。

作者: /u/n0obmaster699 | 发布于: 2026-04-10 19:19


9. 机器学习社区如何看待技术讨论中的人工智能辅助写作?

作者观察到AI辅助写作在专业环境中受鼓励,但在非正式社区常被怀疑为“AI垃圾”,并就此差异向社区提问。

作者: /u/Boris_Ljevar | 发布于: 2026-04-10 13:42