reddit_machinelearning_2026-01-18

Reddit ML - 2026-01-18

作者分享了一种渐进式实现机器学习算法的练习方法，涵盖注意力机制、BPE分词等主题，并提供了带测试和提示的代码库。

_{作者: /u/randmusr66 | 发布于: 2026-01-17 08:33}

使用LLM筛选枚举合成特征以提升决策树可读性，测试中准确率相当或略优。

_{作者: /u/ChavXO | 发布于: 2026-01-17 14:59}

在IIT Kharagpur开发的长上下文推理系统，旨在评估大语言模型能否判断角色背景与整部小说的因果逻辑一致性，而非局部合理性。系统使用Pathway和本地Ollama推理。

_{作者: /u/vicky_kr_ | 发布于: 2026-01-17 17:29}

用户寻求使用商业软件生成的裂缝图作为训练数据，开发混凝土表面裂缝检测ML算法的经验与建议。

_{作者: /u/Charlie_brown1122 | 发布于: 2026-01-17 21:40}

讨论实现“模型即函数”所需条件，如快速冷启动、状态复用和成本模型，并分析当前推理服务难以弹性伸缩的瓶颈。

_{作者: /u/pmv143 | 发布于: 2026-01-17 15:54}

作者质疑一篇KDD论文的可复现性，指出其代码和实验设置模糊，联系作者后未获有效帮助，对论文评审标准表示困惑。

_{作者: /u/Massive-Bobcat-5363 | 发布于: 2026-01-17 05:11}