Reddit ML - 2026-01-18
1. [项目] 逐步掌握Transformer内部原理的编程练习
作者分享了一种渐进式实现机器学习算法的练习方法,涵盖注意力机制、BPE分词等主题,并提供了带测试和提示的代码库。
作者: /u/randmusr66 | 发布于: 2026-01-17 08:33
2. [D] 用大语言模型作为语义正则化器进行特征合成(小型决策树实验)
使用LLM筛选枚举合成特征以提升决策树可读性,测试中准确率相当或略优。
作者: /u/ChavXO | 发布于: 2026-01-17 14:59
3. [D] 基于完整叙事证据评估大语言模型的长上下文一致性推理能力
在IIT Kharagpur开发的长上下文推理系统,旨在评估大语言模型能否判断角色背景与整部小说的因果逻辑一致性,而非局部合理性。系统使用Pathway和本地Ollama推理。
作者: /u/vicky_kr_ | 发布于: 2026-01-17 17:29
4. [项目] 机器学习检测混凝土结构表面裂缝
用户寻求使用商业软件生成的裂缝图作为训练数据,开发混凝土表面裂缝检测ML算法的经验与建议。
作者: /u/Charlie_brown1122 | 发布于: 2026-01-17 21:40
5. [D] 感觉LLM推理还缺少它的AWS Lambda时刻。
讨论实现“模型即函数”所需条件,如快速冷启动、状态复用和成本模型,并分析当前推理服务难以弹性伸缩的瓶颈。
作者: /u/pmv143 | 发布于: 2026-01-17 15:54
6. [讨论] KDD论文结果无法复现?
作者质疑一篇KDD论文的可复现性,指出其代码和实验设置模糊,联系作者后未获有效帮助,对论文评审标准表示困惑。
作者: /u/Massive-Bobcat-5363 | 发布于: 2026-01-17 05:11