newsletter

今日要闻

_{生成时间：2025-12-24 10:21:31}

AI 推荐要点

**GLM-4.7 发布，在编码与复杂推理方面显著提升**（来源：AINews）

在SWE-bench验证集上达到73.8%准确率，接近Claude Sonnet 4.5，并引入“交错思考”等新认知模式，是强大的开源编码模型。
**小米发布 MiMo-V2-Flash，强调部署成本与效率**（来源：AINews）

专注于成本与可部署性的混合专家模型，输入Token价格低至每百万0.1美元，vLLM已提供官方服务配置方案。
**谷歌开源 A2UI 协议，推动智能体生成交互式 UI**（来源：AINews）

标志着智能体从“仅聊天”向“UI生成器”的范式转变，提供了一个标准化的接口层，对前端智能体开发有重要影响。
**研究显示生产级智能体项目普遍混合使用多个框架**（来源：AINews）

对1575个项目的实证研究发现，96%的高星项目混合使用LangChain+LlamaIndex等框架，并揭示了逻辑失败、终止检测等核心痛点。
**高性能注意力推理库 QSInference 发布**（来源：AINews）

用于长上下文LLM的量化稀疏注意力Triton实现，在128k上下文下比FlashAttention-2快8倍，专注解决长序列推理瓶颈。
**Fabrice Bellard 发布 MicroQuickJS**（来源：Hacker News）

大师新作，一个极度精简的JavaScript引擎，引发了关于嵌入式脚本语言选择（如JS vs Lua）的深度技术讨论。
**Meta 在其服务器上采用为 Valve Steam Deck 设计的 Linux 调度器**（来源：Hacker News）

游戏硬件优化（减少卡顿）的技术成果（调度器）被Meta应用于数据中心，展示了开源技术奇妙的“下渗效应”。
**PostgreSQL 18 实现即时数据库克隆**（来源：Hacker News）

重要的数据库新特性，能快速创建数据库的时间点副本，极大便利了开发、测试和数据恢复等场景。
**vllm-project/vllm-omni**（来源：GitHub Trending）

vLLM扩展为高效的全模态模型推理平台，支持文本、图像、视频和音频，通过KV缓存管理和流水线重叠实现高吞吐。
**exo-explore/exo**（来源：GitHub Trending）

开源工具，可将手机、电脑等日常设备通过RDMA over Thunderbolt连接成家庭AI集群，实现大模型的分布式推理。

newsletter

今日要闻

AI 推荐要点

各渠道精选摘要

渠道精选

Hacker News 精选

Reddit 精选频道

每周一看