meituan_2025-09-02

美团正式发布并开源 LongCat-Flash-Chat,动态计算开启高效 AI 时代

2025-09-01

LongCat-Flash-Chat 采用创新的混合专家模型(MoE)架构,总参数量560B,通过“零计算专家”机制实现动态激活(平均27B/Token),显著提升推理效率。在H800上达到100+ tokens/s生成速度,成本低至5元/百万Token。模型在智能体任务、指令遵循和编程基准中表现卓越,尤其在τ2-Bench和IFEval中领先。支持SGLang/vLLM高效部署,适用于高并发复杂Agent应用。

阅读全文