meituan_2025-09-02

美团正式发布并开源 LongCat-Flash-Chat，动态计算开启高效 AI 时代

2025-09-01

LongCat-Flash-Chat 采用创新的混合专家模型（MoE）架构，总参数量560B，通过“零计算专家”机制实现动态激活（平均27B/Token），显著提升推理效率。在H800上达到100+ tokens/s生成速度，成本低至5元/百万Token。模型在智能体任务、指令遵循和编程基准中表现卓越，尤其在τ2-Bench和IFEval中领先。支持SGLang/vLLM高效部署，适用于高并发复杂Agent应用。

阅读全文