AINews - 2025-07-12
📰 十大AI新闻要点
1. xAI发布Grok 4模型
xAI在成立两周年之际发布了Grok 4模型,据传参数量达2.4T,成为继Claude 4 Opus之后第二个公开的超过2T参数的模型。该模型在HLE、GPQA、HMMT等多个基准测试中创下新高,并推出了每月300美元的Grok 4 Heavy版本。
2. Grok 4在多个基准测试中表现优异
Grok 4在ARC-AGI、Vending-Bench、AIME等多个基准测试中表现优异,特别是在ARC-AGI-2测试中达到了15.9%的准确率,并在HLE测试中达到了50.7%的准确率。
3. Grok 4的API定价公布
Grok 4的API定价为每百万输入token 3美元,每百万输出token 15美元,并确认支持256K的上下文窗口。
4. Mistral AI发布Devstral 2507模型
Mistral AI发布了Devstral Small和Medium 2507模型,这些模型在性能和成本效率上有所提升,特别适合软件工程工作流。
5. Liquid AI开源LFM2模型
Liquid AI开源了第二代Liquid Foundation Models (LFM2),这些模型优化了在CPU上的性能,适合边缘设备使用。
6. Google更新Veo 3和T5Gemma
Google更新了Veo 3,新增了将照片转换为带声音视频的功能,并发布了T5Gemma,这是下一代编码器-解码器模型。
7. Hugging Face发布SmolLM3模型
Hugging Face发布了3B参数的SmolLM3模型,并提供了详细的技术报告和训练配方。
8. Perplexity推出Comet浏览器
Perplexity开始邀请测试其新的代理浏览器Comet,该浏览器采用混合客户端-服务器架构,旨在成为“认知操作系统”。
9. METR研究发现AI编码助手可能减慢开发速度
METR的一项随机对照试验发现,2025年初的AI编码助手可能会减慢经验丰富的开源开发者在复杂任务上的速度。
10. Figure Robotics宣布通用机器人即将实现
Figure Robotics的CEO Brett Adcock宣布,团队已扩大到293人,新的北加州园区将支持设计和制造,目标是生产10万台机器人。
🛠️ 十大工具产品要点
1. Grok 4 Heavy版本
Grok 4 Heavy是xAI推出的高端版本,每月订阅费300美元,相当于O3 Pro版本,但存在一些可靠性问题。
2. Grok 4的系统提示泄露
Grok 4的系统提示在GitHub上公开,展示了其分析X用户资料、帖子等内容的能力,并要求在生成图像前进行确认。
3. Devstral-Small-2507模型
Mistral AI和All Hands AI发布的24B参数模型,专为软件工程工作流设计,支持功能调用和Tekken tokenizer。
4. Phi-4-mini-flash-reasoning模型
微软发布的3.8B参数模型,采用SambaY混合解码器架构,专注于数学推理任务。
5. Comet浏览器
Perplexity推出的代理浏览器,采用Chromium基础,集成了AI搜索引擎,旨在提升工作流效率。
6. Liquid Foundation Models V2
Liquid AI开源的第二代模型,包括350M、700M和1.2B参数版本,优化了CPU上的推理速度。
7. Reka Vision平台
Reka AI推出的多模态平台,支持视频和图像搜索、实时警报等功能。
8. LlamaParse工具
LlamaIndex展示的教程,用于从复杂文档创建自动化数据管道到Snowflake Cortex。
9. GenAI Processors库
Google DeepMind开源的Python库,用于构建异步、基于流的实时AI项目。
10. WarpGBM工具
基于CUDA的替代方案,承诺比LightGBM更快的性能,适合高性能计算任务。