AINews - 2025-07-08
📰 十大AI新闻要点
1. Ilya Sutskever正式出任SSI CEO
OpenAI前首席科学家Ilya Sutskever宣布正式担任Safe Superintelligence Inc(SSI)的CEO,Daniel Levy任总裁,Daniel Gross已离职。Sutskever强调公司拥有充足算力和团队,并驳斥收购传闻。
2. Perplexity AI整合银行卖方研究数据
Perplexity CEO宣布已免费整合Morningstar金融研究报告,并计划接入更多银行卖方研究数据。同时透露将推出原生集成在Comet中的笔记/会议/头脑风暴功能。
3. Gemini Veo 3视频模型全球开放
Google DeepMind CEO宣布Veo 3视频生成模型现已向全球Gemini Pro用户开放,包括欧洲地区。该模型支持更高质量的视频生成能力。
4. DeepSeek发布R1T2系列模型
DeepSeek推出R1T2模型,速度提升200%,在GPQA和AIME 24等基准测试表现优异。采用专家组装方法训练,MIT许可在HuggingFace开源。
5. OpenAI推出高价Deep Research API
OpenAI新推出的Deep Research API端点价格高达每次调用30美元,其中o3-deep-research定价40美元/百万输出token,远高于标准API。
6. Together AI开源DeepSWE编码代理
Together AI基于Qwen3-32B开发的开源软件工程代理DeepSWE,在SWE-Bench-Verified测试中达到59%准确率。完整训练工具包和方法论已开源。
7. Kyutai发布开源TTS模型
法国AI实验室Kyutai推出开源文本转语音模型Kyutai TTS和Unmute,支持实时语音合成(220ms延迟)和有限的声音克隆功能。
8. NVIDIA GB300 NVL72开始部署
CoreWeave成为首家部署NVIDIA GB300 NVL72系统的云服务商,该平台采用新型架构,专为大规模AI训练和推理优化。
9. MIT研究揭示ChatGPT对学习的影响
MIT研究发现高能力学习者使用LLM进行主动迭代学习,而低能力学习者倾向于直接获取答案,影响认知负荷和知识建构。
10. ZLUDA项目实现非NVIDIA GPU的CUDA兼容
ZLUDA项目取得重大进展,可在非NVIDIA GPU上运行CUDA二进制文件,但面临法律风险和资源限制的挑战。
🛠️ 十大工具产品要点
1. DeepSeek R1T2模型
200%速度提升的代码模型,MIT许可开源,支持专家组装架构和高效推理。
2. Kyutai TTS
开源实时TTS系统,220ms延迟,支持流式处理和有限声音克隆。
3. DeepSWE编码代理
基于Qwen3-32B的RL训练编码代理,SWE-Bench测试59%准确率,完整训练框架开源。
4. PrivateScribe.ai本地转录平台
MIT许可的完全本地化AI转录平台,整合Whisper和Ollama,专为医疗/法律场景设计。
5. OmniAvatar Wan 1.3B
音频驱动虚拟形象模型,8GB显存即可运行,支持实时面部动画生成。
6. mem0.ai长期记忆系统
与Gemini 2.5集成的长期记忆服务,支持个性化AI应用开发。
7. Claude Code工作流
Anthropic Claude Code的高级配置模板库,支持自动化编程工作流和调试。
8. lm_eval评估工具改进
评估库启动时间从9秒优化至0.05秒,支持惰性加载和更直观的任务发现。
9. Torch.compile优化器
通过Dynamo追踪Python代码生成优化内核,自动融合操作并生成高效CUDA/Triton代码。
10. CuTeDSL编程框架
针对NVIDIA Hopper架构的DSL,优化WGMMA和TMA原子操作,提升张量计算效率。