ai_news_summary_2025-10-17

AINews - 2025-10-17

原文链接

Anthropic发布Claude Haiku 4.5，完全跳过Haiku 4.0和4.1版本。该模型性能接近Sonnet 4.5，但速度快2倍以上，成本降低3倍。定价为输入1美元/百万token，输出5美元/百万token。

Google和Yale联合发布基于Gemma的27B基础模型Cell2Sentence-Scale，该模型生成的关于癌细胞行为的新假说已在活细胞中得到实验验证。团队开源了模型权重和相关资源。

Apple发布M5芯片，配备iPhone 17时代的设备端AI加速器，声称使用8B参数模型时，LLM提示处理速度比M4快约3.5倍，SSD速度提升2倍，统一内存带宽达150GB/s。

Google发布Veo 3.1和3.1 Fast视频模型，新增更丰富的原生音频、改进的电影风格、视频到视频参考、更平滑的过渡和视频扩展功能。

ChatGPT现在可以自动管理和重新排序保存的记忆，支持按最近时间搜索和排序，该功能正在向Plus/Pro网页版用户推出。

Meta论文《Agent Learning via Early Experience》报告通过隐式世界建模和自我反思训练AI代理，无需奖励或演示，在8个环境中提升网络导航(+18.4%)、复杂规划(+15.0%)和科学推理(+13.3%)能力。

日本正推动OpenAI停止在动漫和漫画IP上的训练，并遏制模仿受保护角色的输出，理由是标志性设计具有文化价值，这与日本宽松的文本和数据挖掘例外条款形成冲突。

MIT DSPy实验室宣布递归语言模型(RLMs)，可处理无限上下文并减少上下文衰减，据报道在1000万+token上获得114%的性能提升，即将推出DSPy模块。

Poolside宣布与CoreWeave合作，从2025年12月开始获得40,000+ NVIDIA GB300 GPU，同时启动德克萨斯州西部的2GW AI园区项目Horizon，实现从基础设施到智能的全栈建设。

OpenAI发布gpt-5-search-api，支持域名过滤，价格为10美元/千次调用，比之前降低约60%，提供更高精度的网络查询功能。

Claude Haiku 4.5在OpenRouter上发布，在SWE-bench Verified基准测试中取得超过73%的成绩，在计算机使用任务上超越Sonnet 4，提供接近前沿智能的推理能力。

Windsurf添加Haiku 4.5支持，以1倍积分提供Sonnet 4级别的编码性能，成本仅为三分之一，速度提升2倍以上，用户报告工具调用体验良好。

阿里巴巴Qwen发布密集的Qwen3-VL 4B和8B模型，在FP8精度下运行，VRAM需求低，在STEM、VQA、OCR、视频理解和代理任务上超越Gemini 2.5 Flash Lite和GPT-5 Nano。

Unsloth确认Qwen3-VL微调功能正常，并发布可运行的笔记本文档，支持视觉语言SFT/LoRA微调，提供稳定的模板和评估指南。

早期基准测试显示，4,000美元的NVIDIA DGX Spark(128GB)在gpt-oss-120b-fp4上仅达到约11 tokens/秒，而4,800美元的M4 Max MacBook Pro达到约66 tokens/秒，主要受LPDDR5X带宽限制。

发布retrieve-dspy，一个模块化DSPy集合，用于比较HyDE、ThinkQE、重排序变体等复合检索策略，提升检索增强生成效果。

Pydantic AI 1.1.0版本集成Prefect工作流管理器，提供更强大的代理编排能力，支持复杂的多步骤AI代理任务管理。

NotebookLM for arXiv功能可将密集的AI论文转换为具有跨论文上下文的对话式概述，支持研究人员快速理解多篇相关论文内容。

Andrej Karpathy发布nanochat d32模型，训练约33小时，成本约1,000美元，在CORE基准上达到0.31(GPT-2约0.26)，GSM8K从8%提升至约20%。

Hugging Face Agents & MCP Hackathon将于2025年11月14-30日回归，规模扩大3倍，上次活动有4,200注册、630提交，分发超过100万美元API积分。