V2EX 热门帖子
1. 今天 claude opus 和前两天比,质的飞跃
不知道是不是因为身份识别的缘故,晚上用 cc 感觉突然换了个 ai 一样
作者: syyyyy | 发布时间: 2026-04-15 13:16
2. 999 包月价?
今天看到 trae 闪烁这个广告。999 ,是写错小数点了吗? 不应该是 9.99 吗?
作者: stevenrao | 发布时间: 2026-04-15 13:04
3. 调查: 有人跟我一样用 微信文件传输助手 当记事本用的吗
偶尔有碎片的文字需要记录一下,懒得打开别的 APP, 就顺手发给文件传输助手.
手机/PC 就就都有记录了,用的时候翻翻聊天记录,还支持搜索..
就是一换手机数据就没了.
作者: libii | 发布时间: 2026-04-15 12:01
4. 科普一下低价 gpt 是怎么来的
说白了就是卡 bug 的灵车。
像新加坡、日本、英国这些地区,有时候会有首月免费试用。Telegram 上有 bot 可以全自动免费帮你开通。你只要把自己的 access token 贴进去,它就帮你操作。原理基本就是 ip 代理到免费试用活动区,拿虚拟信用卡、假地址之类的东西去薅首月试用。
这种东西真不建议碰。先不说稳不稳,光是把自己的 token 交出去这件事就已经很危险了,封号、盗号、隐私泄露都有可能。如果 GPT 确实能给你的生活和工作带来帮助,老老实实付费订阅得了。再说了,低价区一个月也就 70 多,真没必要省这点钱
作者: xitler | 发布时间: 2026-04-15 05:50
5. 许久没有登录了,现在登录上来全是 AI 话题
许久没有登录了,现在登录上来全是 AI 话题。已经没有技术贴了,怀念古法编程
作者: huyan3280 | 发布时间: 2026-04-15 11:20
6. Anthropic 宣布在 Claude 平台推行身份验证机制
Anthropic 正在其 Claude 平台逐步推行身份验证机制,当用户访问特定功能或触发常规平台完整性检查时,系统会要求通过第三方合作伙伴 Persona Identities 完成验证以防止滥用、执行使用政策并履行法律义务,用户需提供有效的政府签发证件(如护照、驾照或国民身份证)并拍摄实时自拍。身份验证数据仅用于确认用户身份及合规用途,不会用于模型训练,也不会共享给第三方用于营销。
若验证后发现用户多次违反政策、来自不支持的地区或未满 18 岁,其账号仍可能被封禁。
作者: enzocc | 发布时间: 2026-04-15 06:12
7. claude 认证莫慌
黑市已经有认证服务提供了
作者: MoGeJiEr | 发布时间: 2026-04-15 07:49
8. [开源] Best of RS - 一个由 Rust 编写的追踪 Rust 开源趋势的全栈 web 项目
Best Of RS
核心
根据
Github API定时抓取 rust 开源库快照,计算变化量。后台负责权限,开源库管理,分类管理。 不管你是 rust 开源库的维护者还是使用者,都可以在这里日常追踪你心仪的项目,或者发现那些你未了解过的新玩意。架构实现
BestOfRS 是一个简单的项目,采用 clean 架构实现,依靠 Dioxus fullstack 实现良好的 seo 。代码鲁棒性 ok ,拓展良好,是一个极佳的学习项目以及开发模板。
更多细节可查看架构文档
仓库: https://github.com/zhiyanzhaijie/bestofrs
官网: https://bestofrs.org欢迎大家使用!
作者: zyzj | 发布时间: 2026-04-15 17:10
9. opencode 消息周知插件
用 opencode+iterm2 开发,消息周知有什么好的插件吗?官网给的这个不太好用啊 https://github.com/mohak34/opencode-notifier
作者: tchqiq | 发布时间: 2026-04-15 13:57
10. 搞个云端 claude code 防止 封号
被封了几个号后,发现问题出在很容易忘记切换 全局代理。更换设备这些操作导致 ip 漂移; 于是突发奇想,如果把 claude code cli 所有操作行为锁死在一台 vps ; 就弄了个云端 web terminal 这小工具;
自己用了 2 天,写了 1 个 小项目,感觉还不错,意外收获是可以用手机直接打开网页,也可以躺在床上 编程了 但是手机输入不方便,于是就加了个 语音转 文字输入功能;
说来搞笑,我这个工具全程都使用 claude code 开发出来,用魔法打败魔法啊。我问他这个方案有没有违法 claude code 规则,他说 没有使用第三方工具使用订阅 token ,还是使用原生的 claude code cli ;在允许范围之内;看起来这条路目前比较安全。
有同样需求的同学可以试用一下,不过前提是你需要一台海外 vps 。我用的腾讯云 轻量 vps 99 元一年那种;之前用它来搭梯子。
作者: stevenrao | 发布时间: 2026-04-15 09:29
11. 分享一个自己做的 Nginx 管理工具,实时请求动态预览!(无奈市面上实在找不到好用的,自己撸了个)
NginxMaster [可视化 Nginx 管理面板]
Github 地址: https://github.com/pch18/nginxMaster
欢迎 Issue & PR !(同求 git 仓库点亮小星星⭐️)
简介
- 支持配置: 反向代理, 静态页面, 重定向 等
- 保存自动校验,失败自动回滚,确保 Nginx 服务不中断
- 可以管理 SSL 证书,自动识别证书内容,校验合法性(自动续签待开发)
- 实时请求动态展示(基于 SSE 实现),以及 CPU 、内存、网络监控
- 更多功能开发中
登录方式
- 默认连接地址: http://IP:9999
- 默认用户名: admin
- 默认密码: admin9999
docker 安装命令:
(二选一)
docker run -d --name nginx-master --net=host --restart always pch18/nginx-master docker run -d --name nginx-master -p 9999:9999 -p 443:443 -p 80:80 --restart always pch18/nginx-master支持多架构,amd64, arm64 等,如果缺了某个架构的构建,请提 issue
裸机安装命令(前提安装完 nginx )
(二选一)
curl -fsSL https://raw.githubusercontent.com/pch18/nginxMaster/refs/heads/main/install.debian | sudo bash wget -qO- https://raw.githubusercontent.com/pch18/nginxMaster/refs/heads/main/install.debian | sudo bash
作者: pch18 | 发布时间: 2026-04-15 15:25
12. claude code 崩了么?
API Error API Error: 500 一直这个提示
作者: usbaby | 发布时间: 2026-04-15 15:04
13. 程序员的死局
以前 AI 写出烂代码,我总是会忍不住骂(指导)一下。但我今天突然想到一件事,然后就骂不出来了。那就是,我的每一次反馈都将成为 AI 提升的养料。
俗话说“教会徒弟饿死师傅”,现在我正在做这件事情。
这件事比自动驾驶替代出租车司机还无奈。至少自动驾驶的训练数据不是出租车司机们跑出来的。
作者: dsd2077 | 发布时间: 2026-04-15 13:46
14. 今天在反重力上用 claude 一点都不丝滑,有同样的感受吗?
前几天在反重力上用 claude opus4.6 好好的,非常丝滑,今天就用着很卡,断断续续的,白夸了
作者: ccai | 发布时间: 2026-04-15 14:36
15. GOGDNS 一款简易的私人 DNS 服务器
一款简易的私人 DNS 服务器
DockerHub: https://hub.docker.com/r/billghifun/gogdns
GayHub: https://billghifun.github.io/gogdns-docs/
程序具体工作细节可以看文档站中的介绍。
文档站有很长时间没更新了,计划近日更新。
朋友们遇到问题或 bug 可在此贴回复,如有意见或建议同样也欢迎多多回复。
由于此程序是一位不愿透露姓名的菜的抠脚的人进行的古法编程,所以程序一定会有各种稀奇古怪的问题,还请见谅。
大家可以先用于测试,待设置调整趋于稳定后再进行部署。
注:暂时还未开源,担心有问题的朋友还请慎重下载使用。
作者: Ghifun | 发布时间: 2026-04-15 11:34
16. 海外 Android 手机有什么好用的国内第三方应用市场推荐吗
如题 酷安已死好像没有下载应用的功能了
作者: Kaisar | 发布时间: 2026-04-15 08:40
17. 一个版本, 50 项更新:我们几乎重做了整个播放页
一个版本,50 项更新:我们几乎重做了整个播放页
深夜,戴上耳机,打开播放器,只想安安静静听一首歌。但播放页太挤,歌词看不清,背景和封面不搭……
我们也有同样的感受。所以这次,我们把所有的不舒服,都改了。
静听 1.6.0 ,一个版本,50+ 项更新。从播放页到播放条,从皮肤到搜索,从 iOS 26 适配到每个像素——几乎重新打磨了一遍。
播放页:推翻重来
封面背景,像 Apple Music 一样沉浸。 提取专辑封面施加高斯模糊,模糊力度大到几乎看不清原图,只保留色彩氛围。
歌曲信息和歌词,左右滑动切换。 点击封面也能切换,告别误触。
圆形封面可以旋转。 设置新增封面形状:正方形(默认不旋转)或圆形(缓缓旋转,像黑胶唱片)。
频谱和进度条支持魔法色。 可跟随皮肤主题色或开启魔法色,不再抢眼。
右上角更多按钮,顶部指示条。 参考 QQ 音乐简洁布局,全机型比例适配。
播放条:极简或完整
新增两种模式:极简模式 去掉进度条和更多按钮,进度显示在播放按钮上,高度降低;普通模式 保留完整可拖动进度条。设置页一键切换。
iOS 26 液态玻璃:第一时间适配
导航栏高斯模糊、弹窗圆角统一、TabBar 仿 Apple Music (新增搜索 Tab )、灵动岛适配、锁屏信息更新。升级后像系统原生应用一样自然。
皮肤系统:从”能用”到”好看”
新增系统皮肤(黑白底色+红色高亮),浅色模式文字对比度全面修正,皮肤商店切换即时刷新,经典颜色回归。
音乐库:更聪明更紧凑
分组/筛选/排序整合进右上角菜单,当前选项有对勾标记。按标题分组后右侧出现字母索引。Cell 瘦身至 50pt ,字体按机型比例适配。三行目录精简为两行,批量管理移入设置。列表底部歌曲数和歌词数回来了。
搜索:本地即时响应
实现本地搜索,输入歌名歌手专辑即时出结果。移除三方键盘库修复闪退,Segment 可滑动,主题搭配优化。
还有更多
播放清单点击修复、二级页面播放条对称、歌词写入元数据、WMA 正常播放下一首、短音频正常完成、进度条可拖动且不卡住、封面波纹不再溢出、资料库间距和图标优化、设置新增显示原始标题……
每一项背后都是用户反馈、反复测试、像素级调整。
静听只做一件事:让你手机里的音乐,听起来舒服,看起来也舒服。1.6.0 ,已在 App Store 上线。 https://apps.apple.com/cn/app/id6755151133
作者: kfj92 | 发布时间: 2026-04-15 12:59
18. 北京互联网法院有什么攻略么?起诉北京智谱华章科技股份有限公司退款可行么?
买了质谱的 coding plan ,用了两个月,一直感觉不错,直到前几天,说我是多人使用,一直不让我用。
我一个人用,说我是多人使用,无理由封锁服务,多次!客服没有证据,没有退款。315 投诉估计没用。 北京互联网法院有攻略么?直接起诉退款吧。
作者: feelapi | 发布时间: 2026-04-15 07:47
19. 把电脑伪装成电视,用 DLNA 投屏拿到视频号直播流地址
最近想把视频号的一些直播存下来,搜了一圈发现这事居然这么麻烦 —— 要么挂代理抓包装证书,要么上逆向 Hook 微信进程,总之没一个省心的。
后来突然想到一个事:微信投屏到电视不是用的 DLNA 吗?那电视能拿到直播流地址,我电脑装个假电视不就行了?
试了一下,还真可以。SSDP 组播宣告自己是 MediaRenderer ,微信就会在投屏列表里显示出来。选中之后微信会通过 SOAP 把 m3u8 地址 POST 过来,直接截获就完事了。
整个过程不需要动微信客户端,不需要证书,不需要代理,因为这就是标准的 DLNA 协议流程 —— 微信没法区分真电视和假电视。
用纯 Python 标准库写的,零依赖,500 来行代码:
pip install wechat-finder-dlna wechat-finder-dlna # 手机投屏过来就能拿到直播流地址拿到地址之后 ffmpeg 录制、VLC 播放都行。也支持
--record直接录。B 站、爱奇艺那些支持 DLNA 投屏的 App 也都能用,不只是微信。
项目在这: https://github.com/gtoxlili/wechat-finder-dlna
有想法欢迎提 issue 交流。
作者: Junian | 发布时间: 2026-04-15 08:34
20. 如何建一个自己的号池,让 cursor 真正实现 token 自由
Cursor Pro $20 一个月,500 次快速请求用完就降速。重度用的人,月中就开始焦虑额度。
但 Cursor 的模型不是只能用它自己的配额。
有办法把外部的免费模型接进去,额度用完无缝切换,不中断编码。
先说能接什么
目前能免费拿到的顶级编码模型:
来源 模型 费用 怎么拿 Kiro Claude Sonnet 4.5 免费(约 500 次/月) kiro.dev 注册 Codex GPT-5.4 等 7 个模型 限时免费 安装即用 Antigravity Gemini 3.1 Pro 免费 Google AI Pro 首月免费领 Groq Llama 70B, Kimi K2 免费 注册拿 API Key Cerebras Qwen 235B 免费 注册拿 API Key Gemini API Gemini 2.5 Pro 免费 Google 账号登录 AI Studio 这些加起来,Sonnet + GPT-5.4 + Gemini 3.1 Pro + Llama 70B + Qwen 235B ,全部零成本( Codex 为限时免费)。
问题是:这些配额各自为政,不能直接在 Cursor 里用。
怎么接进 Cursor
用 OpenRelay 。
它跑在本地,把上面所有配额统一成一个端点,然后通过 RPC 代理无缝接入 Cursor 。
具体步骤:
1. 装 OpenRelay
去 GitHub 下载可执行文件:github.com/romgX/openrelay/releases
Windows 双击运行,macOS 终端执行:
chmod +x openrelay-macos xattr -d com.apple.quarantine openrelay-macos ./openrelay-macos打开
http://localhost:18765,进 Web 面板。2. 添加免费 Provider
OpenRelay 会自动扫描你机器上已有的 AI 工具——Kiro 、Claude Code 、Antigravity——自动发现它们的配额。
API 类的( Groq 、Cerebras 、SambaNova ),在面板里点「添加 Provider 」,填一次 API Key 。
3. 组配额池
在面板的「自定义模型组」里,把多个 Provider 串成一条链:
"coding-sonnet" = Kiro (Sonnet 4.5) → Claude Code (Sonnet 4.6) "coding-fast" = Groq (Llama 70B) → Cerebras (Qwen 235B) → SambaNova (DeepSeek V3.2)第一个配额用完,自动切第二个。你感知不到切换。
4. 接入 Cursor
面板里找到 Cursor ,开启 RPC 代理。Cursor 会无缝使用你的配额池,不需要改 Cursor 的任何设置。
搞定。
Claude Code 同理
如果你用 Claude Code ,接入更简单:
export ANTHROPIC_BASE_URL=http://localhost:18765 export ANTHROPIC_API_KEY=unused或者面板里一键配置:选中 Claude Code → 选择 Provider → 开关打开 → 重开终端。
现在 Claude Code 走你的配额池。Kiro 的 Sonnet 用完,自动切 Groq 的 Llama ,再切 Cerebras 。
Google AI Pro:最大的一块免费配额
单独说一下这个,因为它的含金量最高。
Google One AI Pro 首月免费,包含 Gemini 3.1 Pro 、Claude Opus 4.6 、Sonnet 4.6 、GPT-OSS 120B ,配额每 5 小时刷新。
领取方法:Google One 官网 → AI Pro 方案 → 绑支付方式 → $0 开通。到期前取消不扣钱。
领了之后装 Antigravity ( Google 的 AI 编辑器),OpenRelay 自动发现这个配额,加入你的配额池。
家庭组玩法 :Google One 支持家庭组共享,一个主账号拉 5 个人,所有人共享 AI Pro 权益。每人都能在自己电脑上装 Antigravity ,拿到独立的 Gemini 3.1 Pro 和 Opus 4.6 配额。
OpenRelay 自动发现你本机已登录的 Antigravity ,加上你添加的 API Key ( Groq 、Cerebras 等),全部串成一条配额链。怎么注册、有几个号,它不管——只负责把你已有的配额统一管理和自动切换。
算笔账
方案 月费 能用的模型 Cursor Pro $20 自带模型,500 次快速 Claude Code Pro $20 Opus 4.6 + Sonnet 4.6 本文方案 $0 ( Google AI Pro 首月免费,Codex 限时免费) Opus 4.6 + Sonnet 4.5 + GPT-5.4 + Gemini 3.1 Pro + Llama 70B + Qwen 235B $0 方案的代价是:免费额度有日限,重度用可能不够。但多个 Provider 轮换兜底,日常开发基本不断供。
如果你已经有 Cursor 或 Claude Code 订阅,加上这些免费配额,等于在订阅基础上多了一层保险——额度用完不降速,自动切免费池。
注意事项
- 网络要稳定 ——Google 、Anthropic 对异常 IP 敏感
- Google AI Pro 到期前取消 ——不然扣 $19.99
- 所有数据本地处理 ——OpenRelay 跑在你电脑上,Key 不上传,请求直连 AI 后端
- 开源可审计 ——不放心可以看代码
下载
GitHub:github.com/romgX/openrelay
觉得有用,Star 一下。
作者: rxc420902911 | 发布时间: 2026-04-14 12:40
21. 求推荐稳定、高性价比使用 Claude Opus 4.6 的渠道/平台
求助各位,目前主力用 Claude Opus 4.6 遇到了瓶颈:
官方 Claude Pro 限制太严,随便用用就没额度了;换了“反重力”的 Ultra 级别,结果有积分有额度的情况下还经常报错卡顿,体验极差。想问下大家现在有什么稳定、流畅、性价比又高的使用方案?靠谱的 API 中转站或者好用的第三方平台都可以,感谢大家推荐!
作者: ccai | 发布时间: 2026-04-15 09:58
22. Claude 这样订阅有问题吗
Claude 非老账号,美区伪家宽 DNS 解锁,德区 Appstore 充值卡订阅
作者: leo7476040305 | 发布时间: 2026-04-15 10:07
23. API key (GLM) 怎么使用 claude code desktop ?
Desktop 需要 Anthropic 账号登录, 有办法绕过吗?
作者: yangyao | 发布时间: 2026-04-15 10:54
24. OpenAI Plus 和 Team 都缩水了吗
之前 1 个号管饱,现在 3 个号轮着用,还是不够用,这可咋好 ╮(╯▽╰)╭
作者: 919936091 | 发布时间: 2026-04-15 08:46
25. 现在推荐什么路由器刷 openwrt 的?或者能 ssh 进去的
目前看了红米 ax6000 和京东云雅典娜,这两个的话更推荐哪个?
再奢望下有没有能同时支持 5G 卡的。。既能 5G 卡上网,又能插网线上网,还能 ssh 或者 openwrt ,一机解决所有场景。
作者: han3sui | 发布时间: 2026-04-15 06:14
26. 是不是最近会有什么更聪明的大模型要发布了呀?
最近这两天明显感觉 opus 4.6 变笨了很多,简直是量级的降低!按照惯例,一般有新模型要发布前,现有模型就会降智。真搞不懂为什么要这样干!也还没看到啥新模型要发布呀?传说中的 claude mythos 也不会开放出来给大家用呀
作者: V12306EX | 发布时间: 2026-04-15 02:28
27. 用 Claude 要实名了,内地用户怎么办?
Anthropic 正在给 Claude 加上真实证件验证,目前主要针对新注册账号。新号门槛大幅提高,老号价值跟着涨了。🤡
Anthropic 官方帮助中心上线了”Claude 上的身份验证”页面。核心流程:提交护照、驾照或国家身份证,配合摄像头拍实时自拍,大概 5 分钟。不接受复印件、截图、数字证件。
目前是灰度推出,主要针对新注册账号和触发风控的场景。Anthropic 的原话是”当您访问某些功能时”才会看到验证提示。已经在正常使用的老账号,目前没有大规模推送验证的迹象。
接码平台批量注册的路子,成本和难度都在飙升。而且中国护照验证等于主动暴露内地身份,可能直接触发风控。这是一个两难,不验证功能受限,验证了身份暴露。
反过来,已经稳定运行的老账号价值在提升。有使用历史、有订阅记录、没触发过风控,这些在新规则下都是隐性资产。手里有老号的,好好养着。✌️
AI 平台收紧账号管理是大趋势。OpenAI 去年就开始对部分功能要求身份验证,Anthropic 现在跟上了。模型越强,平台越需要知道谁在用。
我们也不必恐慌。老账号正常使用就好,别折腾,别频繁换 IP ,别共享账号。长期来看,AI 工具的使用门槛只会越来越高。现在多准备一条后路,总比到时候被动好。
这件事换个视角看,其实利好谷歌,大家左手 Claude ,右手 Gemini ,还是一条好汉。
作者: mastergo | 发布时间: 2026-04-15 08:55
28. 帮我爸找回了一篇赛博兰亭集序
五年前给老爸买的 iPad ,最近屏幕摔坏了
我把自己的 iPad 丢给他之后,下载了好几个牌类 app (老家特有的某种字牌游戏)都不支持单机模式,他玩得很不得劲,跟我说起老 iPad 里有一款 app 完全支持单机模式
于是楼主开始了寻找失传文件的路程
楼主先用 ipatool 抓包同名 app 的最老版本,安装后提示版本过旧无法登录,无法确认单机模式是否存在;考虑过用 Claude code 逆向去掉登录墙,但苦于手上没有越狱设备,无法砸包;
仔细查阅,推测这个 app 应该有过包名更改和旧包下架,而旧包几乎成了失传文件,只能想方设法从老 iPad 里提取出来
老 iPad 内屏卖 220, 整机闲鱼也只能卖 3 、400, 为了一个 ipa 花几百块钱实在不划算,于是楼主想了个歪点子:
1.盲输锁屏密码
2.mac usb 连接 ipad ,通过 quicktime 投屏 ipad 到 mac ,连蓝牙鼠标
3.万幸多年前老 ipad 上装过 trollstore ,跑 trolldecrypt 砸包,直接给 ipa 提取出来了
4.给新 ipad 安装 livecontainer ,把 ipa 塞进 livecontainer ,完美运行
能用自己的能力帮上家人,很幸福
作者: lemoncoconut | 发布时间: 2026-04-15 09:58
29. 现在那家的 coding plan 还能买到
作者: fengshils | 发布时间: 2026-04-15 03:26
30. 讯飞星辰的 Coding Plan 如何?
刚刚收到讯飞星辰的邮件通知,看到上线了几个套餐
无忧版首月 3.9 元:Qwen3.5-35B-A3B ,Qwen3-Coder-Next-FP8 ,GLM-4.7-Flash
专业版 39 元:Spark X2 ,GLM-5(默认选中),MiniMax-M2.5 ,KIMI-K2.5 ,DeepSeek-V3.2 ,GLM-4.7-Flash ,Qwen3.5-35B-A3B ,Qwen3-Coder-Next-FP8 ,Qwen3.5-397B-A17B
高效版 199 元:套餐是 39 元的 5 倍,多了一个 GLM-5.1
最近一直在使用其他网友的公益站,但很多都挂了,每天一打开电脑就先测哪个站还可以用有点累了。
准备入手一个 39 元的(看中了 GLM5 ,199 元的暂时用不起呀),就是不知道质量如何。如果有网友准备入手了,可填写下我的邀请码 [ MAAS-779BA29D ] ,让我也体验下
作者: default996 | 发布时间: 2026-04-15 06:49
31. 求 vscode 做笔记软件的插件推荐
AI 太强了,打算用 vscode 替代 obsidian ,请问大家在做笔记方面 vscode 有什么好用的插件
作者: aowugong | 发布时间: 2026-04-15 07:09
32. 用多了 AI 后,有没有觉得 AI 生成的文章有很强的既视感?
包括但不限于:
- 排比比喻:这不是 xx, 而是 xxx
- 彩虹屁:这是一个极其硬核且充满数学直觉的思考!这是一个非常具有挑战性且设计复杂的核心脚本!
- 我就在这里,不躲,不藏,不绕,不逃,稳稳地接住你(豆包)
- 我只是个人工智能,所以没法在这方面帮到你。( gemini 废物模式)
- 。。。
这类 AI 句式已经看太多了,甚至最近有点越来越多。以至于现在一看就知道哪些文章可能是 AI 生成的。而且还经常写得非常长,与低质量正相关。
结果就是瞬间失去看下去或者聊下去的动力,或者丢给 AI 让总结吧 /sad
理论上现在 LLM 这么强了,不知道为什么在语言风格上还是缺乏“真人感”。
作者: plmsuper8 | 发布时间: 2026-04-15 02:08
33. 如何 实践 Harness 工程?
看了好几个内容:
https://openai.com/zh-Hans-CN/index/harness-engineering/
https://github.com/walkinglabs/learn-harness-engineering/blob/main/README-CN.md
還有最近 宝玉也有和原作有争论的内容
https://baoyu.io/blog/2026-04-13/ai-first这几个内容后,該怎样实践 Harness ? 有别于 specs, vibe 这種 现有些项目可以尝试进行 Harness 工程?
对于后端 API 服务的话我可以理解怎样做,我认为 有需求,让 AI 處理需求,在提交 PR 时可以做单元测試,再加个定时器做全量的测試,
但是像 前端 项目这種又是怎样做的?
带着好奇心恳请教各位 V2 的大大 ORZ
作者: kenshinhu | 发布时间: 2026-04-15 01:51
34. 啃了那篇 54 页的 Agent Harness 综述, 给大伙讲个省流版
花了两天啃完一篇 54 页的综述, Externalization in LLM Agents ( LLM Agent 中的外化,arXiv 2604.08224 ),用认知科学的框架把 Memory 、Skills 、Protocols 、Harness 这几个看着各管各的工程趋势统一到一个逻辑下面解释,讲的是把能力从模型内部外化到运行环境中的发展过程。我自己这几个月在写一个 coding agent 用的 harness Chorus,所以对这篇综述很感兴趣。说实话 harness 这个词多少有点造词炒热度的味道,但这个先放一边,看看论文本身提了哪些实践。
写了篇完整的解读放博客了: https://chorus-ai.dev/zh/blog/externalization-in-llm-agents/ ,详细的逐页笔记在这: https://github.com/Chorus-AIDLC/Chorus/blob/main/docs/notes-externalization-llm-agents.md ,V2EX 篇幅有限这里简单聊聊,感兴趣可以去看全文。
TLDR: 外部工具不是让模型变强,是把难任务变成简单任务。
论文拿 Donald Norman 的”认知制品”理论做支点。Norman 有个很反直觉的观察:外部工具不是让你能力变强了,而是把任务变成了另一个任务 。
拿购物清单举例,清单不是让你记忆力变好了,它做的事情是把”回忆要买什么”变成了”看一眼纸上写了什么”。任务性质变了,从回忆( recall )变成了识别( recognition ),识别比回忆简单太多了。
LLM Agent 的外化是同一回事。裸模型反复踩三个坑。上下文窗口有限,session 一断记忆就没了,有了外部 memory 之后回忆变成了检索。同一个 prompt 今天分五步做明天分三步后天跳过验证,有了 skill 之后从头发明变成了选择组合。每次调工具都得猜参数格式猜返回结构,有了 protocol (比如 MCP )之后临场猜变成了照着填。共同点就是模型被要求解决的问题变简单了。
TLDR: Weights - > Context -> Harness ,开发者的精力从改模型转向改环境。
然后论文把 2022 到现在的演变分成三层,不是说前一层过时了,而是开发者把边际精力花的地方在转移。2022 年为主是 Weights 阶段,能力等于权重,更大模型更好训练更精对齐,好处是快和泛化强,坏处是想更新一个事实就得 retrain 。2023 到 2024 年是 Context 阶段,prompt engineering 、ReAct、RAG ,不动权重就能改行为,但窗口有限,每个新 session 都是部分失忆的开始。2025 年开始进入 Harness 阶段,从早期的 Auto-GPT 、BabyAGI 到后来的 SWE-Agent(最近还出了个 mini 版,核心 100 行 Python )、OpenHands、LangGraph,可靠性问题越来越多通过改环境解决,不是在 prompt 上修修补补,模型在什么环境里跑比模型本身聪不聪明更影响最终效果。
TLDR: 存多少不重要,检索出什么才重要。
来说说 memory ,这章大概是论文写得最扎实的部分。它把 memory 按”外化了什么负担”分成四层:工作上下文是当前任务的中间状态,不外化就随窗口重置没了;情景经验是之前跑过的决策和失败,能当先例用;语义知识是跨案例成立的抽象,项目惯例之类的;个性化记忆是用户偏好,不能混进通用存储。
memory 架构也经历了几代演进,从全塞 prompt 里的单体上下文,到带检索的外部存储( RAG ),到 MemGPT(现在已经被 Letta 收编了)那种热冷分离的分层管理,再到检索策略本身可以根据反馈演化的自适应系统。论文说存得多但检索弱的系统,给模型呈现的是错误的问题 ,memory 的成功标准不是”存了多少”而是”当前这一步的上下文是不是清晰可读”。
TLDR: 别让模型每次从头发明工作流,打包好让它选。
再说 skill 。模型可能”知道”怎么干一个活,但每次从头推导工作流的时候行为不稳定,跳步骤、停止条件飘忽、工具调用不一致。Skill 就是把验证过的工作流打包成可复用的东西。论文说一个完整的 skill 有三部分:操作过程(步骤骨架)、决策启发(分支处怎么选)、规范约束(什么条件下算合格),三个都指定了才真正可复用。演化路径也很清楚,先是 Toolformer 这种学会稳定调单个工具,然后 Gorilla、ToolLLM 解决工具多了之后选哪个的问题,最后到 Voyager 这种在 Minecraft 里自己探索产生不断增长的代码级 skill 库,能力的存在形式从散落的工具调用变成了可加载可复用的打包知识。
这里有个设计细节挺有意思的,叫渐进披露 。找到一个 skill 不等于要把全部内容立刻塞进上下文,长上下文不能可靠转化为更好性能,详细指令反而可能变成噪声。所以分层加载,一开始只给名字和描述,需要的时候再逐步展开。Claude Code 的 skill 系统就是这么设计的。
TLDR: 不该让模型猜的东西就别让它猜。
然后是 protocol ,论文说在三种外化里 protocol 效果最猛,因为它直接把一整类问题从模型的思考负担里拿走了。没有协议的时候模型每调一个工具都在猜,参数叫什么、按什么顺序传、返回的东西长什么样,这些本来就不该靠猜。有了 MCP ,工具自己声明能做什么参数是什么返回什么,Agent 照着填就行。不过论文没提 MCP 吃 token 的问题,现在社区里 CLI wrapper 大有取代 MCP 的势头。
多 agent 协作方面论文也梳理了几个协议:Google 的 A2A( v1.0 今年 3 月刚发,已经移交 Linux Foundation 了)让 agent 之间互相发现能力和分配任务,IBM 的 ACP 走轻量 REST 路线降低接入门槛,不过 ACP 后来被 Cisco 的 AGNTCY 项目吸收捐给了 Linux Foundation ,独立存在感已经不太强了。论文还理清了一个容易搞混的边界:MCP 管”怎么调工具”,不管”用这些工具该走什么流程”(那是 skill ),也不管”上次聊到哪了”(那是 memory )。
TLDR: Memory 、Skill 、Protocol 三个模块互相喂,正反馈也会放大错误。
最后聊聊模块之间的关系,三个模块不是各干各的,论文画了六条耦合流。
比较有意思的比如 Memory 到 Skill 的经验蒸馏,重复出现的成功路径被抽象成可复用流程。还有 Protocol 到 Skill 的能力生成,接口标准化之后写最佳实践变得容易很多,每个稳定的新接口都是一族新 skill 的种子。
论文还指出了一个自我强化循环:更好的 memory 带来更好的 skill 蒸馏,更好的 skill 产生更丰富的执行记录,进一步改善 memory 。正反馈加速增长,但也放大错误,有毒 memory 导致有缺陷的 skill ,级联下去单个模块控制不住,得靠 harness 级别的干预打断。
读完最大的收获就是一个思维框架吧,遇到 Agent 不靠谱的问题,先想想这个负担应该在模型里还是模型外面,别第一反应换更大的模型。模型擅长的事让模型干,灵活综合、对给定信息做推理。模型不擅长的事搬出去,长期记忆、流程一致性、跟外部系统打交道。
论文的结论也是我这段时间最大的体会:更好的 Agent 不是更好的推理器,是更好地组织的认知系统。
论文: https://arxiv.org/abs/2604.08224 完整解读: https://chorus-ai.dev/zh/blog/externalization-in-llm-agents/ 逐页笔记: https://github.com/Chorus-AIDLC/Chorus/blob/main/docs/notes-externalization-llm-agents.md
作者: fennu2333 | 发布时间: 2026-04-15 04:08
35. Claude 开始引入身份验证
发现 V 站上没有太多人讨论关于 Claude 昨天更新的机制:基于身份证件审查用户。原文是Claude 上的身份验证。
简单来说,Claude 开始接入身份验证机制了,需要有效的政府颁发的带照片的身份证件加摄像头进行验证身份。以下是相关描述:
我们如何验证?
我们选择 Persona Identities 作为验证合作伙伴,基于他们的技术强度、隐私控制和安全保障。请按照以下步骤完成您的身份验证过程。
您需要准备什么
开始前,请准备好以下物品:
- 有效的政府颁发的带照片的身份证件:实体文件,在手边
- 带摄像头的手机或电脑:您可能需要用手机拍摄实时自拍照,或使用网络摄像头
- 几分钟时间:验证通常需要不到五分钟
接受的身份证件类型
我们接受来自大多数国家的原始、实体政府颁发的带照片的身份证件。常见例子包括:
- 护照
- 驾驶执照或州/省身份证
- 国家身份证 您的身份证件必须由政府颁发、清晰易读、完好无损,并包含您的照片。
我们不接受:
- 复印件、截图、扫描件或照片的照片
- 数字或移动身份证件(如移动驾驶执照)
- 非政府身份证件:学生证、员工证、图书卡、银行卡
- 临时纸质身份证件
作者: Quik | 发布时间: 2026-04-15 07:28
36. 腾讯 ieg 招 unity 主程
主攻小游戏研发 需要有较好的 unity 开发经验
可加 minijoe 了解。
作者: minijoe | 发布时间: 2026-04-15 09:34
37. 有没有长期关注 Claude 的朋友,我建了一个 Channel 自动抓取 Claude Team 的推文
这周发现 Cursor 的年订阅到期了,虽然还是去年从闲鱼入的,但是买完好像就用了一个月就吃灰了,这一年一直在用 Claude Code ,不管是工作还是个人生活。
我知晓 Claude Code 的一些新功能,或者是一些不错的分享,都是来源于 X 上面 Team Member 的一些推文,但是刷 X 还有个坏处就是不够聚焦,有时候刷着刷着就上瘾,而且难以沉下心去看一些很有价值的分享。
因此我突发奇想,跑了一个定时任务,抓取 Claude Team Member 的推文(剔除评论、纯转发),交给 Opus 做分类(目前我分了 5 类,分别是 Claude Code, Claude Products, API & Developers, Models & Research, Other )和摘要,再单独做一次翻译,推送到 Discord Channel 。
我坚信 AI 时代应该做减法,因此目前只抓取 5 个账号( Cat Wu, Boris, Thariq, Claude 和 Anthropic 官号),每周也只在周一和周四汇总推送 2 次,我觉得这已经足够我获取到高质量信息了,因为 X 上面大部分的信息其实都是二手加工和转发,Follow the builder, not the influencer.
Channel 我也创建了 2 个,我自己喜欢读英文原文,如果喜欢读中文的也可以只关注中文 Channel 。
Claude 经过了这一年的验证,我自己也学习了好几门 Anthropic 的课程,它绝对是值得我们长期关注和学习的。希望与更多朋友一起交流~
点击可以直接加入 Discord Server
![]()
作者: ChrisCurry | 发布时间: 2026-04-15 04:22
38. 今日份 GPT 5.4 笑话
作者: Zhuzhuchenyan | 发布时间: 2026-04-14 12:57
39. app 闪退拒绝抓包问题
目标 app 环境检测特别多 使用 kernelsu frida 等依然被检测出 ROOT 网络环境等问题(可能自己手机没配置好导致被检测出的)
不知道有什么云平台 [系统层面] 直接抓包的工具推荐的 或者 有偿帮忙抓也行
作者: superboss01 | 发布时间: 2026-04-15 08:56
40. 想用 Windows 系统作为游戏服务器,系统选什么
比较旧的一台零氪 ser5
配置:
CPU: 5800H
内存: 16G DDR4
现在是安装了 Debian 13
docker 跑 GameServerManager 作为 MC 和幸福工程的服务器现在遇到了有部分游戏服务器仅支持 Windows 系统,想换成 Windows ,根据 CPU ,考虑选择 Windows 10 ,请问我选择 server 或者 ltsc ,还是直接安装专业版。如果选择 server 会不会显卡驱动安装会有问题。有更好的结果 11 也是可以考虑的
作者: zhao1cheng | 发布时间: 2026-04-15 07:28
41. 火山云的 Coding Plan 值得买吗? Doubao-Seed-2.0-Code、Doubao-Seed-2.0-pro 这 2 个模型怎么样?
Doubao-Seed-2.0-Code 、Doubao-Seed-2.0-pro 这 2 个模型怎么样?
其他的 GLM-4.7 、Kimi-K2.5 、MiniMax-M2.5 、DeepSeek-V3.2 这些感觉太弱,明显不行。
作者: paranoiagu | 发布时间: 2026-04-15 05:32
42. 用 Zig 写了个 ls 替代工具 zlist,最近做了一些更新
之前在这里发过一次
zlist,这段时间根据 issue 的反馈做了一些改进,简单更新一下:
- 支持单文件路径( zl file.txt )
- 支持多 path 扫描
- 优化了一些错误处理(避免 crash )
- 依赖从 git submodule 迁移到 build.zig.zon
- 做了一些性能优化(大目录下会更快)
- 增加了 benchmark (主要和 eza 还有 macos 自带的 ls 做对比)
目前还在持续打磨中,接下来打算:
- 有人提出希望封装成 lib
- 继续修复一些 issue
项目地址: https://github.com/here-Leslie-Lau/zlist
如果有建议或者想法,欢迎继续拍砖 🙏
目前这个工具,只是学习 zig 的一个练手项目,还存在许多不足。(基于 zig master 构建)
作者: LeslieLau | 发布时间: 2026-04-15 06:13
43. 联通云的 coding plan 不建议
纯恶心,动不动就 429 ,还会莫名出现”type”:”internal_error”,”message”:”/data/ is not a multimodal model”。同样的 skill 我用官方的 glm5.1 就跑得通,用联通云的 glm5.1 就不行。
作者: Yasuke | 发布时间: 2026-04-15 02:15
44. vscode 装了 trae 插件,关闭以后,还能看到几个相关进程
~/VSCode-linux-x64/code ~/.vscode/extensions/marscode.marscode-extension-1.6.22/resource/aiserver/aiServerMainV2.js –pluginHomePathName .marscode –isExternal true –server-root
~/.vscode/extensions/marscode.marscode-extension-1.6.22/resource/aiserver --extension-version 1.6.22 --logFile true --channel vscode --product-name vscode --env-name --is-remote false --enable-event-verify false --log-level info --event-verify-host --machine-id e01993f2a18f70eb2943177305fa60a1af5e6655f7105f6847973755efabfa --ideType vscode-external --aha-ipc-runtime-dir ~/.marscode/server-main --aha-ipc-server-name vscode-ai-server-1.6.22-56138 ~/.marscode/ai-chat/binary/1.6.22/modules/ckg/binary/ckg_server -port=35597 -version_code=2 -storage_path=~/.marscode/ai-chat/AppData/vscode/ckg_server -local_embedding -embedding_storage_type=sqlite_vec -app_id=a4c6ca00-6846-4536-94a6-1b531eb43742 -limit_cpu=1 -source_product=native_ide --ideType=vscode-external ~/.marscode/ai-chat/binary/1.6.22/modules/ai-agent/ai-agent --ideType vscode-external有没有字节的大佬,这几个进程安全么? 会不会后台做些啥?
作者: cnfczn | 发布时间: 2026-04-15 01:38
45. 送一波 Codex 体验福利(相当于官方$28 额度)
呆呆兽中转站 [ DDShub.cc ] 上线 Codex 分组,限时体验福利已放出~
新用户注册填写兑换码即可领取赠金,轻松上手体验。
当前低至 1 折,适合测试与日常使用。
兑换码:0706473F81AFD3FC
作者: xiaoxu1118 | 发布时间: 2026-04-15 07:41
46. 讯飞的 coding plan 怎么样有人用过吗?
有没有用过的,排队严不严重?
作者: qf19910623 | 发布时间: 2026-04-15 01:27
47. Trellis v0.4.0 正式发布!原生 Monorepo 支持 + 多个新平台 + codex 满血支持!
经过 11 个 beta + 2 个 rc ,Trellis v0.4.0 稳定版正式发布!
Monorepo 原生支持
trellis init现在会识别 monorepo ,按包创建独立的 spec 目录,每个 package 都能有自己的一套编码规范和任务。配套地,9 个平台上的before-backend-dev/before-frontend-dev/check-backend/check-frontend合并成了通用的before-dev/check,命令矩阵不会因为 package 数量爆炸。平台支持更多
- GitHub Copilot —
--copilot- Windsurf —
--windsurf- Qoder —
--qoder- Factory Droid —
--droid例如同时启用多个平台:
trellis init --codex --gemini --copilot -u your-nameCodex 满血支持
- 启用了 Codex 的 SessionStart hook :现在 Codex 用户可以跟 Claude Code 用户一样,无需再手动调用
/start命令,启动 session 就能直接对话,task 状态、workflow 、guidelines 自动注入- 支持了 sub-agent 的定义 :
.codex/agents/下新增 TOML 格式的implement/research/checkagent ,跟 Claude Code 的Agent工具语义对齐- shared skills 共享层 :Codex 写入
.agents/skills/(agentskills.io 标准目录),同一份输出会被 Cursor 、Gemini CLI 、GitHub Copilot 、Amp 、Kimi Code 自动读取——勾一个 Codex 选项覆盖一大片工具链其他改进
- 自定义 spec 模板 Registry :
trellis init -r <source>从自定义 git 仓库( GitHub / GitLab / Bitbucket ,含自托管 GitLab 的 HTTPS / SSH )拉 spec 模板,而不是从默认 marketplace 拉。团队可以把自家编码规范维护在内网 git 服务器上分发- 重新 init 的快速路径 :
trellis init --codex在已有项目里追加配置 Codex ;不带参数会弹菜单- 分支感知 :session 和 journal 带上 git 分支上下文,多分支并行不混乱
- Claude Code Statusline 集成
- 多 Agent 流水线 :支持 worktree submodule 和 PR 状态追踪
关键修复
- SessionStart 瘦身 :从约 29 KB 缩到约 7 KB ,修了一个会让 Claude Code 静默截断 task 状态的大坑
- Windows :statusline GBK 编码崩溃(感谢 @xiangagou163 )、Codex
hooks.json的{{PYTHON_CMD}}占位符解析其他修复(节选)
- fix(update): rename 迁移允许指向受保护路径 + 配置解析失败时告警
- fix(update): 创建迁移任务时从
.developer解析名字- fix(hooks): 跨平台规范化
.current-task路径引用(#130 )- fix(hooks): ralph-loop 的
SubagentStop事件字段名(#152 )- fix(opencode): dispatch 等待子任务(#147 )
- fix(init): monorepo 包目录去掉 npm scope 前缀
- fix(init): 模板选择器把 “empty templates” 改成 “from scratch”
- fix(scripts):
[start.py](http://start.py)保留 submodule 的 status 前缀安装与升级
# 新装 npm install -g @mindfoldhq/trellis@latest --registry=https://registry.npmjs.org # 升级(已装过 trellis ) trellis update从 0.3.x 升级会自动处理 36 个命令文件的合并——带 hash 校验,你的本地修改会被保留 ,没被改过的文件才删。
作者: fmfsaisai | 发布时间: 2026-04-15 03:00
48. Claude 防封分流的完整域名配置
[General]
bypass-system = true
skip-proxy = 127.0.0.1,192.168.0.0/16,10.0.0.0/8,172.16.0.0/12,100.64.0.0/10,localhost,*.local[Proxy]
CLAUDE0409 = direct[Rule]
核心域名( DOMAIN-SUFFIX 已覆盖所有 *.anthropic.com 子域名)
DOMAIN-SUFFIX,anthropic.com,CLAUDE0409
DOMAIN-SUFFIX,claude.ai,CLAUDE0409
DOMAIN-SUFFIX,claude.com,CLAUDE0409
DOMAIN-SUFFIX,clau.de,CLAUDE0409
DOMAIN-SUFFIX,claudemcpclient.com,CLAUDE0409
DOMAIN-SUFFIX,claudeusercontent.com,CLAUDE0409CDN 和静态资源
DOMAIN,servd-anthropic-website.b-cdn.net,CLAUDE0409
DOMAIN,anthropic.com.cdn.cloudflare.net,CLAUDE0409认证 / 内容
DOMAIN,anthropic.auth0.com,CLAUDE0409
DOMAIN,anthropic-com.ghost.io,CLAUDE0409监控和遥测
DOMAIN-SUFFIX,sentry.io,CLAUDE0409
DOMAIN-SUFFIX,statsigapi.net,CLAUDE0409
DOMAIN,browser-intake-us5-datadoghq.com,CLAUDE0409
DOMAIN-KEYWORD,datadog,CLAUDE0409
DOMAIN-KEYWORD,sift,CLAUDE0409客服 / 第三方 widget
DOMAIN-SUFFIX,intercom.io,CLAUDE0409
DOMAIN-SUFFIX,intercomcdn.com,CLAUDE0409
DOMAIN,cdn.usefathom.com,CLAUDE0409IP 段 / ASN 兜底
IP-CIDR,160.79.104.0/21,CLAUDE0409,no-resolve
IP-CIDR6,2607:6bc0::/32,CLAUDE0409,no-resolve
IP-ASN,399358,CLAUDE0409,no-resolveFINAL,DIRECT
作者: pks | 发布时间: 2026-04-15 04:08
49. claude 的 resume 好像是创建一个新会话
在 claude windows 客户端创建的会话,从 cli 里面用 resume 命令恢复。
在 cli 里面看着像是恢复原会话,但是从客户端里面看,是自动新创建了一个会话,这个新会话里面的内容是从老会话里复制过来,客户端里存在两个内容一样的会话。
难道 resume 就是这么设计的吗
作者: dadadadaadada | 发布时间: 2026-04-15 00:39
50. 写了个 Go 库解决 LLM 流式输出断线重连的问题
最近在做一个项目,后端 Go ,前端 SSE 推流 LLM 的输出。遇到一个很烦的问题:用户刷新页面或者网络抖一下,流就断了,但后端还在跑,token 照烧不误。
更麻烦的是我们的 LLM worker 和 HTTP handler 不在同一个实例上,负载均衡一转发,重连过来的请求根本找不到原来那个流。
JS/TS 那边有 Vercel 的 resumable-stream 可以用,但 Go 这边翻了一圈啥也没有,就自己撸了一个:
https://github.com/gtoxlili/streamhub
思路不复杂:
- Redis Streams 存 chunk ,断线重连的订阅者先 replay 历史再接实时数据
- Redis Pub/Sub 传 cancel 信号,用户在 A 节点点停止,B 节点上的生成就能收到
- 每个 producer 有个 generation ID 做 fencing token ,防止旧 producer 写脏数据
- 同一个 session 只允许一个 producer 注册,不会重复调 LLM代码大概长这样:
// 生产端 stream, created, err := hub.Register("chat:123", cancelFunc) if !created { return // 已经有人在跑了 } defer stream.Close() stream.Publish("hello") // 消费端(任意实例) chunks, unsub := hub.Get("chat:123").Subscribe(128) defer unsub() for chunk := range chunks { // 先 replay 再 live fmt.Fprint(w, chunk) }目前还比较早期,API 可能还会改。做类似场景的同学可以看看,有想法欢迎提 issue 。
作者: Junian | 发布时间: 2026-04-14 17:37





五年前给老爸买的 iPad ,最近屏幕摔坏了


