hacker_news_top_comments_2026-04-25

Hacker News 高赞评论 - 2026-04-25

1. wg0 在“我取消了 Claude:Token 问题、质量下降和糟糕的支持”下的新评论

我会写详细的规格说明。多文件,附带示例代码,用Markdown格式。

然后交给Claude Sonnet。

在列出硬性要求后,我发现生成的代码要么遗漏需求,要么有重复代码,甚至还有不必要的数据处理(比如把对象映射成更窄类型的新对象,而实际上根本用不到),以及那些为了通过测试而伪造和绕弯子的测试代码。

所以结果就是,我不是在写代码,而是在读大量代码。

在生成式AI出现之前,我亲身体会到一点:写代码要容易得多。真正费时费力的是读代码、理解代码、并在脑海中构建心智模型。

因此,使用生成式AI反而需要我投入更多时间和精力,因为我得读大量代码,理解它们,并确保它们符合我的心智模型。

所以,以Anthropic目前这个价格,生成式AI对我来说是净负收益。因为我不是在搞“氛围编程”,我是在构建真正依赖它的真实软件,我的用户值得我把更多注意力和精力放在他们身上。因此,我很快会取消订阅。

作者: wg0 | 发布于: 2026-04-24 18:14


2. b40d-48b2-979e 在“成人及赌博初创公司的运营成本”一文中的新评论

你可能在体育博彩、赌场或彩票领域有很酷的产品。但几乎所有社交网络和搜索引擎都不会让你在没有相关司法管辖区许可证的情况下投放广告。

_做得好_。你_理应_因为创造那些实际上会毁掉人们生活的产品而面临社会污名。

作者: b40d-48b2-979e | 发布于: 2026-04-24 13:05


3. _fw 在“韩国警方逮捕发布AI合成狼照片男子”下的新评论

你是想告诉我,在公元2026年的今天,有人竟然因为字面意义上的“狼来了”而被逮捕(无论对错)?

一个大约2500年前的寓言,因为AI而再次变得相关,这真是有种讽刺的幽默感。

作者: _fw | 发布于: 2026-04-24 10:10


4. Ladioss 在 “DeepSeek v4” 中的新评论

每次看到美国人自认为在道德上比中国高一等,我都会深感大众宣传的力量何其强大——尽管他们每隔半年就会在全球某个地方,要么为了石油,要么代表以色列,发动一场新的战争。

作者: Ladioss | 发布于: 2026-04-24 07:45


5. chvid 在 “DeepSeek v4” 中的新评论

美国发起的科技战充满了令人难以置信的傲慢与狂妄——看着它逐渐瓦解,实在是一件美妙的事情。

撇开中美竞争不谈,LLM的真正价值将在应用层得以体现。随着LLM的商品化以及缺乏明确的垄断格局,这一领域充满了广阔机遇。

曾几何时,LLM似乎会成为某个严密守护的垄断者的专属领域——那将是一个非常黑暗的世界。幸运的是,我们现在并未陷入那种境地,而且有充分的理由保持乐观。

作者: chvid | 发布于: 2026-04-24 07:19


6. hodgehog11 在 “DeepSeek v4” 下的新评论

这里有不少关于基准测试和编码性能的评论。我想就它在活跃研究场景中处理数学问题的能力,提供一些个人看法。

我收集了一系列硕士和博士级别的新颖概率与统计问题,难度各异。我的测试流程是:先让模型阅读这些问题(通常附带2到6篇相关论文作为背景),然后要求它给出严谨的证明作为后续。由于这些问题相当棘手,我并没有量化的性能指标,只是根据输出在勾勒出有望发表的解决方案方面的有用性来评判。

在这个模型出现之前,Gemini 表现最佳,GPT-5 紧随其后。其他模型都无法与这两者相提并论(不,Claude 也不行)。Gemini 有时对一些较难的问题会有惊人的洞见(对相关程序的有洞察力的猜测在研究中最有用),但两者在单次后续提示中勾勒出具体证明方面都表现挣扎。而这款开启最大思考模式的 DeepSeek V4 Pro 在这方面做得非常出色。它在首次回复中的洞见水平不如 Gemini(更接近 GPT-5),但在后续回复中往往表现更好,其证明令人印象深刻;在好几个案例中几乎完整。

考虑到 Gemini 和 DeepSeek 在 token 性能上也似乎领先,我猜测这可能对它们处理这类问题的能力有影响。这很可能更多是在合理计算预算下,它们能走多远的问题。

尽管基准测试结果似乎并非如此,但这对于开源权重模型来说感觉是一次巨大的进步。向 DeepSeek 团队致敬!

作者: hodgehog11 | 发布于: 2026-04-24 07:11


7. Frieren 在“美国特种兵因涉嫌在马杜罗突袭中赢得40万美元被捕”下的新评论

只有贵族才能玩这种游戏。这名士兵因为做了不符合其阶级身份的事情而受到惩罚。

这就是种姓制度的运作方式。人们不是根据行为本身来评判,而是根据他们与权力的关系。

作者: Frieren | 发布于: 2026-04-24 06:39


8. jari_mustonen 在 “DeepSeek v4” 中的新评论

在这个领域里,它做到了完全开源,开发者文档一流,价格低得离谱,同时还提供了前沿模型的能力。所以基本上,这是黑客献给黑客的作品。太喜欢了!

另外,注意它完全没有依赖CUDA,完全运行在华为芯片上。换句话说,中国生态已经打造出了一套完整的AI技术栈。不管你喜不喜欢,这都是一条大新闻。但垄断被打破,有什么不喜欢的呢?

作者: jari_mustonen | 发布于: 2026-04-24 06:34


9. looksjhg 在“美国特种兵涉嫌在马杜罗突袭中赢得40万美元后被捕”下的新评论

这太搞笑了……他被逮捕受审,而参议院和众议院的人都在干同样的事却逍遥法外?哈哈

作者: looksjjhg | 发布于: 2026-04-24 05:11


10. wisty 在“Meta 告知员工将裁员 10%”下的新评论

AI抢走工作的三种半方式:

  1. 让工人变得多余(目前很大程度上还只是假设?)

  2. 公司大举投资AI,但尚未见到回报,因此需要在其他方面削减开支。

  3. AI成为他们本来就打算裁员的绝佳借口。

另外——投资者更愿意听到“AI”而不是“哎呀,我们遇到麻烦了,所以得裁员”。比如,你砸了几十亿搞个《第二人生》的克隆版,结果玩家还没开发者多……

作者: wisty | 发布于: 2026-04-24 04:26


11. culi 在“Meta 通知员工将裁员 10%”下的新评论

每次裁员都有人拿”过度招聘”说事。这都大规模裁员三年了,他们到底还需要多少次”修正”?

我开始觉得”过度招聘”这套说辞是场有组织的宣传了。

作者: culi | 发布于: 2026-04-24 04:25


12. bandrami 在“Meta 通知员工将裁员 10%”下的新评论

这很有意思,因为这是一个”AI抢走工作”的案例,但并非人们通常理解的那种方式;这些大规模裁员之所以发生,不是因为AI正在取代他们过去的工作,而是因为资本支出(capex)正在吸干所有运营资金。这些公司可能会被迫用AI(尽可能)来替代部分被裁员工,但这只是结果,而非原因。

作者: bandrami | 发布于: 2026-04-24 04:09


13. disillusioned 在“Meta 告知员工将裁员 10%”下的新评论

客观地说,看看其他公司相比之下推出了多少条业务线、多少个部门、多少款实际产品吧。

Meta有什么呢?Facebook。Instagram。Threads,如果你愿意算上的话。WhatsApp。支撑这些产品的广告技术。一个烧掉数十亿美元后被掏空的VR部门黑洞。一个卖眼镜的AR/设备部门。还有一个蓬勃发展的AI部门,光是其中一位员工的薪酬(六年内)就高达15亿美元。

谷歌/Alphabet呢?一整套消费硬件产品线,从摄像头到门铃、智能显示屏到流媒体设备,还有YouTube、YouTube TV、Android、Chrome、谷歌搜索本身、Gemini、GCP、Waymo、Google Fi、Google Fiber、广告业务、基础设施/分析、地图、几十个其他应用……数不胜数。

微软有Azure、Windows、Office(每个显然都是更复杂软件的套件)、Xbox、LinkedIn、Dynamics、Surface等等。

要说的话,苹果可能和Meta稍微接近一点,因为他们业务范围也相对有限,但他们的硬件工程显然是其中巨大的一部分,还有供应链、软件、MacOS、iOS、所有自研第一方应用、App Store、iCloud、Apple TV、零售……

Meta……从纯粹的覆盖面上来说,根本不在同一个级别。马克只是拼命押注于尽可能多地吸纳新兴人才,希望自己能找到合适的应用场景来证明这些投入合理,同时也很乐意在这期间花钱装忙。现在资本支出不得不转向AI所需的计算/数据中心/网关,而这些东西……几乎没人想要?但他打算拿公司尽可能多的资源去赌,以保持相关性,试图在这个领域占有一席之地。他只是用这种“尾巴摇狗”的方式,极度超额支付给个别研究人员,从外部来看,这至少是极其冒险的……

作者: disillusioned | 发布于: 2026-04-23 21:39


14. hintymad 在“Meta 通知员工将裁员 10%”下的新评论

说实话,Meta 招人招得太多了,简直离谱。如果你面试过几个 Meta 的工程师,很容易就会发现其中很大一部分人的工作范围非常狭窄,甚至有些根本就是瞎扯淡。结果就是,这些工程师说不清自己在 Meta 具体做什么,无法深入理解自己的技术栈,一旦面试题稍微偏离那些常见的套路,连常识性的设计问题都答不上来。当然,这些工程师中有很多人其实非常聪明能干,Meta 也确实搭建了许多令人惊叹的系统。所以,我能想到的唯一解释就是:活太少,人太多。如果过去几年 Meta 人均开会时间与编码时间的比例飙升到离谱的程度,我一点都不会感到意外。

作者: hintymad | 发布于: 2026-04-23 20:46


15. alternator 在“GPT-5.5”中的新评论

一位提前获得该模型访问权限的英伟达工程师甚至说:”失去GPT-5.5的访问权限,感觉就像被截肢了一样。”

这句话的阴暗面比它表面看起来更严重;这很可能适用于所有前沿编程模型。随着它们变得更好,我们很快就依赖它们来写代码。这就像在上帝模式下玩游戏。工程师们变得依赖;这真的会上瘾。

这与我使用这些工具时的亲身经历和不安感完全吻合。我现在真的没有耐心自己写代码了,因为用前沿模型一次搞定能快10倍。我的角色已经转变了,虽然能这么快完成这么多工作很棒,但事实是,当token用完后,我基本上就干不了活了。

如果Claude宕机了,对我来说去散步比写代码的杠杆效应更高,因为如果我休息好了,一小时后Claude恢复了,我取得的进展会比硬撑着读一堆LLM生成的代码、试图手动解决问题要更多。

总之,我想说的是,这让我越来越不安。

作者: alternator | 发布于: 2026-04-23 20:23


16. butlike 在 “GPT-5.5” 中的新评论

这引出了一个有趣的哲学问题:假设我们真的实现了通用人工智能(AGI)…谁能保证它不会变成一个超级聪明的”差生”呢?

“嘿,AGI,癌症疗法研究得怎么样了?”

“哦,已经搞定了,就是还得…整理成正式方案你知道吧。大规模推广什么的…”

如果真到了AGI时代,结果发现它就是个彻头彻尾的懒鬼,我觉得这简直有种神级的讽刺感。关掉它吧,说不过去;不关吧,又太重要了。

作者: butlike | 发布于: 2026-04-23 19:53


17. dbeardsl 在“关于近期 Claude Code 质量报告的更新”中的新评论

感谢您的回复,但我从未认为对话中的间隔会增加成本或降低质量。这两点都令人意外且失望。

我觉得这个选择最好留给用户自己决定。

比如:“以完整上下文恢复此对话将消耗您5小时使用量中的X%,但通过删除旧的思考日志可以减少Y%的消耗。”

作者: dbeardsl | 发布于: 2026-04-23 19:28


18. bontaq 在“美国如此富有,为何如此悲伤?”下的新评论

我妈妈说,”我们建的东西都不管用了,”我觉得这句话道出了大多数人的心声。看到有人说”经济一片繁荣!””收入上涨了!”也挺好笑的。是吗,那涨幅赶上通胀了吗?我买得起房吗?

工作总体上反而变得更糟了。远程办公没了。工资更低了。还得拼命用AI,ADHD(注意力缺陷)都快被逼出来了。没人能喘口气。压力山大。又给军队砸了1.5万亿。我们到底在建设什么?为了什么?

这有什么好奇怪的吗?

作者: bontaq | 发布于: 2026-04-23 19:06


19. bcherny 在“关于近期 Claude Code 质量报告的最新动态”下的新评论

大家好,我是Claude Code团队的Boris。

通常情况下,当你与Claude Code对话时,如果对话有N条消息,那么除了最新一条外,其余(N-1)条消息都会命中提示缓存。

问题在于:当你让会话闲置超过1小时,回来再发送提示时,就会完全错过缓存,所有N条消息都需要重新处理。我们发现这个边缘情况导致用户的token成本异常高。极端情况下,如果你的上下文窗口中有90万token,闲置一小时后发送一条消息,就需要一次性写入超过90万token到缓存中,这会消耗你相当大比例的速率限制,尤其是对Pro用户而言。

我们尝试了几种不同的方法来改善这个用户体验:

  1. 在X/社交媒体上教育用户
  2. 在应用内添加提示,建议重新访问旧对话时运行/clear命令(我们发布了几个迭代版本)
  3. 闲置后省略部分上下文:旧的工具结果、旧消息、思考过程。其中,省略思考过程效果最好,但当我们发布这个功能时,无意中引入了博客文章中提到的那个bug。

希望这些信息对你有帮助。如果有任何问题,欢迎提问。

作者: bcherny | 发布于: 2026-04-23 19:02


20. jfkimmes 在 “GPT-5.5” 中的新评论

大家都在谈论Anthropic那个营销噱头——封闭的Mythos模型在CyberGym上取得了83%的成绩。而OpenAI刚刚发布了GPT 5.5,得分82%,并且向所有人开放使用。

我建议任何从事攻防网络安全的人都去试试这个模型。这才是我们真正需要的数据点——没有炒作!

从没想过我会这么说,但OpenAI又成了那个”开放”的选择。

作者: jfkimmes | 发布于: 2026-04-23 18:55