hacker_news_top_comments_2025-07-12

Hacker News 高赞评论 - 2025-07-12

1. jordanb在”报告称英国邮局丑闻中至少13人自杀”中的新评论

大约一年前，我曾深入调查过这起丑闻。最让我震惊的是其中的阶级偏见。

邮局高层根本无法理解为什么会有人愿意购买邮局特许经营权。这需要预先投入大笔资金，而且每人只能经营一家，所以每家邮局都是业主自营模式——本质上人们是在”花钱买工作”。

这些领导层想不通，怎么会有人愿意花钱换取一份需要长时间站柜台的零售工作，只为了年终能勉强达到中产阶级收入水平。他们认定申请者必定另有隐情，而这个”真实动机”就是监守自盗。

于是他们先入为主地认定邮政局长们都在贪污，而会计软件的作用就是抓出这些蛀虫好提起公诉。当系统开始显示巨额资金缺口时，他们对软件的质疑充耳不闻，因为这正是”预期效果”。我敢打赌，如果情况相反——系统几乎没检测到任何异常，他们反而会怀疑软件有问题，因为他们早就给邮政局长们贴上了”窃贼团伙”的标签。

_{作者: jordanb | 发布于: 2025-07-11 14:59}

2. mike_hearn在”报告称英国邮局丑闻中至少13人自杀”下的新评论

致《纽约时报》：请不要用”死于自杀”这样的被动表述。这种被动语态听起来像是天灾，某种令人遗憾但不可避免的偶然事件。重要的是不要粉饰事实：这些邮政局长自杀是因为英国政府根据一个有缺陷的财务系统提供的证据，将他们因未犯下的罪行投入监狱。不要把它描述得像自然灾害一样模糊事件细节。

Horizon系统应该取代Therac-25成为研究软件开发失误后果的典型案例。Therac-25造成6人伤亡，而Horizon摧毁了数百人的生活并导致数十人死亡。可怕的是，Horizon原本不会被任何人视为安全关键系统。它只是一个普通的销售点和会计系统。自杀事件并非直接由软件导致，而是源于失控的司法和社会体系——人们盲目信任实际上正在进行大规模深层政府掩盖的公共机构。

将自杀归咎于允许邮局如此行事的法律和政治体系是合理的，这个体系让如此低素质的人掌权。或许还要归咎于那个多次宣誓作证系统运行良好的软件工程师，尽管漏洞追踪系统中已满是问题报告。但这里是HN，从软件工程角度我们能学到什么？

有些故障是时代局限，如今不会发生，比如电阻式触摸屏故障导致POS机夜间随机点击。但大多数是由于事务性丢失或缺乏适当审计控制导致的漏洞。想象一下缺乏幂等性的消息重放之类的问题。系统记录了从未真正发生的交易，当清点现金时发现短缺，邮局便指控邮政局长盗窃。他们没偷，但这持续了数十年，而那个年代人们对机构的信任比如今更高。这些邮局通常位于小村庄，是社区中心，因此对邮政局长的虚假指控彻底摧毁了他们的社会和商业生活。

简而言之——检查你的交易记录！并确保开发人员不能在生产环境直接修改数据库。

_{作者: mike_hearn | 发布于: 2025-07-11 12:26}

3. simonw在”Grok 4”中的新评论

关于Grok 4有个更有趣的现象：当你询问它关于争议性话题的看法时，它有时会先在X平台上搜索”from:elonmusk”的推文，然后再给出回答！https://simonwillison.net/2025/Jul/11/grok-musk/

_{作者: simonw | 发布于: 2025-07-11 00:40}

4. simonw在”衡量AI对资深开源开发者生产力的影响”中的新评论

这是完整论文链接，包含了许多摘要中遗漏的细节：https://metr.org/Early_2025_AI_Experienced_OS_Devs_Study.pdf

我个人认为，从LLM辅助和AI工具中获得显著的生产力提升，其学习曲线比大多数人预期的要陡峭得多。

这项研究有16名参与者，他们对AI工具的熟悉程度各不相同——其中56%的人从未使用过Cursor，而这项研究主要就是关于Cursor的。

研究人员让这16名参与者处理问题（每人约15个），每个问题被随机分配”可以使用AI”或”不能使用AI”的规则。

因此在整个研究过程中，每位开发者都同时处理了可以使用AI和不能使用AI的任务。

四分之一的参与者表现有所提升，四分之三的参与者表现反而下降。

使用AI表现最好的参与者之一，也是之前Cursor使用经验最丰富的人。论文中承认了这一点：

但我们确实看到唯一一位拥有50小时以上Cursor使用经验的开发者获得了正向加速，这表明Cursor的使用可能存在很高的技能天花板，只有经验丰富的开发者才能获得生产力提升。

我的直觉是，这项研究主要证明了AI辅助开发的学习曲线相当高，当开发者被要求在现有工作流程中融入AI工具时，他们在攀登这条学习曲线的过程中反而会表现得更差。

_{作者: simonw | 发布于: 2025-07-10 17:36}

5. Aurornis在《美国派对文化的消亡》中的新评论

看到社交媒体和智能手机对年轻一代造成的伤害，实在令人痛心。

在Reddit和Twitter上讨论Z世代的帖子时需要格外谨慎。这些讨论本质上存在偏见，因为参与者主要是那些长期泡在网上、沉迷社交媒体的Z世代。

如果你在现实生活中接触过年轻人，很快就会发现他们大多数并不使用Reddit和Twitter这类平台。即便是使用Reddit的年轻人，也很少发帖甚至注册账号。

真正在Reddit上发帖的Z世代只是很小一部分，而且其中很多人都符合”网瘾少年”的特征。难怪Reddit上的Z世代用户说起话来，好像他们这代人完全与社会脱节似的。

_{作者: Aurornis | 发布于: 2025-07-10 15:10}

6. hn_throwaway_99在”美国派对文化的消亡”中的新评论

几天前在GenX版块（发帖者来自Z世代）有个帖子询问90年代末/00年代初”青春电影”里描绘的那种派对是否真实存在：

[Reddit链接]

X世代的回复混杂着困惑与伤感，比如”什么叫’这种派对’？这不就是普通青少年派对吗？！这个问题让我感觉自己既古老又困惑。”整个评论区都值得一读，特别是X世代与Z世代发帖者青春期体验的巨大差异。

社交媒体、智能手机和过度规划/过度保护彻底毁掉了许多年轻人的生活，这让我感到非常悲哀。我也不同意某些评论把问题归咎于”房地产、交通和住宿成本”。这些确实是问题，但如今郊区的家庭和孩子数量与90年代相当，而现在的孩子居然连”基础青少年派对”都认不出来，甚至怀疑这是虚构幻想——这个现象绝不能简单用”如今房价更贵”来解释。

_{作者: hn_throwaway_99 | 发布于: 2025-07-10 15:05}

7. fouronnes3在”Thunderbird 140’Eclipse’”中的新评论

我原本很喜欢Thunderbird，用了好几年，直到一个bug[0]直接删光了我所有邮件。我经常看到有人在问题单里愤怒抱怨（完全可以理解）:( 这个bug会在毫无预警的情况下同时删除服务器和客户端的用户数据。这个bug已经持续存在并被确认了整整17年。你也可能遇到这种情况。修复这种问题难道不该是最高优先级吗？

[0] https://bugzilla.mozilla.org/show_bug.cgi?id=462156

_{作者: fouronnes3 | 发布于: 2025-07-10 09:30}

8. martinpw在”Linda Yaccarino将离开X公司”话题下的新评论

《经济学人》总是能为新闻想出绝妙的标题。这次是：

“琳达·雅卡里诺从X公司CEO变成前CEO。”

https://www.economist.com/business/2025/07/09/linda-yaccarin...

_{作者: martinpw | 发布于: 2025-07-09 22:20}

9. jbreckmckye在”琳达·亚卡里诺将卸任X公司职务”中的新评论

我看不出这算什么成功。

他多付了数百亿美元。这种非受迫性失误造成的损失堪称天文数字。

大量优质用户和内容创作者已经离开，导致X平台逐渐沦为色情机器人、诈骗账号和政治活动家的聚集地。它正在失去”新闻发生地”的吸引力，反而变得越来越小众。

裁员处理得很糟糕。X在新功能开发上举步维艰，距离马斯克承诺的”万能应用”依然遥遥无期。平台频繁出现诡异的UUID错误代码。剩下的开发人员似乎主要在前端实现功能，我甚至怀疑他们是否已经丧失了安全部署后端变更的能力。

极右翼煽动者对X的占领，给马斯克最重要的商业资产特斯拉带来了长期的品牌损害。

我看不到任何积极的结果。

_{作者: jbreckmckye | 发布于: 2025-07-09 20:58}

10. sorcerer-mar在”琳达·雅卡里诺将离开X公司”话题下的新评论

你说她既没有实权，又暗示估值下跌和诉讼都是因为她无能？这说法很奇怪。

不管怎样，她是自愿给一个明显失控的男人当傀儡的，这个污点将永远伴随着她。

_{作者: sorcerer-mar | 发布于: 2025-07-09 15:10}

11. CyberMacGyver在”琳达·雅卡里诺将离开X”话题下的新评论

有一次他们让她公开讲话，结果彻底搞砸了。她根本没有话语权，最糟的是连当替罪羊都不够格，幕后黑手是谁一目了然。这简直是史上最无足轻重、最无关紧要的人事任命。

推特上一片感谢她的回复真是讽刺——在她任期内公司估值暴跌80%，还因为广告商不投广告就把人家告上法庭。无能到令人叹为观止。

_{作者: CyberMacGyver | 发布于: 2025-07-09 14:57}

12. cjpearson在”大多数RESTful API并非真正的RESTful”中的新评论

我理解这种较真的态度，也觉得Fielding的论文很有意思，但这注定是场必败之战。当我看到”REST API”时，基本可以确定以下几点：

接口返回JSON格式数据

CRUD操作被映射到POST/GET/PUT/DELETE方法

团队会为正确的状态码争论不休，而且总有几个用法违反HTTP规范

列表接口很可能被改成POST请求以支持复杂筛选条件

就像敏捷开发、持续集成或DevOps这些概念一样，你可以坚持原始定义，但最终还是要接受语义扩散的现实，按照大众普遍理解的方式来使用这些术语。

_{作者: cjpearson | 发布于: 2025-07-09 09:27}

13. bruce511在《将副业从零起步发展为七位数盈利业务》中的新评论

要在坚持（通向成功）和固执（导致在已经浪费的时间上继续浪费时间）之间找到平衡点，真的非常非常非常困难。

祝贺你成功把握住了这个分寸。

我同意某种形式的市场验证是必要的，至少能假装你属于前者而非后者。那些早期的使用量飙升是有用的提醒，表明这里确实存在商业机会。

我还要特别指出，你从早期就开始投入营销。写博客文章、推广这些文章、建立Discord服务器、承诺回复邮件——这些都是营销行为，它们对成功的贡献可能比代码更大。

我注意到每当收入下滑时，你们的应对方式就是加强营销（表现为发布更多博客文章）。我猜这是有意为之，而且绝对比”让我躲起来默默开发更多功能”的做法高明得多。

这里有很多值得他人借鉴的经验。不仅要祝贺你们现在的成功，更要感谢你们分享这条成功之路。毕竟你可以指明方向，但无法替别人学习。

对了，我很欣赏这种自举(bootstrapping)的方式。我也这么做，而且毫不后悔。这条路更长更艰难，但也省去了大量额外工作。

_{作者: bruce511 | 发布于: 2025-07-08 21:33}

14. tptacek在”Supabase MCP可能泄露整个SQL数据库”中的新评论

这真的能行吗？我理解你想做什么，但这就像试图在把用户提供的JavaScript传给可信的eval()之前先”消毒”一样。这种做法从来就没成功过。

把MCP作为安全边界看起来很奇怪。在我看来问题很明显：在一个实际的代理设置中，如果要对生产数据库（或包含生产数据的数据库）进行自动化查询，应该有一个LLM上下文负责读取工单，另一个LLM上下文负责驱动MCP的SQL调用，然后在这两个上下文之间要有代理代码来维护不变性。

我知道Cursor做不到这点，因为它只有一个上下文。但正因如此，把Cursor指向连接生产数据库的MCP简直是疯狂之举。

_{作者: tptacek | 发布于: 2025-07-08 19:51}

15. robin_reala在”2025年电子邮件能传输500英里吗？”中的新评论

如果你是今天幸运的万分之一（还没听过那个经典的”500英里邮件”故事），可以在这里阅读原文：https://web.mit.edu/jemorris/humor/500-miles。

（该故事5年前在HN讨论过：https://news.ycombinator.com/item?id=23775404，10年前也讨论过：https://news.ycombinator.com/item?id=9338708）

_{作者: robin_reala | 发布于: 2025-07-08 14:02}

16. GMoromisato在”为什么没有好的恐龙电影？”中的新评论

《异形》、《终结者》和《黑客帝国》系列面临着相似的困境。

《异形》成功实现了类型转换，从恐怖片转型为动作片。但后续作品既无法重现首部曲的原始恐惧感，也未能复制第二部的爽快动作场面。仿佛异形宇宙中只存在两个局部最优解，而《异形1》和《异形2》已经双双占位。

《终结者》如出一辙。首部曲是完美的科幻动作片，充满迷幻设定和娱乐性。第二部则颠覆前作：终结者成了好人！这个转折同样成功。但在此之后，还能玩出什么新花样？

至于《黑客帝国》——他们甚至懒得拍摄续集。

_{作者: GMoromisato | 发布于: 2025-07-08 01:35}

17. kragen在”因ChatGPT误以为存在而添加功能”中的新评论

我发现这是使用GPT-4（至少）进行编程最有价值的方式之一。与其直接告诉它API的工作原理，我更倾向于让它自己猜测——通常从需要添加功能的示例代码开始。有时它能想出比我更好的解决方案，然后我会相应调整API使其代码能够工作。

反过来，我有时会提供现有代码让它解释功能。如果它理解错了，这恰好说明我的API设计存在易混淆之处，而且能暴露出具体问题所在。

这种方式充分发挥了神经网络的优势：不是提供准确信息，而是生成高度可信的”幻觉”——创造力而非逻辑性。（最大的好处是我不必花时间仔细排查GPT-4巧妙隐藏在代码中的bug，这通常比传统编码方式更耗时。）

接口设计可能存在多种缺陷，而这种方法只能解决不符合直觉的问题。比如接口本身效率低下、不可靠或缺乏可组合性等问题，AI就无能为力了。但它能确保你的API具有可猜测性和可理解性，这已经非常有价值了。

可惜这种方法只适用于那些尚未广泛流行的API。

_{作者: kragen | 发布于: 2025-07-07 16:01}

18. mike_hearn在《Mercury：基于扩散的超高速语言模型》中的新评论

正好借这个机会提一个我一直在向同事强调的问题：随着LLM智能体(大语言模型代理)的发展，我们很快就会面临比现在更严重的测试性能CPU瓶颈。而在我所知的所有团队中，早在LLM出现前，持续集成(CI)速度就已经是瓶颈了。如果一个智能体写代码的速度比人类快100倍，但每次改动都要花一小时来测试，那又有什么意义呢？

也许只是我运气不好，但在我参与过的大多数项目中，开发者的大量时间都浪费在等待PR(拉取请求)变绿上。很多测试运行最终都卡在I/O或工作节点可用性上，导致改动可能在队列中等待数小时，或者测试随机失败后一切又得重来。

随着编码智能体越来越强，它们将被分配处理简单工单并生成绿色PR，模型会根据测试失败情况实时修复代码。这会让CI瓶颈更加恶化。

大多数项目的测试设置其实都有很多容易优化的地方，但不知为何，多年来我几乎没看到任何改进。我们似乎集体接受了”CI服务就是又慢又贵”的观念，然后就不再尝试改进。实际上CI反而变得越来越慢，因为人们试图让构建完全封闭(因此无法进行运行间缓存)，还把构建从本地专用硬件迁移到I/O性能差且多年未提速的昂贵云虚拟机。

Mercury速度快得惊人，在我做的几个快速测试中生成的代码质量很好且正确。我们该如何让测试执行跟上这种速度呢？

_{作者: mike_hearn | 发布于: 2025-07-07 13:46}

19. Aurornis在《没有人再有性格：我们都是贴标签的产品》中的新评论

最近共事的年轻人中普遍存在这种现象：只要有机会给自己贴标签来定义问题，他们就会趋之若鹜。有趣的是，我根本不用看TikTok就能识别出当下的自我诊断潮流。

很多人深信，一旦给问题贴上标签，别人就无权批评了。不少年轻人把这当作防御策略，给所有事情都打上标签。前阵子流行”时间盲症”——那些习惯性迟到、错过会议或时间管理混乱的人，看到相关短视频后就像发现医学病症般自我诊断。

最荒诞的是，这些人开始理直气壮地错过约定，轻描淡写告知我他们患了”时间盲症”，仿佛这就情有可原。一旦获得病症标签，他们就觉得有了免责金牌。

最令人沮丧的是，这些自诊”时间盲症”的人迟到情况全都变本加厉。当个人问题被包装成医学标签后，他们彻底丧失了改进的动力。

_{作者: Aurornis | 发布于: 2025-07-07 01:52}

20. parpfish在《”没人再有性格了：我们都是贴标签的产品”》中的新评论

几十年前在我第一节变态心理学课上，教授就警告过我们一个近乎铁律的现象：学生们总会立即开始用”轻度”版本自我诊断我们学到的每种心理障碍。这些年来，这个规律屡试不爽，如今更是被TikTok上的自我诊断产业推波助澜。

但我们可以从中领悟几点：

只要给人们机会贴上能让他们感觉与众不同的标签，他们就会趋之若鹜

只要给人们机会为问题命名定性，他们就会抓住不放

多数心理障碍只是程度问题，与常人体验并无本质区别。人们应该借此对受困者产生更多同理心。

_{作者: parpfish | 发布于: 2025-07-07 01:05}