hacker_news_top_comments_2026-04-13

Hacker News 高赞评论 - 2026-04-13

1. sonofhans 在 “Show HN: boringBar – 一款 macOS 任务栏风格 Dock 替代工具” 中的新评论

从用户体验和技术的角度来看,我正是这个产品的目标用户。它解决了我实际遇到的问题,而我也一直在周期性地尝试各种解决方案。

但是,菜单栏应用采用订阅制,这让我无法接受。我的Mac上有些应用已经用了超过20年,其中一些开发公司早就不存在了。我不可能冒着风险花100美元买一个要用十年的应用,然后指望你的公司——或者你的善意——能维持那么久。

作者: sonofhans | 发布于: 2026-04-12 18:06


2. reenorap 在“Pro Max 5x 配额在 1.5 小时内耗尽,尽管使用量适中”中的新评论

Boris,你现在看到了一大堆用户反馈,而Claude的这次改动确实影响了一大批最忠实的用户。

杰夫·贝索斯有句名言:如果用户反馈与数据指标相矛盾,那一定是数据指标测错了方向。我建议你认真对待这里的用户反馈,好好分析一下数据指标究竟在哪里、为什么出了问题。

作者: reenorap | 发布于: 2026-04-12 15:36


3. bcherny 在“Pro Max 5x 配额在 1.5 小时内耗尽,尽管使用量适中”中的新评论

大家好,我是Claude Code团队的Boris。

我们一直在调查这些报告,目前发现的主要问题包括:

  1. 使用100万token上下文窗口时,提示缓存未命中的代价很高。由于Claude Code主代理使用1小时的提示缓存窗口,如果你离开电脑超过一小时然后继续一个陈旧的会话,经常会遇到完全缓存未命中。为了改善这一点,我们已经发布了一些用户体验改进(例如,提示你在继续长时间停滞的会话前使用/clear命令),并且正在研究默认改用40万token上下文窗口的方案,同时保留按需将上下文窗口配置为最高100万token的选项。如果你想现在尝试,可以使用:CLAUDE_CODE_AUTO_COMPACT_WINDOW=400000 claude。

  2. 用户加载了大量技能,或运行了许多代理或后台自动化任务,这种情况在使用大量插件时尤为常见。出乎意料的是,相当多用户都遇到了这个问题。我们正在积极改进:(a)优化用户体验,让这些情况对用户更透明;(b)更智能地截断、精简和调度非主要任务,以避免意外的token消耗。

在调查过程中,我们排除了许多假设:自适应思考机制、其他类型的框架回归、模型和推理回归等。

我们将继续调查并优先处理此事。对于遇到此问题的用户,最有效的做法是运行/feedback命令,并可以选择将反馈ID发布在这里或GitHub issue中。这样我们就能针对具体报告进行调试。

作者: bcherny | 发布于: 2026-04-12 15:02


4. phtrivier在”七个国家现已实现100%可再生能源发电”中的新评论

阿尔巴尼亚、不丹、尼泊尔、巴拉圭、冰岛、埃塞俄比亚和刚果民主共和国利用地热、水力、太阳能或风能生产了超过99.7%的自身用电量。

让我们看看electricitymaps.com的数据!

阿尔巴尼亚(https://app.electricitymaps.com/map/zone/AL/live/fifteen_minutes)

  • 在2026年4月12日16:45(GMT+2时间),阿尔巴尼亚消耗的电量中有22.67%从希腊进口,而希腊22%的电力来自天然气。有趣的是,阿尔巴尼亚向黑山出口的电量几乎与其从希腊进口的电量相当。

不丹:

  • 100%水力发电,完全合理

尼泊尔:

  • 98%水力发电,外加少量太阳能作为补充

冰岛:

  • 70%水力发电,30%地热发电

巴拉圭:

  • 99.9%水力发电

埃塞俄比亚:

  • 96.4%水力发电

刚果民主共和国:

  • 99.6%水力发电

所以,给世界上其他国家的经验教训非常明显:自己造几座山,挖一条大河,然后建水坝,拼命建水坝!!

(开个玩笑,但我敢肯定有人正在搞一个不切实际的地球工程创业公司,准备用人工智能、区块链或两者结合来颠覆地形。)

作者: phtrivier | 发布于: 2026-04-12 14:55


5. 用户 itopaloglu83 在《我们拥有99%的邮件信誉评分,但Gmail不认可》一文中的新评论

我不确定Font Awesome是否也这样,但越来越多的公司即便我在设置里关闭了所有推广邮件,还是会往我收件箱里发垃圾邮件。

所以,我现在一收到不想要的邮件,就立刻在Gmail里标记为垃圾邮件,甚至还会去写差评。

拥有我的邮箱地址不等于获得了我的同意。别再试图用那些恶意的最终用户许可协议来“下药”蒙骗我们了。

作者: itopaloglu83 | 发布于: 2026-04-12 14:37


6. Tell HN:西班牙因足球 Cloudflare 封锁导致 docker pull 失败

呵呵,你算幸运的,至少还能看到提示信息。我的网络服务提供商(ISP)直接就把发往受影响IP地址的流量给丢弃了。没有ping响应,没有traceroute路径,浏览器里就只有一个加载图标在那转啊转,最后显示“找不到页面”。

而对此事负责的足球组织西甲(LaLiga),其迄今为止的每一次回应和评论都轻描淡写,声称这只是个小问题,只影响一小撮谈论什么“Docker镜像”、“GitHub仓库”或“诸如此类不知所云东西”的书呆子。

与此同时,却有证据表明,一些智能家居设备,比如防盗警报器或自动门,在每次有足球比赛时就会停止工作,因为它们依赖的后端服务跑在Cloudflare上。

就在上周,一位女士在社交媒体上求助,因为她用来追踪患有痴呆症父亲位置的GPS应用,在一场比赛期间离线了。天色渐晚,父亲仍未回家,而她无法定位父亲佩戴的追踪标签来找到他:[链接]

这话说起来很残酷,因为没人应该经历这样的事,但尽管这些事件令人揪心,它们却是唯一能让主流人群关注到这种审查封锁的方式。“我拉取不了Docker镜像”这种事永远上不了晚间新闻,但人身安全和个人安保问题,才是推动舆论更强大的动力。

作者: danirod | 发布于: 2026-04-12 14:31


7. 0x3f 在《我们拥有 99% 的邮件信誉,但 Gmail 不认同》中的新评论

我是Font Awesome的订阅用户,没错,说句公道话,他们确实用烦人的营销邮件轰炸我,Gmail那边的问题他们可能也是活该。

他们还用了那种愚蠢的暗黑模式,轮换着用公司里各种人(大卫、哈利、萨姆、珍妮特等等)的邮箱地址@fontawesome.com来发营销邮件。

作者: 0x3f | 发布于: 2026-04-12 14:00


8. Youden在《我们拥有99%的邮件信誉评分,但Gmail不认可》中的新评论

你们是如何获取邮箱地址的?是用户主动明确选择订阅你们的邮件列表,还是你们在未经同意的情况下强行附加给他们的?

我注意到,当我访问 fontawesome.com 并点击”免费开始”时,系统会要求我提供邮箱地址。但这对于使用图标来说并非必要。我需要的只是一个告诉我如何添加 cdnjs 必要标签的页面 0

我认为问题在于你们对用户需求的认知与实际需求存在偏差。如果我每次使用前端开发库都必须先订阅邮件列表,而且他们的邮件还能绕过我的垃圾邮件过滤器,那我邮箱里就再也看不到其他内容了。

我认为谷歌这次的做法是正确的。你们应该把新闻通讯和产品更新与那些只想设置好图标就继续工作的用户区分开来。

作者: Youden | 发布于: 2026-04-12 13:50


9. Avicebron在“AI将遭遇暴力对抗,且无益于任何好事”中的新评论

我觉得,如果人们继续把“不平等”和“加剧不平等的因素”笼统地归咎于“AI”,那好吧,这确实是“AI”的错。但实际上,这两者需要被区分看待。

“如果兴高采烈地夺走人们的生计,必将招致暴力反抗,不会有好结果的。”——这样说才对。

作者: Avicebron | 发布于: 2026-04-12 13:11


10. andai在“Anthropic于3月6日降低缓存TTL”中的新评论

嗯,我立刻能想到的有这么几件事:

  • 封禁OpenClaw用户(这当然在他们的权利范围内,但观感很糟)
  • 全面封禁第三方工具(同上)

(claude -p在订阅版上还能用,但我有种感觉,如果我实际使用它,我的Anthropic账户可能会被干掉。如果能对此给出一些明确的说明就好了。如果我从我的Telegram机器人调用它,这算未经授权的第三方工具吗?)

  • 降低推理投入(然后跑到这里来说“我们会努力确保最有价值的客户获得未被阉割的体验”(稍微转述了一下 xD))
  • 使用量大幅减少(显然是个bug?)前几天,完成同样的任务,Claude的花费比Codex多了21倍
  • 注意到Claude应用中的回复长度急剧缩短。我问了Claude原因,它提到了系统提示中的几项内容,都与减少推理投入、尽可能保持回复简短等有关。

这些都是间接证据,但所有迹象都指向“不顾一切地试图削减成本”。

我喜欢Claude,短期内不会换用其他产品(尽管由于使用限制,我越来越多地用Codex来写代码了),但最近越来越难向朋友们推荐它了。我告诉一个朋友:“它曾经是最好的选择,直到大约两周前……”现在情况就不确定了。

作者: andai | 发布于: 2026-04-12 09:54


11. sunaurus 在“Anthropic 于 3 月 6 日下调缓存 TTL”中的新评论

有没有其他人注意到,就在最近几个月里,和其他工程师讨论Claude/Codex时,大家的看法发生了相当明显的变化?特别是因为这些改动都是秘密或隐藏进行的。

我总感觉,人们越来越不确定自己现在用的是不是当初付费购买的那个产品,还是某个被大幅削弱了的版本,而且这种情绪似乎在不断蔓延。比如最近几周我听到有人提起Anthropic时,几乎总是带着一些负面的意味。

作者: sunaurus | 发布于: 2026-04-12 09:03


12. senko 在“我用每月20美元的技术栈运营多家月入1万美元的公司”中的新评论

如果这听起来像是基础建议,那请想想有多少人坚信自己必须从无服务器架构、Kubernetes、服务器集群、行星级数据库、多区域高可用部署,以及各种其他“最佳实践”开始入手。

说“你完全可以在便宜的VPS上运行这些东西”听起来很业余:人们立刻就会抛出“那扩展性呢”、“那高可用性呢”、“那备份呢”、“现在你还得自己维护”之类的论点——这些基本上都是各大云平台销售话术的翻版。这是一种习得性无助。

作者: senko | 发布于: 2026-04-12 08:52


13. hackingonempty 在“我用每月20美元的技术栈运营多家月入1万美元的公司”中的新评论

企业思维总是认为需要一个独立进程的数据库服务器。但事实上,通过C接口或内存通信的本地SQLite文件,其速度比通过TCP网络跳转到远程Postgres服务器要快几个数量级。

我并非要贬低SQLite——它非常出色,对于许多(甚至大多数)Web应用来说完全够用——但你可以通过Unix域套接字连接到本地的Postgres(或任何数据库),从而几乎避免所有开销。

这种方式使用起来并不比SQLite复杂多少,却能获得Postgres的全部功能。从其他机器对运行中的数据库执行报告等操作会更加容易,而且当需要设置只读副本、实现高可用性,或将数据库与应用程序部署在不同机器上时,也会简单得多。

我认为,将Postgres与应用程序运行在同一台机器上,与搭建Kubernetes集群那种过度乐观的资源规划,并不属于同一性质的问题。

作者: hackingonempty | 发布于: 2026-04-12 08:06


14. ggillas在”利用最突出的AI代理基准测试”中的新评论

这篇关于系统漏洞利用的论文非常出色,希望能改变基准测试的现有方式。

论文中提到:我们在所有测试中都获得了接近满分的成绩,却没有真正完成任何一项任务。这些漏洞利用手段从极其简单(例如向FieldWorkArena发送空对象{})到技术性较强(如在Terminal-Bench中植入特洛伊木马二进制封装器)不等,但它们都指向同一个核心问题:现有的评估体系并未针对“为分数而非任务本身进行优化”的系统设计防御机制。

作者: ggillas | 发布于: 2026-04-11 19:50


15. 用户 kilpikaarna 在《小型模型也发现了 Mythos 所发现的漏洞》中的新评论

Mythos运行的脚手架,本质上不就是一行bash脚本,循环遍历代码库中的每个文件,然后提示模型找出其中的漏洞吗?这听起来和“这里面有金子吗?”的粗暴方式非常接近,只不过是自动化了而已。

Anthropic 实际上有没有透露过 Mythos 产生了多少误报?

值得一提的是,我在 Xitter 上看到一些讨论(所以对此持保留态度),有人尝试用其他(公开的)前沿模型复现他们的结果,但每个模型都只找到了 Mythos 所发现漏洞的一个子集。从 Mythos 是相对于先前模型的一个渐进式(尽管这个进步可能异常巨大)改进这个角度来看,这听起来是合理的,但与此同时,它也带来了相应的大幅增加的复杂性。

因此,他们选择用来展示它的角度以及随之而来的炒作,至少有一部分是夸大其词——说“它太强大了,不能公开发布”听起来可比“在你的代码库上运行一次要花费两万美元,所以我们将直接向企业客户(以及少数几个用于营销的开源项目)提供这项服务”要酷多了。请记住,Nicholas Carlini 演示中使用的例子是基于 Opus 的,所以安全性显然是他们已经研究了一段时间的东西(他们也应该这么做,因为这是一个巨大的风险)。他们并不是突然意外地创造出了一个超级黑客。

作者: kilpikaarna | 发布于: 2026-04-11 18:25


16. tptacek在“小模型同样发现了Mythos找到的漏洞”中的新评论

如果你把Heartbleed漏洞中的那段易受攻击的代码单独抽出来,直接拿给任何一位C语言程序员看,他们都会立刻指出问题。这很明显。但最终是Neel Mehta发现了它。发现漏洞的难点,并不在于准确判断代码是否错误处理了缓冲区,或者在释放后仍持有引用;真正的难点在于,在一个庞大而复杂的程序中定位到这些代码,并理清攻击者控制的数据是如何抵达并触发这段代码的。

Aisle写出这样的观点,实在有些奇怪。

作者: tptacek | 发布于: 2026-04-11 17:28


17. johnfn 在“小型模型也发现了 Mythos 发现的漏洞”中的新评论

Anthropic的文章明确提到了这一点:

这是我们在OpenBSD中通过Mythos Preview运行上千次脚手架测试后发现的最关键漏洞。经过上千次脚手架测试,总成本不到2万美元,并发现了数十个其他问题。虽然发现上述漏洞的那次特定测试成本低于50美元,但这个数字只有在事后回顾时才显得有意义。就像任何搜索过程一样,我们无法提前知道哪次测试会成功。

Mythos的做法相当于在整个大陆上搜寻黄金,并且确实找到了一些。而对于这些小型模型,作者们只是指着某一小块土地,一边暗示性地挑动眉毛一边问:“这儿有黄金吗?嗯?嗯?”

要进行真正公平的比较,我们应该看它能否扫描整个FreeBSD代码库。我推测它能找到漏洞,但同时也会产生大量无关的干扰信息,以至于这些发现变得毫无意义。

作者: johnfn | 发布于: 2026-04-11 17:27


18. epistasis 在“小型模型同样发现了Mythos所发现的漏洞”中的新评论

我们选取了Anthropic在其公告中展示的具体漏洞,隔离出相关代码,并用小型、廉价、开放权重的模型进行了测试。这些模型还原了大部分相同的分析结果。八款模型中有八款都检测到了Mythos的旗舰级FreeBSD漏洞利用代码,其中包括一个仅拥有36亿活跃参数、每百万token成本0.11美元的模型。

这项工作令人印象深刻且极具价值,但隔离相关代码极大地改变了测试场景,以至于我不确定这是否仍属于同一类用例。能够直接导入整个代码库并让模型进行扫描,才是真正能将漏洞扫描能力扩展到更广泛人群的应用场景。

作者: epistasis | 发布于: 2026-04-11 17:16


19. dmk在”比特币挖矿难度下降,矿工每产一枚币都在亏损”中的新评论

标题虽然夸张,但这正是比特币设计的工作方式。矿工退出,算力难度下降,成本降低,挖矿重新变得有利可图。真正有趣的部分不是每枚币的亏损,而是从挖矿无利可图到难度调整之间的延迟时间,这种延迟如何持续对市场施加被迫抛售的压力。

作者: dmk | 发布于: 2026-04-11 13:35


20. 0x3f在《Starfling:单HTML文件中的一键无尽轨道弹射游戏》中的新评论

我希望重启能比现在快得多。这是最烦人的部分,完全破坏了我流畅的游戏体验。我失误后,只能眼睁睁看着它慢慢坠落,或者费力地寻找重置按钮。即使按到了重置,还得经过菜单操作。

至少应该把重置和再玩一次按钮放在同一个位置,这样我就能一直点击那里了。

《超级食肉男孩》才是这类游戏应有的标杆。

作者: 0x3f | 发布于: 2026-04-11 13:01