Hacker News 音频技术 - 2026-03-03
1. Qwen3-ASR 0.6B与1.7B转录模型的C语言推理实现
作者: Curiositry | 发布于: 2026-02-28 00:05
2. Parakeet.cpp – 纯C++实现鹦鹉语音识别推理,支持Metal GPU加速
作者: noahkay13 | 发布于: 2026-02-27 03:48
3. Show HN:基于Kitten TTS的CPU低延迟流式语音助手
Neo AI开发了在CPU上运行的轻量级语音助手流水线,包含语音检测、LLM和TTS流式处理,旨在降低延迟,适用于本地助手和边缘设备。
作者: gauravvij137 | 发布于: 2026-02-26 12:42
4. TinyTTS:超轻量级英语TTS(900万参数,20MB),CPU提速8倍,GPU提速67倍
TinyTTS是一个超轻量级本地语音合成工具,仅20MB,支持CPU/GPU,专为边缘设备和资源受限场景设计。
作者: letrghieu | 发布于: 2026-02-25 14:46
5. Show HN:Moonshine 开源权重 STT 模型——准确率超越 WhisperLargev3
小型初创公司推出开源语音转文本模型,在流式处理和词错率上优于OpenAI Whisper,并接近HF OpenASR排行榜前列。
作者: petewarden | 发布于: 2026-02-24 21:54
6. Show HN:Localvoxtral – 在 macOS 上实现带流式语音识别的本地实时听写
一款原生macOS菜单栏应用,利用Mistral Voxtral实现完全本地的实时语音转文字,边说边出文本,支持Apple Silicon和NVIDIA GPU后端。
作者: T0mSIlver | 发布于: 2026-02-24 15:00
7. Show HN:TTSLab——一款基于WebGPU在浏览器中运行的语音AI助手与TTS实验室
TTSLab是一款开源工具,可在浏览器内通过WebGPU和WASM本地运行文本转语音和语音转文本模型,无需网络或API密钥,并包含实验性的本地语音代理功能。
作者: MbBrainz | 发布于: 2026-02-23 15:52
8. Kyutai Labs 的 Pocket TTS 推出 iOS 版本
作者: unamentis | 发布于: 2026-02-20 17:14
9. Show HN:Apple Silicon 本地 TTS 支持 OpenClaw(基于 MLX,零配置)
OpenClaw插件在Mac上本地运行文本转语音,无需API密钥或云端服务,自动管理Python环境和模型下载。
作者: ZacharyZZ | 发布于: 2026-02-20 03:00
10. Show HN:KittenML 发布三款新模型,开源 TTS 小于 25 MB,表现力出众
作者: rohan_joshi | 发布于: 2026-02-20 02:11
11. 开源语音克隆应用采用Qwen3-TTS技术
作者: angelmm | 发布于: 2026-02-19 12:25
12. 语音助手语音转文本性能评测:10项服务、千条样本、语义错误率分析
作者: edgarsDev | 发布于: 2026-02-18 17:26
13. [Android] Nabu 0.5.4 发布:支持 Soprano TTS 及本地 LLM HTTP 服务器
作者: mewmix | 发布于: 2026-02-16 17:50
14. Vox:基于 Rust 的本地语音 AI 框架(支持语音识别、合成与活动检测)
作者: mertoz3 | 发布于: 2026-02-15 22:52
15. Ask HN:最佳实时本地TTS解决方案是什么?用于电话口译
用户尝试构建实时通话监听系统,但现有AI工具方案效果不佳,寻求更优解决方案。
作者: Wright007 | 发布于: 2026-02-15 18:04
16. Show HN:Repy – 内置TTS与词典查询功能的终端电子书阅读器
作者用AI辅助开发了终端电子书阅读器repy,支持vim导航、文本转语音和词典查询,并分享AI编程体验。
作者: dawdler-purge | 发布于: 2026-02-15 04:41
17. Kokoro TTS 语音合成插件接入 Claude 代码
作者: aeontech | 发布于: 2026-02-10 20:28
18. 纯Go实现,亚秒级快速语音转文字,支持流式自动粘贴
作者: sumerc | 发布于: 2026-02-09 14:23
19. 本地ASR模型的兴起
作者: frostdiscord39 | 发布于: 2026-02-08 18:42
20. Show HN:Cbx – 基于 Chatterbox ONNX 的本地 TTS 命令行工具(单一 Rust 二进制文件)
cbx是一个用Rust编写的单文件命令行工具,用于本地离线文本转语音。它封装了Resemble AI的Chatterbox ONNX模型,无需Python环境即可在脚本中使用。
作者: Tsarp | 发布于: 2026-02-06 17:51