hacker_news_audio_tech_2026-03-01

Hacker News 音频技术 - 2026-03-01

1. Qwen3-ASR 0.6B与1.7B转录模型的C语言推理实现

作者: Curiositry | 发布于: 2026-02-28 00:05


2. Parakeet.cpp – 纯C++实现、支持Metal GPU加速的Parakeet语音识别推理引擎

作者: noahkay13 | 发布于: 2026-02-27 03:48


3. Show HN:基于Kitten TTS的CPU低延迟流式语音助手

Neo AI开发了一个在CPU上低延迟运行的语音助手管道,适用于普通笔记本或边缘设备,包含语音检测和流式处理模块。

作者: gauravvij137 | 发布于: 2026-02-26 12:42


4. TinyTTS:超轻量级英语TTS(900万参数,20MB),CPU速度提升8倍,GPU速度提升67倍

TinyTTS是一个专为边缘设备设计的超小型文本转语音模型,仅9M参数、20MB大小,可在CPU上快速生成音频,旨在节省VRAM以配合大型语言模型本地运行。

作者: letrghieu | 发布于: 2026-02-25 14:46


5. Show HN:Moonshine 开源权重 STT 模型——准确率超越 WhisperLargev3

小型初创公司发布新型语音转文本模型,声称其流式处理效果优于OpenAI Whisper,在HF OpenASR排行榜上表现领先。

作者: petewarden | 发布于: 2026-02-24 21:54


6. Show HN:Localvoxtral – 在 macOS 上实现带流式语音识别的本地实时听写

一款macOS菜单栏实时听写应用,完全在设备端运行,使用Mistral Voxtral模型实现边说边转录,支持Apple Silicon和NVIDIA GPU后端。

作者: T0mSIlver | 发布于: 2026-02-24 15:00


7. Show HN:TTSLab——一款通过WebGPU在浏览器中运行的语音AI助手与TTS实验室

TTSLab是一款开源工具,可在浏览器内通过WebGPU和WASM本地运行TTS和STT模型,无需网络或API密钥,并包含实验性的本地语音代理功能。

作者: MbBrainz | 发布于: 2026-02-23 15:52


8. Kyutai Labs 的 Pocket TTS 推出 iOS 版本

作者: unamentis | 发布于: 2026-02-20 17:14


9. Show HN:Apple Silicon 本地 TTS 支持 OpenClaw(MLX 驱动,零配置)

为Mac开发的OpenClaw插件,可在本地运行文本转语音,无需API密钥或云端服务。它封装mlx-audio,自动管理Python环境和服务器进程,并提供OpenAI兼容的API端点。

作者: ZacharyZZ | 发布于: 2026-02-20 03:00


10. Show HN:KittenML 发布三款新模型,开源 TTS 小于 25 MB,表现力出众

作者: rohan_joshi | 发布于: 2026-02-20 02:11


11. 开源语音克隆应用采用Qwen3-TTS技术

作者: angelmm | 发布于: 2026-02-19 12:25


12. 语音代理STT性能基准测试:10项服务、千条样本、语义WER评估

作者: edgarsDev | 发布于: 2026-02-18 17:26


13. [Android]Nabu 0.5.4 发布:支持 Soprano TTS 及本地 LLM HTTP 服务器

作者: mewmix | 发布于: 2026-02-16 17:50


14. Vox:基于 Rust 的本地语音 AI 框架(支持语音识别、合成与活动检测)

作者: mertoz3 | 发布于: 2026-02-15 22:52


15. Ask HN:最佳实时本地TTS解决方案是什么?用于电话口译

开发者寻求实时监听通话系统的优雅方案,现有AI工具实现效果不佳,希望获得技术见解。

作者: Wright007 | 发布于: 2026-02-15 18:04


16. Show HN:Repy – 内置TTS和词典查询功能的终端电子书阅读器

作者用AI辅助开发了终端电子书阅读器repy,支持vim导航、语音朗读和词典查询,并分享了AI编程的体验。

作者: dawdler-purge | 发布于: 2026-02-15 04:41


17. Kokoro TTS 语音合成插件接入 Claude Code

作者: aeontech | 发布于: 2026-02-10 20:28


18. 纯Go实现,亚秒级快速语音转文字,支持流式自动粘贴

作者: sumerc | 发布于: 2026-02-09 14:23


19. 本地ASR模型的兴起

作者: frostdiscord39 | 发布于: 2026-02-08 18:42


20. Show HN:Cbx – 本地 TTS 命令行工具,封装 Chatterbox ONNX(单一 Rust 二进制文件)

cbx是一个用Rust编写的单文件命令行工具,用于本地离线文本转语音。它封装了Resemble AI的Chatterbox ONNX模型,无需Python环境即可在脚本中使用。

作者: Tsarp | 发布于: 2026-02-06 17:51