macOS · v1.0
Aloud
菜单栏语音输入。Fn 按一下开始说话,再按一下停,识别后的文字直接注入当前聚焦的输入框。识别后端是火山豆包流式 ASR,能听懂中英混和技术词,可选一层 LLM 只修明显口误、不改写。
Fn 切换
按一下 Fn 开始录音,再按一下停。90 秒硬上限兜底,松手即出字。
实时上字
胶囊浮窗逐字上字——说话的同时就看到识别结果,不用等录完才知道有没有听对。带实时波形,停后注入并恢复原剪贴板。
中英混识
火山豆包流式 ASR 2.0,自动中英混识,技术术语识别比系统听写准。
LLM 纠错
可选一层豆包 seed-lite,只修明显语音误识别,不润色、不改写。可关。
本地
凭证存本机,触发纯本地,识别直连火山,不经任何第三方中转。
系统要求
- macOS 14 Sonoma 及以上
- Apple Silicon(M 系列)
- 火山引擎账号 — 自行开通豆包流式语音识别,AppID / Access Token 填入 App 设置
- 麦克风 + 辅助功能权限(监听 Fn 键、注入文字必需)
当前版本未签名也未公证。首次打开 macOS 可能提示「已损坏」——这是 Gatekeeper 拦截未签名的网络下载,不是真的损坏。把 Aloud 拖进「应用程序」,在终端运行 xattr -dr com.apple.quarantine /Applications/Aloud.app 后正常打开即可。这是自用早期工具,无 CI、无代码签名、无自动更新。