3 分钟快速开始(推荐)
- 下载并安装 ChordVox。
- 首次启动后,授予麦克风权限。
- 在设置中选择默认语音引擎(建议先用内置引擎)。
- 设置一个顺手的热键(如 Fn / Globe 或自定义组合键)。
- 按住热键说话,松开后检查是否自动粘贴到目标应用。
你应该能在光标处看到文字
按住热键,说话,松开后,当前输入框应该直接收到文字,不需要复制粘贴。
如果失败,先减少变量
不要一上来同时折腾所有 Provider,先检查麦克风权限和默认引擎。
安装与首次启动
macOS
下载 `.dmg` 后拖拽到 Applications。若提示“无法验证开发者”,为非 App Store 下载软件正常提示。打开「终端」应用,粘贴以下命令并回车即可解除限制(该命令仅移除系统的下载标记,不会修改任何文件):
xattr -dr com.apple.quarantine /Applications/ChordVox.app
open /Applications/ChordVox.app
Windows / Linux
Windows 使用安装包 `.exe`;Linux 使用 `.AppImage` 或 `.deb`。 首次启动建议先确认系统输入设备与默认麦克风。
系统权限与环境检查
| 平台 | 你要检查什么 | 常见问题 |
|---|---|---|
| macOS | 系统设置 → 隐私与安全性 → 麦克风 | 未授权导致无录音 |
| Windows | 设置 → 隐私 → 麦克风(允许应用访问) | 系统总开关关闭 |
| Linux | 检查输入设备(如 `pavucontrol`)与剪贴板工具 | Wayland 剪贴板不可用 |
AI 配置(模型 / API / 本地方案)
ChordVox 支持 OpenAI / Claude / Gemini / Groq 等云端 API,也支持本地 GGUF 模型。 建议先用一个云端模型跑通,再逐步切换到你想要的质量与成本组合。
先走这两条推荐路径
路径 A:最快跑通
先用内置或低延迟引擎,把整条链路跑通,后面再加 AI 润色。
路径 B:正式写作优先
本地工作流稳定后,再接 OpenAI 或 Claude,并单独留一套高质量配置。
| 方案 | 特点 | 适合场景 |
|---|---|---|
| Groq(云端) | 响应快,延迟低 | 快速草稿、实时聊天输入 |
| GPT / Claude(云端) | 文本质量高 | 正式写作、邮件、长文本润色 |
| 本地 GGUF | 隐私强,可离线 | 内网、敏感信息场景 |
推荐配置顺序
- 先固定一个可用模型,避免多变量排错。
- 确认“转写成功 + 润色成功 + 自动粘贴成功”。
- 再创建第二套配置(用于速度/质量切换)。
展开全部提供商配置
按供应商快速配置
如果你不知道该去哪里获取 Key / Access Key,或者不知道回到 ChordVox 后该填哪里,就按下面对应供应商的步骤做。
OpenAI
用于 GPT 系列模型,适合正式写作和高质量润色。
- 打开 OpenAI 的 API Keys 页面并创建新的 secret key。
- 回到 ChordVox,把 key 粘贴到 OpenAI 的 API Key 字段。
- 点击刷新并选择你想用的模型。
OpenRouter
一个 Key 接入多家模型,适合想灵活切换提供商的用户。
- 打开 OpenRouter 的 Keys 页面并创建新 key。
- 回到 ChordVox,把 key 粘贴到 OpenRouter 的 API Key 字段。
- 点击刷新并从返回列表中选择模型。
Anthropic
用于 Claude 系列模型,适合更稳的长文本组织和改写。
- 打开 Anthropic Console 的 API Keys 页面并创建 key。
- 回到 ChordVox,把 key 粘贴到 Anthropic 的 API Key 字段。
- 点击刷新并选择你想用的 Claude 模型。
Google Gemini
通过 Google AI Studio 获取 key,适合 Gemini 模型接入。
- 打开 Google AI Studio 的 API Keys 页面并创建 key。
- 回到 ChordVox,把 key 粘贴到 Gemini 的 API Key 字段。
- 点击刷新并选择需要的 Gemini 模型。
Groq
低延迟、响应快,适合快速草稿和轻量润色。
- 打开 Groq Console 的 Keys 页面并创建 key。
- 回到 ChordVox,把 key 粘贴到 Groq 的 API Key 字段。
- 点击刷新并选择可用模型。
Mistral
主要用于云端文件转录,适合想快速接入外部转录 API 的场景。
- 打开 Mistral Console 的 API Keys 页面并创建 key。
- 回到 ChordVox,在云端转录提供商里填入该 key。
- 选择可用模型后先跑一条短音频确认成功。
AWS Bedrock
不是单个 API Key,需要 Access Key ID、Secret Access Key 和 Region。
- 在 AWS IAM 中创建 Access Key,并确认账号已开通 Bedrock 模型权限。
- 回到 ChordVox,填写 Access Key ID、Secret Access Key 和 Region。
- 点击刷新并选择可用模型;如有私有网络,再补 Endpoint。
Custom Provider
适用于 Ollama、LocalAI 或其它兼容 OpenAI 接口的自建服务。
- 准备好兼容 OpenAI 的 Endpoint URL,以及服务商要求的凭据。
- 在 ChordVox 填入 Endpoint URL、可选 API Key 和协议。
- 点击刷新并从返回列表中选择模型。
自定义提供商没有统一官方 Key 页面,请以你的兼容服务商文档为准。
热键与自动粘贴工作流
配置 A:高速草稿
用于会议、即时聊天、快速记录。目标是“快且可读”。
配置 B:正式输出
用于邮件、文档、对外沟通。目标是“语气稳、格式好”。
自定义词典:准确率提升关键
建议按“人名 / 产品名 / 缩写 / 专业术语”四类维护,并每周迭代一次。
示例(技术团队)
ChordVox
whisper.cpp
Parakeet
SenseVoice
GGUF
Creem
常见问题排错
有录音但没文字
优先检查麦克风权限、输入设备和模型可用性;然后再检查 API 与网络。
识别结果为空或异常短
检查是否误触热键、音量过低、缓存异常;必要时清理本地缓存后重试。
Linux 粘贴失败
Wayland 下优先安装 `wl-clipboard`,并确认系统粘贴工具已正确安装。
Windows 无窗口或无响应
先查看系统托盘,再尝试关闭 GPU 启动参数与安全软件拦截排查。
给新用户的使用建议
- 先追求稳定可用,再追求模型最优。
- 把“快捷键 + 模型 + 提示词”按场景拆成两套配置。
- 每周更新一次词典,准确率会持续提升。
- 如果你面向客户交付,建议把本页教程链接直接放进产品首页。