ChordVox 官方教程

安装 / 配置 / 使用 / 排错

这份教程基于当前版本功能整理,覆盖从首次安装到 AI 配置再到效率工作流的完整路径。 建议先做 3 分钟快速开始,再按需查看详细章节。

完成后你会得到

看完这页前半部分后,你应该能在任意输入框里按住热键,说一句话,然后看到文字自动粘贴出来。

0

3 分钟快速开始(推荐)

  1. 下载并安装 ChordVox。
  2. 首次启动后,授予麦克风权限。
  3. 在设置中选择默认语音引擎(建议先用内置引擎)。
  4. 设置一个顺手的热键(如 Fn / Globe 或自定义组合键)。
  5. 按住热键说话,松开后检查是否自动粘贴到目标应用。
建议: 先把「识别可用 + 自动粘贴可用」跑通,再做 AI 提示词和词典优化,学习成本最低。

你应该能在光标处看到文字

按住热键,说话,松开后,当前输入框应该直接收到文字,不需要复制粘贴。

如果失败,先减少变量

不要一上来同时折腾所有 Provider,先检查麦克风权限和默认引擎。

1

安装与首次启动

macOS

下载 `.dmg` 后拖拽到 Applications。若提示“无法验证开发者”,为非 App Store 下载软件正常提示。打开「终端」应用,粘贴以下命令并回车即可解除限制(该命令仅移除系统的下载标记,不会修改任何文件):

xattr -dr com.apple.quarantine /Applications/ChordVox.app
open /Applications/ChordVox.app

Windows / Linux

Windows 使用安装包 `.exe`;Linux 使用 `.AppImage` 或 `.deb`。 首次启动建议先确认系统输入设备与默认麦克风。

2

系统权限与环境检查

平台 你要检查什么 常见问题
macOS 系统设置 → 隐私与安全性 → 麦克风 未授权导致无录音
Windows 设置 → 隐私 → 麦克风(允许应用访问) 系统总开关关闭
Linux 检查输入设备(如 `pavucontrol`)与剪贴板工具 Wayland 剪贴板不可用
验证标准: 不是“程序在运行”,而是“说一句话后能产出文本并自动粘贴到目标输入框”。
3

AI 配置(模型 / API / 本地方案)

ChordVox 支持 OpenAI / Claude / Gemini / Groq 等云端 API,也支持本地 GGUF 模型。 建议先用一个云端模型跑通,再逐步切换到你想要的质量与成本组合。

先走这两条推荐路径

路径 A:最快跑通

先用内置或低延迟引擎,把整条链路跑通,后面再加 AI 润色。

路径 B:正式写作优先

本地工作流稳定后,再接 OpenAI 或 Claude,并单独留一套高质量配置。

方案 特点 适合场景
Groq(云端) 响应快,延迟低 快速草稿、实时聊天输入
GPT / Claude(云端) 文本质量高 正式写作、邮件、长文本润色
本地 GGUF 隐私强,可离线 内网、敏感信息场景

推荐配置顺序

  1. 先固定一个可用模型,避免多变量排错。
  2. 确认“转写成功 + 润色成功 + 自动粘贴成功”。
  3. 再创建第二套配置(用于速度/质量切换)。
展开全部提供商配置

按供应商快速配置

如果你不知道该去哪里获取 Key / Access Key,或者不知道回到 ChordVox 后该填哪里,就按下面对应供应商的步骤做。

OpenAI

用于 GPT 系列模型,适合正式写作和高质量润色。

  1. 打开 OpenAI 的 API Keys 页面并创建新的 secret key。
  2. 回到 ChordVox,把 key 粘贴到 OpenAI 的 API Key 字段。
  3. 点击刷新并选择你想用的模型。

OpenRouter

一个 Key 接入多家模型,适合想灵活切换提供商的用户。

  1. 打开 OpenRouter 的 Keys 页面并创建新 key。
  2. 回到 ChordVox,把 key 粘贴到 OpenRouter 的 API Key 字段。
  3. 点击刷新并从返回列表中选择模型。

Anthropic

用于 Claude 系列模型,适合更稳的长文本组织和改写。

  1. 打开 Anthropic Console 的 API Keys 页面并创建 key。
  2. 回到 ChordVox,把 key 粘贴到 Anthropic 的 API Key 字段。
  3. 点击刷新并选择你想用的 Claude 模型。

Google Gemini

通过 Google AI Studio 获取 key,适合 Gemini 模型接入。

  1. 打开 Google AI Studio 的 API Keys 页面并创建 key。
  2. 回到 ChordVox,把 key 粘贴到 Gemini 的 API Key 字段。
  3. 点击刷新并选择需要的 Gemini 模型。

Groq

低延迟、响应快,适合快速草稿和轻量润色。

  1. 打开 Groq Console 的 Keys 页面并创建 key。
  2. 回到 ChordVox,把 key 粘贴到 Groq 的 API Key 字段。
  3. 点击刷新并选择可用模型。

Mistral

主要用于云端文件转录,适合想快速接入外部转录 API 的场景。

  1. 打开 Mistral Console 的 API Keys 页面并创建 key。
  2. 回到 ChordVox,在云端转录提供商里填入该 key。
  3. 选择可用模型后先跑一条短音频确认成功。

AWS Bedrock

不是单个 API Key,需要 Access Key ID、Secret Access Key 和 Region。

  1. 在 AWS IAM 中创建 Access Key,并确认账号已开通 Bedrock 模型权限。
  2. 回到 ChordVox,填写 Access Key ID、Secret Access Key 和 Region。
  3. 点击刷新并选择可用模型;如有私有网络,再补 Endpoint。

Custom Provider

适用于 Ollama、LocalAI 或其它兼容 OpenAI 接口的自建服务。

  1. 准备好兼容 OpenAI 的 Endpoint URL,以及服务商要求的凭据。
  2. 在 ChordVox 填入 Endpoint URL、可选 API Key 和协议。
  3. 点击刷新并从返回列表中选择模型。

自定义提供商没有统一官方 Key 页面,请以你的兼容服务商文档为准。

4

热键与自动粘贴工作流

按下热键
说话录音
本地/云端转写
AI 润色
自动粘贴

配置 A:高速草稿

用于会议、即时聊天、快速记录。目标是“快且可读”。

配置 B:正式输出

用于邮件、文档、对外沟通。目标是“语气稳、格式好”。

5

自定义词典:准确率提升关键

建议按“人名 / 产品名 / 缩写 / 专业术语”四类维护,并每周迭代一次。

示例(技术团队)

ChordVox
whisper.cpp
Parakeet
SenseVoice
GGUF
Creem
6

常见问题排错

有录音但没文字

优先检查麦克风权限、输入设备和模型可用性;然后再检查 API 与网络。

识别结果为空或异常短

检查是否误触热键、音量过低、缓存异常;必要时清理本地缓存后重试。

Linux 粘贴失败

Wayland 下优先安装 `wl-clipboard`,并确认系统粘贴工具已正确安装。

Windows 无窗口或无响应

先查看系统托盘,再尝试关闭 GPU 启动参数与安全软件拦截排查。

7

给新用户的使用建议

  • 先追求稳定可用,再追求模型最优。
  • 把“快捷键 + 模型 + 提示词”按场景拆成两套配置。
  • 每周更新一次词典,准确率会持续提升。
  • 如果你面向客户交付,建议把本页教程链接直接放进产品首页。