详情介绍
打开Chrome浏览器 → 访问 `chrome://settings/extensions` → 点击“打开Chrome应用商店” → 搜索“语音输入”或“Voice Typing” → 点击“添加至Chrome”。此操作可启用基础语音转文字功能(支持中文普通话),但需保持网络连接(离线时无法使用),或通过命令行直接安装:
cmd
使用命令行安装指定版本的语音扩展
chrome.exe --user-data-dir="C:\VoiceProfile" --load-extension="https://clients2.google.com/service/update2/crx?id=abcdefghijklmnop"
步骤二:在Chrome设置中启用高级语音服务权限
点击右上角三个点 → 选择“设置” → 在左侧菜单进入“隐私与安全” → 找到“网站设置” → 滑动到底部勾选“使用设备麦克风进行语音搜索”。此操作允许浏览器调用系统麦克风(如Windows自带录音程序同步生效),但可能被其他程序占用(需关闭冲突应用),或通过策略组强制开启:
reg
在注册表中添加语音权限策略
[HKEY_LOCAL_MACHINE\SOFTWARE\Policies\Google\Chrome]
"Enable-Media-Stream"=dword:00000001
步骤三:使用开发者工具注入语音识别API脚本
按下 `Ctrl+Shift+I` 打开控制台 → 输入以下代码并回车:
javascript
// 创建语音识别实例并监听结果
const recognition = new (window.SpeechRecognition || window.webkitSpeechRecognition)();
recognition.lang = 'zh-CN';
recognition.start();
recognition.onresult = function(event) {
document.getElementById('textbox').value = event.results[0][0].transcript;
};
此操作可自定义识别语言(如英语需改为`en-US`),但需网页有输入框(否则需手动创建元素),或通过书签脚本快速启用:
javascript
// 保存为书签并点击执行语音输入
javascript:(function(){var r=new (window.SpeechRecognition||window.webkitSpeechRecognition)();r.lang='zh-CN';r.start();r.onresult=function(e){document.body.innerHTML+=e.results[0][0].transcript+'
';};})();
步骤四:通过操作系统代理实现离线语音转文字
下载 Dragon NaturallySpeaking 或 IBM ViaVoice → 安装后右键浏览器选择“以管理员身份运行” → 在扩展设置中勾选“使用系统语音服务”。此操作可在断网时使用本地引擎(需额外购买授权),但可能占用大量CPU资源(建议高性能电脑使用),或通过命令行调用API:
bash
使用Python调用本地语音识别库
python -m speech_recognition --microphone --language zh-CN