Qwen3 语音识别服务

⚙️ 服务配置

选择语音识别服务提供商并配置相应的API参数

DashScope API Key:

DashScope API Key，格式：sk-xxx，用于阿里云语音识别服务

识别模型:

推荐使用快速识别模型，ITN功能会自动添加标点和格式化

Z.ai 代理地址

识别模型:

推荐使用快速识别模型，ITN功能会自动添加标点和格式化

自定义代理域名

自定义ASR服务的域名，会自动添加 /v1/audio/transcriptions

API Key

认证方式

识别模型:

推荐使用快速识别模型，ITN功能会自动添加标点和格式化

选择音频/视频文件 📁 选择文件

支持格式：
🎵 音频：MP3, WAV, M4A, AAC, FLAC, OGG
🎬 视频：MP4, AVI, MKV, MOV, WMV, WebM
📏 文件大小：音频最大10MB，视频最大3GB

直接从视频文件中分离音频轨道，保持原始音质

音频质量

推荐使用标准质量，适合语音识别

输出格式

WAV: 无损格式，文件较大
WebM: 浏览器原生压缩格式
MP3: 需要在线转换，文件较小

语言

提示词（可选）

示例：这是一段关于技术讨论的录音，包含编程术语如API、数据库、算法等