🎙️ Qwen3 语音识别服务

OpenAI 兼容的智能语音识别与转录服务(支持音频/视频文件)

⚙️ 服务配置

选择语音识别服务提供商并配置相应的API参数
DashScope API Key,格式:sk-xxx,用于阿里云语音识别服务
推荐使用快速识别模型,ITN功能会自动添加标点和格式化
推荐使用快速识别模型,ITN功能会自动添加标点和格式化
自定义ASR服务的域名,会自动添加 /v1/audio/transcriptions
推荐使用快速识别模型,ITN功能会自动添加标点和格式化

📁 文件上传

支持格式:
🎵 音频:MP3, WAV, M4A, AAC, FLAC, OGG
🎬 视频:MP4, AVI, MKV, MOV, WMV, WebM
📏 文件大小:音频最大10MB,视频最大3GB

🔧 识别参数

示例:这是一段关于技术讨论的录音,包含编程术语如API、数据库、算法等