⚙️ 服务配置
选择语音识别服务提供商并配置相应的API参数
DashScope API Key,格式:sk-xxx,用于阿里云语音识别服务
推荐使用快速识别模型,ITN功能会自动添加标点和格式化
推荐使用快速识别模型,ITN功能会自动添加标点和格式化
自定义ASR服务的域名,会自动添加 /v1/audio/transcriptions
推荐使用快速识别模型,ITN功能会自动添加标点和格式化
📁 文件上传
支持格式:
🎵 音频:MP3, WAV, M4A, AAC, FLAC, OGG
🎬 视频:MP4, AVI, MKV, MOV, WMV, WebM
📏 文件大小:音频最大10MB,视频最大3GB
🎵 音频:MP3, WAV, M4A, AAC, FLAC, OGG
🎬 视频:MP4, AVI, MKV, MOV, WMV, WebM
📏 文件大小:音频最大10MB,视频最大3GB
🔧 识别参数
示例:这是一段关于技术讨论的录音,包含编程术语如API、数据库、算法等