服务端 API/AI 能力/语音识别（ASR）/语音识别/文件语音识别
# 语音文件识别 (ASR)

语音文件识别接口，上传整段语音文件进行一次性识别。接口适合 60 秒以内音频识别

**注意事项**：单租户限流：20QPS，同租户下的应用没有限流，共享本租户的 20QPS 限流。免费版不支持调用。

## 请求

基本 | &nbsp;
---|---
HTTP URL | https://open.larksuite.com/open-apis/speech_to_text/v1/speech/file_recognize
HTTP Method | POST
支持的应用类型 | Custom App、Store App
权限要求<br>**调用该 API 所需的权限。开启其中任意一项权限即可调用** | 语音识别(speech_to_text:speech)

### 请求头

名称 | 类型 | 必填 | 描述
---|---|---|---
Authorization | string | 是 | `tenant_access_token`<br>**值格式**："Bearer `access_token`"<br>**示例值**："Bearer t-7f1bcd13fc57d46bac21793a18e560"<br>[了解更多：获取与使用access_token](https://open.larksuite.com/document/ukTMukTMukTM/uMTNz4yM1MjLzUzM)
Content-Type | string | 是 | **固定值**："application/json; charset=utf-8"

### 请求体

名称 | 类型 | 必填 | 描述
---|---|---|---
speech | speech | 是 | 语音资源
speech | string | 否 | pcm格式音频文件（文件识别）或音频分片（流式识别）经base64编码后的内容<br>**示例值**："PdmrfE267Cd/Z9KpmNFh71A2PSJZxSp7+8upCg=="
config | file_config | 是 | 配置属性
file_id | string | 是 | 仅包含字母数字和下划线的 16 位字符串作为文件的标识，用户生成<br>**示例值**："qwe12dd34567890w"
format | string | 是 | 语音格式，目前仅支持：pcm<br>**示例值**："pcm"
engine_type | string | 是 | 引擎类型，目前仅支持：16k_auto 中英混合<br>**示例值**："16k_auto"

### 请求体示例
```json
{
    "speech": {
        "speech": "PdmrfE267Cd/Z9KpmNFh71A2PSJZxSp7+8upCg=="
    },
    "config": {
        "file_id": "qwe12dd34567890w",
        "format": "pcm",
        "engine_type": "16k_auto"
    }
}
```

## 响应

### 响应体

名称 | 类型 | 描述
---|---|---
code | int | 错误码，非 0 表示失败
msg | string | 错误描述
data | \- | \-
recognition_text | string | 语音识别后的文本信息

### 响应体示例
```json
{
    "code": 0,
    "msg": "success",
    "data": {
        "recognition_text": "你好，使用Lark吧"
    }
}
```

### 错误码

HTTP状态码 | 错误码 | 描述 | 排查建议
---|---|---|---
400 | 1040101 | invalid param | 参数错误，参考文档检查输入参数
500 | 1040102 | network anomaly | 后端服务异常或网络异常，可重新请求

