OCR 文字识别 API 接入文档ocr-text
通用 OCR 文字识别,从图片中提取任意文字内容(中文/英文/数字/符号/手写体等),返回逐行文本列表 + 完整拼接文本。 • 双输入模式: - input_type=url:传入公网可访问的图片 URL(http/https) - input_type=base64:传入 base64 编码字符串(≤6MB,自动剥离 data:image/...;base64, 前缀) • 三路输出: - text_list:按原图顺序的逐行文本数组 - full_text:用换行符 \n 拼接的完整文本字符串 - text_count:识别到的文本行数 • 适用场景:截图转文字、表格识别、身份证/名片文字提取、字幕识别、笔记 OCR 等通用场景。专用发票识别请用 /api/invoice。 • OCR 结果缓存 1 小时(同图同结果),重复调用不消耗上游配额。
1. 基本信息
| 接口地址 | https://v1.apizero.cn/api/ocr-text |
|---|---|
| 请求方法 | POST |
| 分类 | ocrdata |
| 提供方 | 极数本源 |
| 计费模式 | 免费试用 |
| 单次消耗 | 0 积分 |
| 起步价 | — |
| QPS 限制 | 2 req/s |
| 每日免费额度 | 300 次(已认证用户) |
| 匿名每日额度 | 50 次(无 API Key) |
| VIP 免费 | 否 |
| 调用次数 |
2. 认证
匿名每日 5 次、QPS 1;登录用户每日 30 次、QPS 2(全部免费)。OCR 结果缓存 1 小时,相同图片只实际调用上游一次。
获取 API Key:登录 https://apizero.cn/account/keys
3. 请求参数
| 参数名 | 类型 | 必填 | 说明 | 示例 |
|---|---|---|---|---|
input_type | string | 是 | 输入类型:url=图片URL / base64=图片base64编码 | url |
input_data | string | 是 | 图片数据。input_type=url 时为 http/https 完整 URL;input_type=base64 时为 base64 字符串(最大 6MB,可选 data:image/jpeg;base64, 前缀) | https://dummyimage.com/400x100/000/fff.png&text=Hello+World |
4. 请求头
| Header | 类型 | 必填 | 说明 | 示例 |
|---|---|---|---|---|
Authorization | string | 否 | API Key 鉴权头,格式 Bearer sk_live_xxx;匿名调用时可省略(每日 5 次免费) | Bearer sk_live_xxxxxxxxxxxxxx |
Content-Type | string | 是 | POST 请求体类型,固定 application/x-www-form-urlencoded | application/x-www-form-urlencoded |
5. 请求示例
以下 5 种语言示例都是可直接运行的,只需把 YOUR_API_KEY 替换为实际 Key。
cURL
curl -X POST "https://v1.apizero.cn/api/ocr-text" \
-H "X-Api-Key: YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"input_type": "url",
"input_data": "https://dummyimage.com/400x100/000/fff.png&text=Hello+World"
}'Python
import requests
resp = requests.request(
"POST",
"https://v1.apizero.cn/api/ocr-text",
headers={"X-Api-Key": "YOUR_API_KEY", "Content-Type": "application/json"},
json={
"input_type": "url",
"input_data": "https://dummyimage.com/400x100/000/fff.png&text=Hello+World",
},
timeout=15,
)
resp.raise_for_status()
print(resp.json())JavaScript (Node.js)
// Node.js 18+ / 浏览器原生 fetch
const res = await fetch("https://v1.apizero.cn/api/ocr-text", {
method: "POST",
headers: {
"X-Api-Key": "YOUR_API_KEY",
"Content-Type": "application/json",
},
body: JSON.stringify({
"input_type": "url",
"input_data": "https://dummyimage.com/400x100/000/fff.png&text=Hello+World"
}),
});
if (!res.ok) throw new Error(`HTTP ${res.status}`);
const data = await res.json();
console.log(data);Go
package main
import (
"bytes"
"fmt"
"io"
"net/http"
)
func main() {
body := []byte(`{"input_type":"url","input_data":"https://dummyimage.com/400x100/000/fff.png&text=Hello+World"}`)
req, _ := http.NewRequest("POST", "https://v1.apizero.cn/api/ocr-text", bytes.NewBuffer(body))
req.Header.Set("X-Api-Key", "YOUR_API_KEY")
req.Header.Set("Content-Type", "application/json")
resp, err := http.DefaultClient.Do(req)
if err != nil { panic(err) }
defer resp.Body.Close()
out, _ := io.ReadAll(resp.Body)
fmt.Println(string(out))
}PHP
<?php
$payload = json_encode([
"input_type" => "url",
"input_data" => "https://dummyimage.com/400x100/000/fff.png&text=Hello+World",
], JSON_UNESCAPED_UNICODE);
$ch = curl_init("https://v1.apizero.cn/api/ocr-text");
curl_setopt_array($ch, [
CURLOPT_RETURNTRANSFER => true,
CURLOPT_CUSTOMREQUEST => "POST",
CURLOPT_POSTFIELDS => $payload,
CURLOPT_HTTPHEADER => [
"X-Api-Key: YOUR_API_KEY",
"Content-Type: application/json",
],
CURLOPT_TIMEOUT => 15,
]);
$body = curl_exec($ch);
curl_close($ch);
$data = json_decode($body, true);
print_r($data);6. 响应字段
| 字段 | 类型 | 说明 | 示例 |
|---|---|---|---|
input_type | string | 回传输入类型(url 或 base64) | — |
text_count | number | 识别到的文本行数 | — |
text_list | array | 按原图顺序的逐行文本数组(字符串数组) | — |
full_text | string | 用换行符 \n 拼接的完整文本字符串,便于前端直接展示 | — |
7. 响应示例
{
"code": 0,
"msg": "成功",
"data": {
"input_type": "url",
"text_count": 3,
"text_list": [
"商品名称:无线蓝牙耳机",
"单价:¥299.00",
"数量:2"
],
"full_text": "商品名称:无线蓝牙耳机\n单价:¥299.00\n数量:2"
},
"request_id": "abc123def456"
}8. 错误码
| code | status | 说明 |
|---|---|---|
4000 | — | 参数错误:input_type/input_data 缺失或非法 / URL 格式错 / base64 含非法字符 / base64 超过 6MB |
4015 | — | 匿名调用每日额度用完,需要 API Key |
4029 | — | QPS 超限 |
4030 | — | 今日额度用完 |
5020 | — | 上游 HTTP 失败 |
5021 | — | 识别失败:图片模糊 / URL 不可达 / 上游服务异常 |
9. 变更日志
- 1.0.0(2026-05-06)
- 首次上线,对接 alapi.cn /api/ocr/text 通用 OCR 服务
- 双输入模式:URL 直接抓取 / base64 直传
- base64 模式自动剥离 data:image/...;base64, 前缀
- base64 上限 6MB,防止 OOM;URL 模式强制 http/https,防 SSRF
- OCR 结果缓存 1h(按 sha256 哈希),相同图片不重复调用付费上游
- 兼容 text_list 两种形式:纯字符串数组 / 含 text 字段的对象数组
- 额外输出 full_text(换行拼接)+ text_count(行数),便于前端直接使用
- token 异常转为通用 5021 错误,不暴露内部配置
常见问题
OCR 文字识别 接口怎么免费使用?
未登录用户每个 IP 每天 50 次免费。登录用户创建 API Key 后每天 300 次免费,超额部分按点数计费(0 点/次)。
OCR 文字识别 支持哪些调用方式?
接口使用 POST 请求。文档提供 cURL、Python、JavaScript (Node.js)、Go、PHP 五种语言的可运行示例。也可以下载 /openapi.json 导入 Postman / Insomnia / Apifox 反向生成 SDK。
调用不限额么? QPS 是多少?
本接口 QPS 限制 2 req/s,每个 API Key 每日免费 300 次。需要更高额度可升级 VIP 套餐或联系售后提高 QPS。
这个接口跟自己直连上游有什么区别?
极数本源 作为中间层提供:统一鉴权(一个 Key 调所有接口)、统一计费(点数制)、统一限流、统一错误码、多上游自动切换。免去逐个对接上游、维护 Key、统计调用量的运维成本。