正在启动平台

网页正文提取content-extract

从新闻、博客、公众号等网页抽取主体正文,自动去除导航/侧栏/广告/评论。基于文本密度算法,同时返回标题、发布时间、配图列表、字数与预估阅读时长。

1. 基本信息

接口地址https://v1.apizero.cn/api/content-extract
请求方法GET
分类dev
提供方极数本源
计费模式免费试用
单次消耗0 积分
起步价
QPS 限制5 req/s
每日免费额度100 次(已认证用户)
匿名每日额度20 次(无 API Key)
VIP 免费
调用次数

2. 认证

匿名免登录可调每日 20 次;登录用户每日 100 次。

获取 API Key:登录 https://apizero.cn/account/keys

3. 请求参数

参数名类型必填说明示例
urlstring目标网页 URL

5. 请求示例 (cURL)

curl "https://v1.apizero.cn/api/content-extract?url=%3Curl%3E&key=YOUR_API_KEY"

6. 响应字段

字段类型说明示例
titlestring文章标题
publish_timestring发布时间(来源于 meta/time 标签)
contentstring提取的正文(含 markdown 风格的标题)
word_countnumber字数(不含空白)
reading_timestring预估阅读时长
imagesarray配图 URL 列表

7. 响应示例

{
    "code": 0,
    "msg": "成功",
    "data": {
        "title": "示例文章标题",
        "publish_time": "2024-01-15",
        "content": "...",
        "word_count": 2300,
        "reading_time": "5分钟",
        "image_count": 3,
        "images": [
            "https:\/\/..."
        ]
    }
}

8. 错误码

codestatus说明
4000url 为空 / 格式错误 / 内网地址
5020目标网页无法访问

9. 变更日志

  • 1.0.0(2026-05-07)
    • 首次上线 · 文本密度算法