- 前言(必读)
- OpenAI官方SDK使用教程
- 批量请求示例
- 聊天模型(Chat)
- 内容审查
- 向量嵌入
- 图片处理
- 音频模型(Audio)
- 绘画模型(Painting)
- 视频模型(Video)
- 音乐创作(suno)
- 文档处理
- 3D模型
- 更多接口开发中...
- 查询令牌用量GET
- 查询令牌限额GET
爬取网页并返回结果
POST
/task/scrape/run-sync
提示
如果爬取大型网站,建议使用异步任务,否则会等待过长造成任务超时。
请求参数
Authorization
在 Header 添加参数
Authorization
,其值为在 Bearer 之后拼接 Token示例:
Authorization: Bearer ********************
Body 参数application/json
endpoint
enum<string>
爬虫端点
枚举值:
scrape
url
string
爬取地址
fields
object
结构化输出
示例:
<...>
标识,规范返回数据格式。如果爬取的数据有缺失,说明字段声明有歧义,ai无法理解或不清楚具体应该填充哪个内容。例如上面的titile 到底是网页的title还是文章的title。description
string
补充描述
示例
{
"endpoint": "scrape",
"url": "https://www.jianshu.com/p/f08ed6faf1a8",
"fields": {
"title": "",
"author": "",
"content": "",
"public_time": "",
"word_count": ""
}
}
示例代码
Shell
JavaScript
Java
Swift
Go
PHP
Python
HTTP
C
C#
Objective-C
Ruby
OCaml
Dart
R
请求示例请求示例
Shell
JavaScript
Java
Swift
curl --location --request POST 'https://api.gpt.ge/task/scrape/run-sync' \
--header 'Content-Type: application/json' \
--data-raw '{
"endpoint": "scrape",
"url": "https://www.jianshu.com/p/f08ed6faf1a8",
"fields": {
"title": "",
"author": "",
"content": "",
"public_time": "",
"word_count": ""
}
}'
返回响应
🟢200成功
application/json
Body
task_id
string
必需
status
string
必需
started_at
string
可选
finished_at
null
可选
示例
{
"task_id": "tUaXHZethj8WJ92it",
"status": "READY",
"started_at": "2025-04-18T18:15:06.566Z",
"finished_at": null
}
修改于 2025-04-19 06:54:22