V-API
  1. 图片处理
V-API
  • 前言(必读)
  • OpenAI官方SDK使用教程
  • 批量请求示例
  • 聊天模型(Chat)
    • 列出可用模型
      GET
    • 聊天接口(通用)
      POST
    • 聊天接口(图片分析)
      POST
    • 聊天接口(函数调用)
      POST
    • 聊天接口(o1系列模型)
      POST
    • gpt-4o-all 文件分析
      POST
    • gpt-4-all 文件分析
      POST
    • 聊天补全
      POST
    • Claude (OpenAI格式)-可PDF分析
      POST
    • Claude (原生格式)-可PDF分析
      POST
    • Gemini (OpenAI格式)-可文件分析
      POST
    • GPTs
      POST
  • 内容审查
    • 文本审查
      POST
    • 图片审查
      POST
  • 向量嵌入
    • 创建嵌入
  • 图片处理
    • 特别说明
    • 任务:智能抠图
      POST
    • 任务:图片清晰化(无损放大)
      POST
    • 任务:图片添加背景
      POST
    • 任务:去水印-自动
      POST
    • 任务:去水印
      POST
    • 任务:OCR服务
      POST
    • 任务:证件照
      POST
    • 任务:照片上色
      POST
    • 查询:任务结果
      GET
  • 绘画模型(Painting)
    • MidJourney
      • 提交模式与状态码说明
      • 任务:文生图、文图生图 Imagine
      • 任务:换脸 swap_face
      • 任务:绘图变化
      • 任务:绘图变化-simple
      • 任务:执行动作
      • 任务:图生图 Blend
      • 任务:图生文 Describe
      • 任务:局部重绘 Modal
      • 任务:提示词缩短 Shorten
      • 查询:根据ID列表查任务
      • 查询:根据ID查询任务
      • 查询:根据ID获取图片
      • 查询:根据ID获取图片 Seed
      • 上传:上传图片到Discord
    • dalle和gpt-image-1
      • 图像生成 dall-e-2、dall-e-3
      • 图像生成 gpt-image-1
      • 图像编辑 gpt-image-1
      • 图像编辑 DreamO-弃用
    • Grok
      • 图像生成
    • Flux
      • Flux绘画 Dalle格式
      • Flux绘画 Chat格式
    • Ideogram
      • README
      • Generate (文生图)
      • Remix(混合图)
      • Upscale(高清放大)
      • Describe(图生描述)
    • stable-diffusion
      • stable-diffusion (chat格式)
      • stable-diffusion (dalle格式)
    • 即梦AI
      • 即梦3.0生图
      • 即梦AI 生图-旧版
    • 可灵AI
      • README
  • 视频模型(Video)
    • 视频模型说明
    • 快手可灵AI
      • Callback 协议
      • 任务:图像生成
      • 任务:虚拟试穿
      • 任务:文生视频
      • 任务:图生视频
      • 任务:视频延长
      • 任务:视频配音-对口型
      • 任务:视频特效-单图
      • 任务:视频特效-双人互动
      • 查询:任务结果
      • 查询:批量查询
    • vidu视频
      • 模板生视频template参数
      • 任务:模板生视频(推荐)
      • 任务:文生视频
      • 任务:图生视频
      • 任务:参考生视频
      • 任务:首尾帧视频
      • 查询:任务结果
    • 即梦AI
      • 任务:图生视频
      • 任务:文生视频
      • 查询:任务结果
    • pika视频
      • 任务:生成视频
      • 查询:任务结果
    • luma视频
      • 任务:生成视频
      • 任务:拓展视频
      • 查询:单个任务
      • 查询:批量查询任务
      • 获取:无水印视频
    • runway 官方API
      • 任务:生成视频
      • 查询:单个任务
    • runway 旧版API-暂时失效
      • 任务:生成视频.gen2
      • 任务:生成视频.gen3
      • 任务:拓展视频
      • 查询:单个任务
      • 上传:参考图 A认证
      • 上传:参考图 C 获取
    • 数字人
      • 必读指南
      • 任务:生成数字人视频
      • 查询:任务结果
      • 获取:默认voice 列表
  • 音频模型(Audio)
    • Realtime (实时语音对话)
    • 文字转语音TTS
      • 模型 TTS-1
      • 模型 ChatTTS
      • 模型 fish-speech-1.5
      • 模型 fish-speech-1.2-sft
      • 模型 MegaTTS3
      • 模型 Step-Audio-TTS-3B
      • 模型 FunAudioLLM-CosyVoice-300M
    • 语音转文字 whisper
      • 模型 whisper-1
      • 模型 whisper-base
      • 模型 whisper-large
      • 模型 whisper-large-v3
      • 模型 whisper-large-v3-turbo
      • 创建翻译
      • 模型 SenseVoiceSmall
  • 音乐创作(suno)
    • 接口介绍
    • 聊天方式:生成歌曲
    • 任务:生成歌曲
    • 任务:生成歌词
    • 查询:批量查询任务
    • 查询:单个任务
  • 文档处理
    • OCR识别
    • 任务:PDF解析
    • 查询:PDF解析结果
  • 3D模型
    • 任务:图片转3D模型
    • 查询:任务结果
  • 网络爬虫
    • 任务:爬取网页
    • 爬取网页并返回结果
    • 查询:异步任务结果
  • 更多接口开发中...
    • test
  • 查询令牌用量
    GET
  • 查询令牌限额
    GET
  • 查询账户信息
    GET
  1. 图片处理

任务:OCR服务

POST
/task/pic/ocr
注意:请使用formData方式发送请求

请求参数

Authorization
在 Header 添加参数
Authorization
,其值为在 Bearer 之后拼接 Token
示例:
Authorization: Bearer ********************
Body 参数multipart/form-data
image_file
file 
必需
源图像文件(二进制),与 image_url 参数 二选一,支持的格式 pdf, ppt, pptx, xls, xlsx, doc, docx, jpeg, jpg, png, gif, bmp
image_url
string 
必需
源图像URL,与 image_file 参数 二选一,请勿使用非80、443端口地址。支持的格式 pdf, ppt, pptx, xls, xlsx, doc, docx, jpeg, jpg, png, gif, bmp
示例值:
https://p1-kling.klingai.com/bs2/upload-ylab-stunt/332e084d74c59da4056b7600c151d469.png
format
enum<string> 
处理后的输出格式。
可选
枚举值:
txtpdfdocxxlsxpptx
language
enum<string> 
可选
输入文件语言。默认为 ChinesePRC、English和Digits。最多不超过10种语言。
多种语言用逗号分隔,名称区分大小写,比如 English,ChinesePRC,Digits
枚举值:
ChinesePRCEnglishDigits
默认值:
ChinesePRC
password
string 
可选
文件密码。如果输入文件有密码,请在此参数中传入密码,密码最大长度为32位。

示例代码

Shell
JavaScript
Java
Swift
Go
PHP
Python
HTTP
C
C#
Objective-C
Ruby
OCaml
Dart
R
请求示例请求示例
Shell
JavaScript
Java
Swift
curl --location --request POST 'https://api.gpt.ge/task/pic/ocr' \
--form 'image_file=@""' \
--form 'image_url="https://p1-kling.klingai.com/bs2/upload-ylab-stunt/332e084d74c59da4056b7600c151d469.png"' \
--form 'format=""' \
--form 'language=""' \
--form 'password=""'

返回响应

🟢200成功
application/json
Body
data
object 
必需
file
string 
必需
type
integer 
必需
state
integer 
必需
task_id
string 
必需
progress
integer 
必需
ocr_pages
integer 
必需
created_at
integer 
必需
file_pages
integer 
必需
input_size
integer 
必需
output_size
integer 
必需
completed_at
integer 
必需
processed_at
integer 
必需
state_detail
string 
必需
status
integer 
必需
示例
{
    "data": {
        "file": "https://wxtechsz.oss-cn-shenzhen.aliyuncs.com/tasks/output/ocr/a695981c-5c4f-45c4-a931-92bf4f58077f.txt?x-oss-credential=LTAI5tGjJnh66c1txANiRBQN/20250511/cn-shenzhen/oss/aliyun_v4_request&x-oss-date=20250511T085901Z&x-oss-expires=3600&x-oss-signature=e6df504693d80727b3a4ce7c097368045de8dae46edd6b7e78c6124592c70569&x-oss-signature-version=OSS4-HMAC-SHA256",
        "type": 101,
        "state": 1,
        "task_id": "a695981c-5c4f-45c4-a931-92bf4f58077f",
        "progress": 100,
        "ocr_pages": 1,
        "created_at": 1746953927,
        "file_pages": 1,
        "input_size": 116929,
        "output_size": 164,
        "completed_at": 1746953930,
        "processed_at": 1746953927,
        "state_detail": "Complete"
    },
    "status": 200
}
上一页
任务:去水印
下一页
任务:证件照
Built with