无需自建上传、处理和轮询管线,就能处理视频和音频文件。
curl
POST /v1/tasks
curl -X "POST" "https://api.videototext.dev/v1/tasks" \
-H "Authorization: Bearer $VTT_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"assetId": "asset_9m2k8r",
"language": "Auto",
"timestampMode": "CHUNK",
"transcriptionMode": "balanced"
}'
为产品团队而设计
Video To Text API
用生产可用的转录 API,为你的产品接入视频、音频、时间戳和可搜索文字稿能力。
它是什么
面向现代应用的语音转文字基础设施
Video To Text API 将录音、会议、访谈、课程和媒体库转换成清晰文字稿,让你的产品可以搜索、总结、生成字幕和自动化处理。
获取全文、带时间戳的分段、逐词时间、源文件信息、任务状态和计费字段。
日常任务使用 balanced,对质量更敏感的内容切换到 precision。
功能介绍
把转录能力稳定接入真实产品流程
适合需要在 SaaS 产品中提供录音整理、内容检索、字幕和智能分析能力的团队。
大文件上传
通过签名地址上传媒体文件,避免文件经过你的应用服务器中转。
可靠任务创建
依靠明确任务状态和可选重试保障,构建稳定的转录处理流程。
时间戳文字稿
基于分段和逐词时间数据,构建字幕、搜索、剪辑、审核和编辑工具。
清晰模式控制
选择 balanced 兼顾速度和成本,或选择 precision 优先保证转录质量。
使用场景
让语音内容进入你的产品体验
帮助用户更快查找、复盘、编辑和再利用录制内容。
会议智能
将会议和通话录音转换为可搜索纪要、摘要、行动项和客户洞察。
媒体内容处理
为播客、直播回放、访谈、课程和长视频生成可编辑文字稿。
字幕和剪辑工具
用时间戳能力支撑字幕生成、片段选择、审核流程和时间线编辑。
开始接入