Ir al contenido
curl POST /v1/tasks
curl -X "POST" "https://api.videototext.dev/v1/tasks" \
  -H "Authorization: Bearer $VTT_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "assetId": "asset_9m2k8r",
    "language": "Auto",
    "timestampMode": "CHUNK",
    "transcriptionMode": "balanced"
  }'
Anade transcripcion rapida y precisa a tu producto con una API lista para produccion para video, audio, marcas de tiempo y texto buscable.
Que es

Infraestructura de voz a texto para apps modernas

Video To Text API convierte grabaciones, reuniones, entrevistas, clases y bibliotecas multimedia en texto limpio que tu producto puede buscar, resumir, subtitular y automatizar.

Transcribe multimedia a escala

Procesa archivos de video y audio sin crear tu propia canalizacion de carga, procesamiento y polling.

Devuelve datos listos para producto

Obtén texto completo, fragmentos con marcas de tiempo, tiempos por palabra, metadatos de origen, estado de tarea y campos de facturacion.

Elige velocidad o precision

Usa balanced para cargas de trabajo habituales o cambia a precision para contenido sensible a la calidad.

Funciones

Todo lo necesario para lanzar flujos de transcripcion

Disenada para equipos SaaS que necesitan transcripcion fiable dentro de flujos reales de producto.

Cargas de archivos grandes

Sube multimedia mediante URLs firmadas para que los archivos no tengan que pasar por el servidor de tu aplicacion.

Creacion fiable de tareas

Usa estados de tarea predecibles y protecciones opcionales para reintentos al crear colas de transcripcion resilientes.

Transcripciones con marcas de tiempo

Crea subtitulos, busqueda, editores, clips y herramientas de revision a partir de tiempos por fragmento y por palabra.

Controles claros de modo

Elige balanced para velocidad y coste, o precision cuando la calidad de la transcripcion sea lo mas importante.

Casos de uso

Haz que el contenido hablado sea util en todo tu producto

Da a tus usuarios formas mas rapidas de encontrar, revisar, editar y reutilizar voz grabada.

Inteligencia de reuniones

Convierte llamadas y grabaciones en notas buscables, resumenes, acciones pendientes e insights de clientes.

Operaciones multimedia

Genera transcripciones para podcasts, webinars, entrevistas, contenido educativo y videos largos.

Herramientas de subtitulado y edicion

Usa marcas de tiempo como base para subtitulos, seleccion de clips, flujos de revision y editores de linea de tiempo.

Listo para crear

Empieza con una carga y una tarea de transcripcion.