Este repositorio contiene la aplicación de Speech to Text desarrollada en FastAPI con el modelo Whisper. La aplicación convierte el habla en texto utilizando técnicas de procesamiento de voz.
- Construye la imagen de Docker ejecutando el siguiente comando:
docker build -t tolsc-s2t
- Inicia el contenedor de Docker con la imagen creada:
docker run -dp8000:8000 tolsc-s2t
- Realiza las peticiones a través de la API utilizando multipart/formdata con método POST con la llave "audio_file" de la siguiente manera:
http://your.deploy.ip:8000/speech-to-text
También puedes realizar la petición utilizando el siguiente comando de cURL:
curl -X POST -F "[email protected]" http://your.deploy.ip:8000/speech-to-text
Ten en cuenta que la API solo acepta archivos de audio en formato .m4a
.
- Santiago Fernández ([email protected])
- Fabian Olarte ([email protected])
- Mateo Rosero ([email protected])
- Andrés Vásquez ([email protected])