Periodismo

Herramientas de Inteligencia Artificial para pasar audio a texto

Los más recientes avances en inteligencia artificial están consiguiendo convertir en una tarea que se realiza de manera automática y prácticamente sin intervención humana lo que hasta ahora suponía una tediosa tarea: transcribir charlas, conferencias o entrevistas a texto.

Algunas herramientas de transcripción de texto pueden funcionar en cualquier idioma y en tiempo real gracias a la inteligencia artificial

Grabaciones de voz de gran longitud y complejidad quedan reducidas a tareas sencillas con la concurrencia de distintas herramientas que en algunos casos son incluso capaces de identificar de manera automática el idioma e incluso transcribir conversaciones en tiempo real.

Estas son algunas de las herramientas más efectivas, desarrolladas por algunas de las más importantes y bien conocidas empresas del sector tecnológico:

-Amazon Transcribe: Su destinatario principal son las empresas y está especializada en la transcripción en tiempo real de llamadas y conversaciones, siendo capaz de generar subtítulos, identificando de manera automática el idioma. De manera gratuita transcribe únicamente 60 minutos de audio al mes, disponiendo de distintas tarifas en función de la cantidad de minutos mensuales de conversación que se desee transcribir.

-Google Speech-to-Text: Además de ofrecer transcripciones desde audio a texto también cumple la función de control de voz y es capaz de ofrecer respuestas interactivas para plataformas de atención al cliente. Las transcripciones quedan almacenadas en Google Cloud. Los primeros 60 minutos de transcripción son gratuitos.

-IBM Watson Speech to Text: Es una de las herramientas más veteranas y fue desarrollada para generar archivos de texto a partir de grabaciones de audio de voz hablada de manera natural. Está específicamente dirigida a empresas de atención al cliente y también cuenta con funciones de asistente virtual. Ofrece 500 minutos gratis mensuales de transcripción.

-Microsoft Azure Speech to Text: Maneja más de 100 idiomas y permite agregar nuevas palabras al vocabulario de manera que puedan ser reconocidas en futuras transcripciones.

-Nuance Communications: Es una de las empresas pioneras en el reconocimiento de voz y en el procesamiento del lenguaje natural, siendo la desarrolladora de Siri, el asistente inteligente de Apple o Dragon Profesional, software de dictado para documentos clínicos. Este software tiene un precio cercano a los 500 euros.

Antonio Rentero

Comunicador especializado en tecnología y cine. Jurista especializado en protección de datos. Curioso especializado en prácticamente todo.

Fuente;https://www.trecebits.com/

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *