El enfoque de InterMIND para las videollamadas multilingües

Videollamada multilingüe en tiempo real

La mayoría de las herramientas de traducción se crearon para textos en los que se puede esperar. Sale un documento, vuelve una traducción, alguien la revisa. Una conversación en vivo no funciona así. Nadie en una reunión va a pausar, enviar una oración para que sea traducida y esperar a que regrese antes de responder. La traducción tiene que ocurrir dentro de la conversación o no es parte de ella en absoluto.

Esa limitación cambia lo que se puede construir. Esta publicación trata sobre cómo InterMIND concibe las videollamadas multilingües, y sobre ser honestos respecto a dónde la tecnología aún es incipiente.

El problema con las soluciones habituales

Los enfoques comunes siempre tienen alguna deficiencia.

Subtítulos sobre una llamada en un idioma extranjero. Sigues escuchando a la otra persona hablar un idioma que no entiendes, y lees una transcripción en tiempo real debajo. Funciona, pero divide tu atención. Estás viendo texto desplazarse mientras intentas leer un rostro, y rara vez coinciden. Se parece más a cine subtitulado que a una conversación.

Traducción palabra por palabra. Traducir cada frase literalmente es la versión fácil y la que más se pierde. El significado en una conversación real reside en el tono, en lo que alguien intenta lograr con una frase, en los términos específicos que utiliza un campo. Una reproducción literal de las palabras puede ser técnicamente correcta y aún así perder el punto que se intenta transmitir, lo cual en una negociación o una discusión clínica es precisamente la parte que no se puede permitir perder.

Plugins añadidos a una plataforma existente. Añadir una capa de traducción sobre un sistema de llamadas construido para un idioma a la vez significa vivir con lo que ese sistema ya haya decidido sobre el audio, la sincronización y el enrutamiento. Obtienes lo que las uniones permiten.

Una experiencia en un solo idioma

El objetivo hacia el que trabajamos es simple de enunciar: todos hablan su propio idioma y escuchan a los demás en el suyo, y debería sentirse como una llamada donde todos comparten el mismo idioma.

Eso es diferente de los subtítulos. Los subtítulos te mantienen consciente, en cada momento, de que se está produciendo una traducción. El objetivo aquí es lo contrario. En lugar de superponer texto a una conversación en un idioma extranjero, InterMIND intenta que todo el intercambio llegue en tu idioma, para que tu atención se mantenga en la persona y en la discusión en lugar de en la maquinaria intermedia.

Llegar a eso significa tratar la fidelidad a la intención como más importante que la fidelidad a las palabras individuales. El sistema intenta transmitir el tono, la intención y la terminología del dominio, no intercambiar palabras una por una. A veces, la traducción más precisa de una oración no es la más literal, y una conversación en vivo es donde esa distinción importa más.

Por qué una plataforma independiente, y su coste

InterMIND es su propio sistema de video, no un complemento de Teams o Zoom. Es una contrapartida real, y vale la pena exponer ambos lados claramente.

El coste es la integración. Si tu organización reside dentro de una herramienta de reuniones existente, una plataforma separada es un lugar separado para estar, y esa fricción es real. No vamos a pretender que no lo sea.

La razón por la que aceptamos ese coste es el control sobre todo el camino desde el habla hasta el sonido. Cuando eres propietario de la captura, transcripción, traducción y reproducción de principio a fin, puedes ajustar cómo se entregan entre sí. La calidad de la traducción en una llamada en vivo depende en gran medida de cómo encajan esas etapas: cómo se sincroniza el audio, cómo la cadena de procesamiento decide cuándo una idea es lo suficientemente completa como para traducirla. Ser propietario de ese camino es lo que hace que la experiencia de un solo idioma se sienta como una sola cosa en lugar de varias herramientas pegadas con cinta adhesiva.

Dónde se encuentra realmente la tecnología

InterMIND es nuevo, y preferimos decirlo así que adornarlo.

La traducción de voz en tiempo real es realmente difícil, y la calidad no es uniforme. Depende del par de idiomas —algunos tienen muchos más recursos que otros— y del tema, ya que un modelo general maneja las conversaciones triviales de manera más fiable que la terminología legal o médica densa. Los puntos de referencia independientes para este tipo de traducción multilingüe en vivo aún son escasos, por lo que todavía no hay un gran cuerpo de evidencia externa a la que recurrir.

Por ello, preferimos ofrecerte una forma de verificarlo antes que un número en el que confiar. Si quieres evaluar cualquier producto de traducción en tiempo real, incluido el nuestro, el camino honesto es probarlo en tus propias conversaciones, en tus propios idiomas, según tus propias condiciones. Escribimos más sobre cómo se debe medir realmente la precisión de la traducción — la versión corta es que una cifra de precisión titular dice muy poco hasta que sabes qué se midió y cómo.

Trae tus propios pares de idiomas y tu propia materia. Una demostración con un par fácil sobre conversaciones triviales generales no te dice casi nada sobre cómo una herramienta maneja tus reuniones reales. Prueba el caso que te importa.

Dónde esto importa más

Las llamadas multilingües en tiempo real son más valiosas donde la barrera del idioma tiene mayor peso.

Negociaciones internacionales, donde el coste de malinterpretar la intención es alto y esperar a los intérpretes ralentiza todo.
Equipos distribuidos que trabajan en diferentes idiomas cada día y pierden algo al recurrir a un segundo idioma compartido que nadie habla de forma nativa.
Campos regulados — legal, médico, financiero — donde la terminología exacta importa y donde poder revisar lo que se dijo y cómo se tradujo es parte del trabajo.

Esos son los entornos donde una experiencia en un solo idioma demuestra su valía, y donde acertar con la intención, no solo con las palabras, es el objetivo principal.

Nuestra posición

InterMIND es una apuesta a que las conversaciones en vivo entre idiomas merecen algo mejor que subtítulos o intercambio literal de palabras, y que la forma de lograrlo es controlar todo el proceso en lugar de acoplarse al de otro. Creemos que es la apuesta correcta. También creemos que lo honesto con un producto joven es decirte dónde es fuerte, dónde aún no está probado y cómo puedes comprobarlo por ti mismo, y dejar que los resultados, en tus idiomas y en tus reuniones, hablen por sí mismos.