La Universidad de Vigo busca voces para que Siri y Alexa hablen en gallego

Laura Docío, Abel Caballero, Mónica Valderrama y Lorenzo Rodríguez, ayer en la presentación.
photo_camera Laura Docío, Abel Caballero, Mónica Valderrama y Lorenzo Rodríguez, ayer en la presentación.
La institución viguesa presentó el proyecto ‘FalAI’, para el que necesita recopilar hasta 60.000 frases para desarrollar un asistente conversacional que funcione en este idioma

En un mundo en el que la interacción por voz con la tecnología es algo cada vez más cotidiano –como, por ejemplo, el contestador ‘robótico’ de los centros de salud–, los hablantes de las lenguas minoritarias y minorizadas como el gallego no cuentan con herramientas que funcionen a este nivel, pues para ello es necesario una gran base de datos de grabaciones de voces que permitan entrenar a los algoritmos de inteligencia artificial (IA) que permiten que un ‘software’ hable y entienda un idioma.  Es por eso que la Universidad de Vigo presentó ayer el proyecto ‘FalAI’, una iniciativa que busca recopilar miles de voces para, finalmente, desarrollar un asistente conversacional –esto es, una herramienta como Siri o Alexa– en gallego.

 

 

Se trata de una colaboración del grupo de investigación atlanTTic con la empresa Balidea, experta en tecnologías del habla. En el acto de presentación, celebrado en el edificio Redeiras,  estuvieron presentes el alcalde Abel Caballero, la vicerrectora de Comunicación y Relaciones Institucionales Mónica Valderrama, la investigadora Laura Docío y el director de Balidea Lorenzo Rodríguez. Valderrama señaló que proyectos como ‘FalAI’ son un “orgullo” para la universidad al demostrar el valor de la colaboración público-privada y el compromiso de la UVigo con la lengua gallega, una de las líneas maestras del gobierno del actual equipo rectoral.

 

 

Por su parte, Lorenzo Rodríguez destacó que “no hay tecnología que hable en gallego”, por lo que ‘FalAI’ es un “hito importante” en  el sector de las telecomunicaciones. En la misma dirección apuntó Caballero, quien destacó que es importante que “en el diálogo con las máquinas nos respondan en nuestra lengua”. 

Así, todos animan a que el mayor número de gente posible colabore a desarrollar este asistente conversacional, el primero que hable y entienda gallego.

Treinta frases de cuatro segundos para colaborar

Para entrenar a los algoritmos de este futuro asistente conversacional en gallego será necesaria la colaboración de, al menos, unas 6.000 personas. Así lo indicó Laura Docío, investigadora principal del proyecto. Cualquiera puede participar en la página web falai.balidea.com, donde se concretan los pasos para grabar 30 frases de unos tres o cuatro segundos cada una. La docente de la UVigo destacó que este tipo de asistentes conversacionales por voz son cada vez más comunes y el reto de este mismo reside en los pocos datos de los que se dispone a la hora de desarrollar algo así en gallego. 

Precisamente en este tema hizo hincapié Docío, pues para que esta herramienta sea útil necesitará tener registrados diferentes variantes dialectales para poder entender a cualquier usuarios. Es por eso que indicó que, además de muchas grabaciones, es necesario que sean diversas.

Esta novedosa herramienta podría estar lista en un año

Durante la presentación de ‘FalAI’, la investigadora principal del proyecto explicó que, si se consiguen los 6.000 participantes deseados a través de la web falai.balidea.com, el primer asistente conversacional en gallego podría estar listo “en cuestión de un año”. 

Eso sí, se trataría de un primer prototipo enfocado a tareas cotidianas y, sobre todo, en el ámbito de la sanidad (por ejemplo, pedir una cita para el médico o describir síntomas a una máquina). Ese es el primer objetivo de este proyecto, financiado con 22.500 euros dentro del programa europeo ‘European Language Equality’ y enmarcado dentro del desarrollo de la tesis doctoral de Andrés Piñeiro, que encabeza, junto a Laura Docío, Carmen García Mateo y el personal de Balidea, el equipo de investigación que se ocupará de desarrollar esta novedosa herramienta.

De este modo, las frases disponibles para grabar en la web están pensadas para esta primera etapa de desarrollo, que se podrá ampliar con el paso del tiempo para hacer un asistente más completo. 

Otro de los objetivos de este programa es hacer un estudio que sirva de guía en el diseño y puesta en marcha de agentes conversacionales por voz en lenguas minoritarias con pocos recursos como el croata, el checo, el danés o el búlgaro.

Te puede interesar