LA LINGÜÍSTICA, CIENCIA INDISPENSABLE PARA EL
DESARROLLO TECNOLÓGICO
Detrás del desarrollo de la inteligencia artificial,
robots, celulares, asistentes de voz y más, hay un trabajo multidisciplinario.
Seguramente las primeras disciplinas que se te vienen a la mente al hablar del
desarrollo de esta tecnología son la robótica, mecatrónica, programación, por
mencionar algunas. Sin embargo, qué hay de otras disciplinas como la
psicología, la filosofía, y de la que hablaremos en este artículo; la
lingüística.
Cuando interactúas con algún dispositivo normalmente
lo haces por voz o por texto, ¿cierto?, y la facilidad con la que lo haces es
gracias al desarrollo que se ha hecho en algo que los lingüistas llamamos
lingüística computacional.
Que entre otras muchas cosas es una herramienta
fundamental en el desarrollo de la tecnología.
Lo que nos hace especiales a los seres humanos
Todas las especies animales tienen una manera de comunicarse, pero
solo los seres humanos tenemos algo que se llama el lenguaje natural.
Entre otras características que lo hace único, nuestras lenguas
(idiomas) están formadas por 5 niveles:
La fonética: el estudio del sonido.
La morfología: el estudio de la estructura interna de las palabras.
La sintaxis: el estudio de la relación palabra-frase.
La semántica: el estudio del significado.
La pragmática: el estudio de las expresiones lingüísticas y su relación con el
mundo exterior.
Ninguna otra especie posee en su lenguaje estas características,
pero si hay algo que hoy en día se le puede acercar.
El Procesamiento del Lenguaje Natural (NPL/PLN) o Lingüística
Computacional como le llamamos los lingüistas, es la rama encargada de
implementar estos niveles en las computadoras (por englobar a las máquinas o
inteligencias que procesan nuestro lenguaje).
¿Qué hay de complejo en el hablar?
Si bien las máquinas e inteligencias artificiales “dominan” partes
de los 5 niveles de un lenguaje natural, aún sigue existiendo una gran brecha
entre esto y un lenguaje artificial.
Por cada nivel de los mencionados arriba, el PLN puede enfrentar
muchos retos en los que aún queda un largo camino por recorrer. Y tal vez te
preguntes, ¿qué tipo de problemas?
Pues para nosotros el comunicarnos es tan necesario y natural como
el respirar; pero justamente en ello recae su complejidad.
¿Te ha pasado que le pides a tu dispositivo que te busque alguna
información y te entienda mil cosas diferentes a lo que necesitas? A mí me ha
pasado muchas veces, la última fue cuando le pedí a mi Alexa que me buscara
“casas a la venta” y ella me respondió con lugares para comprar “gasas”; nada
que ver, ¿cierto?
Bueno, esto también puede pasarnos a los humanos, pero lo que para
mí dispositivo representa 5 fonemas (cuatro sonidos g.a.s.a.s).
Para cualquier persona representa 5 fonemas más una representación
gráfica mental que nos permite diferenciar y corregir la información que
escuchamos mal y deducir el mensaje correctamente.
Algunos problemas
Otro problema muy común, es la diferenciación de fonemas de con
diferentes realizaciones acústicas de una misma lengua. Un asistente de voz
podría diferenciar muy bien el sonido estándar “ch” del español, pero resulta
que para lo que un hablante de la ciudad de Lima es “chancla” para un hablante
de la selva podría ser “shancla”.
Parecería un problema muy mínimo, pero esto es un solo fonema
comparado en dos variantes del español de Perú; pero si lo multiplicamos por la
cantidad de países en las que se habla el español y cuantas variedades hay en
cada uno de ellos, el reto es realmente abrumador.
Ahora, piensa en esto: para una persona resulta fácil entender esta
oración, “Vi a mi primo caminando en el coche”, es obvio que quien iba en el
coche fue quien vio a su primo, más no que el primo iba caminando en el auto.
Sin embargo, para un lenguaje artificial identificar estas
ambigüedades resulta aún más complicado por más frecuencias que se les enseñe a
estos.
Además, esto sin contar que el léxico de una lengua está formado
por un número infinito de palabras y de significados; por ejemplo, la palabra
“gato” puede tener al menos tres significados distintos, y aunque parezca
sencilla la solución de programar al lenguaje con un diccionario donde estén
contenidas estos significados.
¿Dónde queda aquel léxico que no está registrado en los corpus?
Podríamos seguir enlistando un sinfín de problemas a los que se
enfrenta esta área que es tan crucial para el desarrollo de la Inteligencia
Artificial, pero sin duda no nos alcanzarían los artículos. Pero podemos
despedirnos con una reflexión.
El conocimiento y el lenguaje son entes vivos debido a que los
seres humanos somos seres en constante cambio y movimiento; nos adaptamos fácil
a ello porque somos el agente de estos cambios y los experimentamos en tiempo
real.
Día con día aprendemos de infinidad de información que se codifica
en el lenguaje, ¿cómo hará la inteligencia artificial para simular esto?
Seguramente quedan muchas dudas aún y a la vez los expertos en el
tema trabajan para resolverlas, sin embargo, queda claro que la capacidad de
abstracción humana del lenguaje es sumamente compleja y muy difícil de imitar.
Oly Alcántara de
la Cruz
No hay comentarios:
Publicar un comentario
Nota: solo los miembros de este blog pueden publicar comentarios.