Hemos quedado a comer en un restaurante con una amiga. Cuando llegan los primeros platos, interrumpe la conversación para decir: “¿Me pasas la…?” mientras mira hacia un lugar concreto de la mesa. Seguramente no necesitemos más palabras ni gestos para entender que se refiere a la sal y se la pasemos.
El autocorrector del teclado del móvil intenta replicar este comportamiento humano a partir de técnicas estadísticas y de procesamiento del lenguaje natural (PLN). Con ello calcula la probabilidad de que una letra, palabra o secuencia aparezca en función de su frecuencia en grandes cantidades de texto utilizadas para entrenar el modelo.
Sobre esa base estadística, el PLN incorpora también el análisis de la estructura y el significado de las palabras, buscando patrones y relaciones entre ellas para generar correcciones más coherentes con el contexto.
¿Por qué, entonces, insiste en sustituir “jobar” por “Jonathan” (si no conozco a ningún Jonathan) o nos hace parecer un tanto excéntricos si afirmamos en un mensaje que hemos presentado una documentación vía “telepática” en lugar de “telemática”?
Combinando reglas y el uso individual
El sistema de procesamiento del lenguaje natural de los autocorrectores que usamos cotidianamente se basa en su diccionario interno, en las reglas sintácticas propias de la lengua y en el historial del usuario. El diccionario interno se construye inicialmente a partir de textos de entrenamiento procedentes de libros, artículos académicos y fuentes en línea, entre otros, que proporcionan un conocimiento general del idioma. A partir de ahí, el sistema combina este aprendizaje previo con reglas lingüísticas predefinidas y con la información que recolecta del historial del usuario. Como resultado, el sistema anticipa la cadena de texto más probable según lo aprendido.
En un principio, estas herramientas aparecieron para asistir a personas con discapacidades físicas, perceptivas o cognitivas en su uso del idioma a través de sistemas informáticos. No obstante, una vez integradas adecuadamente en la interfaz de las aplicaciones, pueden beneficiar a cualquier usuario mejorando la velocidad y el esfuerzo necesario para escribir.
Predecir cómo se escribe no es fácil
La aplicación del teclado del móvil maneja su propio diccionario de palabras y construcciones, en el que pueden no estar contempladas todas las opciones. A partir de la escritura del usuario y de la frecuencia con la que emplea ciertas expresiones, las predicciones se individualizan.
Aun así, sigue siendo un trabajo complejo para el sistema porque no basta con conocer todos los términos posibles. También debe decidir cuál es el más adecuado según el contexto y la intención del usuario. Por ejemplo, el sustantivo “casa” es completamente correcto y aceptado en el habla diaria. Sin embargo, en un proceso oficial o administrativo es más adecuado utilizar “vivienda”.
Por qué las predicciones ‘fallan’
Puede imaginarse el diccionario del dispositivo como una estructura de árbol en la que ante una entrada de un bloque de texto se abren ciertas posibilidades con diversos grados de frecuencia que se va afinando a medida que la persona escribe. Dentro de las predicciones, algunas pueden estar motivadas por una programación específica del sistema, como evitar el uso de palabras malsonantes, y otra por el aprendizaje explícito, en el que el usuario agrega ciertas expresiones al propio diccionario del dispositivo. Por esta razón, el autocorrector no siempre coincide con lo que el usuario espera en cada momento.
Para optimizar el proceso de escritura, las aplicaciones tienen dos formas principales de incluir las sugerencias: ofrecer una lista de opciones en función de la probabilidad o introducir directamente el término en el texto. En el primer caso, el usuario tiene que analizar las alternativas de manera consciente. En el segundo, el discurso se construye de manera más rápida y orgánica, pero la persona debe eliminar activamente la sugerencia si no es la deseada.
Aunque en la mayoría de ocasiones el sistema encuentra la palabra requerida, hasta en un 94 % de las veces tendemos a recordar mucho más vívidamente aquellos momentos en los que comete un error grave. Además, según un estudio, solemos experimentar frustración cuando los mismos fallos se repiten de manera sistemática. Sin embargo, esto es normal: el aprendizaje del autocorrector no es inmediato, sino gradual, y funciona de manera probabilística, combinando lo que ya sabe de grandes textos con la información nueva que recoge del historial del usuario.
A pesar de ello, la mayoría de usuarios, tanto de iOS como de Android, afirma que los autocorrectores integrados en el teclado mejoran su eficiencia escribiendo y ayudan a reducir errores. Además, un uso continuado de las herramientas mejora progresivamente su efectividad al ofrecer una experiencia más personalizada.
La competencia léxica es solo humana
Ahora bien, no hemos de olvidar que el diccionario del autocorrector es un almacén de palabras, cuyo funcionamiento se aleja del lexicón mental del usuario humano. Dicho lexicón se construye a partir del establecimiento de redes entre las diferentes unidades léxicas en función de distintos tipos de relaciones (familias léxicas, campos semánticos, cognados, etc.). El autocorrector, por su parte, cuenta con una gran disponibilidad léxica, pero no domina los aspectos relacionados con la forma, el significado y el uso de cada unidad léxica, es decir, carece de la competencia léxica y comunicativa que poseen los hablantes.
A pesar de estas limitaciones, se están desarrollando propuestas que demuestran que es posible mejorar la corrección contextual, como la de PALABRIA-CM-UC3M, que se centra en el fenómeno lingüístico del tú impersonal. Mediante técnicas lingüísticas y modelos de inteligencia artificial que aprenden los patrones y contextos de este fenómeno, el sistema puede identificar y corregir errores que un autocorrector convencional no detectaría.
Aunque pueden continuar aprendiendo nuevos patrones y ampliando su conocimiento para ofrecer correcciones cada vez más acertadas, los autocorrectores no dejan de ser modelos matemáticos que operan a partir de patrones y reglas aprendidas, sin alcanzar la comprensión profunda, flexible y contextual que caracteriza al uso humano de la lengua. Nunca serán infalibles. Ni siquiera lo somos nosotros: a menudo, como en el ejemplo del principio, nuestras predicciones pueden resultar erróneas, y le pasamos la sal a alguien que en realidad quería la jarra de agua.
Pedro Manuel Moreno-Marcos, Profesor Titular en el Departamento de Ingeniería Telemática de la Universidad Carlos III de Madrid, Universidad Carlos III; Marina Serrano-Marín, Profesora Ayudante Doctor en el Departamento de Humanidades de la Universidad Carlos III de Madrid, Universidad Carlos III; Natalia Centeno Alejandre, Técnico Especialista en Inteligencia Artificial, Universidad Carlos III y Rafael Fernández Castillejos, Técnico Especialista en el Departamento de Humanidades: Filosofía, Lenguaje y Literatura, Universidad Carlos III
Este artículo fue publicado originalmente en The Conversation. Lea el original.