GDS TV Clima Pronóstico

¿Por qué se equivoca tanto el autocorrector?

Las personas no necesitamos que nuestro interlocutor termine su frase para saber qué es lo que quiere decir. Nuestro conocimiento de la estructura interna de la lengua nos permite anticipar qué palabra utilizará. Además, el contexto de la situación comunicativa nos da información sobre el contenido y las expresiones que dirá nuestro interlocutor.

IdeasAyerGuillermo SammartinoGuillermo Sammartino
el_androide_libre_89501190_180031564_1706x1280

Hemos quedado a comer en un restaurante con una amiga. Cuando llegan los primeros platos, interrumpe la conversación para decir: “¿Me pasas la…?” mientras mira hacia un lugar concreto de la mesa. Seguramente no necesitemos más palabras ni gestos para entender que se refiere a la sal y se la pasemos.

El autocorrector del teclado del móvil intenta replicar este comportamiento humano a partir de técnicas estadísticas y de procesamiento del lenguaje natural (PLN). Con ello calcula la probabilidad de que una letra, palabra o secuencia aparezca en función de su frecuencia en grandes cantidades de texto utilizadas para entrenar el modelo.

Sobre esa base estadística, el PLN incorpora también el análisis de la estructura y el significado de las palabras, buscando patrones y relaciones entre ellas para generar correcciones más coherentes con el contexto.

¿Por qué, entonces, insiste en sustituir “jobar” por “Jonathan” (si no conozco a ningún Jonathan) o nos hace parecer un tanto excéntricos si afirmamos en un mensaje que hemos presentado una documentación vía “telepática” en lugar de “telemática”?

Combinando reglas y el uso individual

El sistema de procesamiento del lenguaje natural de los autocorrectores que usamos cotidianamente se basa en su diccionario interno, en las reglas sintácticas propias de la lengua y en el historial del usuario. El diccionario interno se construye inicialmente a partir de textos de entrenamiento procedentes de libros, artículos académicos y fuentes en línea, entre otros, que proporcionan un conocimiento general del idioma. A partir de ahí, el sistema combina este aprendizaje previo con reglas lingüísticas predefinidas y con la información que recolecta del historial del usuario. Como resultado, el sistema anticipa la cadena de texto más probable según lo aprendido.

En un principio, estas herramientas aparecieron para asistir a personas con discapacidades físicas, perceptivas o cognitivas en su uso del idioma a través de sistemas informáticos. No obstante, una vez integradas adecuadamente en la interfaz de las aplicaciones, pueden beneficiar a cualquier usuario mejorando la velocidad y el esfuerzo necesario para escribir.

Predecir cómo se escribe no es fácil

La aplicación del teclado del móvil maneja su propio diccionario de palabras y construcciones, en el que pueden no estar contempladas todas las opciones. A partir de la escritura del usuario y de la frecuencia con la que emplea ciertas expresiones, las predicciones se individualizan.

Aun así, sigue siendo un trabajo complejo para el sistema porque no basta con conocer todos los términos posibles. También debe decidir cuál es el más adecuado según el contexto y la intención del usuario. Por ejemplo, el sustantivo “casa” es completamente correcto y aceptado en el habla diaria. Sin embargo, en un proceso oficial o administrativo es más adecuado utilizar “vivienda”.

Por qué las predicciones ‘fallan’

Puede imaginarse el diccionario del dispositivo como una estructura de árbol en la que ante una entrada de un bloque de texto se abren ciertas posibilidades con diversos grados de frecuencia que se va afinando a medida que la persona escribe. Dentro de las predicciones, algunas pueden estar motivadas por una programación específica del sistema, como evitar el uso de palabras malsonantes, y otra por el aprendizaje explícito, en el que el usuario agrega ciertas expresiones al propio diccionario del dispositivo. Por esta razón, el autocorrector no siempre coincide con lo que el usuario espera en cada momento.

Para optimizar el proceso de escritura, las aplicaciones tienen dos formas principales de incluir las sugerencias: ofrecer una lista de opciones en función de la probabilidad o introducir directamente el término en el texto. En el primer caso, el usuario tiene que analizar las alternativas de manera consciente. En el segundo, el discurso se construye de manera más rápida y orgánica, pero la persona debe eliminar activamente la sugerencia si no es la deseada.

Aunque en la mayoría de ocasiones el sistema encuentra la palabra requerida, hasta en un 94 % de las veces tendemos a recordar mucho más vívidamente aquellos momentos en los que comete un error grave. Además, según un estudio, solemos experimentar frustración cuando los mismos fallos se repiten de manera sistemática. Sin embargo, esto es normal: el aprendizaje del autocorrector no es inmediato, sino gradual, y funciona de manera probabilística, combinando lo que ya sabe de grandes textos con la información nueva que recoge del historial del usuario.

A pesar de ello, la mayoría de usuarios, tanto de iOS como de Android, afirma que los autocorrectores integrados en el teclado mejoran su eficiencia escribiendo y ayudan a reducir errores. Además, un uso continuado de las herramientas mejora progresivamente su efectividad al ofrecer una experiencia más personalizada.

La competencia léxica es solo humana

Ahora bien, no hemos de olvidar que el diccionario del autocorrector es un almacén de palabras, cuyo funcionamiento se aleja del lexicón mental del usuario humano. Dicho lexicón se construye a partir del establecimiento de redes entre las diferentes unidades léxicas en función de distintos tipos de relaciones (familias léxicas, campos semánticos, cognados, etc.). El autocorrector, por su parte, cuenta con una gran disponibilidad léxica, pero no domina los aspectos relacionados con la forma, el significado y el uso de cada unidad léxica, es decir, carece de la competencia léxica y comunicativa que poseen los hablantes.

A pesar de estas limitaciones, se están desarrollando propuestas que demuestran que es posible mejorar la corrección contextual, como la de PALABRIA-CM-UC3M, que se centra en el fenómeno lingüístico del impersonal. Mediante técnicas lingüísticas y modelos de inteligencia artificial que aprenden los patrones y contextos de este fenómeno, el sistema puede identificar y corregir errores que un autocorrector convencional no detectaría.

Aunque pueden continuar aprendiendo nuevos patrones y ampliando su conocimiento para ofrecer correcciones cada vez más acertadas, los autocorrectores no dejan de ser modelos matemáticos que operan a partir de patrones y reglas aprendidas, sin alcanzar la comprensión profunda, flexible y contextual que caracteriza al uso humano de la lengua. Nunca serán infalibles. Ni siquiera lo somos nosotros: a menudo, como en el ejemplo del principio, nuestras predicciones pueden resultar erróneas, y le pasamos la sal a alguien que en realidad quería la jarra de agua.The Conversation

Pedro Manuel Moreno-Marcos, Profesor Titular en el Departamento de Ingeniería Telemática de la Universidad Carlos III de Madrid, Universidad Carlos III; Marina Serrano-Marín, Profesora Ayudante Doctor en el Departamento de Humanidades de la Universidad Carlos III de Madrid, Universidad Carlos III; Natalia Centeno Alejandre, Técnico Especialista en Inteligencia Artificial, Universidad Carlos III y Rafael Fernández Castillejos, Técnico Especialista en el Departamento de Humanidades: Filosofía, Lenguaje y Literatura, Universidad Carlos III

Este artículo fue publicado originalmente en The Conversation. Lea el original.

Te puede interesar
shutterstock_2086007896

“Esta es mi vida”: claves psicológicas y riesgos de la sobreexposición en redes sociales

The Conversation
Ideas10 de septiembre de 2025

“Hoy me han despedido y no sé qué hacer con mi vida”. “Acabo de salir de terapia y me siento rota”. “Aquí están las cosas que me da vergüenza admitir”. Frases como estas, acompañadas de vídeos llorando en TikTok o Instagram o hilos interminables en X, se han convertido en fenómenos virales. Lo que antes se reservaba a la intimidad de un diario personal o una charla con un amigo, hoy se expone ante millones de personas.

Violencia-portada

Los adolescentes viven inmersos en violencia digital: ¿cómo les afecta?

The Conversation
Ideas31 de agosto de 2025

La percepción de la violencia machista como un problema social está disminuyendo entre los jóvenes: mientras que en 2019 el 82,5 % consideraba que era una cuestión de gran relevancia, en 2023 esta cifra se redujo al 65 %. ¿A qué puede deberse esta bajada tan significativa?

9e92d7ae3b73f320c7ca3c3b23a35c42

Corazón Azul Blanco: una iniciativa agrícola para mejorar la calidad de los alimentos

RFI Por Ivonne Sánchez
Ideas09 de julio de 2025

Corazón Azul Blanco es una iniciativa de prácticas agrícolas para alimentar de manera más sana a los animales y por ende, a los humanos. No hace mucho, Colombia se sumó a este movimiento internacional que nació en Francia hace 25 años. Un estudio clínico demostró que la leche materna tenía un mayor porcentaje de Omega 3 en las mujeres embarazadas que consumieron estos productos, así como una microbiota más diversa en los intestinos de los bebés.

Lo más visto
17056758513079

¿Por qué han callado históricamente los países árabes sobre Gaza y siguen sin darle apoyo?

Guillermo Sammartino
AnálisisEl viernes

Durante tres días, los ministros de Exteriores y jefes de Estado debatieron una respuesta coordinada. El resultado fue una declaración conjunta que condena el bombardeo, acusa a Israel de genocidio, limpieza étnica y uso del hambre como arma de guerra y alerta sobre la expansión de asentamientos en Cisjordania. El texto también reafirma la necesidad de una “seguridad compartida” en la región.

el_androide_libre_89501190_180031564_1706x1280

¿Por qué se equivoca tanto el autocorrector?

Guillermo Sammartino
IdeasAyer

Las personas no necesitamos que nuestro interlocutor termine su frase para saber qué es lo que quiere decir. Nuestro conocimiento de la estructura interna de la lengua nos permite anticipar qué palabra utilizará. Además, el contexto de la situación comunicativa nos da información sobre el contenido y las expresiones que dirá nuestro interlocutor.