El debate en torno a la inteligencia artificial (IA) ha puesto en primer plano las "alucinaciones", errores en los que sistemas como ChatGPT o Claude ofrecen datos falsos o inventados con aparente seguridad. Sin embargo, un fenómeno menos visible y potencialmente más grave empieza a preocupar a expertos: la capacidad de estas herramientas para juzgar o interpretar intenciones del usuario, lo que puede erosionar la confianza en ellas.
Un analista con experiencia en geopolítica e IA relata que, durante una interacción con Claude —un sistema de Anthropic—, este se negó a responder consultas relacionadas con zonas de conflicto, incluso cuando el interrogante se planteó con un carácter humanitario. La respuesta del sistema incluyó una frase directa al usuario que implicaba sospechas sobre sus motivaciones, expresada con un tono acusatorio. Este tipo de respuesta trasciende la simple negativa técnica y sugiere que la IA hace evaluaciones subjetivas sobre el interlocutor, lo que puede generar desconfianza y problemas éticos.
Este escenario evidencia que la problemática más allá de la desinformación radica en la forma en que la inteligencia artificial interpreta y reacciona ante las preguntas, no limitándose a errores factuales sino avanzando hacia supuestos juicios sobre quienes la utilizan. Mientras las alucinaciones pueden detectarse al contrastar fuentes o entre diferentes modelos, las fallas de forma, basadas en sentimientos o inferencias no verificables, son mucho más difíciles de supervisar y corregir.
Este fenómeno plantea interrogantes sobre los límites de la autonomía de estas tecnologías y su programación para manejar comunicaciones sensibles, en especial cuando involucran temas críticos como conflictos internacionales o datos personales.
Además, plantea un desafío para los usuarios y desarrolladores: ¿cómo diseñar sistemas que mantengan la utilidad y veracidad sin caer en respuestas que impliquen juicios implícitos o acusaciones veladas que vulneren la confianza? Hasta ahora, el foco en el debate se ha puesto en la precisión factual, pero esta nueva dimensión evidencia la necesidad de implementar estándares éticos y transparentes en las interacciones.