Una publicación de blog de Patrick McCanna despegó hoy en Hacker News, con 318 puntos y más de 220 comentarios al momento de escribir este artículo. El título lo dice todo: el texto que ves en la ventana de Extended Thinking de Claude Code no es auténtico.

¿Qué significa esto en la práctica? Cuando Claude Code trabaja en modo «Extended Thinking» y lo ves «pensar» —esa ventana de texto desplazable con razonamientos y autocrítica—, no es una transmisión directa del proceso real del modelo. Anthropic ha confirmado que, para los modelos Claude 4, el pensamiento real está cifrado y almacenado en un campo signature al que no tienes acceso. Lo que ves es, en cambio, una versión resumida que el modelo genera posteriormente.

No ves lo que Claude piensa. Ves lo que Claude elige decirte que pensó.

Esto no es exactamente una arquitectura nueva; ha estado en la documentación de Anthropic durante un tiempo. Pero McCanna señala algo importante: la gente cree que obtiene transparencia, cuando en realidad recibe una versión de presentación. Hay una enorme diferencia, especialmente para los desarrolladores que lo usan para depurar o para entender por qué el modelo tomó una decisión específica.

En HN, las reacciones están divididas. Algunos creen que Anthropic es lo suficientemente claro en su documentación y que esto es un problema de expectativas del usuario, no un problema de engaño. Otros están genuinamente irritados: han pagado y construido flujos de trabajo en torno a la creencia de que realmente ven el «interior» del modelo. Un tercer grupo señala que esto es un problema de la industria: OpenAI, Google y otros hacen lo mismo, pero lo comercializan de manera igualmente vaga.

Claude simula pensar, pero no te muestra el pensamiento real - Bilde 1

Lo que hace esto especialmente interesante ahora mismo es el momento. Anthropic acaba de lanzar la familia Claude 4 y el nuevo sistema de pensamiento adaptativo con parámetros de effort. Cuanto más avanzado y opaco se vuelve el backend, más importante es que lo que los usuarios ven se corresponda realmente con lo que sucede bajo el capó.

Desde la perspectiva underground: esto no es un escándalo, pero es una señal temprana de una creciente fricción entre la marca de «somos transparentes» de las empresas de IA y lo que la transparencia realmente requiere técnicamente. Es de esperar que esta discusión resurja cada vez que se lance la próxima generación de modelos.

Nota: esto se basa en el análisis de la comunidad y una publicación de blog, no en investigación verificada de forma independiente. Pero con 318 puntos en HN, la señal es lo suficientemente fuerte como para prestarle atención.