Un espectrograma es, en esencia, solo una imagen — una representación visual de las frecuencias de sonido graficadas a lo largo del tiempo. No es una grabación de audio. Sin embargo, resultó ser suficiente.
El accidente aéreo que desencadenó la crisis
En 2025, un avión de carga de UPS, el Vuelo 2976, se estrelló cerca de Louisville, Kentucky. Como parte de su informe estándar de accidente, la Junta Nacional de Seguridad del Transporte de EE. UU. (NTSB) publicó un archivo de espectrograma en su archivo de documentos públicos. La divulgación de la grabación de voz de la cabina (CVR) está prohibida por la ley federal en EE. UU., y la NTSB había seguido las regulaciones al pie de la letra.
El problema era que los legisladores no habían previsto lo que la IA avanzada haría posible.
El comentarista de ciencia popular Scott Manley señaló que los espectrogramas codifican matemáticamente datos de audio en una imagen — y que técnicamente es posible revertir este proceso. No pasó mucho tiempo antes de que los individuos se tomaran el desafío en serio. Utilizando la herramienta de IA Codex, combinada con transcripciones públicamente disponibles del accidente, lograron generar clips de audio que recrearon las voces de los dos pilotos y sus últimas conversaciones en la cabina.
Los clips se difundieron en línea.
La situación es profundamente inquietante. Estas voces pertenecían a personas que perdieron la vida — y ahora circulan sin consentimiento.
La NTSB cerró el archivo
La presidenta de la NTSB, Jennifer Hommendy, describió el incidente como «profundamente inquietante» e instó a las redes sociales a eliminar las grabaciones generadas por IA, según el material de investigación. La comisión tomó la drástica medida de retirar todo su sistema de documentos públicos de internet. Incluso después de que se restableció el acceso, 42 hilos de investigación — incluido el del Vuelo 2976 — permanecieron cerrados para su revisión.
La NTSB aún no ha anunciado soluciones permanentes de cambio de política sobre cómo se manejarán los espectrogramas en futuros expedientes.
Un vacío legal
El problema central es que la ley federal estadounidense prohíbe la divulgación pública de la grabación de voz de la cabina, pero no dice nada sobre la reconstrucción de audio a partir de archivos no sonoros como los espectrogramas. Esto ha creado un área gris legal para la cual ni la comisión ni los legisladores tienen una respuesta clara.
Expertos legales citados en el material de investigación sugieren que el incidente podría obligar al Congreso o a los reguladores federales a reevaluar lo que se define legalmente como una «grabación» — y si los datos que pueden convertirse algorítmicamente en audio deberían estar sujetos a las mismas restricciones que los archivos de audio originales.
Las políticas construidas sobre suposiciones acerca de lo que los datos de señales en bruto podrían revelar están ahora, como lo formuló un experto, «empíricamente rotas» por la IA.
Consecuencias más amplias: Fraude, tribunales y duelo
La dimensión ética se extiende mucho más allá de la seguridad aérea. El material de investigación documenta tres problemas graves:
Consentimiento y dignidad: Las personas fallecidas no pueden dar su consentimiento para que sus voces sean recreadas. Zelda Williams, hija del difunto actor Robin Williams, ha condenado públicamente el contenido generado por IA con la voz de su padre como «irrespetuoso», «espeluznante» y un «monstruo de Frankenstein», según el material de origen.
Fraude y engaño: El FBI ha advertido sobre un fuerte aumento en la clonación de voz por IA utilizada para estafas — incluyendo estafas de «emergencia familiar» donde se engaña a personas mayores para que crean que un familiar está en peligro, y ataques de «vishing» contra empresas donde la IA imita la voz de ejecutivos.
Presentación de pruebas en los tribunales: Estudios referenciados en el material de origen muestran que los oyentes calificaron las voces reales y las voces clonadas por IA como la misma persona en aproximadamente el 80 por ciento de los casos. Bajo las reglas de evidencia estadounidenses actuales, el reconocimiento de una voz por parte de un testigo aún puede ser suficiente para autenticar una grabación — incluso si es un clon de IA.
¿Qué sigue?
La NTSB no ha proporcionado un cronograma para cuándo se reabrirán los 42 casos cerrados, o si los espectrogramas se eliminarán de futuros expedientes públicos. La cuestión de una nueva legislación tampoco está resuelta.
Lo que está claro es que este no es un caso aislado — es un síntoma de un cambio tecnológico más amplio donde la frontera entre datos y audio, entre imagen y voz, ha dejado de existir de la manera en que los legisladores alguna vez asumieron.
