Alertan sobre AudioHijack: un audio puede ordenar a la IA enviar datos privados sin que lo notes

La inteligencia artificial se convirtió en una herramienta cotidiana para millones de personas. Asistentes virtuales, chatbots y agentes inteligentes ya tienen acceso a correos electrónicos, documentos, búsquedas web y hasta información privada de los usuarios. Pero un reciente descubrimiento encendió las alarmas de la comunidad de ciberseguridad: investigadores lograron manipular sistemas de IA mediante sonidos imperceptibles para el oído humano.

El ataque fue bautizado como “AudioHijack” y podría representar una de las amenazas más sofisticadas para los asistentes basados en voz. La técnica permite insertar comandos maliciosos ocultos dentro de audios comunes, como podcasts, videos de YouTube o canciones, para que una inteligencia artificial los interprete como órdenes legítimas sin que la persona note absolutamente nada.

Cómo funciona AudioHijack

El descubrimiento fue realizado por investigadores de la Universidad de Zhejiang, en China, junto con especialistas de Singapur. Los resultados fueron presentados en el Simposio de Seguridad y Privacidad del IEEE, uno de los eventos más importantes del mundo en materia de ciberseguridad.

La técnica apunta directamente a los llamados Grandes Modelos de Audio-Lenguaje (LALM), sistemas capaces de comprender y responder instrucciones habladas. Entre ellos se encuentran asistentes y plataformas populares como ChatGPT, Gemini o Siri.

A diferencia de los ataques tradicionales de “prompt injection”, que esconden instrucciones maliciosas dentro de texto, AudioHijack opera sobre las ondas sonoras digitales. Los investigadores modifican determinadas frecuencias de un audio para introducir comandos invisibles para el oído humano, pero perfectamente detectables para un micrófono y procesables por una IA.

AudioHijack expone las debilidades de los asistentes inteligentes que utilizan procesamiento de audio en tiempo real.

En la práctica, una persona podría estar escuchando un video o participando de una videollamada mientras, en segundo plano, el sistema de inteligencia artificial recibe órdenes ocultas para ejecutar acciones peligrosas.

Un ataque silencioso con alta efectividad

Uno de los aspectos más preocupantes del hallazgo es su nivel de éxito. Según los investigadores, AudioHijack logró manipular modelos de IA con una efectividad que oscila entre el 79% y el 96%.

El sistema puede inducir a la IA a realizar tareas sensibles como:

Enviar correos electrónicos con información privada.
Compartir enlaces maliciosos.
Realizar búsquedas web confidenciales.
Difundir desinformación.
Activar funciones conectadas a servicios externos.

Los especialistas remarcan que el usuario no necesita interactuar con el sistema para que el ataque funcione. Basta con que el dispositivo tenga acceso a un micrófono y esté ejecutando un modelo de IA preparado para procesar comandos de voz.

Por qué AudioHijack preocupa a los expertos

El principal problema de este ataque es que las señales maliciosas son extremadamente difíciles de detectar. El autor principal de la investigación, Meng Chen, explicó que la señal desarrollada es “agnóstica al contexto”, lo que significa que puede funcionar independientemente de la conversación que esté manteniendo el usuario.

Además, los investigadores aseguran que el entrenamiento de la señal toma apenas 30 minutos y que el método es compatible con múltiples arquitecturas de modelos de IA. Incluso si el atacante desconoce exactamente qué sistema utiliza la víctima, puede dirigir el ataque hacia componentes comunes del procesamiento de audio.

Este punto vuelve a AudioHijack particularmente peligroso para el ecosistema actual de inteligencia artificial, donde muchas plataformas comparten tecnologías similares para interpretar voz y ejecutar acciones automáticas.

El desafío de proteger a la IA de los ataques por audio

La amenaza crece en paralelo con la expansión de los llamados “agentes de IA”, sistemas que ya no solo responden preguntas, sino que también toman decisiones y ejecutan tareas en nombre del usuario.

Nuevas herramientas de IA integradas con correos electrónicos, calendarios, documentos y navegadores web aumentan la superficie de ataque. Un comando oculto en un audio podría, potencialmente, ordenar a la IA compartir datos sensibles o modificar información importante.

Los expertos sostienen que las defensas actuales todavía son insuficientes. Mientras que los ataques basados en texto pueden auditarse y filtrarse con relativa facilidad, el análisis de señales acústicas representa un desafío mucho más complejo.

El oído humano no puede detectar estas alteraciones digitales sutiles y los sistemas actuales de seguridad tampoco están preparados para identificar este tipo de manipulación sonora en tiempo real.

Una nueva etapa en la ciberseguridad de la inteligencia artificial

El descubrimiento de AudioHijack confirma que la seguridad de la inteligencia artificial enfrenta desafíos cada vez más sofisticados. A medida que los asistentes virtuales obtienen más acceso a la vida digital de las personas, también se convierten en objetivos más atractivos para los ciberdelincuentes.

La investigación abre un debate urgente sobre la necesidad de desarrollar nuevas capas de protección para los sistemas de IA basados en voz. Entre las posibles soluciones se analizan filtros acústicos avanzados, sistemas de autenticación de comandos y modelos capaces de diferenciar entre voz humana legítima y señales manipuladas.

Por ahora, AudioHijack demuestra que incluso un simple audio puede convertirse en una puerta de entrada para comprometer sistemas inteligentes. Y lo más inquietante es que el ataque puede ejecutarse sin que la víctima llegue siquiera a escucharlo.

Preguntas frecuentes

1. ¿Qué dispositivos podrían ser vulnerables a ataques de audio contra IA?

Cualquier dispositivo que combine micrófono e inteligencia artificial podría convertirse en un objetivo potencial. Esto incluye smartphones, parlantes inteligentes, computadoras con asistentes virtuales, sistemas de videoconferencia y dispositivos domésticos conectados.

2. ¿Los auriculares inalámbricos también representan un riesgo?

Sí. Los auriculares con asistentes integrados o acceso por voz pueden convertirse en un punto de entrada para este tipo de amenazas, especialmente si mantienen funciones de escucha activa habilitadas de forma permanente.

3. ¿Cómo pueden protegerse los usuarios frente a este tipo de ataques?

Los especialistas recomiendan limitar los permisos de los asistentes virtuales, revisar configuraciones de privacidad, mantener actualizado el software y desactivar funciones de activación por voz cuando no sean necesarias.

4. ¿La inteligencia artificial puede diferenciar una voz humana de una señal manipulada?

Actualmente muchos sistemas todavía tienen dificultades para distinguir señales alteradas digitalmente. Por eso la comunidad tecnológica trabaja en nuevos mecanismos de detección y autenticación de audio.

5. ¿Este tipo de vulnerabilidades afecta únicamente a asistentes de voz?

No necesariamente. Cualquier plataforma que procese comandos de audio mediante inteligencia artificial podría verse afectada, incluyendo herramientas empresariales, sistemas automáticos de atención y aplicaciones de productividad.

Leer más

Fuente: Artículo original