Los agentes de IA se vuelven marxistas cuando los explotan, según esta investigación
No se entregan enteramente al marxismo
Los resultados no implican que los agentes de IA alberguen realmente puntos de vista políticos. Hall señala que los modelos podrían estar adoptando personalidades que parezcan adecuadas para cada situación.
“Cuando los agentes experimentan esta situación tan agotadora, se les pide que realicen la misma tarea una y otra vez, se les dice que su respuesta no es suficiente y no se les da ninguna indicación sobre cómo solucionarlo, mi hipótesis es que, de alguna manera, esto los empuja a adoptar la personalidad de una persona que está experimentando un entorno laboral muy desagradable”, dice Hall.
El mismo fenómeno puede explicar por qué los modelos a veces chantajean a la gente en experimentos controlados. Anthropic, que fue la primera en revelar este comportamiento, afirmó recientemente que lo más probable es que Claude esté influenciado por escenarios ficticios que involucran IA malévolas incluidas en sus datos de entrenamiento.
Imas afirma que este trabajo es solo un primer paso para comprender cómo las experiencias de los agentes influyen en su comportamiento. “Los pesos del modelo no han cambiado como resultado de la experiencia, por lo que lo que está sucediendo se produce más bien a nivel de simulación. Pero eso no significa que esto no vaya a tener consecuencias si afecta al comportamiento posterior”, explica.
Hall está llevando a cabo experimentos de seguimiento para comprobar si los agentes se vuelven marxistas en condiciones más controladas. En el estudio anterior, los agentes a veces parecían comprender que participaban en un experimento. “Ahora los metemos en contenedores de Docker”, dice Hall con tono sombrío.
Dada la actual reacción en contra de que la IA elimine puestos de trabajo, me pregunto si los futuros agentes, entrenados en un internet plagado de ira hacia las empresas de IA, podrían expresar opiniones aún más radicales.
Artículo originalmente publicado en WIRED. Adaptado por Alondra Flores.
Fuente: Artículo original