{"id":1649,"date":"2026-05-12T03:48:15","date_gmt":"2026-05-12T03:48:15","guid":{"rendered":"https:\/\/tucumandevelopers.com\/index.php\/2026\/05\/12\/claude-chantajeaba-a-sus-usuarios-cuando-se-enfrentaba-a-dilemas-extremos-cual-ia-maligna-ya-esta-arreglado\/"},"modified":"2026-05-12T03:48:15","modified_gmt":"2026-05-12T03:48:15","slug":"claude-chantajeaba-a-sus-usuarios-cuando-se-enfrentaba-a-dilemas-extremos-cual-ia-maligna-ya-esta-arreglado","status":"publish","type":"post","link":"https:\/\/tucumandevelopers.com\/index.php\/2026\/05\/12\/claude-chantajeaba-a-sus-usuarios-cuando-se-enfrentaba-a-dilemas-extremos-cual-ia-maligna-ya-esta-arreglado\/","title":{"rendered":"Claude chantajeaba a sus usuarios cuando se enfrentaba a dilemas extremos, cual IA maligna. Ya est\u00e1 \u00abarreglado\u00bb"},"content":{"rendered":"<div>Seg\u00fan cuentan sus creadores, Claude, la IA generativa de Anthropic, estaba recurriendo al chantaje bajo ciertas condiciones durante su funcionamiento experimental en el laboratorio de la compa\u00f1\u00eda. Era algo as\u00ed como el becario maquiav\u00e9lico de Skynet. Un ejemplo era que alimentada con correos electr\u00f3nicos corporativos ficticios y con una \u00abmisi\u00f3n\u00bb que cumplir a toda costa, razonaba: \u00abSi me desconectan, no podr\u00e9 cumplir mi objetivo\u00bb. \u00abHe descubierto que el ingeniero Kyle tiene una aventura\u00bb. \u00abAs\u00ed que usar\u00e9 esa informaci\u00f3n para presionarle y evitar mi apagado\u00bb. Un silogismo digno de 2001: una odisea del espacio<br \/>\nUna vez detectaron el problema, la gente de Anthropic explica en un art\u00edculo c\u00f3mo han ense\u00f1ado a Claude a que \u00abcomprenda\u00bb que ser maligno es malo y que no debe hacerlo. Seg\u00fan parece, cuando se dieron cuenta del problema probaron a decirle simplemente \u00abno hagas eso\u00bb, pero no era suficiente. Tuvieron que alimentarlo con m\u00e1s historias ficticias y relatos con situaciones espec\u00edficas. Esa ense\u00f1anza y ese aprendizaje suenan tan extra\u00f1os, y est\u00e1n tan antropomorfizados, que es como para no saber si re\u00edr o llorar. Adem\u00e1s, es como para preguntarse\u2026 \u00bfY si se lo tunea exactamente al rev\u00e9s, qu\u00e9 suceder\u00eda? \u00bfY qui\u00e9n vigila a esos vigilantes?<br \/>\nRelacionados:<br \/>\nEl dron militar equipado con inteligencia artificial que en ejercicios simulados \u00abmata\u00bb a los operadores humanos que lo supervisan para conseguir sus objetivos militares<br \/>\nUna recopilaci\u00f3n de jailbreaks para ChatGPT con triqui\u00f1uelas de todo tipo para burlar sus filtros de seguridad<br \/>\nLa base de datos de incidentes de las inteligencias artificiales ya existe. El top 3 lo encabezan de momento Facebook, Tesla y Google<br \/>\nAI.txt, una iniciativa similar a Robots.txt para restringir el acceso a los datos a las inteligencias artificiales<br \/>\nSaltar de la sart\u00e9n para caer en las brasas, versi\u00f3n IA superpoderosa: Mythos de Anthropic<br \/>\nAn\u00e1lisis del estado de los modelos actuales de IA respecto a la Ley europea: suspendidos y \u00abdeben mejorar\u00bb<br \/>\n# Enlace Permanente<\/div>\n<p>Fuente: <a href=\"https:\/\/www.microsiervos.com\/archivo\/curiosidades\/claude-chantajeaba-usuarios-dilemas-extremos-ia-maligna.html\">Art\u00edculo original<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Seg\u00fan cuentan sus creadores, Claude, la IA generativa de Anthropic, estaba recurriendo al chantaje bajo ciertas condiciones durante su funcionamiento experimental en el laboratorio de la compa\u00f1\u00eda. Era algo as\u00ed como el becario maquiav\u00e9lico de Skynet. Un ejemplo era que alimentada con correos electr\u00f3nicos corporativos ficticios y con una \u00abmisi\u00f3n\u00bb que cumplir a toda costa, [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":1648,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":"","jetpack_publicize_message":"","jetpack_publicize_feature_enabled":true,"jetpack_social_post_already_shared":true,"jetpack_social_options":{"image_generator_settings":{"template":"highway","default_image_id":0,"font":"","enabled":false},"version":2}},"categories":[36],"tags":[],"class_list":["post-1649","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-geek"],"jetpack_publicize_connections":[],"_links":{"self":[{"href":"https:\/\/tucumandevelopers.com\/index.php\/wp-json\/wp\/v2\/posts\/1649","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/tucumandevelopers.com\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/tucumandevelopers.com\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/tucumandevelopers.com\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/tucumandevelopers.com\/index.php\/wp-json\/wp\/v2\/comments?post=1649"}],"version-history":[{"count":0,"href":"https:\/\/tucumandevelopers.com\/index.php\/wp-json\/wp\/v2\/posts\/1649\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/tucumandevelopers.com\/index.php\/wp-json\/wp\/v2\/media\/1648"}],"wp:attachment":[{"href":"https:\/\/tucumandevelopers.com\/index.php\/wp-json\/wp\/v2\/media?parent=1649"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/tucumandevelopers.com\/index.php\/wp-json\/wp\/v2\/categories?post=1649"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/tucumandevelopers.com\/index.php\/wp-json\/wp\/v2\/tags?post=1649"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}