{"id":1806,"date":"2026-05-16T03:22:43","date_gmt":"2026-05-16T03:22:43","guid":{"rendered":"https:\/\/tucumandevelopers.com\/index.php\/2026\/05\/16\/la-ia-ha-puesto-patas-arriba-una-vieja-regla-de-los-servidores-la-memoria-ya-no-quiere-vivir-en-cada-maquina\/"},"modified":"2026-05-16T03:22:43","modified_gmt":"2026-05-16T03:22:43","slug":"la-ia-ha-puesto-patas-arriba-una-vieja-regla-de-los-servidores-la-memoria-ya-no-quiere-vivir-en-cada-maquina","status":"publish","type":"post","link":"https:\/\/tucumandevelopers.com\/index.php\/2026\/05\/16\/la-ia-ha-puesto-patas-arriba-una-vieja-regla-de-los-servidores-la-memoria-ya-no-quiere-vivir-en-cada-maquina\/","title":{"rendered":"La IA ha puesto patas arriba una vieja regla de los servidores: la memoria ya no quiere vivir en cada m\u00e1quina"},"content":{"rendered":"<div>\n<div>\n<p><strong>La memoria de la conversaci\u00f3n.<\/strong> Cada respuesta de un modelo de lenguaje se construye poco a poco, token a token. Para no recalcular todo lo anterior en cada paso, los sistemas guardan una especie de memoria de trabajo llamada KV cache. The Next Platform explica que ah\u00ed se conservan los vectores de atenci\u00f3n previos, que ayudan al modelo a seguir teniendo en cuenta el contexto mientras genera la respuesta. El problema es que en servicios con muchos usuarios esa cach\u00e9 puede crecer hasta ocupar cantidades enormes de memoria, incluso m\u00e1s que el propio modelo.<\/p>\n<p> <!-- BREAK 4 --><\/p>\n<p><strong>Ya no es solo teor\u00eda.<\/strong> Esta idea ya no vive solo en documentos t\u00e9cnicos o promesas de arquitectura. <a rel=\"noopener, noreferrer\" href=\"https:\/\/www.theregister.com\/systems\/2026\/05\/10\/memory-godboxes-could-offer-relief-from-the-rampocalypse\/5237463\">The Register menciona<\/a> a Panmnesia, Liqid y UnifabriX como compa\u00f1\u00edas que trabajan en sistemas para llevar memoria fuera del servidor y ponerla al alcance de varias m\u00e1quinas. Algunos lo hacen con switches CXL, otros con grandes reservas de DDR5 que pueden repartirse entre distintos hosts. The Next Platform a\u00f1ade el caso de Enfabrica y su sistema Emfasys, pensado para inferencia y capaz, seg\u00fan el medio, de alcanzar 18 TB de DDR5 por servidor de memoria y 144 TB en un rack completo. La conclusi\u00f3n es sencilla: la industria no solo busca m\u00e1s memoria, busca colocarla de otra manera para que la IA pueda aprovecharla mejor.<\/p>\n<p>Im\u00e1genes | Xataka con Nano Banana<\/p>\n<p>En Xataka | <a href=\"https:\/\/www.xataka.com\/robotica-e-ia\/netflix-chino-ha-disenado-plan-ia-genere-mayoria-su-contenido-cinco-anos-suena-arriesgado\" data-vars-post-title=\"El 'Netflix chino' ha dise\u00f1ado un plan para que la IA genere la mayor\u00eda de su contenido en cinco a\u00f1os. Suena arriesgado \" data-vars-post-url=\"https:\/\/www.xataka.com\/robotica-e-ia\/netflix-chino-ha-disenado-plan-ia-genere-mayoria-su-contenido-cinco-anos-suena-arriesgado\">El &#8216;Netflix chino&#8217; ha dise\u00f1ado un plan para que la IA genere la mayor\u00eda de su contenido en cinco a\u00f1os. Suena arriesgado<\/a><\/p>\n<\/p><\/div>\n<\/div>\n<\/div>\n<\/div>\n<p>Fuente: <a href=\"https:\/\/www.xataka.com\/robotica-e-ia\/ia-ha-puesto-patas-arriba-vieja-regla-servidores-memoria-no-quiere-vivir-cada-maquina\">Art\u00edculo original<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>La memoria de la conversaci\u00f3n. Cada respuesta de un modelo de lenguaje se construye poco a poco, token a token. Para no recalcular todo lo anterior en cada paso, los sistemas guardan una especie de memoria de trabajo llamada KV cache. The Next Platform explica que ah\u00ed se conservan los vectores de atenci\u00f3n previos, que [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":1805,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":"","jetpack_publicize_message":"","jetpack_publicize_feature_enabled":true,"jetpack_social_post_already_shared":true,"jetpack_social_options":{"image_generator_settings":{"template":"highway","default_image_id":0,"font":"","enabled":false},"version":2}},"categories":[34],"tags":[],"class_list":["post-1806","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-xataka"],"jetpack_publicize_connections":[],"_links":{"self":[{"href":"https:\/\/tucumandevelopers.com\/index.php\/wp-json\/wp\/v2\/posts\/1806","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/tucumandevelopers.com\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/tucumandevelopers.com\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/tucumandevelopers.com\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/tucumandevelopers.com\/index.php\/wp-json\/wp\/v2\/comments?post=1806"}],"version-history":[{"count":0,"href":"https:\/\/tucumandevelopers.com\/index.php\/wp-json\/wp\/v2\/posts\/1806\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/tucumandevelopers.com\/index.php\/wp-json\/wp\/v2\/media\/1805"}],"wp:attachment":[{"href":"https:\/\/tucumandevelopers.com\/index.php\/wp-json\/wp\/v2\/media?parent=1806"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/tucumandevelopers.com\/index.php\/wp-json\/wp\/v2\/categories?post=1806"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/tucumandevelopers.com\/index.php\/wp-json\/wp\/v2\/tags?post=1806"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}