{"id":178356,"date":"2025-10-21T14:01:55","date_gmt":"2025-10-21T17:01:55","guid":{"rendered":"https:\/\/nuevoitsitio1.wpenginepowered.com\/co\/sin-categoria\/red-hat-lleva-la-inferencia-de-ia-distribuida-a-las-cargas-de-trabajo-de-ia-de-produccion-con-red-hat-ai-3\/"},"modified":"2025-11-21T21:22:05","modified_gmt":"2025-11-22T00:22:05","slug":"red-hat-lleva-la-inferencia-de-ia-distribuida-a-las-cargas-de-trabajo-de-ia-de-produccion-con-red-hat-ai-3","status":"publish","type":"post","link":"https:\/\/www.itsitio.com\/co\/inteligencia-artificial\/red-hat-lleva-la-inferencia-de-ia-distribuida-a-las-cargas-de-trabajo-de-ia-de-produccion-con-red-hat-ai-3\/","title":{"rendered":"Red Hat lleva la inferencia de IA distribuida a las cargas de trabajo de IA de producci\u00f3n con Red Hat AI 3"},"content":{"rendered":"<p><strong>Red Hat <\/strong>present\u00f3 <strong>Red Hat AI 3<\/strong>, una importante evoluci\u00f3n de su <strong>plataforma de IA para la empresa<\/strong>. Esta plataforma, que combina las \u00faltimas innovaciones de <strong>Red Hat AI Inference Server, Red Hat Enterprise Linux AI (RHEL AI) y Red Hat OpenShift AI<\/strong>, ayuda a simplificar las complejidades de la inferencia de IA de alto rendimiento a gran escala, lo cual permite a las organizaciones acelerar la transici\u00f3n de las cargas de trabajo de la prueba de concepto a producci\u00f3n, adem\u00e1s de mejorar la colaboraci\u00f3n en torno a aplicaciones basadas en IA.<\/p>\n<p>A medida que las empresas trascienden la experimentaci\u00f3n con la IA, se enfrentan a obst\u00e1culos significativos, entre ellos, la <strong>privacidad de los datos, el control de costos y la gesti\u00f3n de modelos dispares<\/strong>. El proyecto <strong>NANDA \u201cThe GenAI Divide: State of AI in Business\u201d<\/strong>, del <strong>Massachusetts Institute of Technology<\/strong>, pone de relieve la realidad de la IA de producci\u00f3n, en la que cerca del 95 % de las organizaciones no est\u00e1n obteniendo retornos financieros cuantificables de los aproximadamente USD 40.000 millones que invierten las empresas.<\/p>\n<p>Red Hat AI 3 se dedica a <strong>resolver directamente estos desaf\u00edos al ofrecer una experiencia m\u00e1s coherente y unificada para que los CIO y los responsables del \u00e1rea de TI maximicen sus inversiones en tecnolog\u00edas de computaci\u00f3n aceleradas<\/strong>. Red Hat AI 3 hace posible escalar y distribuir cargas de trabajo de IA con rapidez entre entornos h\u00edbridos de multiproveedores, a la vez que mejora la colaboraci\u00f3n entre equipos en cargas de trabajo de IA de pr\u00f3xima generaci\u00f3n como agentes, todo en la misma plataforma com\u00fan.<\/p>\n<figure id=\"attachment_178357\" aria-describedby=\"caption-attachment-178357\" style=\"width: 614px\" class=\"wp-caption aligncenter\"><img fetchpriority=\"high\" decoding=\"async\" class=\"size-full wp-image-178357\" src=\"https:\/\/nuevoitsitio1.wpenginepowered.com\/co\/wp-content\/uploads\/sites\/4\/2025\/10\/Red-Hat-presenta-AI-3.webp\" alt=\"Red Hat presenta AI 3, la evoluci\u00f3n de su plataforma empresarial de inteligencia artificial, que unifica capacidades clave para llevar la IA de la prueba de concepto a la producci\u00f3n a gran escala.\" width=\"614\" height=\"574\" srcset=\"https:\/\/www.itsitio.com\/co\/wp-content\/uploads\/sites\/4\/2025\/10\/Red-Hat-presenta-AI-3.webp 614w, https:\/\/www.itsitio.com\/co\/wp-content\/uploads\/sites\/4\/2025\/10\/Red-Hat-presenta-AI-3-300x280.webp 300w\" sizes=\"(max-width: 614px) 100vw, 614px\" \/><figcaption id=\"caption-attachment-178357\" class=\"wp-caption-text\">Red Hat presenta AI 3, la evoluci\u00f3n de su plataforma empresarial de inteligencia artificial, que unifica capacidades clave para llevar la IA de la prueba de concepto a la producci\u00f3n a gran escala.<\/figcaption><\/figure>\n<p>Gracias a que est\u00e1 dise\u00f1ada sobre una base de est\u00e1ndares abiertos, Red Hat AI 3 asiste a las organizaciones en cualquier etapa en la que se encuentren en su experiencia con la IA, admitiendo cualquier modelo en cualquier acelerador de hardware, desde centros de datos, la nube p\u00fablica y entornos de IA soberana hasta el edge m\u00e1s alejado.<\/p>\n<h2><span style=\"color: #333399;\">Red Hat AI 3: del entrenamiento a la \u201cacci\u00f3n\u201d, el cambio hacia la inferencia de IA empresarial<\/span><\/h2>\n<p>A medida que las organizaciones llevan las iniciativas de IA a la fase de producci\u00f3n, el foco pasa del entrenamiento y el ajuste de modelos a la inferencia, que ser\u00eda la fase de \u201cacci\u00f3n\u201d de la IA empresarial. Red Hat AI 3 hace hincapi\u00e9 en la <strong>inferencia escalable y rentable al basarse en los proyectos comunitarios vLLM y llm-d de gran \u00e9xito<\/strong>, as\u00ed como en las <strong>capacidades de optimizaci\u00f3n de modelos de Red Hat<\/strong>, y ofrece un servicio de modelos de lenguajes de gran tama\u00f1o (LLM) de nivel de producci\u00f3n.<\/p>\n<p>Para ayudar a los CIO a sacar el m\u00e1ximo partido de su aceleraci\u00f3n de hardware de alto valor, Red Hat OpenShift AI 3.0 presenta la <strong>disponibilidad general de llm-d, que reinventa la forma en que los LLM se ejecutan nativamente en Kubernetes<\/strong>. llm-d habilita la inferencia inteligente distribuida, que aprovecha el valor comprobado de la orquestaci\u00f3n de Kubernetes y el rendimiento de vLLM, combinado con tecnolog\u00edas open source clave como <a href=\"https:\/\/gateway-api-inference-extension.sigs.k8s.io\/\" target=\"_blank\" rel=\"noopener\">Kubernetes Gateway API Inference Extension<\/a>, la librer\u00eda de transferencia de baja latencia de NVIDIA Dynamo (NIXL) y la librer\u00eda de comunicaci\u00f3n DeepEP Mixture of Experts (MoE), permitiendo a las organizaciones:<\/p>\n<figure id=\"attachment_178358\" aria-describedby=\"caption-attachment-178358\" style=\"width: 677px\" class=\"wp-caption aligncenter\"><img decoding=\"async\" class=\"size-full wp-image-178358\" src=\"https:\/\/nuevoitsitio1.wpenginepowered.com\/co\/wp-content\/uploads\/sites\/4\/2025\/10\/Red-Hat-AI-3-pone-el-foco-en-la-inferencia-de-IA-como-fase-clave-de-valor-habilitando-la-ejecucion-eficiente-de-modelos-de-lenguaje-de-gran-tamano-LLM-en-entornos-empresariales.webp\" alt=\"Red Hat AI 3 pone el foco en la inferencia de IA como fase clave de valor, habilitando la ejecuci\u00f3n eficiente de modelos de lenguaje de gran tama\u00f1o (LLM) en entornos empresariales.\" width=\"677\" height=\"512\" \/><figcaption id=\"caption-attachment-178358\" class=\"wp-caption-text\">Red Hat AI 3 pone el foco en la inferencia de IA como fase clave de valor, habilitando la ejecuci\u00f3n eficiente de modelos de lenguaje de gran tama\u00f1o (LLM) en entornos empresariales.<\/figcaption><\/figure>\n<ul>\n<li><strong>reducir costos y mejorar los tiempos de respuesta<\/strong>, con la programaci\u00f3n de modelos inteligente y consciente de la inferencia y el servicio desagregado;<\/li>\n<li><strong>Ofrecer simplicidad operativa y m\u00e1xima fiabilidad<\/strong> con &#8220;Rutas bien iluminadas&#8221; prescriptivas que agilizan el despliegue de modelos a escala en Kubernetes.;<\/li>\n<li><strong>Maximizar la flexibilidad con soporte multiplataforma<\/strong> para desplegar la inferencia de LLM en diferentes aceleradores de hardware, incluyendo NVIDIA y AMD.<\/li>\n<\/ul>\n<p>llm-d parte de vLLM para evolucionar de un motor de inferencia de alto rendimiento en un solo nodo a un sistema de servicio uniforme, escalable y distribuido que permite un rendimiento predecible, un retorno de la inversi\u00f3n cuantificable y una planificaci\u00f3n eficaz de la infraestructura. Todas las mejoras abordan directamente los desaf\u00edos que plantea el servicio de modelos masivos, como los modelos Mixture-of-Experts (MoE) y el manejo de cargas de trabajo muy variables.<\/p>\n<h2><span style=\"color: #333399;\">Red Hat AI 3: una plataforma unificada para la IA colaborativa<\/span><\/h2>\n<p>Red Hat AI 3 ofrece una experiencia unificada y flexible adaptada a las demandas de colaboraci\u00f3n que exige la creaci\u00f3n de soluciones de IA generativa listas para producci\u00f3n. Est\u00e1 dise\u00f1ado para ofrecer valor tangible al fomentar la colaboraci\u00f3n y unificar los flujos de trabajo entre equipos a trav\u00e9s de una \u00fanica plataforma para que tanto los ingenieros de plataforma como los ingenieros de IA ejecuten su estrategia de inteligencia artificial. Las nuevas capacidades enfocadas en proporcionar la productividad y eficiencia necesarias para escalar de la prueba de concepto a la producci\u00f3n incluyen:<\/p>\n<figure id=\"attachment_178213\" aria-describedby=\"caption-attachment-178213\" style=\"width: 1200px\" class=\"wp-caption alignnone\"><img decoding=\"async\" class=\"size-full wp-image-178213\" src=\"https:\/\/www.itsitio.com\/co\/wp-content\/uploads\/sites\/5\/2025\/09\/La-IA-transforma-la-banca-global.webp\" alt=\"Gen AI Studio brinda un entorno interactivo para prototipar aplicaciones de IA generativa, probar prompts y ajustar par\u00e1metros en tiempo real.\" width=\"1200\" height=\"582\" srcset=\"https:\/\/www.itsitio.com\/co\/wp-content\/uploads\/sites\/4\/2025\/09\/La-IA-transforma-la-banca-global.webp 1200w, https:\/\/www.itsitio.com\/co\/wp-content\/uploads\/sites\/4\/2025\/09\/La-IA-transforma-la-banca-global-300x146.webp 300w, https:\/\/www.itsitio.com\/co\/wp-content\/uploads\/sites\/4\/2025\/09\/La-IA-transforma-la-banca-global-1024x497.webp 1024w, https:\/\/www.itsitio.com\/co\/wp-content\/uploads\/sites\/4\/2025\/09\/La-IA-transforma-la-banca-global-768x372.webp 768w\" sizes=\"(max-width: 1200px) 100vw, 1200px\" \/><figcaption id=\"caption-attachment-178213\" class=\"wp-caption-text\">Red Hat AI 3: Gen AI Studio brinda un entorno interactivo para prototipar aplicaciones de IA generativa, probar prompts y ajustar par\u00e1metros en tiempo real.<\/figcaption><\/figure>\n<ul>\n<li><strong>Capacidades de Modelo como Servicio (MaaS)<\/strong> se basan en la inferencia distribuida y permiten a los equipos de TI actuar como sus propios proveedores de MaaS, sirviendo modelos comunes de forma centralizada y proporcionando acceso bajo demanda tanto para los desarrolladores de IA como para las aplicaciones de IA. Esto permite una mejor gesti\u00f3n de costos y da soporte a casos de uso que no pueden ejecutarse en servicios p\u00fablicos de IA debido a preocupaciones de privacidad o datos.<\/li>\n<li><strong>AI hub<\/strong> permite a los ingenieros de plataforma explorar, desplegar y administrar activos fundamentales de IA. Proporciona un centro centralizado con un cat\u00e1logo curado de modelos (incluidos modelos de IA generativa validados y optimizados), un registro para gestionar el ciclo de vida de los modelos y un entorno de despliegue para configurar y monitorizar todos los activos de IA que se ejecutan en OpenShift AI.<\/li>\n<li><strong>Gen AI studio (Estudio de IA Generativa)<\/strong> ofrece un entorno pr\u00e1ctico para que los ingenieros de IA interact\u00faen con los modelos y prototipen r\u00e1pidamente nuevas aplicaciones de IA generativa. Con la funci\u00f3n de punto final de activos de IA (AI assets endpoint), los ingenieros pueden descubrir y consumir f\u00e1cilmente los modelos disponibles y los servidores MCP (Model Control Plane), que est\u00e1n dise\u00f1ados para agilizar la forma en que los modelos interact\u00faan con herramientas externas. El playground integrado proporciona un entorno interactivo y sin estado para experimentar con modelos, probar prompts y ajustar par\u00e1metros para casos de uso como el chat y la generaci\u00f3n aumentada por recuperaci\u00f3n (RAG).<\/li>\n<li><strong>Nuevos modelos de Red Hat validados y optimizados<\/strong> se incluyen para simplificar el desarrollo. La selecci\u00f3n curada incluye modelos populares de c\u00f3digo abierto como gpt-oss de OpenAI, DeepSeek-R1, y modelos especializados como Whisper para la conversi\u00f3n de voz a texto y Voxtral Mini para agentes habilitados por voz.<\/li>\n<\/ul>\n<figure id=\"attachment_178336\" aria-describedby=\"caption-attachment-178336\" style=\"width: 780px\" class=\"wp-caption alignnone\"><img loading=\"lazy\" decoding=\"async\" class=\"size-full wp-image-178336\" src=\"https:\/\/nuevoitsitio1.wpenginepowered.com\/co\/wp-content\/uploads\/sites\/4\/2025\/10\/Red-Hat-780x470-1.webp\" alt=\"Red Hat impulsa un nuevo est\u00e1ndar abierto con Model Context Protocol (MCP), clave para el desarrollo de agentes de IA interoperables y escalables.\" width=\"780\" height=\"470\" srcset=\"https:\/\/www.itsitio.com\/co\/wp-content\/uploads\/sites\/4\/2025\/10\/Red-Hat-780x470-1.webp 780w, https:\/\/www.itsitio.com\/co\/wp-content\/uploads\/sites\/4\/2025\/10\/Red-Hat-780x470-1-300x181.webp 300w, https:\/\/www.itsitio.com\/co\/wp-content\/uploads\/sites\/4\/2025\/10\/Red-Hat-780x470-1-768x463.webp 768w\" sizes=\"(max-width: 780px) 100vw, 780px\" \/><figcaption id=\"caption-attachment-178336\" class=\"wp-caption-text\">Red Hat AI 3 impulsa un nuevo est\u00e1ndar abierto con Model Context Protocol (MCP), clave para el desarrollo de agentes de IA interoperables y escalables.<\/figcaption><\/figure>\n<h2><span style=\"color: #333399;\">Sentando las bases para los agentes de IA de pr\u00f3xima generaci\u00f3n<\/span><\/h2>\n<p>Los <strong>agentes de IA est\u00e1n destinados a transformar la forma en que se crean las aplicaciones y sus complejos flujos de trabajo aut\u00f3nomos impondr\u00e1n grandes exigencias a las capacidades de inferencia<\/strong>. La versi\u00f3n Red Hat OpenShift AI 3.0 contin\u00faa sentando las bases para los sistemas de IA ag\u00e9nticos escalables, no solo a trav\u00e9s de sus capacidades de inferencia, sino tambi\u00e9n al a\u00f1adir nuevas caracter\u00edsticas y mejoras enfocadas en la gesti\u00f3n de agentes.<\/p>\n<p>Para acelerar la creaci\u00f3n y la implementaci\u00f3n de agentes, Red Hat AI 3 ha introducido una <strong>capa de API unificadas basada en Llama Stack<\/strong>, que ayuda a alinear el desarrollo con est\u00e1ndares del sector como OpenAI compatibles con los protocolos de interfaces LLM. Asimismo, para promover un ecosistema m\u00e1s abierto e interoperable, Red Hat es pionero en la adopci\u00f3n de Model Context Protocol (MCP), un poderoso est\u00e1ndar emergente que simplifica la forma en que los modelos de IA interact\u00faan con herramientas externas, lo que representa una caracter\u00edstica fundamental para los agentes de IA modernos.<\/p>\n<figure id=\"attachment_177870\" aria-describedby=\"caption-attachment-177870\" style=\"width: 1200px\" class=\"wp-caption alignnone\"><img loading=\"lazy\" decoding=\"async\" class=\"size-full wp-image-177870\" src=\"https:\/\/www.itsitio.com\/co\/wp-content\/uploads\/sites\/5\/2025\/07\/La-inteligencia-artificial-impulsa-una-nueva-era-en-defensa-digital.webp\" alt=\"La inteligencia artificial empresarial avanza hacia una nueva etapa: desde el entrenamiento de modelos hasta la inferencia escalable y en tiempo real, Red Hat AI 3 lidera esta transici\u00f3n con soluciones abiertas, seguras y listas para producci\u00f3n.\" width=\"1200\" height=\"582\" srcset=\"https:\/\/www.itsitio.com\/co\/wp-content\/uploads\/sites\/4\/2025\/07\/La-inteligencia-artificial-impulsa-una-nueva-era-en-defensa-digital.webp 1200w, https:\/\/www.itsitio.com\/co\/wp-content\/uploads\/sites\/4\/2025\/07\/La-inteligencia-artificial-impulsa-una-nueva-era-en-defensa-digital-300x146.webp 300w, https:\/\/www.itsitio.com\/co\/wp-content\/uploads\/sites\/4\/2025\/07\/La-inteligencia-artificial-impulsa-una-nueva-era-en-defensa-digital-1024x497.webp 1024w, https:\/\/www.itsitio.com\/co\/wp-content\/uploads\/sites\/4\/2025\/07\/La-inteligencia-artificial-impulsa-una-nueva-era-en-defensa-digital-768x372.webp 768w\" sizes=\"(max-width: 1200px) 100vw, 1200px\" \/><figcaption id=\"caption-attachment-177870\" class=\"wp-caption-text\">La inteligencia artificial empresarial avanza hacia una nueva etapa: desde el entrenamiento de modelos hasta la inferencia escalable y en tiempo real, Red Hat AI 3 lidera esta transici\u00f3n con soluciones abiertas, seguras y listas para producci\u00f3n.<\/figcaption><\/figure>\n<p>Red Hat AI 3 presenta un nuevo kit de herramientas modular y extensible para la personalizaci\u00f3n de modelos, desarrollado a partir de la funcionalidad existente de InstructLab. Este kit proporciona librer\u00edas especializadas de Python que otorgan a los desarrolladores mayor flexibilidad y control.<\/p>\n<p>El toolkit se basa en proyectos de c\u00f3digo abierto como Docling para el procesamiento de datos, que agiliza la ingesta de documentos no estructurados a un formato que la IA puede leer. Tambi\u00e9n incluye un marco de trabajo flexible para la generaci\u00f3n de datos sint\u00e9ticos y un centro de entrenamiento (training hub) para el ajuste fino de LLM.<\/p>\n<p>El centro de evaluaci\u00f3n (evaluation hub) integrado ayuda a los ingenieros de IA a monitorizar y validar los resultados, permiti\u00e9ndoles aprovechar con confianza sus datos propietarios para obtener resultados de IA m\u00e1s precisos y relevantes.<\/p>\n<h3><span style=\"color: #333399;\">Leer m\u00e1s<\/span><\/h3>\n<ul>\n<li><strong><a href=\"https:\/\/www.itsitio.com\/co\/inteligencia-artificial\/cinco-formas-en-que-process-ai-optimiza-costos-y-productividad\/\">Cinco formas en que Process AI optimiza costos y productividad<\/a><\/strong><\/li>\n<li><a href=\"https:\/\/www.itsitio.com\/co\/inteligencia-artificial\/las-44-profesiones-que-podrian-ser-reemplazadas-por-la-inteligencia-artificial-segun-openai\/\"><strong>Las 44 profesiones que podr\u00edan ser reemplazadas por la inteligencia artificial, seg\u00fan OpenAI<\/strong><\/a><\/li>\n<li><a href=\"https:\/\/www.itsitio.com\/co\/inteligencia-artificial\/google-cloud-impulsa-la-transformacion-digital-de-terpel-con-ia-y-analitica-avanzada\/\"><strong>Google Cloud impulsa la transformaci\u00f3n digital de Terpel con IA y anal\u00edtica avanzada<\/strong><\/a><\/li>\n<\/ul>\n","protected":false},"excerpt":{"rendered":"<p>Red Hat present&oacute; Red Hat AI 3, una importante evoluci&oacute;n de su plataforma de IA para la empresa. Esta plataforma, que combina las &uacute;ltimas innovaciones de Red Hat AI Inference Server, Red Hat Enterprise Linux AI (RHEL AI) y Red Hat OpenShift AI, ayuda a simplificar las complejidades de la inferencia de IA de alto rendimiento a gran escala, lo cual permite a las organizaciones acelerar la transici&oacute;n de las cargas de trabajo de la prueba de concepto a producci&oacute;n, adem&aacute;s de mejorar la colaboraci&oacute;n en torno a aplicaciones basadas en IA. A medida que las empresas trascienden la experimentaci&oacute;n con la IA, se enfrentan a obst&aacute;culos significativos, entre ellos, la privacidad de los datos, el control de costos y la gesti&oacute;n de modelos dispares. El proyecto NANDA &ldquo;The GenAI Divide: State of AI in Business&rdquo;, del Massachusetts Institute of Technology, pone de relieve la realidad de la IA de producci&oacute;n, en la que cerca del 95 % de las organizaciones no est&aacute;n obteniendo retornos financieros cuantificables de los aproximadamente USD 40.000 millones que invierten las empresas. Red Hat AI 3 se dedica a resolver directamente estos desaf&iacute;os al ofrecer una experiencia m&aacute;s coherente y unificada para que los CIO y los responsables del &aacute;rea de TI maximicen sus inversiones en tecnolog&iacute;as de computaci&oacute;n aceleradas. Red Hat AI 3 hace posible escalar y distribuir cargas de trabajo de IA con rapidez entre entornos h&iacute;bridos de multiproveedores, a la vez que mejora la colaboraci&oacute;n entre equipos en cargas de trabajo de IA de pr&oacute;xima generaci&oacute;n como agentes, todo en la misma plataforma com&uacute;n. Gracias a que est&aacute; dise&ntilde;ada sobre una base de est&aacute;ndares abiertos, Red Hat AI 3 asiste a las organizaciones en cualquier etapa en la que se encuentren en su experiencia con la IA, admitiendo cualquier modelo en cualquier acelerador de hardware, desde centros de datos, la nube p&uacute;blica y entornos de IA soberana hasta el edge m&aacute;s alejado. Red Hat AI 3: del entrenamiento a la &ldquo;acci&oacute;n&rdquo;, el cambio hacia la inferencia de IA empresarial A medida que las organizaciones llevan las iniciativas de IA a la fase de producci&oacute;n, el foco pasa del entrenamiento y el ajuste de modelos a la inferencia, que ser&iacute;a la fase de &ldquo;acci&oacute;n&rdquo; de la IA empresarial. Red Hat AI 3 hace hincapi&eacute; en la inferencia escalable y rentable al basarse en los proyectos comunitarios vLLM y llm-d de gran &eacute;xito, as&iacute; como en las capacidades de optimizaci&oacute;n de modelos de Red Hat, y ofrece un servicio de modelos de lenguajes de gran tama&ntilde;o (LLM) de nivel de producci&oacute;n. Para ayudar a los CIO a sacar el m&aacute;ximo partido de su aceleraci&oacute;n de hardware de alto valor, Red Hat OpenShift AI 3.0 presenta la disponibilidad general de llm-d, que reinventa la forma en que los LLM se ejecutan nativamente en Kubernetes. llm-d habilita la inferencia inteligente distribuida, que aprovecha el valor comprobado de la orquestaci&oacute;n de Kubernetes y el rendimiento de vLLM, combinado con tecnolog&iacute;as open source clave como Kubernetes Gateway API Inference Extension, la librer&iacute;a de transferencia de baja latencia de NVIDIA Dynamo (NIXL) y la librer&iacute;a de comunicaci&oacute;n DeepEP Mixture of Experts (MoE), permitiendo a las organizaciones: reducir costos y mejorar los tiempos de respuesta, con la programaci&oacute;n de modelos inteligente y consciente de la inferencia y el servicio desagregado; Ofrecer simplicidad operativa y m&aacute;xima fiabilidad con &ldquo;Rutas bien iluminadas&rdquo; prescriptivas que agilizan el despliegue de modelos a escala en Kubernetes.; Maximizar la flexibilidad con soporte multiplataforma para desplegar la inferencia de LLM en diferentes aceleradores de hardware, incluyendo NVIDIA y AMD. llm-d parte de vLLM para evolucionar de un motor de inferencia de alto rendimiento en un solo nodo a un sistema de servicio uniforme, escalable y distribuido que permite un rendimiento predecible, un retorno de la inversi&oacute;n cuantificable y una planificaci&oacute;n eficaz de la infraestructura. Todas las mejoras abordan directamente los desaf&iacute;os que plantea el servicio de modelos masivos, como los modelos Mixture-of-Experts (MoE) y el manejo de cargas de trabajo muy variables. Red Hat AI 3: una plataforma unificada para la IA colaborativa Red Hat AI 3 ofrece una experiencia unificada y flexible adaptada a las demandas de colaboraci&oacute;n que exige la creaci&oacute;n de soluciones de IA generativa listas para producci&oacute;n. Est&aacute; dise&ntilde;ado para ofrecer valor tangible al fomentar la colaboraci&oacute;n y unificar los flujos de trabajo entre equipos a trav&eacute;s de una &uacute;nica plataforma para que tanto los ingenieros de plataforma como los ingenieros de IA ejecuten su estrategia de inteligencia artificial. Las nuevas capacidades enfocadas en proporcionar la productividad y eficiencia necesarias para escalar de la prueba de concepto a la producci&oacute;n incluyen: Capacidades de Modelo como Servicio (MaaS) se basan en la inferencia distribuida y permiten a los equipos de TI actuar como sus propios proveedores de MaaS, sirviendo modelos comunes de forma centralizada y proporcionando acceso bajo demanda tanto para los desarrolladores de IA como para las aplicaciones de IA. Esto permite una mejor gesti&oacute;n de costos y da soporte a casos de uso que no pueden ejecutarse en servicios p&uacute;blicos de IA debido a preocupaciones de privacidad o datos. AI hub permite a los ingenieros de plataforma explorar, desplegar y administrar activos fundamentales de IA. Proporciona un centro centralizado con un cat&aacute;logo curado de modelos (incluidos modelos de IA generativa validados y optimizados), un registro para gestionar el ciclo de vida de los modelos y un entorno de despliegue para configurar y monitorizar todos los activos de IA que se ejecutan en OpenShift AI. Gen AI studio (Estudio de IA Generativa) ofrece un entorno pr&aacute;ctico para que los ingenieros de IA interact&uacute;en con los modelos y prototipen r&aacute;pidamente nuevas aplicaciones de IA generativa. Con la funci&oacute;n de punto final de activos de IA (AI assets endpoint), los ingenieros pueden descubrir y consumir f&aacute;cilmente los modelos disponibles y los servidores MCP (Model Control Plane), que est&aacute;n dise&ntilde;ados para agilizar la forma en que los modelos interact&uacute;an con herramientas externas. El playground integrado proporciona un entorno interactivo y sin estado para experimentar con<\/p>\n","protected":false},"author":229,"featured_media":178360,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"site-sidebar-layout":"default","site-content-layout":"","ast-site-content-layout":"default","site-content-style":"default","site-sidebar-style":"default","ast-global-header-display":"","ast-banner-title-visibility":"","ast-main-header-display":"","ast-hfb-above-header-display":"","ast-hfb-below-header-display":"","ast-hfb-mobile-header-display":"","site-post-title":"","ast-breadcrumbs-content":"","ast-featured-img":"","footer-sml-layout":"","ast-disable-related-posts":"","theme-transparent-header-meta":"","adv-header-id-meta":"","stick-header-meta":"","header-above-stick-meta":"","header-main-stick-meta":"","header-below-stick-meta":"","astra-migrate-meta-layouts":"default","ast-page-background-enabled":"default","ast-page-background-meta":{"desktop":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"tablet":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"mobile":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""}},"ast-content-background-meta":{"desktop":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"tablet":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"mobile":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""}},"footnotes":""},"categories":[17],"tags":[247],"class_list":["post-178356","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-inteligencia-artificial","tag-red-hat"],"_links":{"self":[{"href":"https:\/\/www.itsitio.com\/co\/wp-json\/wp\/v2\/posts\/178356","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.itsitio.com\/co\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.itsitio.com\/co\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.itsitio.com\/co\/wp-json\/wp\/v2\/users\/229"}],"replies":[{"embeddable":true,"href":"https:\/\/www.itsitio.com\/co\/wp-json\/wp\/v2\/comments?post=178356"}],"version-history":[{"count":0,"href":"https:\/\/www.itsitio.com\/co\/wp-json\/wp\/v2\/posts\/178356\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.itsitio.com\/co\/wp-json\/wp\/v2\/media\/178360"}],"wp:attachment":[{"href":"https:\/\/www.itsitio.com\/co\/wp-json\/wp\/v2\/media?parent=178356"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.itsitio.com\/co\/wp-json\/wp\/v2\/categories?post=178356"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.itsitio.com\/co\/wp-json\/wp\/v2\/tags?post=178356"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}