当前位置:首页>新闻 > 红帽AI推理服务器正式发布,助力混合云中任意模型和任意加速器上的生成式AI

红帽AI推理服务器正式发布,助力混合云中任意模型和任意加速器上的生成式AI

红帽AI推理服务器由vLLM驱动并通过Neural Magic技术进一步增强可在混合云环境中提供速度更快、性能更优且成本效益更高的AI推理

中国北京 – 2025521 – 全球领先的开源解决方案提供商红帽公司近日宣布推出红帽AI推理服务器(Red Hat AI Inference Server),这是在混合云中普及生成式AI(gen AI)的重要一步。作为红帽AI中的新产品,该企业级推理服务器源自强大的vLLM社区项目,并通过红帽对Neural Magic技术的集成进一步增强,可以提供更高的速度、加速器效率和成本效益,助力实现红帽“在任意云环境中的任意AI加速器上运行任意生成式AI模型”的愿景。无论是独立部署,还是作为红帽企业Linux AI(RHEL AI)和红帽OpenShift AI的集成组件,这一革新性平台赋能企业,在生产环境中高效部署和扩展生成式AI。

推理是AI的关键执行引擎,预训练模型在此将数据转化为实际影响。它是用户交互的核心环节,要求快速且准确的响应。随着生成式AI模型复杂性激增及生产部署规模扩大,推理可能成为关键瓶颈,消耗大量硬件资源,削弱响应能力,并抬高运营成本。强大的推理服务器不再是一种“奢侈品”,而是大规模释放AI的真正潜力,更加轻松地应对底层复杂性的必要条件。

红帽推出红帽AI推理服务器解决这些挑战。红帽AI推理服务器是一款专为高性能设计的开放推理解决方案,配备先进的模型压缩和优化工具。该创新提供响应速度显著提升的用户体验,以及在AI加速器、模型和IT环境选择上无可比拟的灵活性,赋能企业充分利用生成式AI的变革性力量。

vLLM:拓展推理创新

红帽AI推理服务器基于加州大学伯克利分校于2023年中启动的行业领先vLLM项目。该社区项目提供高吞吐量生成式AI推理,支持大规模输入上下文,可实现多GPU模型加速,并支持连续批处理等功能。

vLLM广泛支持公开可用的模型,并具备与先进前沿模型(包括DeepSeek、谷歌的Gemma、Llama、Llama Nemotron、Mistral、Phi等)以及开放的企业级推理模型(如Llama Nemotron)的零日集成。这使它成为未来AI推理创新的事实标准。先进的前沿模型提供商正越来越多地采用vLLM,进一步加强了其在塑造生成式AI未来中的关键作用。

推出红帽AI推理服务器

红帽AI推理服务器将vLLM的前沿创新整合进自身的企业级能力中。红帽AI推理服务器可以作为独立的容器化产品交付,也可以作为RHEL AI和红帽OpenShift AI的一部分提供。

无论在何种部署环境中,红帽AI推理服务器均向用户提供经过加固且具备支持的vLLM发行版,并包含以下功能:

· 智能LLM压缩工具,可大幅缩减基础AI模型与微调AI模型大小,在保持甚至可能进一步提升模型准确性的同时,最小化计算资源消耗。

· 优化的模型存储库,托管在红帽AI组织的Hugging Face中,提供对经过验证和优化的前沿AI模型集合的即时访问,这些模型已准备好用于推理部署,可助力效率提升2-4倍,同时不影响模型准确性。

· 红帽的企业支持,以及在将社区项目带入生产环境方面数十年的专业经验。

· 第三方支持,实现更大的部署灵活性,支持红帽AI推理服务器在非红帽Linux和Kubernetes平台上部署,具体遵循红帽第三方支持政策

红帽的愿景:任模型,任加速器,任,自由部署

AI的未来应当充满无限机遇,而不应受到基础设施孤岛的限制。红帽认为,未来,企业可以在任意云环境中的任意加速器上部署任意模型,提供卓越且更加一致的用户体验,而无需高昂的成本。为了释放生成式AI投资的真正潜力,企业需要一个通用推理平台——一个用以推动当下以及未来数年中,更加无缝、更高性能AI创新的标准。

正如红帽通过将Linux转变为现代IT的基石,开创了开源企业先河,如今红帽正构建AI推理的未来。vLLM拥有成为标准化生成式AI推理核心的潜力,红帽致力于构建一个繁荣的生态系统,不仅围绕vLLM社区,还包括用于大规模分布式推理的llm-d。红帽的愿景非常清晰:无论采用何种AI模型、底层加速器或部署环境,vLLM都能成为新型跨混合云环境推理的开放标准权威。

支持证言

红帽AI业务部门副总裁兼总经理Joe Fernandes

“推理是生成式AI的真正价值所在,即在用户进行交互时,特定模型会迅速给出准确回复,但这必须以高效和具有成本效益的方式实现。红帽AI推理服务器旨在满足大规模高性能、快速响应的推理需求,同时保持低资源需求,提供一个通用推理层,支持任意模型在任意环境中的任意加速器上运行。”

AMD AI产品管理企业副总裁Ramine Roane

“通过与红帽合作,AMD提供开箱即用的解决方案,推动企业中高效生成式AI的应用。基于AMD Instinct™ GPU的红帽AI推理服务器为组织提供企业级、社区驱动的AI推理能力,并由经过全面验证的硬件加速器提供支持。”

思科高级副总裁兼总经理Jeremy Foster

“AI工作负载需要速度、一致性和灵活性,而这正是红帽AI推理服务器旨在达成的目标。该创新为思科和红帽提供了契机,使双方能够继续携手探索新方法,让AI部署更易获取、更加高效、更具可扩展性,帮助企业为未来做好准备。”

英特尔数据中心与AI软件解决方案及生态系统副总裁Bill Pearson

“英特尔很高兴与红帽合作,在英特尔 Gaudi 加速器上启用红帽AI推理服务器。此次集成将为客户提供优化解决方案,以简化并扩展AI推理,为各类企业AI应用带来先进性能与效率。”

NVIDIA企业软件副总裁John Fanelli

“高性能推理使模型和AI智能体不仅能够回答问题,还能在实时环境中进行推理和调整。借助开放的全栈NVIDIA加速计算和红帽AI推理服务器,开发者可在混合云环境中大规模运行高效推理,并通过红帽推理服务器和全新NVIDIA企业AI验证设计方案开展部署工作。”

关于红帽

红帽是开放混合云技术的领导者,为变革性的IT创新和AI应用提供可信、一致且全面的基础。红帽的云、开发者、AI、Linux、自动化和应用平台等技术产品组合,协助企业从数据中心到边缘跨环境部署任意应用。作为全球领先的企业级开源软件解决方案提供商,红帽积极投入开放生态系统和社区,解决未来的IT挑战。通过与合作伙伴和客户紧密协作,帮助他们构建、连接、自动化、保护和管理IT环境,并提供咨询服务以及屡获殊荣的培训和认证方案。

为您推荐
  • 广西一新娘,因“长得太美”而火出圈,网友:山窝里的金凤凰!
    2024-03-15
    在广西某个幽静的村落,一场盛大的婚礼成为了村民们茶余饭后的热议焦点。婚礼之所以如此引人瞩目,不仅因为它洋溢着浪漫与温馨的气息,更因为新娘那令人惊艳的容貌,仿佛一位踏月而来的仙女,让在场的每一个人都为之倾倒。新娘名为小梅,是一位土生土长的广西姑娘。她那双清澈明亮的大眼睛,宛如山间的一泓清泉,灵动而深邃。她那弯弯的眉毛,如同柳叶一般婀娜多姿,映衬着白皙如玉的肌肤,更显清丽脱俗。当她笑起来时,那灿烂的笑
  • 接连签约!南通将新增一批打卡地
    2024-03-15
    为全面落实全市“重大项目攻坚突破年”部署要求,2024年开年以来,全市文广旅系统主动作为、强势开局,推动文旅市场加快复苏,重大文旅项目如“春花绽放”般签约。截至目前,新签约文旅项目7个,总投资额24亿元。项目详情滨海酒店项目签约时间:2024年1月签约地点:启东市投资金额:10亿元项目介绍:滨海高端度假酒店项目位于启东市江海澜湾旅游度假区,由上海长甲集团投资建设,总投资10亿元,占地约370亩,将打造集高端度假酒店
  • 四川五日游旅游路线,四川游哪些美食,来四川如何规划行程
    2024-03-15
    四川,简称"川"或"蜀",省会成都,位于中国大陆西南腹地,自古就有"天府之国"之美誉,是中国西部门户,大熊猫故乡。四川今与重庆、贵州、云南、西藏、青海、甘肃、陕西诸省市交界。四川东部为川东平行岭谷和川中丘陵,中部为成都平原,西部为川西高原。这次出游是朋友推荐的一位四川当地旅行规划师小雅安排的,没有任何自费项目!从接站到住宿、交通、吃饭、门票等都是小雅安排,十分省心。真心推荐
  • 夫妻关系如何维持?寻找专属于你的婚姻幸福之路
    2024-03-15
    在《社会心理学》中提到了两个在现代生活中似乎无可辩驳的事实,一是亲密而持久的婚姻关系是幸福生活的标志;二是亲密而持久的婚姻关系正在减少。由此,人们必须付出努力才能防止爱情的衰退,这就像哈维说的:“‘用心照顾’我们的亲密关系能够使我们获得更长久的满足”,那么怎样才算是对亲密关系的“用心照顾”,也就是说我们应该如何维持夫妻关系,对此,同样在《社会心理学》中给出了一些建议:这些建议虽然有效,但又太过笼统
  • “微笑型抑郁症”患者突然自杀,亲朋好友无比震惊!这类悲剧其实可以预防
    2024-03-15
    我们写过不少关于“微笑型抑郁症”的文章。比如去年7月,一代天后李玟自杀身亡,几乎震惊了所有人!在大众心目中,她一直阳光、热情、爱笑,网友完全没想到她会自杀。她的离世,令不少人开始了解“微笑型抑郁症”。
  • 吃“裸碳水”升糖快,不妨给它加层衣服
    2024-03-15
    你是否听说过“裸碳水”?它是由简单碳水化合物组成的食物,不含脂肪、蛋白或纤维,比如加工食品、糖果、白米饭及含糖汽水等。与全谷物豆类等复合碳水相比,它极易消化并导致血糖飙升,易导致肥胖、二型糖尿病或心脏病。Verywell网站发文称,目前有很多减肥策略要求低碳水,这会走入另一个极端。无论是裸碳水或是复合碳水,都会在体内转化成葡萄糖,这是大脑最青睐的热量来源,对大脑活动以及人体功能非常重要。来源 / unsplash不
  • 天津男篮主场胜四川 李荣培高难度跳投
    2024-03-15
    3月10日,天津先行者队球员李荣培(中)在比赛中投篮。新华社记者 赵子硕 摄当日,在2023-2024赛季中国男子篮球职业联赛(CBA)常规赛第41轮比赛中,天津先行者队主场113比93战胜四川金强队。3月10日,天津先行者队
  • 新疆男篮主场击败北控 阿不都沙拉木突破
    2024-03-15
    3月10日,新疆伊力特队球员阿不都沙拉木(中)在北京控股队球员刘晓宇(右)、陈国豪的夹击防守下突破上篮。新华社记者 胡虎虎 摄当日,在2023-2024赛季中国男子篮球职业联赛(CBA)常规赛第41轮比赛中,新疆伊力特
  • 辽宁本钢胜深圳马可波罗 韩德君篮下强吃
    2024-03-15
    3月12日,辽宁本钢队球员韩德君(左二)在比赛中上篮。新华社记者 潘昱龙 摄当日,在2023-2024赛季中国男子篮球职业联赛(CBA)常规赛第42轮比赛中,辽宁本钢队主场109比98战胜深圳马可波罗队。3月12日,深圳马可波罗队球员萨林杰(左)在比赛中拼抢篮板球。新华社记者 潘昱龙 摄3月12日,辽宁本钢队球员张镇麟(中)在比赛中上篮。新华社记者 潘昱龙 摄3月12日,辽宁本钢队球员张镇麟(左上)在比赛中投篮。新华社记者 潘昱龙 摄3
  • 《谢谢你温暖我》央八首播,流水账记事,故事性差,李兰迪演技好
    2024-03-15
    3月9日,电视剧《谢谢你温暖我》在央八单集首播,在腾讯视频5集更新。基于目前已经上线的剧情内容来讲,这部电视剧在叙事上,过分流水账了,显然不足以用故事性吸引观众。在演技方面,李兰迪确实是该剧的加分项。收视率方面,后续来讲,该剧成绩应该不会好。这部电视剧的剧情梗概已经提前把主线故事亮明了,男女主角谈恋爱之后,男主角生病了,女主角不离不弃照顾男主。这当然是一个很有价值的主线,男女朋友之间,夫妻之间,相濡