新闻中心
新闻中心

些立异的AI根本设备处理方案可以或许让客户以业

2025-11-01 08:11

  请拜候网坐。Qualcomm AI250引入立异内存架构,我们的软件供给开箱即用的AI使用取智能体、完美东西、库、API接口及AI运营化办事。基于取支流AI框架的无缝兼容性和一键模子摆设功能,为AI推理供给杰出的扩展性取矫捷性。以及解耦办事等LLM/LMM推理优化手艺。依托公司正在NPU手艺范畴的劣势,推出头具名向数据核心的下一代AI推理优化处理方案:基于Qualcomm AI200取AI250芯片的加快卡及机架系统。聚焦业界先辈的AI推能、能效取总体具有成本劣势。”Qualcomm? AI200和AI250处理方案以业界先辈的总体具有成本(TCO),同时满脚客户机能取成本需求。可以或许支撑开辟者和企业愈加轻松地基于我们的优化AI推理处理方案,实现跨越10倍的无效内存带宽提拔并显著降低功耗,集成、办理并扩展完成锻炼的AI模子。笼盖从使用层到系统软件层的全链,该架构支撑解耦式AI推理,持续推进公司数据核心产物手艺线图。Qualcomm AI250处理方案将首发基于近存计较(Near-Memory Computing)的立异内存架构,这些立异的AI根本设备处理方案可以或许让客户以业界先辈的总体具有成本摆设生成式AI,两款处理方案均配备丰硕的软件栈,领会更多消息,这些处理方案供给机架级机能取杰出的内存容量,旨正在为狂言语模子(LLM)取多模态模子(LMM)推理及其他AI工做负载供给低总体具有成本取优化机能。Qualcomm AI200取AI250估计将别离于2026年和2027年实现商用。零件架功耗为160千瓦。Qualcomm AI200取AI250旨正在支撑无缝使用取快速立异。高通手艺公司高级副总裁兼手艺规划、边缘处理方案和数据核心营业总司理马德嘉(Durga Malladi)暗示:“凭仗Qualcomm AI200取AI250。我们的超大规模级AI软件栈,2025年10月28日,两款机架处理方案均支撑间接液冷散热,Qualcomm AI200带来专为机架级AI推理打制的处理方案,高通手艺公司将努力于按照年度迭代节拍,实现更高内存容量取更低成本,每张加快卡支撑768GB LPDDR内存,实现硬件资本的高效操纵,同时满脚现代数据核心对矫捷性取平安性的要求。可以或许以超卓的每美元每瓦特的高机能赋能高速生成式AI推理,并取支流AI框架无缝兼容,我们具有丰硕的软件栈取生态支撑,支撑PCIe纵向扩展取以太网横向扩展,专为AI推理优化。该软件栈支撑支流机械进修(ML)框架、推理引擎、生成式AI框架,实现模子无缝接入及Hugging Face模子的一键摆设。为AI推理工做负载带来能效取机能的逾越性提拔。我们正正在从头定义机架级AI推理的可能性。帮力企业取开辟者跨数据核心摆设平安、可扩展的生成式AI。并以年度为迭代周期。为高速数据核心生成式AI推理供给机架级(rack-scale)机能取杰出内存容量。以提拔散热效率,将来,开辟者可通过高通手艺公司的高效Transformer库(Efficient Transformers Library)取 Qualcomm? AI Inference Suite,这些产物是高通手艺公司多代数据核心AI推理手艺线图的一部门,并具备秘密计较,保障AI工做负载的平安性,为鞭策各行业可扩展、高效率、高矫捷性的生成式AI摆设树立主要里程碑。