IT之家 12 月 23 日消息,华为数据存储与中科弘云今日发布了 AI 推理加速联合解决方案。
该方案以华为 OceanStor A 系列存储为数据底座,结合中科弘云智算互联网云服务平台 HyperCN 平台,优化长序列推理体验。
该方案深度融合华为 OceanStor A 系列存储、华为 UCM 推理记忆数据管理技术以及中科弘云 HyperCN 平台能力,通过 KV Cache 多级缓存管理、秒级算力调度、分钟级推理大模型部署及全流程 AI 工具链,将智能算力输送至业务一线。该联合方案的核心优势如下:
经实测,在智能问答的典型推理场景中,该方案实现首 Token 时延(TTFT)降低 57.5%,且序列长度越长,优化效果越显著;在长文档推理场景中,结合 GSA 稀疏加速算法,当序列长度为 39K 时,并发能力提升 86%,推理吞吐提升 36%,提升推理效率与体验。
IT之家从合作公告获悉,该联合方案目前已在能源电力、智能制造、国家实验室等关键行业启动试点应用。