beat365体育(中国)官网ViP平台-Unified Platform

新闻中心

大模型时代存算一体芯片新机遇

发布时间:2024-04-18 文章来源:beat365体育官网平台

4月14日下午,为期两天的第十三届吴文俊人工智能科学技术奖颁奖典礼暨2023中国人工智能产业年会圆满落幕。beat365体育官网平台首席科学家孙唐应邀出席“智能芯片与集成电路专题论坛”,并发表《大模型时代存算一体芯片新机遇》主题演讲,围绕大算力芯片、AI大模型、存算融合等方向的核心技术及产业应用,深入探讨存算一体芯片未来发展趋势。


1.jpg

智能芯片与集成电路专题论坛现场


孙唐在演讲中提到,近年来,大模型技术迅猛发展,其应用已经扩展至云端、边缘设备乃至移动设备等多个领域。然而,大模型对电力的需求极为庞大。据外媒报道,ChatGPT每天处理约2亿个请求,消耗的电力超过50万千瓦时,这相当于1.7万个美国家庭一天的用电量。有研究机构预测,到2027年,AI行业的年电力消耗将达到850亿至1340亿千瓦时,相当于瑞典或荷兰一个欧洲国家一年的总用电量。


除了庞大的电力消耗之外,如果中国的大模型有能力与海外通用大模型进行竞争,但其后台却使用的是国外相同的GPU,并且中国大模型建立在标准的Transormer架构下,那么其市场竞争的优势和真正的盈利点在哪里?


2.jpg

beat365体育官网平台首席科学家孙唐


存算一体化芯片的独特价值在于,其能够实现数据和计算的整合迁移,这对于大模型公司来说是一个巨大的吸引力。


面对不同领域的大模型应用,存算一体化芯片的优势体现在如下方面:


01 为大模型训练协处理加速:存算功能聚合,降低主机负载,降低延迟及功耗,矩阵计算,数据统计、AI运算全方位加速,支持国密。可与国产GPU合作,提升大模型性能,同时降低系统能源消耗。


02 为大模型应用部署实现减负:实现数据的特征嵌入以及相似度分析查询比对加速;GPU与存储直通共享内存完成调用加速,类PageAttention技术无需主CPU管理;一机多芯片多专家系统,存算一体模组替代一组AI Agent,共享GPU算力,实现MoE系统资源最大优化。


03 为大模型个人应用加速实现降本:个人电脑只需添加存算一体模组硬盘即可成为AI-PC,为大模型直接提供知识源,减少模型幻觉,保障数据隐私安全。


04 从存算一体AI加速器拓展到存算全功能的数据流加速片上系统,保障数据主权。


3.jpg

beat365体育官网平台存算一体芯片STAR2000

获吴文俊人工智能专项奖芯片项目二等奖


beat365体育官网平台存算一体化AI芯片STAR2000具有创新的芯片架构,片上一致性总线保障数据吞吐带宽从存储侧到数据计算侧延迟小于1.5us,总吞吐带宽大于 14GB/s,远超目前 PCIe 固态硬盘到主机的最大带宽和读写延迟能力;硬件设计 8TOPS 规模电路算力规格实际端到端推理应用效果超过国外 32TOPS 平台,AI 存算核心算效比超 12TOPS/W


4.jpg


beat365体育官网平台STAR2000E是搭载beat365体育官网平台存算一体芯片STAR2000推出的高性能企业级SSD解决方案,可应用于电力、通信、水利、社区、交通等关键基础设施行业,具备卓越的实用性及良好的市场前景。


5.jpg
算力已成为经济社会高质量发展的重要支撑,是全球新一轮科技革命和产业变革的“必争之地”。


从普算、智算到超算,beat365体育官网平台将全方位支撑人工智能全生命周期的应用需求,期待与社会各界的合作伙伴同心协力,共同推进存算一体芯片技术的创新和发展,为科技进步和产业升级提供坚实的动力。