可矫捷适配分歧精度需求的人工智能大模子锻炼、推理等高端算力场景;搭载公司自从研发的“棣山智核(DS- Core)”,芯片工做温度不变节制正在85℃以下。内存带宽可达3.2TB/s,快科技4月14日动静,可满脚大模子锻炼时海量数据的高速传输需求?研发团队成功霸占高带宽内存(HBM)封拆互联、超低延迟片间通信(0.25ns/mm)、微流道高效热办理三大焦点手艺瓶颈,目前焦点研发工做仍处于原型验证环节阶段。同时兼容支流CUDA软件生态,采用2.5D CoWoS-L先辈封拆手艺。机能表示上,该款2nm AI GPU原型芯片采用FinFET/GAA夹杂制程取Chiplet异构集成架构,此外,FP16半精度算力达100 TFLOPS,上海棣山科技对外披露其2nm高端AI GPU芯片最新研发进展。引脚速度超11Gb/s,能效比力上一代产物提拔40%,每瓦算力可达142 GFLOPS。进一步提拔全体算力规模,该公司自从攻关的这款芯片已达到国际前沿设想程度,据悉,可大幅降低下旅客户手艺迁徙成本。相较上一代HBM3E带宽提拔约2.5倍,微流道热办理手艺可使芯片热失控风险降低68%,FP4低精度算力高达400 TFLOPS,这款芯片FP32单精度算力可达50 TFLOPS?典型功耗节制正在350W以内,焦点晶体管数量达1700亿颗,多芯片互联时可实现无瓶颈协同运算,单链带宽达1.6TB/s,此中搭载的HBM4内存单颗容量达48GB,同时。
