基于CPO逻辑,市场此前走出了包括剑桥科技、中际旭创、联特科技等大牛股。而国盛证券最新研报又挖掘出了一个新光通信细分LPO(线性驱动可插拨光模块),认为800G LPO是AI时代最具潜力的技术路线。
LPO是什么
LPO是光模块的封装形式,主要运用于高速光模块领域,就是通过线性直驱技术替换传统的DSP,实现系统降功耗、降延迟的优势,但系统误码率和传输距离有所牺牲,该技术适用于数据中心等短距离传输场景。LPO是可插拔模块向下演进的技术路线,主要用来实现降功耗;CPO也是演进的路线,但不是在可插拔光模块架构下,而是将光模块移到靠近交换机芯片,做到交换机设备里面。
LPO有什么优势
1)低功耗。LPO功耗相较可插拔光模块下降50%,与CPO接近。如下图显示采用Linear-drive方案后,硅光、VCSEL、薄膜铌酸锂功耗均下降50%左右。根据Macom的数据,具有DSP功能的800G多模光模块的功耗可超过13W,而利用MACOM PURE DRIVE技术的800G多模光模块功耗低于4W,下降70%。低功耗不仅节省电能,而且能够减少模块内组件的发热。
2)低延迟。去掉DSP芯片后,系统减少了对信号复原的时间,延迟大幅降低。DSP/重定时功能增加了延迟,以MACOM PURE DRIVE技术为例,因采用信号串行方案,LPO光模块可以做到皮秒级别的延迟时间。
3)低成本。DSP价格较高,400G光模块中,DSP的BOM成本约占20-40%;LPO的Driver和TIA里集成了EQ功能,成本会较DSP上浮少许,但LPO方案还是可以将光模块成本下降许多。
4)可热插拔。相比于CPO,LPO没有显著改变光模块的封装形式,采用可插拔模块,便于维护,并且可以充分利用现有的成熟技术。
半导体厂商Macom已发布LPO解决方案MACOM PURE DRIVE,与标准的DSP架构相比具有以下优势:
- 将光互连功耗降低50%以上;
- 最小化链路延迟,对机器学习和人工智能应用至关重要;
- 消除了成本高昂且冗余的信号重定时模块;
- 解决了独立的DSP芯片发热的问题;
- 简化了模块实现,具有更大的灵活性;
- 减少占地面积以满足空间受限的设计要求;
- 可扩展至1.6T速率。
LPO的应用
随着AI技术的发展,大模型、大数据、大算力日益成为AIGC应用的核心制约。大模型和数据集是AIGC发展的软件基础,而算力是最为重要的基础设施。AI以并行计算为主,核心处理器主要为GPU,但除了GPU性能外,通信因素也会成为制约超算的短板,只要有一条链路出现网络阻塞,就会产生数据延迟。因此,AI服务器对于底层数据传输速率和延时要求非常苛刻,需要高速率的光模块匹配,因此AI服务器对800G光模块的需求很大。
以英伟达DGX H100服务器为例,H100+NVLink Network+IB架构中,一个服务器对应5+4+4+5个连接外部的4xNVLink通道,即18个800G光口,36个800G,即一张H100在该架构下,用于显存互联的部分就需要4.5个800G光模块。
国盛证券表示,以上背景下,LPO技术是800G时代最具潜力的方案。随着DSP芯片由7nm制程向5nm制程演进,DSP芯片的设计、制造成本也水涨船高。而LPO方案在光模块中去掉DSP芯片,能够大幅降低功耗和延时,并具有成本优势,而其系统误码率和传输距离较短的缺陷,在AI计算中心短距离应用场景下也得到弥补。因此,LPO方案能够高度契合AI计算中心短距离、大带宽、低功耗、低延时的需求。
LPO有望2024年底量产
国盛证券表示,LPO作为一种新技术,预计2024年年底量产,LightCounting也预计业内将在2024年底首次部署LPO光模块。
目前新易盛、剑桥科技等已发布相关产品,中际旭创已有技术储备和产品开发,海信宽带推出800G线性互联光缆。高线性度的TIA、Driver芯片作为LPO技术的核心零部件,目前有Macom、Semtech、美信等主要供应商,博通也在推进相关产品研发。目前剑桥科技与Macom深入合作,且正在向微软供货高速光模块。
国盛证券认为,北美云厂商正在积极扩充算力资源,未来微软、Meta、AWS、谷歌都有可能逐步接受LPO方案。
值得注意的是,LPO方案需要和交换机进行配合,对光模块厂商在产业内上下游合作协同要求更高,龙头公司如中际旭创、新易盛将更加具备优势。
VCAI.CN 原创文章,转载请注明出处:https://vcai.cn/index.php/zhuti-20230518-lpo/