12月7日,谷歌发布了规模最大、功能最强的AI大模型Gemini。Gemini是基于Transformer decoder构建的多模态模型,这种技术能够处理视频、音频和文本等不同内容形式的信息,能够进行更复杂的推理、理解更加细微的信息(ChatGPT只能读取和输出文字和语音)。Gemini由谷歌TPU V5e和TPU V4训练,并在训练过程中展现出工程化创新,如将4096个TPU V4每个芯片连接到一个专用的光学交换机,可以在大约10秒内动态重新配置4x4x4芯片立方体为任意的3D环形拓扑结构的超级节点。在交换机层面,谷歌使用OCS光交换,来满足可灵活配置的AI算力的需求,这主要是光子在超大型AI超算架构下具有明显的优势。光交换系统组成部件有望迎来新产业机会。
注:TPU(Tensor Processing Unit, 张量处理器),谷歌专门为加速深层神经网络运算能力而研发的一款芯片。
一、光交换的基本原理
大多数网络设备是基于电域的信号进行处理,光域的信号先转换为电域的信号,然后进行放大、再生或交换,最后重新转换为光域的信号,即“光-电-光”转换,是传输中的重大瓶颈。光交换技术是通过替换现有的进行“光-电-光”转换的网络,实现更高效的光域的信息传输。光交换的优势非常明显:
- 光域的交换成本更低,不需要大量昂贵的高速电子产品,能有效降低通信硬件成本。
- 消除“光-电-光”及相关控制的复杂性,同时可以使交换设备的体积更小、功耗更低。
光交换机制一般有:光电路交换(Optical Circuit Switching, OCS),光突发交换(Optical Burst Switching, OBS)和光分组交换(Optical Packet Switching, OPS)。
光电路交换OCS是目前最成熟的交换机制:在OCS中,网络需要为每一个连接请求建立从源端到目的地端的光路;每一条光域的链路上均需要分配一个专门的波长用于发送数据信息。OCS无需“光-电-光”的转换过程,其交换机制分为三个阶段:1)光链路建立阶段是双向的带宽申请过程,需要经过请求与应答确认两个处理过程;2)光链路保持阶段,链路始终被通信占用,不允许其他通信方共享该链路;3)光链路拆除阶段,任意通信一方首先发出断开信号,另一方收到断开信号后进行确认,链路的资源就被真正释放。光交换技术除了应用于网络架构的全光互连,未可能用在光学计算、量子计算、量子通信等领域。
二、谷歌OCS的优缺点
交换机从传统电交换机升级到OCS光交换机,其优势如下:
- OCS降低了光模块对交换芯片的依存度,即使带宽从100G升级到800G甚至直到1.6T及更高,OCS方案均可兼容,加速高阶网络的演进。
- OCS可以解决集群灵活配置、扩容、灾备、并行等需求,多波长和速率兼容。
- 改变传统的数据中心spine-leaf结构结构,直接通过MEMS光开关进行不同服务器之间的数据传输,减少通过传统电网络交换机(EPS)在数据交换时光电转换的开销。
- 芯片和光模块等器件迭代升级加速,传统架构的交换机无法兼容多个不同代际的设备,不断更新造成CAPEX高企。通过OCS交换机,长期看节省费用(目前OCS交换机价格相对较高)。
三、OCS相关产业链
谷歌OCS本质是用MEMS系统的阵列组反射实现光信号交换,取代原有光电混合交换机体系,其成本占整个TPU超算系统的5%。OCS光交换系统主要组成部件有MEMS振镜、850nm光源、摄像头模组、2D透镜阵列、环形器、波分光模块、滤波片等,受益的主要环节包括:
- MEMS振镜。22年全球市场规模约7.9亿美元,核心厂商包括DiCon Fiberoptics、Accelink 和 II-VI Incorporated等,前五大厂商占有全球约54%的份额。国内上市的企业有光迅科技,未上市的企业有亿源通、光隆科技、格致光电等。
- 光进铜退、全光网络、全光计算,需要大量特种有源光纤代替直连电缆。22年全球市场规模约21.2亿美元,国内主要企业有太辰光、博创科技。
- 波分开关WSS,全球市场规模约9.97亿美元,国内主要企业包括腾景科技、光迅科技、博创科技、天孚通信、太辰光。
- 光纤环形器,国内企业包括横店东磁、亿源通等。
VCAI.CN 原创文章,转载请注明出处:https://vcai.cn/index.php/zhuti-20231212-ocs/