???????????????????????????????????????
????????????????
???????????????????
????????????????
????????????????
???????????????????????????????????????????????????????????????????????????????????????????????????
??????????????????????????????????
????????????????
????????????????
???????????????????????????????????
???????????????
??????????????????????????????????????
近年(nian)來,在人工智(zhi)能(neng)計(ji)算(suan)需(xu)求不(bu)斷(duan)增長(zhang)的推動(dong)下,對GPU和(he)其他計(ji)算(suan)硬件(jian)的(de)需求急(ji)劇(ju)飆(biao)升。僅今年(nian)一年(nian),英(ying)偉達(da)的股(gu)價就(jiu)上(shang)漲(zhang)了(le)200%以(yi)上,這(zhe)一點顯(xian)而易(yi)見(jian)。此外,由(you)于數據(ju)中(zhong)心的人工智能(neng)訓練需(xu)要(yao)高速數(shu)據傳(chuan)輸,對(dui)人工智(zhi)能(neng)服務(wu)器集群(qun)的需(xu)求也急(ji)劇(ju)上(shang)升(sheng)。隨著(zhe)數(shu)據中(zhong)心基礎設施(shi)的(de)不斷(duan)擴(kuo)大(da),光(guang)模(mo)塊(kuai)的使用(yong)量(liang)呈指(zhi)數(shu)級(ji)增(zeng)長(zhang)。目前,200G和(he)400G光(guang)模塊(kuai)已經(jing)大規模(mo)部(bu)署,800G光(guang)模(mo)塊(kuai)已(yi)經(jing)開(kai)始(shi)進入量(liang)產和引(yin)進(jin)階段(duan)。
為什么需要800G光模(mo)塊(kuai)?
數(shu)據(ju)中心內(nei)的數據傳(chuan)輸(shu)主(zhu)要(yao)分為(wei)南北流(liu)量(liang)和東西(xi)流(liu)量(liang)兩(liang)個(ge)方(fang)向(xiang)。南北(bei)向流量(liang)是(shi)指數據中心(xin)外(wai)用戶(hu)與(yu)內部服(fu)務(wu)器之間(jian)的(de)數(shu)據(ju)傳(chuan)輸(shu),東(dong)西(xi)向(xiang)流(liu)量(liang)是(shi)指(zhi)數(shu)據(ju)中心之(zhi)間(jian)以及數據中(zhong)心內(nei)服務(wu)器(qi)之間的(de)數(shu)據(ju)傳(chuan)輸。隨(sui)著(zhe)ChatGPT引(yin)爆(bao)的(de)AI大模型(xing)市場,數(shu)據中(zhong)心的(de)東西(xi)流(liu)量(liang)和(he)內部(bu)服務器(qi)流(liu)量比例增加。
更(geng)新(xin)數據中心拓(tuo)撲結構
數(shu)據(ju)中心(xin)計(ji)算規模和東西向(xiang)流(liu)量(liang)不斷(duan)擴(kuo)大,數(shu)據中心網(wang)絡架構(gou)也在不(bu)斷(duan)變化。在(zai)傳(chuan)統的(de)三(san)層(ceng)拓撲結(jie)構中,服(fu)務(wu)器(qi)之(zhi)間(jian)的(de)數(shu)據(ju)交換(huan)需(xu)要(yao)經(jing)過接入(ru)交(jiao)換機、匯聚交(jiao)換機(ji)和核(he)心(xin)交換(huan)機(ji)。這(zhe)給(gei)匯(hui)聚交(jiao)換(huan)機和核心交(jiao)換機帶來(lai)了巨(ju)大的(de)工(gong)作壓(ya)力(li)。
三層拓(tuo)撲:如(ru)果采用(yong)傳(chuan)統(tong)的(de)三層拓(tuo)撲(pu),進一(yi)步(bu)擴(kuo)大(da)服(fu)務器集群的(de)規(gui)模,則需(xu)要(yao)在(zai)核心層和匯(hui)聚(ju)層(ceng)部署(shu)高(gao)性能設備(bei),設(she)備(bei)成本將大幅(fu)增加(jia)。兩層(ceng)Spine-Leaf拓(tuo)撲(pu):Leaf-Spine拓撲將(jiang)傳統(tong)的三(san)層(ceng)架構扁(bian)平(ping)化為兩(liang)層架構(gou)。在(zai)這種(zhong)設置(zhi)中(zhong),葉(ye)子交換(huan)機(ji)(類似于(yu)傳統(tong)三(san)層(ceng)架(jia)構(gou)中(zhong)的訪(fang)問(wen)層(ceng)交(jiao)換(huan)機)直接連(lian)接到服(fu)務(wu)器。骨干交換(huan)機(ji),相(xiang)當(dang)于核心(xin)層(ceng)交(jiao)換機,直接(jie)連接(jie)到葉(ye)交換機(ji),每個(ge)骨干交(jiao)換機連(lian)接到(dao)所有葉(ye)交(jiao)換機(ji)。
AI計算(suan)和(he)800G光(guang)模塊
與傳(chuan)統的三層(ceng)拓(tuo)撲(pu)結構(gou)相(xiang)比(bi),脊(ji)葉結(jie)構需(xu)要(yao)大量(liang)的端口。因(yin)此,無論是(shi)服(fu)務(wu)器還(hai)是(shi)交換機,都需要(yao)更多的光模(mo)塊(kuai)來進行光(guang)纖(xian)通信(xin)。對(dui)于使用gpu的廣泛AI訓練(lian)應(ying)用(yong),在NVIDIA的(de)DGX H100服(fu)務(wu)器(qi)中,集(ji)成了(le)8個(ge)H100 gpu,對(dui)計算(suan)和(he)存儲(chu)網(wang)絡的(de)需(xu)求相(xiang)當于大約12個800G光模塊和18個(ge)400G光模(mo)塊。更多(duo)信息(xi)可以在(zai)這篇文(wen)章中找到(dao):NVIDIA DGX H100簡(jian)介(jie)。這表明在(zai)葉脊(ji)架構下,數(shu)據(ju)中心(xin)對高速光模(mo)塊(kuai)的(de)需求(qiu)呈指(zhi)數級(ji)增長。隨著數(shu)據(ju)中(zhong)心規(gui)模的擴(kuo)大,特別(bie)是(shi)對AI大(da)型(xing)模(mo)型(xing)訓(xun)練的(de)需(xu)求(qiu),以及GPU服務(wu)器(qi)對(dui)更高傳輸(shu)速率(lv)的(de)需(xu)求增(zeng)加(jia),800G光(guang)模(mo)塊(kuai)的采(cai)用速(su)度正在(zai)加快(kuai)。
加速部署800G光(guang)模(mo)塊(kuai)
在人工智能計算進(jin)步(bu)的背(bei)景下(xia),800G模(mo)塊的需(xu)求正在(zai)穩步上(shang)升(sheng),全球(qiu)領(ling)先(xian)的(de)制(zhi)造商(shang)加大(da)了部署力度。例如(ru),星際(ji)光(guang)學(xue)公司已(yi)經(jing)在2023年上(shang)半(ban)年開始增加(jia)800G光(guang)模(mo)塊(kuai)的(de)生(sheng)產(chan),與gpu匹(pi)配(pei)的(de)800G產品一起(qi)穩(wen)定(ding)地向(xiang)海(hai)外主要客戶交(jiao)付(fu)。在OFC 2023上(shang),海信(xin)寬帶推(tui)出(chu)了(le)業界首款(kuan)800G QSFP-DD BiDi SR4.2光模塊(kuai)產(chan)品(pin),并展(zhan)示(shi)了800G QSFP-DD SR8、800G OSFP SR8、800G OSFP 2xFR4/DR8、800G QSFP-DD 2xFR4/DR8等基(ji)于(yu)PAM4信(xin)令(ling)的800G系列光(guang)模塊(kuai)產(chan)品(pin),展示(shi)了(le)全(quan)面的(de)產(chan)品系列(lie)。
總(zong)結
隨著(zhe)GPU訂(ding)單驅動(dong)需求的(de)確(que)定(ding)性,800G光模(mo)塊的批(pi)量出貨(huo)階(jie)段(duan)將(jiang)從今(jin)年下(xia)半(ban)年(nian)開始(shi)。800G光(guang)模(mo)塊(kuai)作為(wei)人工(gong)智能計算(suan)能力的(de)重(zhong)要(yao)一環,在數(shu)據中心規模(mo)不(bu)斷(duan)擴(kuo)大(da)和人(ren)工(gong)智(zhi)能(neng)培(pei)訓需(xu)求持續增(zeng)長(zhang)的推(tui)動(dong)下(xia),市場增長和(he)部署速(su)度(du)將(jiang)加快。
???????????????????????????????????????
???????????????????
????????????????
???????????????????
????????????????
????????????????
???????????????????????????????????????????????????????????????????????????????????????????????????
??????????????????????????????????
????????????????
????????????????
???????????????????????????????????
???????????????
????????????????????
??????????????????????????????????????