国产chinesehdxxxx老太婆,办公室玩弄爆乳女秘hd,扒开腿狂躁女人爽出白浆 ,丁香婷婷激情俺也去俺来也,ww国产内射精品后入国产

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

智能計(jì)算中心規(guī)劃建設(shè)指南

架構(gòu)師技術(shù)聯(lián)盟 ? 來源:智算中心網(wǎng)絡(luò)架構(gòu)白皮書 ? 2023-08-09 09:49 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

傳統(tǒng)的云數(shù)據(jù)中心網(wǎng)絡(luò)一般是基于對(duì)外提供服務(wù)的流量模型而設(shè)計(jì)的,流量主要是從數(shù)據(jù)中心到最終客戶,即以南北向流量為主,云內(nèi)部東西向流量為輔。承載 VPC 網(wǎng)絡(luò)的底層物理網(wǎng)絡(luò)架構(gòu),對(duì)于承載智算業(yè)務(wù)存在如下挑戰(zhàn)。

本文選自“智算中心網(wǎng)絡(luò)架構(gòu)白皮書(2023)”“智能計(jì)算中心規(guī)劃建設(shè)指南”,對(duì)傳統(tǒng)網(wǎng)絡(luò)與智算網(wǎng)絡(luò)、兩層胖樹、三次胖樹及全面的分析對(duì)比,并介紹了組網(wǎng)最佳實(shí)踐。

有阻塞網(wǎng)絡(luò):考慮到并非所有服務(wù)器都會(huì)同時(shí)對(duì)外產(chǎn)生流量,為了控制網(wǎng)絡(luò)建設(shè)成本, Leaf 交換機(jī)的下聯(lián)帶寬和上聯(lián)帶寬并非按照 1:1 設(shè)計(jì),而是存在收斂比。一般上聯(lián)帶寬僅有下聯(lián)帶寬的三分之一。

云內(nèi)部流量時(shí)延相對(duì)較高:跨 Leaf 交換機(jī)的兩臺(tái)服務(wù)器互訪需要經(jīng)過 Spine 交換機(jī),轉(zhuǎn)發(fā)路徑有 3 跳。

帶寬不夠大:一般情況下單物理機(jī)只有一張網(wǎng)卡接入 VPC 網(wǎng)絡(luò),單張網(wǎng)卡的帶寬比較有限,當(dāng)前較大范圍商用的網(wǎng)卡帶寬一般都不大于 200Gbps。

對(duì)于智算場(chǎng)景,當(dāng)前比較好的實(shí)踐是獨(dú)立建一張高性能網(wǎng)絡(luò)來承載智算業(yè)務(wù),滿足大帶寬,低時(shí)延,無損的需求。

大帶寬的設(shè)計(jì)

智算服務(wù)器可以滿配 8 張 GPU 卡,并預(yù)留 8 個(gè) PCIe 網(wǎng)卡插槽。在多機(jī)組建 GPU 集群時(shí),兩個(gè) GPU 跨機(jī)互通的突發(fā)帶寬有可能會(huì)大于 50Gbps。因此,一般會(huì)給每個(gè) GPU 關(guān)聯(lián)一個(gè)至少 100Gbps 的網(wǎng)絡(luò)端口。在這種場(chǎng)景下可以配置 4張 2*100Gbps 的網(wǎng)卡,也可以配置 8 張 1*100Gbps 的網(wǎng)卡,當(dāng)然也可以配置 8 張單端口 200/400Gbps 的網(wǎng)卡。

7fed62ee-3643-11ee-9e74-dac502259ad0.png

無阻塞設(shè)計(jì)

無阻塞網(wǎng)絡(luò)設(shè)計(jì)的關(guān)鍵是采用 Fat-Tree(胖樹)網(wǎng)絡(luò)架構(gòu)。交換機(jī)下聯(lián)和上聯(lián)帶寬采用 1:1 無收斂設(shè)計(jì),即如果下聯(lián)有64 個(gè) 100Gbps 的端口,那么上聯(lián)也有 64 個(gè) 100Gbps 的端口。

此外交換機(jī)要采用無阻塞轉(zhuǎn)發(fā)的數(shù)據(jù)中心級(jí)交換機(jī)。當(dāng)前市場(chǎng)上主流的數(shù)據(jù)中心交換機(jī)一般都能提供全端口無阻塞的轉(zhuǎn)發(fā)能力。

低時(shí)延設(shè)計(jì) AI-Pool

在低時(shí)延網(wǎng)絡(luò)架構(gòu)設(shè)計(jì)方面,百度智能云實(shí)踐和落地了基于導(dǎo)軌(Rail)優(yōu)化的AI-Pool 網(wǎng)絡(luò)方案。在這個(gè)網(wǎng)絡(luò)方案中,8 個(gè)接入交換機(jī)為一組,構(gòu)成一個(gè) AI-Pool。以兩層交換機(jī)組網(wǎng)架構(gòu)為例,這種網(wǎng)絡(luò)架構(gòu)能做到同 AI-Pool 的不同智算節(jié)點(diǎn)的 GPU 互訪僅需一跳。

在 AI-Pool 網(wǎng)絡(luò)架構(gòu)中,不同智算節(jié)點(diǎn)間相同編號(hào)的網(wǎng)口需要連接到同一臺(tái)交換機(jī)。如智算節(jié)點(diǎn) 1 的 1 號(hào) RDMA 網(wǎng)口,智算節(jié)點(diǎn) 2 的 1 號(hào) RDMA 網(wǎng)口直到智算節(jié)點(diǎn) P/2 的 1 號(hào) RDMA 網(wǎng)口都連到 1 號(hào)交換機(jī)。

在智算節(jié)點(diǎn)內(nèi)部,上層通信庫基于機(jī)內(nèi)網(wǎng)絡(luò)拓?fù)溥M(jìn)行網(wǎng)絡(luò)匹配,讓相同編號(hào)的 GPU 卡和相同編號(hào)的網(wǎng)口關(guān)聯(lián)。這樣相同GPU 編號(hào)的兩臺(tái)智算節(jié)點(diǎn)間僅一跳就可互通。

不同GPU編號(hào)的智算節(jié)點(diǎn)間,借助NCCL通信庫中的Rail Local技術(shù),可以充分利用主機(jī)內(nèi)GPU間的NVSwitch的帶寬,將多機(jī)間的跨卡號(hào)互通轉(zhuǎn)換為跨機(jī)間的同GPU卡號(hào)的互通。

80098bcc-3643-11ee-9e74-dac502259ad0.png

對(duì)于跨 AI-Pool 的兩臺(tái)物理機(jī)的互通,需要過匯聚交換機(jī),此時(shí)會(huì)有 3 跳。

80232d2a-3643-11ee-9e74-dac502259ad0.png

網(wǎng)絡(luò)可承載的 GPU 卡的規(guī)模和所采用交換機(jī)的端口密度、網(wǎng)絡(luò)架構(gòu)相關(guān)。網(wǎng)絡(luò)的層次多,承載的 GPU 卡的規(guī)模會(huì)變大,但轉(zhuǎn)發(fā)的跳數(shù)和時(shí)延也會(huì)變大,需要結(jié)合實(shí)際業(yè)務(wù)情況進(jìn)行權(quán)衡。

兩層胖樹架構(gòu)

8 臺(tái)接入交換機(jī)組成一個(gè)智算資源池 AI-Pool。圖中 P 代表單臺(tái)交換機(jī)的端口數(shù)。單臺(tái)交換機(jī)最大可下聯(lián)和上聯(lián)的端口為P/2 個(gè),即單臺(tái)交換機(jī)最多可以下聯(lián) P/2 臺(tái)服務(wù)器和 P/2 臺(tái)交換機(jī)。兩層胖樹網(wǎng)絡(luò)可以接入 P*P/2 張 GPU 卡。

80557eb0-3643-11ee-9e74-dac502259ad0.png

三層胖樹架構(gòu)

三層網(wǎng)絡(luò)架構(gòu)中會(huì)新增匯聚交換機(jī)組和核心交換機(jī)組。每個(gè)組里面的最大交換機(jī)數(shù)量為 P/2。匯聚交換機(jī)組最大數(shù)量為 8,核心交換機(jī)組的最大數(shù)量為 P/2。三層胖樹網(wǎng)絡(luò)可以接入 P*(P/2)*(P/2)=P*P*P/4 張 GPU 卡。

在三層胖樹組網(wǎng)中,InfiniBand 的 40 端口的 200Gbps HDR 交換機(jī)能容納的最多 GPU 數(shù)量是 16000。這個(gè) 16000GPU 卡的規(guī)模也是目前 InfiniBand 當(dāng)前在國內(nèi)實(shí)際應(yīng)用的 GPU 集群的最大規(guī)模網(wǎng)絡(luò),當(dāng)前這個(gè)記錄被百度保持。

8082aa66-3643-11ee-9e74-dac502259ad0.png

兩層和三層胖樹網(wǎng)絡(luò)架構(gòu)的對(duì)比

可容納的 GPU 卡的規(guī)模

兩層胖樹和三層胖樹最重要的區(qū)別是可以容納的 GPU 卡的規(guī)模不同。在下圖中 N 代表 GPU 卡的規(guī)模,P 代表單臺(tái)交換機(jī)的端口數(shù)量。比如對(duì)于端口數(shù)為 40 的交換機(jī),兩層胖樹架構(gòu)可容納的 GPU 卡的數(shù)量是 800 卡,三層胖樹架構(gòu)可容納的 GPU 卡的數(shù)量是 16000 卡。

80cbbf12-3643-11ee-9e74-dac502259ad0.png

轉(zhuǎn)發(fā)路徑

兩層胖樹和三層胖樹網(wǎng)絡(luò)架構(gòu)另外一個(gè)區(qū)別是任意兩個(gè)節(jié)點(diǎn)的網(wǎng)絡(luò)轉(zhuǎn)發(fā)路徑的跳數(shù)不同。

對(duì)于同智算資源池 AI-Pool 的兩層胖樹架構(gòu),智算節(jié)點(diǎn)間同 GPU 卡號(hào)轉(zhuǎn)發(fā)跳數(shù)為 1 跳。智算節(jié)點(diǎn)間不同 GPU 卡號(hào)在沒有做智算節(jié)點(diǎn)內(nèi)部 Rail Local 優(yōu)化的情況下轉(zhuǎn)發(fā)跳數(shù)為 3 跳。

對(duì)于同智算資源池 AI-Pool 的三層胖樹架構(gòu),智算節(jié)點(diǎn)間同 GPU 卡號(hào)轉(zhuǎn)發(fā)跳數(shù)為 3 跳。智算節(jié)點(diǎn)間不同 GPU 卡號(hào)在沒有做智算節(jié)點(diǎn)內(nèi)部 Rail Local 優(yōu)化的情況下轉(zhuǎn)發(fā)跳數(shù)為 5 跳。

80ecb71c-3643-11ee-9e74-dac502259ad0.png

典型實(shí)踐

不同型號(hào)的 InfiniBand/RoCE 交換機(jī)和不同的網(wǎng)絡(luò)架構(gòu)下所支持的 GPU 的規(guī)模不同。結(jié)合當(dāng)前已成熟商用的交換機(jī),我們推薦幾種物理網(wǎng)絡(luò)架構(gòu)的規(guī)格供客戶選擇。

Regular:InfiniBand 兩層胖樹網(wǎng)絡(luò)架構(gòu),基于 InfiniBand HDR 交換機(jī),單集群最大支持 800 張 GPU 卡。

Large:RoCE 兩層胖樹網(wǎng)絡(luò)架構(gòu),基于 128 端口 100G 數(shù)據(jù)中心以太交換機(jī),單集群最大支持 8192 張 GPU 卡。

XLarge:InfiniBand 三層胖樹網(wǎng)絡(luò)架構(gòu),基于 InfiniBand HDR 交換機(jī),單集群最大支持 16000 張 GPU 卡。

XXLarge:基于 InfiniBand Quantum-2 交換機(jī)或同等性能的以太網(wǎng)數(shù)據(jù)中心交換機(jī),采用三層胖樹網(wǎng)絡(luò)架構(gòu),單集群最大支持 100000 張 GPU 卡。

810b9466-3643-11ee-9e74-dac502259ad0.png

Large智算物理網(wǎng)絡(luò)架構(gòu)實(shí)踐

支撐上層創(chuàng)新應(yīng)用和算法落地的關(guān)鍵環(huán)節(jié)之一是底層的算力,而支撐智算集群的算力發(fā)揮其最大效用的關(guān)鍵之一是高性能網(wǎng)絡(luò)。度小滿的單個(gè)智算集群的規(guī)??蛇_(dá) 8192 張 GPU 卡,在每個(gè)智算集群內(nèi)部的智算資源池 AI-Pool 中可支持 512張 GPU 卡。通過無阻塞、低時(shí)延、高可靠的網(wǎng)絡(luò)設(shè)計(jì),高效的支撐了上層智算應(yīng)用的快速迭代和發(fā)展。

XLarge智算物理網(wǎng)絡(luò)架構(gòu)實(shí)踐

為了實(shí)現(xiàn)更高的集群運(yùn)行性能,百度智能云專門設(shè)計(jì)了適用于超大規(guī)模集群的 InfiniBand 網(wǎng)絡(luò)架構(gòu)。該網(wǎng)絡(luò)已穩(wěn)定運(yùn)行多年,2021 年建設(shè)之初就直接采用了 200Gbps 的 InfiniBand HDR 交換機(jī),單臺(tái) GPU 服務(wù)器的對(duì)外通信帶寬為1.6Tbps。

責(zé)任編輯:彭菁

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 帶寬
    +關(guān)注

    關(guān)注

    3

    文章

    994

    瀏覽量

    42190
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    13

    文章

    9795

    瀏覽量

    88001
  • 交換機(jī)
    +關(guān)注

    關(guān)注

    22

    文章

    2747

    瀏覽量

    101930
  • 數(shù)據(jù)中心
    +關(guān)注

    關(guān)注

    16

    文章

    5230

    瀏覽量

    73529
  • 智能計(jì)算
    +關(guān)注

    關(guān)注

    0

    文章

    191

    瀏覽量

    16722

原文標(biāo)題:智算中心網(wǎng)絡(luò)架構(gòu)設(shè)計(jì)實(shí)踐(2023)

文章出處:【微信號(hào):架構(gòu)師技術(shù)聯(lián)盟,微信公眾號(hào):架構(gòu)師技術(shù)聯(lián)盟】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    多個(gè)城市人工智能計(jì)算中心陸續(xù)上線

    開發(fā)、模型訓(xùn)練和模型推理等場(chǎng)景,提供從底層芯片算力釋放到頂層應(yīng)用使能的人工智能全棧能力。 ? 當(dāng)前,采用集約化方式建設(shè)公共算力已形成廣泛共識(shí),全國有20多個(gè)城市正在建設(shè)或準(zhǔn)備建設(shè)人工
    的頭像 發(fā)表于 06-01 00:01 ?3828次閱讀

    智算中心網(wǎng)絡(luò)架構(gòu)選型原則

    ? 通常,在在AI智算系統(tǒng)中,一個(gè)模型從生產(chǎn)到應(yīng)用,一般包括離線訓(xùn)練和推理部署兩大階段;本文選自“ 智算中心網(wǎng)絡(luò)架構(gòu)白皮書(2023) ”“ 智能計(jì)算中心規(guī)劃
    的頭像 發(fā)表于 08-07 09:13 ?3332次閱讀

    基建狂魔又一大工程,智算中心

    AI時(shí)代下的新型基礎(chǔ)設(shè)施。而專注在AI算力上這一點(diǎn),也讓其有別于超算中心和云數(shù)據(jù)中心。 ? 2020年4月,國家發(fā)改委也聯(lián)合浪潮,對(duì)這一新型基礎(chǔ)設(shè)施發(fā)布了《智能計(jì)算中心
    的頭像 發(fā)表于 09-08 09:23 ?4970次閱讀

    【亞派·資訊】電力發(fā)展“十三五”規(guī)劃:推進(jìn)“互聯(lián)網(wǎng)+”智能電網(wǎng)建設(shè)

    接納和優(yōu)化配置多種能源的能力,滿足多元用戶供需互動(dòng)。全面建設(shè)智能變電站。全面推廣智能調(diào)度控制系統(tǒng),應(yīng)用大數(shù)據(jù)、云計(jì)算、物聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)技術(shù),提升信息平臺(tái)承載能力和業(yè)務(wù)應(yīng)用水平。
    發(fā)表于 08-29 15:35

    臺(tái)灣將建設(shè)計(jì)算中心并成立公司

    臺(tái)灣將建設(shè)計(jì)算中心并成立公 臺(tái)灣將建設(shè)計(jì)算中心并成立公司
    發(fā)表于 01-26 17:03 ?896次閱讀

    曙光聯(lián)手北京計(jì)算中心 打造云計(jì)算聯(lián)合實(shí)驗(yàn)室

    近日,國內(nèi)知名服務(wù)器廠商曙光公司與國內(nèi)最大的工業(yè)云計(jì)算中心北京市計(jì)算中心對(duì)外宣布共同聯(lián)手建設(shè)"北京市計(jì)算中心曙光 云計(jì)算聯(lián)合實(shí)驗(yàn)室"(以下簡(jiǎn)
    發(fā)表于 01-04 15:50 ?1016次閱讀

    站在風(fēng)口 本土AI智能計(jì)算中心蓄勢(shì)待發(fā)

    作為全國領(lǐng)先的智能計(jì)算中心,“灃東新城智能計(jì)算中心”于6月正式發(fā)布了AI開放創(chuàng)新平臺(tái)——灃云平臺(tái),平臺(tái)現(xiàn)已上線并開放免費(fèi)公測(cè),用戶注冊(cè)、登錄后即可進(jìn)行AI
    發(fā)表于 07-31 11:30 ?750次閱讀

    武漢人工智能計(jì)算中心項(xiàng)目正式啟動(dòng)建設(shè)

    中國科學(xué)技術(shù)信息研究所黨委書記、科技部新一代人工智能發(fā)展研究中心趙志耘主任表示:“人工智能計(jì)算中心未來將是一個(gè)非常重要的基礎(chǔ)設(shè)施。發(fā)布白皮書的目的是在‘政產(chǎn)學(xué)研用’各個(gè)方面起到推動(dòng)作用
    的頭像 發(fā)表于 10-30 14:59 ?2119次閱讀

    深扒北京超級(jí)云計(jì)算中心背后的故事

    據(jù)了解,北京超級(jí)云計(jì)算中心成立于2011年,依托中國科學(xué)院計(jì)算機(jī)網(wǎng)絡(luò)信息中心建立,由北京北龍超級(jí)云計(jì)算有限責(zé)任公司負(fù)責(zé)運(yùn)營(yíng),是懷柔科學(xué)城北京市人民政府與中國科學(xué)院共同
    的頭像 發(fā)表于 12-21 15:39 ?5629次閱讀

    許昌市政府與華為共同建設(shè)中原人工智能計(jì)算中心

    集微網(wǎng)消息,據(jù)河南日?qǐng)?bào)報(bào)道,1月30日,許昌市政府與華為公司簽署戰(zhàn)略合作協(xié)議,共同建設(shè)中原人工智能計(jì)算中心。此舉對(duì)于加快許昌人工智能產(chǎn)業(yè)發(fā)展、完善黃河鯤鵬計(jì)算產(chǎn)業(yè)生態(tài)具有重要意義。 根
    的頭像 發(fā)表于 02-01 17:35 ?2410次閱讀

    華為人工智能計(jì)算中心已在多省市落地應(yīng)用

    在第三屆中國超級(jí)算力大會(huì)ChinaSC 2021上,華為人工智能計(jì)算中心解決方案(簡(jiǎn)稱“人工智能計(jì)算中心”)憑借出色的人工智能
    的頭像 發(fā)表于 11-15 14:28 ?3405次閱讀

    沈陽人工智能計(jì)算中心正式上線并網(wǎng)投入運(yùn)行

    【中國,沈陽,2022年8月9日】東北首座人工智能計(jì)算中心——沈陽人工智能計(jì)算中心(簡(jiǎn)稱“沈陽智算”)正式上線并網(wǎng)投入運(yùn)行。
    發(fā)表于 08-10 09:53 ?1762次閱讀

    沈陽人工智能計(jì)算中心正式上線并網(wǎng)

    “北方算谷”啟幕暨沈陽人工智能計(jì)算中心上線并網(wǎng)儀式在遼寧省沈陽市渾南區(qū)舉行。作為東北地區(qū)目前接入中國算力網(wǎng)絡(luò)的唯一節(jié)點(diǎn),沈陽人工智能計(jì)算中心將通過鵬城實(shí)驗(yàn)室聯(lián)通全國算力企業(yè)和
    發(fā)表于 08-11 09:52 ?770次閱讀

    人工智能計(jì)算中心是干什么的

    人工智能計(jì)算中心是干什么的? 人工智能計(jì)算中心是指一種計(jì)算機(jī)設(shè)施,專門用于進(jìn)行人工智能領(lǐng)域的研究
    的頭像 發(fā)表于 08-15 16:06 ?1738次閱讀

    數(shù)通365案例 | 全國首個(gè)人工智能計(jì)算中心,新以太助力武漢"最強(qiáng)大腦"

    武漢人工智能計(jì)算中心是科技部已批復(fù)的15個(gè)國家人工智能創(chuàng)新發(fā)展試驗(yàn)區(qū)中率先投入運(yùn)營(yíng)的項(xiàng)目。武漢人工智能計(jì)算中心
    的頭像 發(fā)表于 12-07 18:15 ?847次閱讀