2022-10-11 分類(lèi): 網(wǎng)站建設(shè)
2019年6月25日,由浪潮與OCP開(kāi)放計(jì)算社區(qū)聯(lián)合主辦的首屆OCP China Day(開(kāi)放計(jì)算中國(guó)日)在北京正式開(kāi)啟。本屆OCP China Day聚焦人工智能、邊緣計(jì)算、OpenRack、OpenRMC、SONiC、OAM等前沿技術(shù)話(huà)題,來(lái)自Facebook、LinkedIn、Intel、微軟、百度、騰訊、阿里、諾基亞、中國(guó)移動(dòng)、浪潮等資深技術(shù)專(zhuān)家分享了最新技術(shù)進(jìn)展。近千名工程師和數(shù)據(jù)中心從業(yè)者參加了此次大會(huì)。
OCP是全球大的開(kāi)放硬件社區(qū),2011年由Facebook發(fā)起成立,其宗旨是以開(kāi)源開(kāi)放的方式,重構(gòu)當(dāng)前的數(shù)據(jù)中心硬件,發(fā)展面向下一代數(shù)據(jù)中心的服務(wù)器、存儲(chǔ)、網(wǎng)絡(luò)、基礎(chǔ)設(shè)施等創(chuàng)新硬件。目前,OCP核心會(huì)員超過(guò)200家。
伴隨著云計(jì)算產(chǎn)業(yè)的發(fā)展,云數(shù)據(jù)中心創(chuàng)新方向逐漸明晰。在數(shù)據(jù)中心創(chuàng)新的整體策略上,幾乎全球所有的CSP都選擇了高集成、模塊化、面向應(yīng)用的設(shè)備定制化。開(kāi)放計(jì)算也對(duì)數(shù)據(jù)中心的設(shè)計(jì)產(chǎn)生了重大影響,云數(shù)據(jù)中心需要更加通用的機(jī)架和機(jī)柜設(shè)計(jì)。在本次OCP China Day上,來(lái)自O(shè)CP基金會(huì)、LinkedIn、百度、Facebook的專(zhuān)家分別介紹了在Olympus、Open19、ODCC天蝎項(xiàng)目、Open Rack 4種機(jī)架/機(jī)柜設(shè)計(jì)不同特征和最新進(jìn)展。
以下為大會(huì)演講實(shí)錄:
OCP CTO Bill Carter:云計(jì)算的發(fā)展推進(jìn)了機(jī)柜進(jìn)行擴(kuò)展性和效率的優(yōu)化
OCP CTO Bill Carter
主持人:歡迎大家重新回到主會(huì)場(chǎng),我們下午精彩繼續(xù)。下午四個(gè)項(xiàng)目的分享都是OCP重點(diǎn)投入的,第一個(gè)主題分享,我們?cè)俅斡姓?qǐng)OCP CTO Bill Carter上臺(tái)。
OCP CTO Bill Carter:非常感謝,下面我們會(huì)談一下機(jī)柜的架構(gòu),接下來(lái)這一個(gè)小時(shí)我有一系列的嘉賓發(fā)言人要上臺(tái)講不同的機(jī)架和機(jī)柜的架構(gòu),但是在此之前我想要講講我們?cè)趺礃幼叩浇裉爝@里,我們這個(gè)旅程是什么樣的進(jìn)展。我們先看一下一百年前的情況吧,大家能認(rèn)得出來(lái)機(jī)電器嗎?這其實(shí)是一個(gè)用在早期的發(fā)電報(bào)的時(shí)代,通過(guò)有線(xiàn)去發(fā)布信號(hào),在美國(guó)是ATNT發(fā)明的,他們相當(dāng)于中國(guó)常見(jiàn)的電信商。他們把這些東西放在機(jī)柜里面,這是當(dāng)時(shí)的機(jī)電器的機(jī)架在1922年的模樣。因?yàn)樗麄冇羞@么多機(jī)柜,所以為它專(zhuān)門(mén)書(shū)寫(xiě)了技術(shù)規(guī)范復(fù)制在美國(guó)各地,因此1934年這就變成了第一個(gè)EIA 19英寸的機(jī)柜的規(guī)范。如果說(shuō)大家今天還用的是EIA的19英寸的機(jī)架的話(huà),那你用的是將近一百年前的技術(shù)了,因此也會(huì)有一個(gè)項(xiàng)目是改進(jìn)機(jī)架設(shè)計(jì)的。
這是到2011年、2012年我們會(huì)涉及到一些機(jī)架的設(shè)計(jì),今天也會(huì)分享到一些相關(guān)的信息,希望我們可以進(jìn)一步發(fā)展,到現(xiàn)在更加通用的機(jī)架和機(jī)柜的設(shè)計(jì)。也是因?yàn)樵朴?jì)算的發(fā)展推進(jìn)了機(jī)柜為擴(kuò)展性和效率進(jìn)行優(yōu)化,我們有4種非常不同的機(jī)柜的設(shè)計(jì),一個(gè)是Olympus項(xiàng)目,是幾年前微軟牽頭建立的項(xiàng)目,跟OCP一起合作;當(dāng)然還有Open19的設(shè)計(jì),也是LinkedIn的工程團(tuán)隊(duì)負(fù)責(zé)統(tǒng)領(lǐng)的,Zaid之后會(huì)講LinkedIn的設(shè)計(jì)。還有ODCC天蝎項(xiàng)目,大家最熟悉這方面,百度的丁瑞全先生會(huì)跟我們分享這方面。最后我們會(huì)邀請(qǐng)來(lái)自Facebook的Steve Mills跟我們講一下Open Rack以及Facebook對(duì)此的貢獻(xiàn),他們已經(jīng)走過(guò)了三代,現(xiàn)在正在為第三代努力。我們希望把這些項(xiàng)目的東西都集成在一起給大家分享得更多。今天早晨我講到八年前我們關(guān)注不同的地方,現(xiàn)在關(guān)注到各個(gè)項(xiàng)目的相似之處。
Olympus的微軟的同事來(lái)不了,我?guī)退v幾頁(yè)片子。我們分享一下這個(gè)項(xiàng)目的情況,它是一個(gè)整機(jī)柜的設(shè)計(jì),有幾個(gè)部分,在設(shè)計(jì)中分享和貢獻(xiàn)給了社區(qū),19英寸的機(jī)架,用的是和ATNT二十世紀(jì)同樣的設(shè)計(jì),但是有一個(gè)修改,就是他們有一個(gè)機(jī)架管理的解決方案在上面,所以把前端放入計(jì)算節(jié)點(diǎn)之后它在背后就自動(dòng)連接起來(lái)。另外還有通用的電源線(xiàn),所以不管你的數(shù)據(jù)中心是什么樣的都可以通到數(shù)據(jù)中心的電源,這電源的連接器有的地方有有不同的大小,會(huì)發(fā)明一個(gè)系統(tǒng)使得這個(gè)電源線(xiàn)能夠互操作。同時(shí)也設(shè)計(jì)了機(jī)柜背后有配電系統(tǒng),把這個(gè)電源線(xiàn)相應(yīng)的信號(hào)轉(zhuǎn)換之后,所有的交流電傳給計(jì)算節(jié)點(diǎn),他們有1U2U3U的服務(wù)器的機(jī)箱,也是參考設(shè)計(jì)的一部分,可以互換使用。還有一個(gè)新的供電的解決方案,它是非常獨(dú)特的,它沒(méi)有兩個(gè)供電,只有一個(gè)供電電源,但是有兩個(gè)整流器。
我們來(lái)看這幾個(gè)特征。背部有19英寸EIA的兼容,是1200毫米深的機(jī)柜,它們的電源功率解決方案在背板,也有機(jī)架的管理,能夠提供彈性。還有我剛才說(shuō)的電源,它有兩個(gè)整流器,但是每一個(gè)相位都有一個(gè)整流器,所以它還有相位的平衡。今天很多時(shí)候我們會(huì)把每個(gè)相位都進(jìn)行轉(zhuǎn)換,輸出直流電或交流電,它們有可能會(huì)不平衡,但是有了這種相位的平衡器均衡器,三個(gè)相位就可以有同樣的電流,都放到同一個(gè)供電的盒子里面,這就是Olympus項(xiàng)目的特點(diǎn),所有的計(jì)算節(jié)點(diǎn)都是熱插拔,可以盲插,適應(yīng)背后配電的系統(tǒng)。他們獲得了世界各地的安全認(rèn)證,對(duì)所有的組件都獲得了安全認(rèn)證,這是非常必要的。因?yàn)榘堰@個(gè)東西安裝在自己世界各地的數(shù)據(jù)中心,有的時(shí)候放到了客戶(hù)的數(shù)據(jù)中心里面,我們把它稱(chēng)為其他人共有的數(shù)據(jù)中心。這個(gè)有可能會(huì)對(duì)安全方面,像電磁干擾有一些安全方面的要求,所以希望全世界各地安全方面的要求都能夠滿(mǎn)足,無(wú)論地點(diǎn)在哪里都可以兼容,無(wú)論是微軟的數(shù)據(jù)中心還是客戶(hù)的數(shù)據(jù)中心。除了簡(jiǎn)單易用和擴(kuò)展性以外,它們還有其他的特點(diǎn)。
左下方是2路的計(jì)算節(jié)點(diǎn),它是一個(gè)非常好的開(kāi)放的設(shè)計(jì),可以看到只有一個(gè)銀盒子在最后角落里,這是供電的單元,這種彈性和相位的均衡也是在供電的小盒子里設(shè)計(jì)好的,這就是Olympus項(xiàng)目。
LinkedIn Head of Infrastructure Engineering Zaid Ali Kahn:很多邊緣的機(jī)架都不是集中數(shù)據(jù)中心的工程師去維護(hù),邊緣的數(shù)據(jù)中心需要能夠?qū)崿F(xiàn)自維護(hù)或者簡(jiǎn)單省事的維護(hù)
Zaid Ali Kahn, LinkedIn Head of Infrastructure Engineering
OCP CTO Bill Carter:接下來(lái)我們?cè)俅窝?qǐng)Zaid Ali Kahn上場(chǎng),他是LinkedIn的基礎(chǔ)設(shè)施工程的首席工程師,讓他介紹一下LinkedIn在Open 19架構(gòu)方面的情況。
Zaid Ali Kahn:介紹了EIA19英寸以及它有多長(zhǎng)時(shí)間的歷史了,我在想今天在講什么以及架構(gòu)未來(lái)如何發(fā)展,我們未來(lái)的子孫后代會(huì)怎么看我們現(xiàn)在的情況,他們會(huì)不會(huì)也召開(kāi)一個(gè)研討會(huì),四五十年以后人們來(lái)講我們的技術(shù)也是很老的技術(shù)了。無(wú)論如何這都是很好的工程。
我跟大家介紹一下Open 19的技術(shù),我們最近剛剛把Open 19的技術(shù)貢獻(xiàn)給了OCP,我們有孵化的委員會(huì),如果你是在這個(gè)領(lǐng)域工作的話(huà),那么7月份的時(shí)候我們會(huì)對(duì)架構(gòu)方面有更深度的討論,所以歡迎大家參加,希望這個(gè)技術(shù)能有更加廣泛的應(yīng)用,而不只是在我們數(shù)據(jù)中心的應(yīng)用。我跟大家介紹一下我們的技術(shù)架構(gòu)。先看幾個(gè)想法,我們?yōu)槭裁匆@么做?幾年前我們?cè)跀?shù)據(jù)中心有一些限制,我們的空間有很大的限制,而且電源功率也有很大的限制,我們沒(méi)有奢侈的買(mǎi)很多地,豎很多的機(jī)柜起來(lái),每個(gè)機(jī)柜都很大,事實(shí)上我們有空間的限制,我們需要空間和功率得到大的利用,所以我們需要機(jī)柜能夠比較緊湊。我們現(xiàn)在一個(gè)機(jī)柜要裝96個(gè)服務(wù)器節(jié)點(diǎn),這樣的復(fù)雜性就要求我們需要有些新的解決方案,尤其是如果你要實(shí)現(xiàn)這樣的規(guī)模效應(yīng),需要大幅度的提高效率、降低成本。我們就發(fā)明了這種Open 19的技術(shù),它是基于計(jì)算節(jié)點(diǎn)的小盒子,模塊化的能適應(yīng)所有19英寸的機(jī)架,就是用很多配置,可以是雙寬的或雙高的,我們希望把每一個(gè)計(jì)算節(jié)點(diǎn)的電源功率的部分都集中起來(lái),所以我們有一個(gè)電源架。
另外一個(gè)部分就是我們的交換機(jī)交換層,大家在這個(gè)圖上可以看到有兩個(gè)交換機(jī),其實(shí)兩個(gè)不是必要的,我們這樣設(shè)計(jì)是因?yàn)橐粋€(gè)機(jī)柜有2個(gè)葉節(jié)點(diǎn),這是里邊的一些構(gòu)造。接下來(lái)我再深度分析一下,機(jī)柜的這些盒子有12 2U或8 2U的選擇,你的配置可以選,你可以放4個(gè)節(jié)點(diǎn),你可以放2個(gè)雙高半寬的節(jié)點(diǎn),可以放2個(gè)雙寬的放1個(gè)雙高的節(jié)點(diǎn),都可以。我們的想法就是一系列不同的計(jì)算節(jié)點(diǎn)的大小尺寸和風(fēng)量都不同,都可以放到機(jī)架當(dāng)中去,可以在右邊看到背部是卡扣式的后開(kāi)門(mén),就像剛才Bill Carter在Olympus項(xiàng)目中說(shuō)到的,不希望這個(gè)數(shù)據(jù)中心的工程師需要走到機(jī)柜的后面做一些維修,所以從前邊基本都可以做得到,能夠盡量的簡(jiǎn)單。
接下來(lái)我們說(shuō)一下這些磚塊的外形,它們都是計(jì)算節(jié)點(diǎn),我們不希望所有的節(jié)點(diǎn)都是我們自己設(shè)計(jì),我們希望把它開(kāi)源出去,讓大家都可以貢獻(xiàn),無(wú)論是服務(wù)器內(nèi)部還是其他的部分,使得多個(gè)供應(yīng)商都可以自己去制造生產(chǎn)。你可以有單磚塊的可以有雙高半寬、雙高雙寬的節(jié)點(diǎn),我們有線(xiàn)性的功率和數(shù)據(jù)增長(zhǎng),它也是自我保持的,電磁干擾、安全和冷卻都能夠做得很好。這是我特別喜歡的一點(diǎn),我們很大的一個(gè)創(chuàng)新之處就是電纜系統(tǒng),因?yàn)橐话愕姆?wù)器電纜布線(xiàn)特別復(fù)雜,所以我們非常強(qiáng)調(diào)這點(diǎn),大家可以看到背部所有電纜,藍(lán)色是電源,白色是網(wǎng)絡(luò),背部的卡扣,它有25G和100G的網(wǎng)絡(luò)配置。
我們的想法就是它能夠非常簡(jiǎn)單地管理,像我之前說(shuō)的我們不希望數(shù)據(jù)中心的工程師花很多時(shí)間去布線(xiàn),我們希望能夠簡(jiǎn)化他們的工作,讓他們更快的能布好,這樣的話(huà)在機(jī)柜的集成方面有6倍的改進(jìn)。
我們?cè)倏匆幌码娫醇堋_@是下一個(gè)階段,我們把這個(gè)服務(wù)器里邊的這些電源部分全部都拿出來(lái)集中在一起放到一個(gè)電源架上面,它可以是19.2千瓦,6個(gè)3.2千瓦,它通過(guò)端口管理,所有的都可配置,我們希望所有的服務(wù)器都能夠?qū)崿F(xiàn)統(tǒng)一的管理,可以通過(guò)電源架把它開(kāi)啟和關(guān)閉,而且它是充分冗余的,有AB輸入,在這點(diǎn)上我們跟很多的供應(yīng)商合作。
下面我們分享一下這項(xiàng)技術(shù)的好處。其中一點(diǎn)沒(méi)有在這個(gè)片子上,很多人都在討論邊緣,邊緣我們需要什么?它可能需要不同類(lèi)型的支持,很多邊緣的機(jī)架都不是集中的數(shù)據(jù)中心的工程師去維護(hù),所以邊緣的數(shù)據(jù)中心需要能夠?qū)崿F(xiàn)自維護(hù)或者簡(jiǎn)單省事的得到維護(hù),所以O(shè)pen 19更適合部署到邊緣,因?yàn)椴季€(xiàn)很簡(jiǎn)單,其他的解決方案都是非常易于維護(hù)的。所以說(shuō)我們覺(jué)得很多人會(huì)感興趣,將Open 19技術(shù)采用在邊緣數(shù)據(jù)中心當(dāng)中。所以我們的想法就是它能夠適合所有的19英寸的機(jī)架,我們還可以做一些經(jīng)濟(jì)化,我們有一些架構(gòu)的改良使得實(shí)現(xiàn)更好的一體化。我們可以實(shí)現(xiàn)5-6倍的更快的機(jī)柜級(jí)的融合集成。我們還有一個(gè)小視頻,就是一般的機(jī)柜的集成和Open 19機(jī)柜的機(jī)柜,大家可以對(duì)比它有多快。在服務(wù)器的方面,我們提高了效率,沒(méi)有服務(wù)器的電源供電,這樣的話(huà)效率能夠提高,另外有很大的節(jié)約。隨著我們數(shù)據(jù)中心的擴(kuò)展,有了成千上萬(wàn)的節(jié)點(diǎn),加總起來(lái)的節(jié)約就會(huì)非常明顯。
這是在我們生產(chǎn)環(huán)境當(dāng)中的情況,左邊是那些空的盒子,右邊放了計(jì)算節(jié)點(diǎn),大家可以看出來(lái)把它們放進(jìn)去非常容易,看起來(lái)就像一般的19英寸的機(jī)柜一樣,但是它是卡扣式的。我們?cè)趯ふ腋邇?nèi)存的高端的服務(wù)器,我們需要每個(gè)服務(wù)器消費(fèi)3T的內(nèi)存,我們?cè)谙朐趺礃訛檫@個(gè)項(xiàng)目尋到合適的架構(gòu),因?yàn)槲覀円彩荗CP的一部分,所以我們也把這個(gè)問(wèn)題提給了社區(qū)。有人說(shuō)Olympus的模板是最好的方案,所以我們把它放到了Open 19平臺(tái)上面,我們現(xiàn)在的數(shù)據(jù)中心也有Olympus的模板,就是照片里的這個(gè)樣子,我們也可以把其他項(xiàng)目的優(yōu)勢(shì)集成到我們自己的Open 19的項(xiàng)目中,然后集成起來(lái),有了Open 19和Olympus加起來(lái)就能實(shí)現(xiàn)更好的效果。我們?cè)谙嗷マD(zhuǎn)換進(jìn)行一些匯總,這就是我非常自豪的想跟大家分享。
未來(lái)我們也會(huì)開(kāi)放找更多其他的因素,我們也有些新的服務(wù)器的模塊,其中LinkedIn也會(huì)貢獻(xiàn)自己的架構(gòu),這是我們路線(xiàn)圖當(dāng)中的一些設(shè)想。我們和其他不同的IC合作,我們想要考慮邊緣數(shù)據(jù)中心。這是我們布線(xiàn)的系統(tǒng)在后部,大家可以看到背后是怎么相連的,非常的整潔。
謝謝大家,我的分享到此結(jié)束,我希望剛才給大家分享的這些信息大家都會(huì)覺(jué)得比較有用,如果大家有任何問(wèn)題的話(huà)可以隨時(shí)找我溝通。
百度AI系統(tǒng)架構(gòu)師丁瑞全:天蝎項(xiàng)目在中國(guó)已進(jìn)行了大規(guī)模部署,在新的AI、5G以及液冷和48V供電場(chǎng)景里也做了新的嘗試,希望和OCP共同推動(dòng)技術(shù)標(biāo)準(zhǔn),應(yīng)對(duì)新的挑戰(zhàn)
百度AI系統(tǒng)架構(gòu)師 丁瑞全
百度AI系統(tǒng)架構(gòu)師丁瑞全:我是丁瑞全,百度AI的系統(tǒng)架構(gòu)師,這是在百度陽(yáng)泉數(shù)據(jù)中心部署的照片,我之前沒(méi)有去過(guò)這個(gè)數(shù)據(jù)中心,發(fā)現(xiàn)這個(gè)Rack這么漂亮,百度在今年年初和浪潮一起創(chuàng)造了一個(gè)記錄,在8個(gè)小時(shí)成功交付了一萬(wàn)臺(tái)服務(wù)器,這是非常驚人的,這就是整機(jī)柜給我們帶來(lái)的好處。
天蝎整機(jī)柜的歷史,上面是主要的幾個(gè)階段,我們發(fā)布的一些時(shí)間點(diǎn),下面是基于天蝎整機(jī)柜經(jīng)典的產(chǎn)品。天蝎項(xiàng)目在2011年就成立了,當(dāng)時(shí)百度聯(lián)合阿里、騰訊以及相關(guān)主要廠(chǎng)商成立了這個(gè)組織,這個(gè)時(shí)間點(diǎn)和OCP時(shí)間差不多,上午的家軍和Bill講到我們嘗試和OCP組織建立合作交流,共同推動(dòng)標(biāo)準(zhǔn)。也是因?yàn)閲?guó)內(nèi)、國(guó)外特殊場(chǎng)景的差異沒(méi)有達(dá)到融合,在之后的幾年里各自按照自己的路線(xiàn)發(fā)展。
2014年發(fā)布了天蝎2.0,在Scorpio2.0可以達(dá)到大規(guī)模交付的狀態(tài)了,基于這個(gè)標(biāo)準(zhǔn)開(kāi)發(fā)了冷存儲(chǔ)服務(wù)器,單U 18個(gè)盤(pán),還有高溫耐腐蝕的服務(wù)器,針對(duì)中國(guó)的環(huán)境做的相關(guān)設(shè)計(jì),我們也發(fā)布了X-Man,百度AI計(jì)算機(jī),也是當(dāng)時(shí)業(yè)界最的產(chǎn)品。之后發(fā)布了天蝎2.5,在這之上也做了產(chǎn)品迭代,X-Man2.0發(fā)布了,然后在2018年底發(fā)布了X-Man3.0,實(shí)現(xiàn)16個(gè)AI加速器高速互聯(lián),我們現(xiàn)在已經(jīng)進(jìn)入了X-Man3.0的階段。
在AI、5G、邊緣計(jì)算以及云計(jì)算技術(shù)浪潮下,我們面臨新的挑戰(zhàn)和機(jī)遇,我們需要更大的性能,面臨更大規(guī)模供電挑戰(zhàn),我們需要支持單節(jié)點(diǎn)或者跨節(jié)點(diǎn)互聯(lián),我們有很多新的AI節(jié)點(diǎn)出來(lái),需要標(biāo)準(zhǔn)化通用化,稍后我也會(huì)分享在這個(gè)方面做的工作。5G和邊緣計(jì)算有從云端到算力的部署,有AI的能力,能更好地做邊緣的語(yǔ)音圖像相關(guān)的識(shí)別,更好地降低成本,云計(jì)算這一塊需要有快速交付部署能力,同時(shí)以客戶(hù)需求為先,快速達(dá)到交互的方案。
1.0是模塊化,將供電散熱集中管理分離出來(lái),有比較好的模塊基礎(chǔ)。2.0主要做的標(biāo)準(zhǔn)化,1.0產(chǎn)品里不同系統(tǒng)廠(chǎng)商方案在一個(gè)Rack里無(wú)法共存,這給升級(jí)迭代帶來(lái)很多問(wèn)題,所以2.0做了很多標(biāo)準(zhǔn)化,把硬件軟件做得很清楚,不管是中間件、還是散熱還是服務(wù)器,都可以在Rack里共享。
在3.0,面對(duì)5G、邊緣計(jì)算、AI新的場(chǎng)景里以及云計(jì)算的趨勢(shì)做了一定的改進(jìn),我們肯定更關(guān)注彈性、可擴(kuò)展性,減少相關(guān)部件,支持更大的供電能力,這是更高功耗相關(guān)的CPU和AI芯片,我們也需要更好的靈活部署方式。
這是3.0 Rack大的架構(gòu),我們以SU為單元構(gòu)建這個(gè)系統(tǒng),SU和OCP的OU有一點(diǎn)小的差別,稍微矮一點(diǎn),這個(gè)我們的需求都能夠滿(mǎn)足,同時(shí)在Rack層面部署更多的節(jié)點(diǎn),所以有比較多的好處,3.0同時(shí)可以兼容19英寸和21英寸的產(chǎn)品,達(dá)到降低整個(gè)系統(tǒng)的成本。
供電方面相比以前有很大的變化,我們?cè)O(shè)計(jì)了48V的PSU,也有AI的場(chǎng)景,包括在多個(gè)CPU里單個(gè)節(jié)點(diǎn),怎么去支持整個(gè)部署能力,降低成本,48V是AI關(guān)鍵的基礎(chǔ)。
散熱方面,我們之前是整機(jī)柜集中式的散熱,它的好處是比較靈活,而云計(jì)算面臨變遷和混合部署也帶來(lái)了新的問(wèn)題,所以我們?cè)谛碌膶用嫔辖鉀Q問(wèn)題,同時(shí)采用液冷散熱技術(shù)。我們?cè)?017年就部署了液冷技術(shù),再逐步推廣到通用的CPU計(jì)算場(chǎng)景里。
這是我們幾個(gè)典型的計(jì)算機(jī)配置,左邊是微服務(wù)器低功耗產(chǎn)品,右邊是高密度低成本的產(chǎn)品。第三,全寬主板,主要面向計(jì)算密集型產(chǎn)品,以及高性能存儲(chǔ)場(chǎng)景。
最后面是第三個(gè)1U主板,在系統(tǒng)層面通過(guò)2U構(gòu)建模塊,支持大容量高計(jì)算場(chǎng)景的需求。所以剛才講的是整個(gè)天蝎項(xiàng)目,也發(fā)展了很久,在中國(guó)也部署了幾萬(wàn)個(gè)Rack,達(dá)到近百萬(wàn)服務(wù)器的規(guī)模,在新的AI、5G場(chǎng)景里,在液冷和48V供電場(chǎng)景里也做了新的嘗試,我們也希望在這方面和OCP共同推動(dòng)技術(shù)標(biāo)準(zhǔn),應(yīng)對(duì)新的挑戰(zhàn)。
Steve Mills, Facebook Technical Lead: Facebook看到了在共同平臺(tái)上構(gòu)建基礎(chǔ)架構(gòu)的價(jià)值,我們可以在這個(gè)平臺(tái)上分享新技術(shù)的開(kāi)發(fā)
Steve Mills, Facebook Technical Lead
Bill Carter:謝謝Richard,過(guò)去八年里我們確實(shí)是從當(dāng)時(shí)的標(biāo)準(zhǔn)慢慢向現(xiàn)在演化,當(dāng)時(shí)我們是12V的標(biāo)準(zhǔn),現(xiàn)在八年過(guò)去了我們變成了48V的標(biāo)準(zhǔn),所以再次感謝丁先生跟我們分享天蝎這個(gè)項(xiàng)目。下面我們要有請(qǐng)來(lái)自Facebook的Steve Mills跟大家分享,Steve Mills在這個(gè)項(xiàng)目里已經(jīng)工作了四五年的時(shí)間,在我們這個(gè)行業(yè)已經(jīng)是很長(zhǎng)時(shí)間了,它主要是在OCP的RACK,還有供電的項(xiàng)目有很多經(jīng)驗(yàn)。
Steve Mills, Facebook Technical Lead:大家好,大家知道Open RackV3是下一代的解決方案,從今年的早些時(shí)間開(kāi)始的,今天我要跟大家分享我們Open Power這個(gè)項(xiàng)目怎么通過(guò)OCP社區(qū)進(jìn)行協(xié)作。我希望跟大家介紹一下什么是Open Rack V3,我們?cè)趺丛贠CP的社區(qū)進(jìn)行合作,接下來(lái)這個(gè)項(xiàng)目會(huì)有什么進(jìn)展,首先談一下為什么是Open Rack V3。
過(guò)去一段時(shí)間我們很迅速的擴(kuò)展了我們擁有的很多技術(shù)的能力,因?yàn)榧夹g(shù)發(fā)展非??欤@個(gè)會(huì)議室里幾乎每個(gè)人都遇到了物理學(xué)基本限制相關(guān)的障礙,這些是原子級(jí)別的問(wèn)題,是大家都還沒(méi)有特別熟悉的領(lǐng)域,探索的成本越來(lái)越高。很多組件的制造商可以進(jìn)行改進(jìn),但是需要很多研發(fā)支出才能實(shí)現(xiàn)這些收益。與這些相應(yīng)的研發(fā)支出和相應(yīng)的后續(xù)步驟怎么更好的控制成本和風(fēng)險(xiǎn)呢,最好的辦法就是我們進(jìn)行分享,這就是像OCP這樣的平臺(tái)的用武之地,F(xiàn)acebook看到了在共同平臺(tái)上構(gòu)建基礎(chǔ)架構(gòu)的價(jià)值,我們可以在這個(gè)平臺(tái)上分享新技術(shù)的開(kāi)發(fā),F(xiàn)acebook V1和V2平臺(tái)一開(kāi)始是Facebook內(nèi)部開(kāi)發(fā)的,后來(lái)在后期的研發(fā)階段進(jìn)行開(kāi)放研發(fā)。在這個(gè)架構(gòu)里面,因?yàn)閂1和 V2是內(nèi)部研發(fā)的,所以非常專(zhuān)注于Facebook自己的需求,后來(lái)我們有Open Rack V3之后它就有更開(kāi)放的社區(qū),所以越來(lái)越多的人就可以用這個(gè)平臺(tái)給自己打造適合自己的功能,我們可以在一個(gè)通用的框架下增加更多的功能,所以我們需要的這樣的平臺(tái)需要有一定的靈活度,這樣我們的用戶(hù)才能把這些功能做定制化的開(kāi)發(fā)。
我們?cè)赩3里面的power架構(gòu)能夠有更多的靈活定制,不是僅關(guān)注Facebook的需求。我們?cè)谝恍┍容^先進(jìn)的冷卻高效機(jī)制里也有相關(guān)技術(shù)的發(fā)展,希望通過(guò)Open Rack V3為更多Open Rack架構(gòu)做出貢獻(xiàn)。這就是我對(duì)Open Rack V3的介紹,Open Rack V3現(xiàn)在又有什么新進(jìn)展呢?首先就是我剛才說(shuō)的Open Rack V3不僅僅是針對(duì)Facebook的需求,而是能夠?yàn)楦_(kāi)放的社區(qū)提供更好的功能,我們?cè)诖怪遍g隔里跟V2有一些變化,V2是open U 14、18毫米的間隔,V3是44.45毫米的間隔,微軟、百度也有相應(yīng)的需求,我們現(xiàn)在沒(méi)有支持到EIA的寬度,只是垂直間隔這塊。
第二是我們的動(dòng)態(tài)定制,從V2 1400kg到V3的1600kg,第三是高度從41個(gè)openU到44×48mmopenU 或48×44.45,另外是Cabal(音)Manager,我們把它當(dāng)做一個(gè)可選的工具包,通過(guò)這個(gè)可選的工具包大家可以更好的給自己做定制的開(kāi)發(fā)。下面就是液體的起管,這個(gè)液體管匯Liquid Manifold (ACS)就是我剛才說(shuō)的先進(jìn)的冷卻機(jī)制,它也放在我們的可選工具包里的功能。另外是后端數(shù)據(jù)結(jié)構(gòu),也是放在這個(gè)可選工具包里面,它也是熱插拔的。它有幾種可以選的方案,比如高速的銅線(xiàn)、高速的光纖或者低速的銅線(xiàn)管理主線(xiàn),這個(gè)也有一些方向可以走。我們?cè)趥?cè)邊板這塊,F(xiàn)acebook V2這塊只能有空氣的containment,現(xiàn)在到V3會(huì)有更多的安全的設(shè)置放到里面,可以選擇更多安全和其他的設(shè)置。對(duì)于我們的安全而言我們?cè)黾恿烁嗟囊?guī)格,整個(gè)項(xiàng)目正在進(jìn)展過(guò)程中。下面看一下總線(xiàn)的電壓的值,現(xiàn)在不僅有12V,也有48V,這兩個(gè)都是可選的。電源架既可以是之前固定的,現(xiàn)在在總線(xiàn)任何的地方都可以進(jìn)行部署,它可以在不同的電源架上進(jìn)行安置。
關(guān)于現(xiàn)在的電源架的位置,機(jī)架里面可以有一個(gè)固定的安置主要原因是它有一個(gè)螺栓,這個(gè)螺栓可以將其電源架的輸入和電源架進(jìn)行一個(gè)固定,對(duì)于V3而言它并不是螺栓進(jìn)行連接,一旦改變了連接的方式之后,你在任何機(jī)架的位置都可以進(jìn)行安裝,這樣你在進(jìn)行部署的時(shí)候能夠讓客戶(hù)有非常多的靈活性。當(dāng)然我們還有電源架和BBU,可以讓它有非常多的靈活性,它可以和BBU進(jìn)行靈活的部署,比如我們BBU的容量在需要的時(shí)候可以進(jìn)行不同的部署。我們也有調(diào)峰的功能,我們有關(guān)于電源架輸入的部署,所以無(wú)論是在前端還是后端我們都可以對(duì)電源架進(jìn)行相關(guān)的部署。傳統(tǒng)而言,F(xiàn)acebook用的是5PIN的輸入,到現(xiàn)在我們已經(jīng)有了7PIN的輸入,這樣我求可以將PDU從機(jī)架上釋放下來(lái)。我們可以看到這個(gè)功能大家已經(jīng)演示過(guò)了,就是在微軟的Olympus當(dāng)中,也是在自己的開(kāi)放機(jī)架的部署中做好的。
下面看只有一個(gè)唯一的功率區(qū),之前有2個(gè),F(xiàn)acebook在大多數(shù)情況下都會(huì)部署一個(gè)功率區(qū)。如何和更廣泛的OCP的社區(qū)進(jìn)行聯(lián)合,對(duì)于Facebook的文化而言聯(lián)合一直是我們的一部分,這就是我們認(rèn)為我們和工業(yè)界的合作伙伴合作是我們工作方式的延伸,能夠和業(yè)界的合作伙伴做得更好,而且在過(guò)去一些年我們一直能為社區(qū)做出自己的貢獻(xiàn),這也是在Open RackV3中我們一直遵循的Facebook的準(zhǔn)則。
我們看一下這個(gè)架構(gòu)究竟是怎樣的。它是48V的走線(xiàn)和48V的IT后邊的電力連接,這兩個(gè)組件就可以和總件進(jìn)行相關(guān)的連接,它已經(jīng)是在Open Rack的部署中做好,我們特別希望你們能夠用它現(xiàn)在部署好的方式進(jìn)行使用。當(dāng)然我們還和一個(gè)聯(lián)合的研發(fā)項(xiàng)目做了Open Rack V3的機(jī)架,我們有一個(gè)熱啟動(dòng)的液體的冷卻系統(tǒng),剛才咱們已經(jīng)談到了。
我們看一下電源架之所以能夠有目前非常好的架構(gòu),首先我們有相關(guān)的技術(shù)規(guī)范,同時(shí)我們還有一個(gè)電源架的管理中心的控制器,我們也有一個(gè)電源架的48V的輸出的連接器,它能夠成為電源架和總線(xiàn)之間的連接,它能夠使得我們的電源架在整個(gè)總線(xiàn)的任何位置進(jìn)行部署。我們還有一個(gè)通用的7PIN的輸入的連接器,剛才我給大家看到的是目前單獨(dú)研究的Open Rack項(xiàng)目下進(jìn)行研發(fā)的項(xiàng)目,對(duì)于Open Rack V3而言我們?cè)诮窈髸?huì)增加更多的功能和配置。
我們看一看下一步將會(huì)做什么呢?下一個(gè)月會(huì)召開(kāi)一個(gè)工程師會(huì)議,這個(gè)會(huì)議主要是看一下Open Rack Power、先進(jìn)的冷卻系統(tǒng)、數(shù)據(jù)中心三個(gè)聯(lián)合的項(xiàng)目,我們希望在現(xiàn)在部署的情況下提供一致的和可交互的方式,以便我們?cè)谶M(jìn)行部署的時(shí)候,比如在冷板上面的熱量能夠在我們的數(shù)據(jù)中心做更好的遷移,再有一個(gè)就是關(guān)于我們功率的設(shè)計(jì),現(xiàn)在OCP的這些利益合作伙伴正在幫助我們?nèi)〉眠M(jìn)展,今天我談到的這些話(huà)題如果大家感興趣的話(huà),我特別希望大家能夠直接聯(lián)系我,以便我們能共同一起工作。就如同我們現(xiàn)在已經(jīng)取得的技術(shù)規(guī)范方面的進(jìn)展已經(jīng)放到了OCP的網(wǎng)站上,大家感興趣的話(huà)可以隨時(shí)看到。如果大家想?yún)⑴c這些項(xiàng)目的話(huà),很顯然你可以放到Make It Power郵件上面去,議程有什么變化或者我們有什么進(jìn)展都將通過(guò)郵件發(fā)送給大家。這是我給大家講的一些情況,非常感謝。
本文標(biāo)題:云數(shù)據(jù)中心4類(lèi)機(jī)架/機(jī)柜設(shè)計(jì)的特征與進(jìn)展
文章網(wǎng)址:http://m.rwnh.cn/news2/204502.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供定制開(kāi)發(fā)、響應(yīng)式網(wǎng)站、定制網(wǎng)站、網(wǎng)站改版、營(yíng)銷(xiāo)型網(wǎng)站建設(shè)、軟件開(kāi)發(fā)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶(hù)投稿、用戶(hù)轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話(huà):028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容