今天在 2017 年開放計算峰會 (OCP) 上,Facebook 宣布對其服務器硬件系列進行端到端更新。 此公告包括所有新的存儲機箱、GPU 服務器和計算服務器,以及最新版本的 優勝美地,Facebook 的多節點計算平台。 所有設計規範均可通過開放計算項目網站獲取,並將發布適用於所有系統的全套硬件設計文件。
今天在 2017 年開放計算峰會 (OCP) 上,Facebook 宣布對其服務器硬件系列進行端到端更新。 此公告包括所有新的存儲機箱、GPU 服務器和計算服務器,以及最新版本的 優勝美地,Facebook 的多節點計算平台。 所有設計規範均可通過開放計算項目網站獲取,並將發布適用於所有系統的全套硬件設計文件。
Facebook 一直在並且仍在不斷發展。 社交媒體和社交網絡服務仍然保持其成功的地位和照片共享功能; 從一開始,Facebook 就增加了其他幾個功能。 幾年前,Facebook 收購了照片和視頻共享服務 Instagram。 如今,Facebook 每天有 100 億小時的視頻觀看時間,95 萬張照片和視頻被粘貼到 Instagram,超過 400 億人使用 Facebook Messenger 進行語音和視頻聊天。 為了跟上這一步伐並讓客戶滿意,Facebook 需要更新其服務器群以提高性能和規模。
在存儲方面,Facebook 正在更換自 2013 年以來一直使用的 Open Vault 機箱。新機箱 Bryce Canyon 專為照片和視頻等數據的高密度存儲而設計。 新的 Bryce Canyon 是一個 4OU(開放式機架單元),支持多達 72 個 3.5 英寸 HDD(12 Gb SAS/6 Gb SATA),密度比以前的設計高 20%。 Bryce Canyon 採用模塊化設計,可以靈活地成為不同的配置,例如 JBOD 或強大的存儲服務器。 就存儲服務器而言,新平台支持更強大的處理器,內存佔用量是之前存儲設備的四倍。
所有這些照片和視頻都需要強大的 GPU 系統為其提供動力。 Facebook 正在用新的 Big Basin 替換其 Big Sur GPU 服務器。 Big Basin 是一個 JBOG(只是一堆 GPU),旨在從 GPU 中分解 CPU 計算。 獨立的設計意味著 Big Basin 將需要獨立的計算和網絡模塊,但這也意味著它們可以獨立擴展。 Big Basin 可以支持八個 GPU(NVIDIA Tesla P100 GPU 加速器)。 與 Big Sur 相比,它的內存從 12GB 增加到 16GB,吞吐量增加了近 100%。
通過上述的模塊化設計,需要有某種用於計算的主機。 Facebook 一直在將 Leopard 用於各種計算服務。 今天他們推出了 Tioga Pass,它具有雙路主板,採用相同的 6.5” x 20” 外形尺寸,支持單面和雙面設計。 Tioga Pass 可以通過其雙面設計最大化內存配置,兩側都有 DIMM。 Facebook 還升級了 mSATA 連接器,帶有支持 NVMe 的 M.2 插槽。 PCIe 插槽已從 x24 升級到 x32,允許兩個 x16 插槽或一個 x16 插槽和兩個 x8 插槽。 這使可用 PCIe 帶寬加倍,並使服務器成為 Big Basin 和 Lightning JBOF 的更靈活的主機。 Facebook 還添加了一個 100G NIC,以實現對閃存的更高帶寬訪問。
Facebook 還更新了其多節點計算平台 Yosemite。 最新版本使用新的 4 OU vCubby 機箱設計,但它仍然與 Open Rack v2 兼容。 每個 cubby 支持四個 1S 服務器卡或兩個服務器加兩個設備卡,四個服務器中的每一個都可以連接到 50G 或 100G 多主機 NIC。 另一個有趣的新功能是熱服務支持,不再需要服務器離線才能提供服務。 新的 Yosemite 可以同時支持 Mono Lake 和 Twin Lake 1S 服務器,並提供對 Glacier Point SSD 載卡和 Crane Flat 設備載卡的支持。
開放計算項目網站上將提供上述各項的規範。