返回列表
智算中心的 AI NIC 解決方案
智算中心的需求與挑戰
隨著AI模型的規模和復雜性不斷增加,尤其是在深度學習和大數據處理的背景下,數據傳輸量劇增,網絡容易成為系統性能的瓶頸。特別是在分布式計算環境中,節點之間的數據交換頻繁,若網絡帶寬不足或延遲過高,會嚴重影響AI任務的執行效率,所以AI網絡需要支持高帶寬以便在節點之間快速傳輸大量數據。同時,低延遲是實時AI訓練和推理的關鍵。
解決方案實現
- 接口速率: 提供單口400GE或雙口200GE IO以及PCIe Gen5高速接口,能夠滿足AI計算和數據中心應用對帶寬的嚴苛需求。
- DPU直達 NVMe 存儲: 通過DPU直接連接 NVMe 存儲設備,實現數據的高速讀寫,減少中間環節帶來的延遲,從而顯著提升系統的整體性能。
- RDMA 協議: 搭載標準/自研 RDMA協議,實現了遠程內存訪問的高效性和低延遲,適用于大規模數據處理和高性能計算任務。
- 自研通信庫: 硬件結合自研通信庫,能夠實時感知業務需求,根據實際應用場景動態調整,優化數據傳輸路徑和計算任務分配。
- 多路徑高性能擁塞控制算法: 自研的多路徑擁塞控制算法在高并發和高負載情況下,能夠智能地選擇最佳數據傳輸路徑,避免網絡擁塞,保障數據傳輸的穩定性和速度。
- 降低長尾時延: 硬件級重傳機制有效減少了因網絡波動和數據包丟失導致的延遲,長尾時延降低達 50%,顯著減少了因重傳帶來的等待時間,提升了整體系統響應速度。

