平臺介紹
|
面向智算、超算、通用計算各類算力應用需求,為運營者提供一站式算力集群資源管理方案,為算力使用者提升工作效率,實現算力與數據、算法的一體化應用的目標。
|
|

|
智能計算一體化平臺
|
|

|
全棧覆蓋的算力管理與服務體系
|
從操作系統、IaaS 管理、容器管理到模型、應用的各個層次提供了支撐,解決從底層算力到模型、應用之間的工程化問題,大幅提升大模型及應用開發、部署工作效率。
|
|

|
跨區域多集群算力統一管理與調度
|
支持對不同區域、不同機房、不同集群的算力進行統一管理與調度。
- 支持跨區域、跨機房納管算力集群和存儲集群
- 針對不同算力集群可以配置最近最快的存儲集群,實現算力對存儲的高效訪問
- 可基于廣域網等帶寬低、延遲高的網絡進行算力的管理與控制
- 全面支持算力集群內部的高速低延遲計算網絡通信( IB、RoCE 等)
|

|
完善的資源調度與資源配額管理
|
很多情況下算力資源依然是稀缺的,面向不同項目對資源的不同需求,基于資源組劃分與資源隊列技術,提供了完善的資源調度機制與資源配額管理功能。
|
- 將算力資源分為不同資源組,用于不同類型的計算需求
- 可建立多個資源隊列,作為用戶請求資源的對象 資源隊列可配置不同的調度優先級
- 資源隊列可配置 GPU、CPU、內存等資源的配額,實現配額管理
- 不同項目可綁定到不同資源隊列,通過項目將用戶分配到不同資源隊列上
|

|