品高智能算力調度平臺是依托品高在云計算與人工智能領域的深厚技術積累打造的智能算力調度云底座,滿足企業在AI場景下的國產化、場景化、低碳化、協同化等多元化需求。
品高智能算力調度平臺通過驅動級GPU切割、異構資源統一調度與精細化管理能力,實現AI算力資源的統一調度、按需切割和靈活分配,幫助企業高效利用AI算力。同時支持多租戶管理和資源安全隔離,降低運營成本。
品高智能算力調度平臺讓企業在云環境中實現智能、高效、彈性的AI算力運維,助力AI業務創新和技術發展。

通算智算一體化:支持多廠商多類異構GPU的一池多芯架構,構建統一的適應性資源支撐體系。
多模式調度:支持整機、整卡、NVIDIA GPU-MIG、vGPU等多種GPU資源分配模式,滿足不同業務場景的靈活需求。
簡化資源管理:提供統一的管理界面和自動化調度功能,使得企業在管理集群通算智算一體化的AI計算資源時更加便捷高效,減少了管理復雜度。
超大規模集群支持:單集群可支持2048臺物理服務器,可支撐萬卡集群構建
多元vGPU共享能力:同時支持時間切分模式與空間切分模式,為不同AI任務場景提供靈活多樣的vGPU資源共享方案,全面提升算力利用率。
空間切分模式:實現將GPU的空間資源(顯存與TPC)按空間維度靈活劃分為多個獨立子分區,每個分區可并行支持不同任務,實現多任務高效協同運行。
資源獨立分配:每個租戶擁有獨立的GPU、存儲、網絡等資源,實現全方位隔離,保障多租戶環境下的安全和穩定。
權限與運維管理:靈活的租戶配置、權限管理和資源監控,支持多租戶運營、成本精細化管理和安全審計。
多網卡與固定IP支持:單個Pod可靈活綁定多張網卡,容器重建時自動保留原有固定IP,顯著提升網絡配置靈活性和業務穩定性。
內外部混合組網:支持多種內外部網絡接入模式,滿足不同業務和場景的靈活組網需求。
RDMA網絡管理:提供RDMA網絡二層隔離,支持租戶安全隔離和多網段精細化管理,保障高性能計算任務的數據安全與網絡高效利用。
基于驅動級別的底層能力,實現對GPU物理資源的精細化切割,實現對時間切片、TPC等關鍵GPU資源的深度管控,從而滿足復雜AI工作負載在資源隔離、彈性調度和多場景適配上的需求,顯著提升GPU利用率與調度靈活性。
網絡管理結合eBPF技術,實現低延遲、高帶寬的網絡數據傳輸。為AI任務提供高效、穩定的數據通路,全面保障數據通信效率和業務連續性。
通過源碼級ApiServer深度改造,內置租戶邏輯轉換器,實現API調用過程中的租戶標識自動識別與安全隔離,從源頭杜絕訪問逃逸風險。基于多租戶安全架構設計集群權限體系,支持精細化資源分配與訪問控制。