互聯網大數據和數據共享平臺的發展,獲得了海量的數據積累,也為深度學習的發展提供了強大的推動力。而由于深度學習的網絡模型復雜、參數多、收斂困難和樣本數量龐大等特點,對深度學習硬件系統的計算能力提出了更高的要求。曙光GPU深度學習平臺解決方案從計算加速、存儲系統、網絡系統、作業調度系統、集群管理及軟件框架等方面進行整體的設計和優化,幫助用戶解決深度學習在訓練過程中所面臨的海量計算問題,簡化構建深度學習平臺的難度,降低業務投入成本,賦能用戶深度學習研究。可廣泛應用于圖像識別、人臉識別、語音識別、自然語言處理等應用場景。

曙光GPU深度學習平臺計算系統采用曙光新一代 XMachine高性能GPU服務器組成大規模GPU訓練、推理集群,輸出強大算力;計算數據、日志log和模型數據等統一存儲在曙光ParaStor300分布式并行存儲中,能夠實現全局文件的統一訪問和并發讀寫;該系統支持Caffe/TensorFlow等多種主流深度學習框架、應用容器技術,提供數據集管理、模型管理、訓練等服務。幫助用戶解決多用戶組資源分配、開發環境快速搭建、應用程序靈活遷移等技術需求。使用戶在集群上輕松部署深度學習應用、跟蹤試驗和訓練、發布模型,而無需關心繁瑣部署運維,專注于核心業務。
