人工智能云計(jì)算平臺(tái)解決方案
-

人工智能云計(jì)算平臺(tái)解決方案(1/2)
-

人工智能云計(jì)算平臺(tái)解決方案(2/2)


曙光人工智能云計(jì)算平臺(tái)解決方案提供快速、穩(wěn)定、彈性的GPU計(jì)算資源。同時(shí)平臺(tái)集成了數(shù)據(jù)集管理、模型管理、訓(xùn)練等服務(wù),支持Caffe/TensorFlow等多種深度學(xué)習(xí)框架,靈活的資源調(diào)度策略,使訓(xùn)練過(guò)程更加高效、彈性。極大的簡(jiǎn)化了企業(yè)構(gòu)建深度學(xué)習(xí)平臺(tái)的難度,提高資源使用率,降低了業(yè)務(wù)投入成本,使用戶(hù)更加專(zhuān)注于深度學(xué)習(xí)應(yīng)用本身。主要應(yīng)用于深度學(xué)習(xí)訓(xùn)練/推理、圖形圖像處理以及科學(xué)計(jì)算等場(chǎng)景。

曙光人工智能云計(jì)算平臺(tái)解決方案底層依托云計(jì)算的彈性資源,中層則采用XMachine高性能集群組成云GPU計(jì)算平臺(tái)。計(jì)算數(shù)據(jù)、日志log和模型數(shù)據(jù)統(tǒng)一存儲(chǔ)在曙光ParaStor300分布式并行存儲(chǔ)中。并通過(guò)曙光容器化的企業(yè)級(jí)分布式深度學(xué)習(xí)平臺(tái),提供數(shù)據(jù)集管理、模型管理、訓(xùn)練等服務(wù)。幫助用戶(hù)解決多用戶(hù)組資源分配、開(kāi)發(fā)環(huán)境快速搭建、應(yīng)用程序靈活遷移等技術(shù)需求。該系統(tǒng)以主流深度學(xué)習(xí)框架為基礎(chǔ),支持Caffe/TensorFlow等多種深度學(xué)習(xí)框架,與Kubernetes和Docker容器技術(shù)相結(jié)合,提供實(shí)驗(yàn)環(huán)境、離線(xiàn)任務(wù)和在線(xiàn)服務(wù)三大功能,支持業(yè)務(wù)從模型研究、批量訓(xùn)練到在線(xiàn)預(yù)測(cè)的全流程打通,完美的滿(mǎn)足了一站式深度學(xué)習(xí)訓(xùn)練與實(shí)時(shí)推理的需求,是目前具有高性?xún)r(jià)比的整體 AI 訓(xùn)練與推理解決方案。
