由于公司沒有運維, 又需要監(jiān)控服務(wù)器的一些數(shù)據(jù)信息, 想盡快的啟動一個數(shù)值監(jiān)控系統(tǒng). 技術(shù)評估了下打算 graphite + grafana 的方式來建設(shè). graphite 是一個時間數(shù)列數(shù)據(jù)庫,并且自帶一些簡單 web 圖形展示功能. 雖然 web 展示方面...
ChatGPT和Sora等AI大模型應(yīng)用,將AI大模型和算力需求的熱度不斷帶上新的臺階。哪里可以獲得...
大模型的訓(xùn)練用4090是不合適的,但推理(inference/serving)用4090不能說合適,...
圖示為GPU性能排行榜,我們可以看到所有GPU的原始相關(guān)性能圖表。同時根據(jù)訓(xùn)練、推理能力由高到低做了...