事件背景
分析處理過程
問題處理以及分析
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://specialneedsforspecialkids.com/yun/129689.html
摘要:我們?cè)趨f(xié)助某客戶排查一個(gè)文件存儲(chǔ)的性能時(shí)發(fā)現(xiàn),其使用的訓(xùn)練性能和硬件的能力有很大的差距后面內(nèi)容有具體性能對(duì)比數(shù)據(jù)。但直接緩存數(shù)據(jù)在集群規(guī)模上升之后肯定是不現(xiàn)實(shí)的,我們初步只緩存各個(gè)訓(xùn)練文件的句柄信息,以降低元數(shù)據(jù)訪問開銷。我們?cè)趨f(xié)助某AI客戶排查一個(gè)UFS文件存儲(chǔ)的性能case時(shí)發(fā)現(xiàn),其使用的Pytorch訓(xùn)練IO性能和硬件的IO能力有很大的差距(后面內(nèi)容有具體性能對(duì)比數(shù)據(jù))。讓我們感到困惑...
閱讀 1346·2023-01-11 13:20
閱讀 1684·2023-01-11 13:20
閱讀 1132·2023-01-11 13:20
閱讀 1858·2023-01-11 13:20
閱讀 4100·2023-01-11 13:20
閱讀 2704·2023-01-11 13:20
閱讀 1385·2023-01-11 13:20
閱讀 3597·2023-01-11 13:20