摘要:通過(guò)選用云主機(jī),基因企業(yè)在基因計(jì)算環(huán)節(jié)可以大幅提升產(chǎn)能而普通大眾,也能享受成本降低帶來(lái)的普惠。而客戶(hù)選用云主機(jī),避免了維護(hù)復(fù)雜板卡的大量人力物力的投入,縮減了驗(yàn)證平臺(tái)的維護(hù)成本。
摘要: 概括F3經(jīng)典使用場(chǎng)景
人工智能深度學(xué)習(xí)客戶(hù),推理應(yīng)用
最近兩年,人工智能在全球掀起了巨大的應(yīng)用熱潮,除了互聯(lián)網(wǎng)巨頭,如Google,F(xiàn)acebook,Alibaba之外,涌現(xiàn)出眾多的Start up公司,也都逐漸成為行業(yè)翹楚。
在人工智能技術(shù)方案選擇上,GPU無(wú)疑是現(xiàn)階段的首選,這其中的主要原因,一方面,GPU完善的生態(tài),高并行度的計(jì)算力,很好地幫助客戶(hù)完成了方案的實(shí)現(xiàn)和部署上線(xiàn);另外一方面,人工智能發(fā)展,仍處于早期階段,各個(gè)行業(yè)都在從算法層面嘗試尋找商業(yè)落地的可能性,是一個(gè)從“0”到“1”的過(guò)程。在可以預(yù)見(jiàn)的未來(lái)幾年,隨著人工智能落地應(yīng)用越來(lái)越多,大規(guī)模商業(yè)部署漸漸成為可能,進(jìn)而對(duì)于更低功耗,更低成本,更低處理延時(shí),更多定制化等的需求,將會(huì)逐漸凸顯。可是F3在人工智能大規(guī)模商業(yè)部署(推理應(yīng)用)中,具備獨(dú)特的性能優(yōu)勢(shì)和廣闊的潛在空間不可小視。
低延遲
相比于F3(FPGA),GPU計(jì)算的處理優(yōu)勢(shì),在于其眾多專(zhuān)用的并行計(jì)算單元以及超高的顯存帶寬,讓多路大規(guī)模數(shù)據(jù)搬移快速并行計(jì)算成為典型的計(jì)算模式,但這一模式導(dǎo)致了每路數(shù)據(jù)的處理延遲增加,對(duì)于一些低延遲需求的在線(xiàn)業(yè)務(wù)場(chǎng)景,如語(yǔ)音識(shí)別等。在Batch值較小的情況下,F(xiàn)3(FPGA)的處理延時(shí),僅為GPU的1/10。
超高的定點(diǎn)計(jì)算力
對(duì)于深度神經(jīng)網(wǎng)絡(luò)的計(jì)算,一個(gè)發(fā)展趨勢(shì)就是降低數(shù)據(jù)表示的精度,降低網(wǎng)絡(luò)對(duì)于計(jì)算力的需求,以提高計(jì)算吞吐量。從雙精度浮點(diǎn)到單精度浮點(diǎn),再到定點(diǎn)處理。而定點(diǎn)運(yùn)算卻是FPGA的傳統(tǒng)優(yōu)勢(shì),相比于GPU,F(xiàn)PGA內(nèi)部配備了眾多的定點(diǎn)處理單元,甚至整個(gè)FPGA芯片內(nèi)部邏輯資源全部可以配置成定點(diǎn)處理單元,進(jìn)而具備了超高的頂點(diǎn)運(yùn)算能力。
目前申請(qǐng)測(cè)試的客戶(hù)中,有很大一部分就是沖著F3的這些優(yōu)勢(shì)而來(lái),期望在其業(yè)務(wù)上帶來(lái)創(chuàng)新和產(chǎn)品的性?xún)r(jià)比提升。
基因測(cè)序
基因測(cè)序是一種新型基因檢測(cè)技術(shù),能夠從血液或唾液中分析測(cè)定基因全序列,預(yù)測(cè)罹患多種疾病的可能性,基因測(cè)序技術(shù)能鎖定個(gè)人病變基因,提前預(yù)防和治療,目前基因測(cè)序廣為人知的是針對(duì)唐氏綜合征篩查的無(wú)創(chuàng)產(chǎn)前基因檢測(cè)。伴隨著基因測(cè)序技術(shù)的快速發(fā)展,基因數(shù)據(jù)的生成呈現(xiàn)指數(shù)級(jí)增長(zhǎng),而應(yīng)用也越來(lái)越廣泛,對(duì)分析能力提出更高要求。
傳統(tǒng)的計(jì)算系統(tǒng)通過(guò)采用多個(gè)高端CPU搭建HPC系統(tǒng)實(shí)現(xiàn)了縮短時(shí)間的目的,但這樣也使得成本增加,行業(yè)應(yīng)用規(guī)模以及基因企業(yè)發(fā)展規(guī)模受限。目前國(guó)內(nèi)基因企業(yè),面臨基因計(jì)算成本偏高,而業(yè)務(wù)需求旺盛,急需高性?xún)r(jià)比的算力資源解決行業(yè)困境。
以人類(lèi)全基因組(WGS)分析為例,單個(gè)WGS,使用一臺(tái)16c/64GB的CPU實(shí)例,完成分析需要近100小時(shí)的時(shí)間,而F3在30分鐘以?xún)?nèi)即可完成。極大地縮減了計(jì)算時(shí)間和成本。
通過(guò)選用F3云主機(jī),基因企業(yè)在基因計(jì)算環(huán)節(jié)可以大幅提升產(chǎn)能;而普通大眾,也能享受成本降低帶來(lái)的普惠。
IC設(shè)計(jì)原型驗(yàn)證
在傳統(tǒng)的數(shù)字IC設(shè)計(jì)流程中,使用FPGA搭建芯片原型驗(yàn)證平臺(tái),測(cè)試功能是重要的一個(gè)環(huán)節(jié),在這個(gè)過(guò)程中,需要大量的FPGA邏輯單元。而對(duì)于傳統(tǒng)數(shù)字芯片設(shè)計(jì)公司來(lái)講,購(gòu)買(mǎi)或者自研復(fù)雜的FPGA驗(yàn)證單板/或平臺(tái),耗時(shí)耗力,且不是公司主要業(yè)務(wù)方案,加之FPGA平臺(tái)升級(jí)換代速度超過(guò)芯片設(shè)計(jì)周期,對(duì)于更大邏輯量FGPA板卡的追求,不斷研制最新fpga板卡一直是大型數(shù)字芯片設(shè)計(jì)的痛點(diǎn)之一。
F3云主機(jī),選用單芯片邏輯單元達(dá)250萬(wàn)個(gè)的VU9P,支持雙芯片600Gbps的互聯(lián),以及多板塊間的100Gbps的互聯(lián),最大實(shí)例支持16個(gè)VU9P芯片,很好地滿(mǎn)足了數(shù)字芯片原型驗(yàn)證階段,對(duì)于大邏輯量的需求。
而客戶(hù)選用F3云主機(jī),避免了維護(hù)復(fù)雜FPGA板卡的大量人力物力的投入,縮減了驗(yàn)證平臺(tái)的維護(hù)成本。
視頻處理(視頻編碼,視頻內(nèi)容處理)
隨著視頻采集及傳輸技術(shù)的發(fā)展,視頻素材的分辨率和幀率在不斷提升。分辨率從2K到4K到8K;幀率從30到60到120;新的標(biāo)準(zhǔn)及技術(shù),比如HDR,也不斷出現(xiàn)。
素材質(zhì)量的增長(zhǎng),圖像碼流量也隨之增長(zhǎng)。人們需要壓縮率更好的壓縮算法標(biāo)準(zhǔn),才能夠適應(yīng)新的圖像壓縮需求:
? 同樣的壓縮率得到更好的畫(huà)質(zhì)
? 同樣的畫(huà)質(zhì)得到更好的壓縮率
以H.265編碼為例,目前客戶(hù)選擇的主流技術(shù)平臺(tái)為CPU或者GPU。
對(duì)于H.265/HEVC編碼處理,F(xiàn)PGA方案有著最完善的功能和preset配置,支持最多的有利于提高畫(huà)質(zhì)和降低bitrate的功能,適合各個(gè)場(chǎng)景下H265/HEVC的編解碼配置。同時(shí)具有靈活部署,易于升級(jí)的特點(diǎn),非常容易就可以在某一個(gè)平臺(tái)上升級(jí)IP特性,甚至根據(jù)需求,隨時(shí)更換成其他協(xié)議的編解碼功能。
FPGA的可擴(kuò)展性也是GPU不可比擬的,能非常容易的在同一塊FPGA上pipeline部署編解碼相關(guān)的上下游應(yīng)用;同時(shí),因?yàn)镕PGA之間的高速互聯(lián)特性,也可以方便地在不同F(xiàn)PGA、不同F(xiàn)PGA板卡間部署完整的相關(guān)應(yīng)用方案。
成本方面,高畫(huà)質(zhì)IP雖然通道數(shù)量基本與GPU持平,但是帶來(lái)的bitrate的大幅降低,可以顯著降低帶寬成本、存儲(chǔ)成本,綜合成本是降低的;
以下為一個(gè)典型的H.265編碼測(cè)試場(chǎng)景,在編碼速度對(duì)應(yīng)x265的“very slow”配置結(jié)果,F(xiàn)PGA編碼器能夠達(dá)到1080p60(60幀/秒)的處理能力,遠(yuǎn)大于x265的3幀/秒。
5.數(shù)據(jù)庫(kù)加速
在數(shù)據(jù)規(guī)模爆炸式增長(zhǎng)的背景下,數(shù)據(jù)處理的速度,無(wú)疑是用戶(hù)所關(guān)心的。
以大型互聯(lián)網(wǎng)公司為例,每天處理的數(shù)據(jù)量級(jí)都在 PB ,每天更新的網(wǎng)頁(yè)以?xún)|計(jì),每 24 小時(shí)更新的日志超過(guò)PB。這樣的數(shù)據(jù)規(guī)模,對(duì)于目前的處理平臺(tái),是個(gè)巨大的挑戰(zhàn),需要大型的集群來(lái)完成。而在這樣的數(shù)據(jù)處理規(guī)模中,數(shù)據(jù)倉(cāng)庫(kù)的性能,直接關(guān)系到了數(shù)據(jù)本身的處理能力。
F3(FPGA)云主機(jī),得益于FPGA細(xì)顆粒度的數(shù)據(jù)處理能力,高并發(fā)度的并行計(jì)算能力,能夠大幅提升數(shù)據(jù)庫(kù)產(chǎn)品的性能:
以數(shù)據(jù)庫(kù)處理中的排序單元為例,在PostgreSQL的核心處理單元加速中,F(xiàn)3相比CPU能夠帶來(lái)10倍以上的性能提升。
再以時(shí)序數(shù)據(jù)的處理為例,大數(shù)據(jù)領(lǐng)域中,時(shí)序數(shù)據(jù)使用超過(guò)一半。廣泛應(yīng)用于物聯(lián)網(wǎng)(IoT)設(shè)備監(jiān)控系統(tǒng) ,企業(yè)能源管理系統(tǒng)(EMS),生產(chǎn)安全監(jiān)控系統(tǒng),電力檢測(cè)系統(tǒng)等行業(yè)場(chǎng)景。F3單路數(shù)據(jù)吞吐性能是單核CPU的30倍以上!
原文鏈接
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://specialneedsforspecialkids.com/yun/19751.html
摘要:前言業(yè)務(wù)開(kāi)發(fā)中經(jīng)常會(huì)用到異步函數(shù),這里簡(jiǎn)單的對(duì)異步函數(shù)以及它的各種各樣的解決方案做一個(gè)淺析優(yōu)缺點(diǎn)優(yōu)點(diǎn)能夠極大的提高程序并發(fā)業(yè)務(wù)邏輯的能力缺點(diǎn)異步函數(shù)的書(shū)寫(xiě)方式和代碼執(zhí)行邏輯很不直觀(guān),回調(diào)函數(shù)這種方式不太符合人類(lèi)的的線(xiàn)性思維異步函數(shù)的執(zhí)行流程 前言 業(yè)務(wù)開(kāi)發(fā)中經(jīng)常會(huì)用到異步函數(shù),這里簡(jiǎn)單的對(duì)異步函數(shù)以及它的各種各樣的解決方案做一個(gè)淺析 優(yōu)缺點(diǎn): 優(yōu)點(diǎn): 能夠極大的提高程序并發(fā)業(yè)務(wù)邏輯的能...
摘要:前言業(yè)務(wù)開(kāi)發(fā)中經(jīng)常會(huì)用到異步函數(shù),這里簡(jiǎn)單的對(duì)異步函數(shù)以及它的各種各樣的解決方案做一個(gè)淺析優(yōu)缺點(diǎn)優(yōu)點(diǎn)能夠極大的提高程序并發(fā)業(yè)務(wù)邏輯的能力缺點(diǎn)異步函數(shù)的書(shū)寫(xiě)方式和代碼執(zhí)行邏輯很不直觀(guān),回調(diào)函數(shù)這種方式不太符合人類(lèi)的的線(xiàn)性思維異步函數(shù)的執(zhí)行流程 前言 業(yè)務(wù)開(kāi)發(fā)中經(jīng)常會(huì)用到異步函數(shù),這里簡(jiǎn)單的對(duì)異步函數(shù)以及它的各種各樣的解決方案做一個(gè)淺析 優(yōu)缺點(diǎn): 優(yōu)點(diǎn): 能夠極大的提高程序并發(fā)業(yè)務(wù)邏輯的能...
摘要:前言業(yè)務(wù)開(kāi)發(fā)中經(jīng)常會(huì)用到異步函數(shù),這里簡(jiǎn)單的對(duì)異步函數(shù)以及它的各種各樣的解決方案做一個(gè)淺析優(yōu)缺點(diǎn)優(yōu)點(diǎn)能夠極大的提高程序并發(fā)業(yè)務(wù)邏輯的能力缺點(diǎn)異步函數(shù)的書(shū)寫(xiě)方式和代碼執(zhí)行邏輯很不直觀(guān),回調(diào)函數(shù)這種方式不太符合人類(lèi)的的線(xiàn)性思維異步函數(shù)的執(zhí)行流程 前言 業(yè)務(wù)開(kāi)發(fā)中經(jīng)常會(huì)用到異步函數(shù),這里簡(jiǎn)單的對(duì)異步函數(shù)以及它的各種各樣的解決方案做一個(gè)淺析 優(yōu)缺點(diǎn): 優(yōu)點(diǎn): 能夠極大的提高程序并發(fā)業(yè)務(wù)邏輯的能...
摘要:第一部分執(zhí)行代碼之后,返回了一個(gè)新的匿名函數(shù),此時(shí)在全局作用域調(diào)用匿名函數(shù)它不在是的屬性或者方法,此時(shí)調(diào)用者是因此輸出是。總結(jié)關(guān)于中的,記住誰(shuí)調(diào)用,就指向誰(shuí)要訪(fǎng)問(wèn)閉包的,要定義個(gè)變量緩存下來(lái)。 前言: 這是一篇關(guān)于閉包函數(shù)的總結(jié)和筆記 希望對(duì)大家有點(diǎn)幫助 寫(xiě)的不好的地方,也請(qǐng)大家多多指教 一: js中的命名函數(shù),匿名函數(shù),自調(diào)用函數(shù)和回調(diào)函數(shù) 1.命名函數(shù): 函數(shù)如果有名字,就...
閱讀 791·2021-09-22 16:01
閱讀 2083·2021-08-20 09:37
閱讀 1693·2019-08-30 15:54
閱讀 1689·2019-08-30 15:44
閱讀 826·2019-08-28 18:23
閱讀 3005·2019-08-26 12:17
閱讀 1005·2019-08-26 11:56
閱讀 1539·2019-08-23 16:20