【技術系列】淺談GPU虛擬化技術（第一章）

XFLY 發布于2019-06-26 18:22 / 1439人閱讀

摘要：年第一個產品與群雄逐鹿在發布了的產品，則標志著虛擬化的成熟并逐漸開啟了異構計算虛擬化的快速發展歷程。而其中的便是基于的分片虛擬化方案。圖形渲染虛擬化高性價比只此一款。各種新興行業也開始應用虛擬化技術。

摘要： GPU深度好文系列，阿里云技術專家分享

第一章 GPU虛擬化發展史

GPU的虛擬化發展歷程事實上與公有云市場和云計算應用場景的普及息息相關。如果在10年前談起云計算，大部分人的反應是“不知所云“。但是隨著云計算場景的普及，概念的深入人心，慢慢地大家都對云計算有一個較清晰的概念和實例化的理解。自然，隨著應用場景從單一依賴CPU的計算單元的應用擴展到多種體系架構，異構計算場景的應用上來后，對GPU，FPGA，TPU等專業計算芯片也提出了虛擬化和上云的強烈要求。尤其是最近幾年機器學習、深度學習等領域的快速發展，催生了異構計算場景搬遷上云的高潮。

那么這個異構計算應用場景的市場規模有多大呢？異構計算作為機器學習人工智能的計算載體，先來看看人工智能前景如何？（引用出處：https://bg.qianzhan.com/repor...）

圖一：2015-2018年全球人工智能市場規模及預測（單位：億元，%）

圖二： 2014-2018年中國人工智能產業市場規模及增速（單位：億元，%）

所以我們不難理解，為什么各大云計算廠商無論大小，都會極力研發異構計算產品，爭搶市場的主導地位。

由于GPU是異構計算的主力軍，讓我們來回顧一下GPU虛擬化的發展歷史，并對各個GPU廠商做一個橫向比較，大家就不難看出來，哪些廠商處于領導地位，哪些是醬油黨 :)

2008年：序言

VMware的GPU全虛擬化VSGA技術是第一次對GPU共享虛擬化的嘗試，于2008年底在VMware商業化的Workstation 6.5和Fusion 2.0版本中首度問世，后續又在面向數據中心的產品vSphere中有集成。但這是一個VMware專有的閉源解決方案，在開源社區和VMware之外的產品中沒有見到大規模應用，不是本篇關注的重點。

2012年：開始

隨著kernel VFIO模塊的引入和直通設備的慢慢普及，GPU的虛擬化之路得以開啟。而開始大規模運用，則大體是伴隨著VFIO模塊的成功落地。事實上，在2012年左右，GPU直通技術一直是VFIO模塊的一個重要應用場景。

2013年：第一個產品與群雄逐鹿

Nvidia 在2013 發布了GRID K1的產品，則標志著GPU虛擬化的成熟并逐漸開啟了異構計算虛擬化的快速發展歷程。

而事實上在2013同年，Intel OTC 針對HSW的GVT-d 和GVT-g的GPU虛擬化方案的也已經開發了一年有余。當初硬件基于SNB/HSW，而原型代碼是基于Xen Hypervisor。（題外話：回頭來看，會發現當初如日中天的Xen，竟然在幾年后被后起之秀KVM逐漸取代。而當今公有云市場已鮮有Xen的身影了，替Citrix心疼幾秒）。

Intel對GPU行業發展保持著敏銳的技術洞察力，早在2011年便已經開始了GPU虛擬化的提案，然而由于沒有引起足夠的重視，直到三年后的2014年，才有基于GVT-g的XenClient產品問世。

同年： VFIO 模塊的社區維護者在KVM Forum上也正式發布了VGA的assignment。（詳見：https://www.linux-kvm.org/ima...）

同年初： AMD 也已經開始基于SRIOV的GPU虛擬化方案（Tonga架構），并開始研發SRIOV PF的GIM驅動和vGPU調度系統。由此推測SRIOV的硬件實現應該提前半年左右已經完成。直到兩年后，AMD終于迎來了首款GPU SRIOV的產品：FirePro S7150 (2016年初發布)。

Nvidia作為GPU行業的龍頭老大，基本上在GPU虛擬化的研發和產品化是領先了各位對手1-2年以上。而作為競爭對手的AMD在之后奮起直追。而Intel 基本上在那個時期還屬于陪跑者。

2014年：vGPU 分片虛擬化誕生

一年后，也就是2014年，隨著一篇Usenix ATC的論文的發表：”A Full GPU Virtualization Solution with Mediated Pass-Through“ 默默無聞的GPU虛擬化的一個新技術正式進入了大家的視眼：GPU分片虛擬化（中文暫且這么叫吧，因為mediated passh-through的叫法根本就不能讓人明白這個到底是什么）。

該論文由Intel OTC的兩位Principal Engineer發表，也代表了Intel在GPU虛擬化領域的技術積累（產品化一直不見起色，說起來都是淚）。

應該說Nvidia作為行業龍頭對分片虛擬化在社區的推動起到至關重要的角色，事實上VFIO的mdev框架是由Nvidia為了GRID vGPU 產品線而引入。mdev的概念由Nvidia率先提出的，并合并到了Linux 內核4.10。人家玩閉源生態系統也開始擁抱開源。

而AMD 2014 則沒有消息，應該是繼續研發全球首款基于SRIOV的GPU方案。

2015年：分化

Intel 與Citrix的合作，先后發布了基于GVT-d和分片虛擬化的GVT-g的XenClient 和 XenServer的產品。這些產品代表著當時Xen社區GPU虛擬化業界的標桿。為什么是Xen社區呢？因為GVT-g當時還沒有發布KVM 版本。

Intel 也開始在各大內外會議推送GVT-g的技術，當然是希望自己技術可以產品化并有一個好的市場前景。比如在當年“英特爾開發者大會”（IDF）上率先發布了基于GVT-g的多媒體視頻處理云端方案。聽的人很多一百多號人，并且感興趣的也不少。作為一個利用免費GPU來做音視頻處理，比多帶帶用E5 Server要劃算的多。但是遺憾的是最終沒有任何產品落地。究其原因還是內在Intel GPU的定位問題。后續會講到Intel GVT-g 方案的致命傷和痛點。

而AMD繼續研發全球首款SRIOV GPU。

當其他人都在玩技術的時候，Nvidia已經開始了產業布局。同年發布了AWS上和VMware合作的基于GRID的各種方案，比如非常炫酷的Game Streaming。

其實GRID 是大概念。代表了Nvidia的GPU虛擬化的一大摞產品。而其中的GRID vGPU便是基于mdev的分片虛擬化方案。

2016，2017年：回報

2016年AMD帶來了全球首款GPU的SRIOV顯卡FirePro S7150x2。而這款針對圖形渲染應用的產品也成為了之后各大公有云廠商的必推業務。圖形渲染虛擬化高性價比只此一款。

Intel繼續在各大論壇極力宣傳Intel GVT-g技術。并在技術上第一次領先行業龍頭Nvidia率先實現了vGPU的熱遷移技術，可以說Intel OTC的虛擬化部門在自己力所能及的情況下把GVT-g做到了極致，然而在產品化的道路上卻越走越艱難。

Nvidia此時憑借著AI的風口一路狂奔，日益完善GRID技術和分片虛擬化，把對手遠遠的拋在了后面。此時Nvidia也開始在開源社區拋頭露面。并在2016年的KVM Forum的第二天，Nvidia架構師Neo隆重介紹了GRID vGPU技術。而恰巧本人作為GVT-g技術的代表在同一會場做GPU Live Migration的主題介紹。

大家感受一下當時的場景：GRID vGPU聽眾與GVT-g的聽眾對比：

不得不說，早年Intel作為核顯GPU的代表與Nvidia作為獨立顯卡的代表在GPU研發上有深度合作。而隨后與AMD的合作開發CPU+GPU的芯片。以及最近的Intel與AMD合作對抗Nvidia在GPU領域的擠壓。

以上三位既是對手又是朋友。

2018年：新領域

Nvidia繼續保持著行業第一的身份把持了絕大部分市場份額。誰讓人家有遠見早早布局早早收割。

AMD 也有后續產品的發布。比如針對老對手Nvidia的對標Deep Learning的MI25的發布等。

隨著GPU虛擬化應用的普及，GPU虛擬化的應用場景不再限于云計算市場。各種新興行業也開始應用GPU虛擬化技術。最直接的便是車載娛樂系統，簡稱IVI（In-vehicle Information system ）。于是三位老朋友又是老對手，都開始在IVI和自動駕駛領域開始競爭。而這也為Intel GVT-g的技術落地帶來了轉機。于是Intel率先發布了基于物聯網的虛擬化方案（ACRN），并夾帶著GVT-g的分片虛擬化技術浩浩蕩蕩地再次出發。

原文鏈接

閱讀更多干貨好文，請關注掃描以下二維碼：

云服務器 GPU云服務器云計算第一章 GPU 主機技術 GPU主機技術 GPU 云運算技術

文章版權歸作者所有，未經允許請勿轉載,若此文章存在違規行為，您可以聯系管理員刪除。

轉載請注明本文地址：http://specialneedsforspecialkids.com/yun/19719.html

【技術系列】淺談GPU虛擬化技術（第一章）

摘要：年第一個產品與群雄逐鹿在發布了的產品，則標志著虛擬化的成熟并逐漸開啟了異構計算虛擬化的快速發展歷程。而其中的便是基于的分片虛擬化方案。圖形渲染虛擬化高性價比只此一款。各種新興行業也開始應用虛擬化技術。摘要： GPU深度好文系列，阿里云技術專家分享第一章 GPU虛擬化發展史 GPU的虛擬化發展歷程事實上與公有云市場和云計算應用場景的普及息息相關。如果在10年前談起云計算，大部分人的...

n7then 2019-06-24 18:00 評論0 收藏0
《網絡黑白》一書所抄襲的文章列表

摘要：網絡黑白一書所抄襲的文章列表這本書實在是垃圾，一是因為它的互聯網上的文章拼湊而成的，二是因為拼湊水平太差，連表述都一模一樣，還抄得前言不搭后語，三是因為內容全都是大量的科普，不涉及技術也沒有干貨。《網絡黑白》一書所抄襲的文章列表這本書實在是垃圾，一是因為它的互聯網上的文章拼湊而成的，二是因為拼湊水平太差，連表述都一模一樣，還抄得前言不搭后語，三是因為內容全都是大量的科普，不涉及技術...

zlyBear 2019-06-21 16:31 評論0 收藏0
淺談移動端 View 的顯示過程

摘要：被電子束轟擊的每個位置，熒光層都會產生一個小亮點，最終小亮點們將會組成一幅幅影像，顯示在電視屏幕上。下圖展示的是攝像機慢放后，電子束的繪制過程。未來，個推技術團隊將繼續關注移動端的性能優化，為大家分享相關的技術干貨。作者：個推安卓開發工程師一七隨著科技的發展，各種移動端早已成為人們日常生活中不可或缺的部分，人們使用移動端產品工作、社交、娛樂……移動端界面的流暢性已經成為影響用戶...

Zhuxy 2019-08-06 13:42 評論0 收藏0

發表評論

登陸后可評論

0條評論

XFLY

男|高級講師

我要關注我要私信

TA的文章

Linux環境基礎開發工具的使用

閱讀 1297·2021-11-22 09:34
SpinServers：美國服務器75折優惠 $126/月起，圣何塞機房，亞洲優化線路，10Gbps

閱讀 2160·2021-10-08 10:18
Python 常用小妙招（一）

閱讀 1724·2021-09-29 09:35
數據可視化之clay:設計思想和建立初衷

閱讀 2452·2019-08-29 17:20
webpack4.0打包總結

閱讀 2137·2019-08-29 15:36
CSS居中對齊

閱讀 3398·2019-08-29 13:52
Angular2入門系列（二）————環境搭建

閱讀 775·2019-08-29 12:29
CSS:hover選擇器

閱讀 1182·2019-08-28 18:10

国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務器低至59元/年，更有多臺、長期優惠，快來選購！

【技術系列】淺談GPU虛擬化技術（第一章）

相關文章