摘要:由此,我嘗試著利用在前端進行圖片主題色的提取。一主題色算法目前比較常用的主題色提取算法有最小差值法中位切分法八叉樹算法聚類色彩建模法等。
本文由云+社區發表
圖片主題色在圖片所占比例較大的頁面中,能夠配合圖片起到很好視覺效果,給人一種和諧、一致的感覺。同時也可用在圖像分類,搜索識別等方面。通常主題色的提取都是在后端完成的,前端將需要處理的圖片以鏈接或id的形式提供給后端,后端通過運行相應的算法來提取出主題色后,再返回相應的結果。
這樣可以滿足大多數展示類的場景,但對于需要根據用戶“定制”、“生成”的圖片,這樣的方式就有了一個上傳圖片---->后端計算---->返回結果的時間,等待時間也許就比較長了。由此,我嘗試著利用 canvas在前端進行圖片主題色的提取。
一、主題色算法目前比較常用的主題色提取算法有:最小差值法、中位切分法、八叉樹算法、聚類、色彩建模法等。其中聚類和色彩建模法需要對提取函數和樣本、特征變量等進行調參和回歸計算,用到 python的數值計算庫 numpy和機器學習庫 scikit-learn,用 python來實現相對比較簡單,而目前這兩種都沒有成熟的js庫,并且js本身也不擅長回歸計算這種比較復雜的計算。我也就沒有深入的研究,而主要將目光放在了前面的幾個顏色量化算法上。
而最小差值法是在給定給定調色板的情況下找到與色差最小的顏色,使用的場景比較小,所以我主要看了中位切分法和八叉樹算法,并進行了實踐。
中位切分法中位切分法通常是在圖像處理中降低圖像位元深度的算法,可用來將高位的圖轉換位低位的圖,如將24bit的圖轉換為8bit的圖。我們也可以用來提取圖片的主題色,其原理是是將圖像每個像素顏色看作是以R、G、B為坐標軸的一個三維空間中的點,由于三個顏色的取值范圍為0~255,所以圖像中的顏色都分布在這個顏色立方體內,如下圖所示。
之后將RGB中最長的一邊從顏色統計的中位數一切為二,使得到的兩個長方體所包含的像素數量相同,如下圖所示
重復這個過程直到切出長方體數量等于主題色數量為止,最后取每個長方體的中點即可。
在實際使用中如果只是按照中點進行切割,會出現有些長方體的體積很大但是像素數量很少的情況。解決的辦法是在切割前對長方體進行優先級排序,排序的系數為體積 * 像素數。這樣就可以基本解決此類問題了。
八叉樹算法八叉樹算法也是在顏色量化中比較常見的,主要思路是將R、G、B通道的數值做二進制轉換后逐行放下,可得到八列數字。如 #FF7880轉換后為
R: 1111 1111 G: 0111 1000 B: 0000 0000
再將RGB通道逐列粘合,可以得到8個數字,即為該顏色在八叉樹中的位置,如圖。
在將所有顏色插入之后,再進行合并運算,直到得到所需要的顏色數量為止。
在實際操作中,由于需要對圖像像素進行遍歷后插入八叉樹中,并且插入過程有較多的遞歸操作,所以比中位切分法要消耗更長的時間。
二、中位切分法實踐根據之前的介紹和網上的相關資料,此處貼上我自己理解實現的中位切分法代碼,并且找了幾張圖片將結果與QQ音樂已有的魔法色相關算法進行比較,圖一為中位切分法結果,圖二為后臺cgi返回結果
圖一
圖二
可以看到有一定的差異,但是差值相對都還比較小的,處理速度在pc上面還是比較快的,三張圖分別在70ms,100ms,130ms左右。這里貼上代碼,待后續批量處理進行對比之后再分析。
(function () { /** * 顏色盒子類 * * @param {Array} colorRange [[rMin, rMax],[gMin, gMax], [bMin, bMax]] 顏色范圍 * @param {any} total 像素總數, imageData / 4 * @param {any} data 像素數據集合 */ function ColorBox(colorRange, total, data) { this.colorRange = colorRange; this.total = total; this.data = data; this.volume = (colorRange[0][1] - colorRange[0][0]) * (colorRange[1][1] - colorRange[1][0]) * (colorRange[2][1] - colorRange[2][0]); this.rank = this.total * (this.volume); } ColorBox.prototype.getColor = function () { var total = this.total; var data = this.data; var redCount = 0, greenCount = 0, blueCount = 0; for (var i = 0; i < total; i++) { redCount += data[i * 4]; greenCount += data[i * 4 + 1]; blueCount += data[i * 4 + 2]; } return [parseInt(redCount / total), parseInt(greenCount / total), parseInt(blueCount / total)]; } // 獲取切割邊 function getCutSide(colorRange) { // r:0,g:1,b:2 var arr = []; for (var i = 0; i < 3; i++) { arr.push(colorRange[i][1] - colorRange[i][0]); } return arr.indexOf(Math.max(arr[0], arr[1], arr[2])); } // 切割顏色范圍 function cutRange(colorRange, colorSide, cutValue) { var arr1 = []; var arr2 = []; colorRange.forEach(function (item) { arr1.push(item.slice()); arr2.push(item.slice()); }) arr1[colorSide][1] = cutValue; arr2[colorSide][0] = cutValue; return [arr1, arr2]; } // 找到出現次數為中位數的顏色 function getMedianColor(colorCountMap, total) { var arr = []; for (var key in colorCountMap) { arr.push({ color: parseInt(key), count: colorCountMap[key] }) } var sortArr = __quickSort(arr); var medianCount = 0; var medianColor = 0; var medianIndex = Math.floor(sortArr.length / 2) for (var i = 0; i <= medianIndex; i++) { medianCount += sortArr[i].count; } return { color: parseInt(sortArr[medianIndex].color), count: medianCount } // 另一種切割顏色判斷方法,根據數量和差值的乘積進行判斷,自己試驗后發現效果不如中位數方法,但是少了排序,性能應該有所提高 // var count = 0; // var colorMin = arr[0].color; // var colorMax = arr[arr.length - 1].color // for (var i = 0; i < arr.length; i++) { // count += arr[i].count; // var item = arr[i]; // if (count * (item.color - colorMin) > (total - count) * (colorMax - item.color)) { // return { // color: item.color, // count: count // } // } // } return { color: colorMax, count: count } function __quickSort(arr) { if (arr.length <= 1) { return arr; } var pivotIndex = Math.floor(arr.length / 2), pivot = arr.splice(pivotIndex, 1)[0]; var left = [], right = []; for (var i = 0; i < arr.length; i++) { if (arr[i].count <= pivot.count) { left.push(arr[i]); } else { right.push(arr[i]); } } return __quickSort(left).concat([pivot], __quickSort(right)); } } // 切割顏色盒子 function cutBox(colorBox) { var colorRange = colorBox.colorRange, cutSide = getCutSide(colorRange), colorCountMap = {}, total = colorBox.total, data = colorBox.data; // 統計出各個值的數量 for (var i = 0; i < total; i++) { var color = data[i * 4 + cutSide]; if (colorCountMap[color]) { colorCountMap[color] += 1; } else { colorCountMap[color] = 1; } } var medianColor = getMedianColor(colorCountMap, total); var cutValue = medianColor.color; var cutCount = medianColor.count; var newRange = cutRange(colorRange, cutSide, cutValue); var box1 = new ColorBox(newRange[0], cutCount, data.slice(0, cutCount * 4)), box2 = new ColorBox(newRange[1], total - cutCount, data.slice(cutCount * 4)) return [box1, box2]; } // 隊列切割 function queueCut(queue, num) { while (queue.length < num) { queue.sort(function (a, b) { return a.rank - b.rank }); var colorBox = queue.pop(); var result = cutBox(colorBox); queue = queue.concat(result); } return queue.slice(0, 8) } function themeColor(img, callback) { var canvas = document.createElement("canvas"), ctx = canvas.getContext("2d"), width = 0, height = 0, imageData = null, length = 0, blockSize = 1, cubeArr = []; width = canvas.width = img.width; height = canvas.height = img.height; ctx.drawImage(img, 0, 0, width, height); imageData = ctx.getImageData(0, 0, width, height).data; var total = imageData.length / 4; var rMin = 255, rMax = 0, gMin = 255, gMax = 0, bMin = 255, bMax = 0; // 獲取范圍 for (var i = 0; i < total; i++) { var red = imageData[i * 4], green = imageData[i * 4 + 1], blue = imageData[i * 4 + 2]; if (red < rMin) { rMin = red; } if (red > rMax) { rMax = red; } if (green < gMin) { gMin = green; } if (green > gMax) { gMax = green; } if (blue < bMin) { bMin = blue; } if (blue > bMax) { bMax = blue; } } var colorRange = [[rMin, rMax], [gMin, gMax], [bMin, bMax]]; var colorBox = new ColorBox(colorRange, total, imageData); var colorBoxArr = queueCut([colorBox], 8); var colorArr = []; for (var j = 0; j < colorBoxArr.length; j++) { colorBoxArr[j].total && colorArr.push(colorBoxArr[j].getColor()) } callback(colorArr); } window.themeColor = themeColor })()三、八叉樹算法實踐
也許是我算法實現的問題,使用八叉樹算法得到的最終結果并不理想,所消耗的時間相對于中位切分法也長了不少,平均時間分別為160ms,250ms,400ms還是主要看八叉樹算法吧...同樣貼上代碼
(function () { var OctreeNode = function () { this.isLeaf = false; this.pixelCount = 0; this.red = 0; this.green = 0; this.blue = 0; this.children = [null, null, null, null, null, null, null, null]; this.next = null; } var root = null, leafNum = 0, colorMap = null, reducible = null; function createNode(index, level) { var node = new OctreeNode(); if (level === 7) { node.isLeaf = true; leafNum++; } else { // 將其丟到第 level 層的 reducible 鏈表中 node.next = reducible[level]; reducible[level] = node; } return node; } function addColor(node, color, level) { if (node.isLeaf) { node.pixelCount += 1; node.red += color.r; node.green += color.g; node.bllue += color.b; } else { var str = ""; var r = color.r.toString(2); var g = color.g.toString(2); var b = color.b.toString(2); while (r.length < 8) r = "0" + r; while (g.length < 8) g = "0" + g; while (b.length < 8) b = "0" + b; str += r[level]; str += g[level]; str += b[level]; var index = parseInt(str, 2); if (null === node.children[index]) { node.children[index] = createNode(index, level + 1); } if (undefined === node.children[index]) { console.log(index, level, color.r.toString(2)); } addColor(node.children[index], color, level + 1); } } function reduceTree() { // 找到最深層次的并且有可合并節點的鏈表 var level = 6; while (null == reducible[level]) { level -= 1; } // 取出鏈表頭并將其從鏈表中移除 var node = reducible[level]; reducible[level] = node.next; // 合并子節點 var r = 0; var g = 0; var b = 0; var count = 0; for (var i = 0; i < 8; i++) { if (null === node.children[i]) continue; r += node.children[i].red; g += node.children[i].green; b += node.children[i].blue; count += node.children[i].pixelCount; leafNum--; } // 賦值 node.isLeaf = true; node.red = r; node.green = g; node.blue = b; node.pixelCount = count; leafNum++; } function buidOctree(imageData, maxColors) { var total = imageData.length / 4; for (var i = 0; i < total; i++) { // 添加顏色 addColor(root, { r: imageData[i * 4], g: imageData[i * 4 + 1], b: imageData[i * 4 + 2] }, 0); // 合并葉子節點 while (leafNum > maxColors) reduceTree(); } } function colorsStats(node, object) { if (node.isLeaf) { var r = parseInt(node.red / node.pixelCount); var g = parseInt(node.green / node.pixelCount); var b = parseInt(node.blue / node.pixelCount); var color = r + "," + g + "," + b; if (object[color]) object[color] += node.pixelCount; else object[color] = node.pixelCount; return; } for (var i = 0; i < 8; i++) { if (null !== node.children[i]) { colorsStats(node.children[i], object); } } } window.themeColor = function (img, callback) { var canvas = document.createElement("canvas"), ctx = canvas.getContext("2d"), width = 0, height = 0, imageData = null, length = 0, blockSize = 1; width = canvas.width = img.width; height = canvas.height = img.height; ctx.drawImage(img, 0, 0, width, height); imageData = ctx.getImageData(0, 0, width, height).data; root = new OctreeNode(); colorMap = {}; reducible = {}; leafNum = 0; buidOctree(imageData, 8) colorsStats(root, colorMap) var arr = []; for (var key in colorMap) { arr.push(key); } arr.sort(function (a, b) { return colorMap[a] - colorMap[b]; }) arr.forEach(function (item, index) { arr[index] = item.split(",") }) callback(arr) } })()四、結果對比
在批量跑了10000張圖片之后,得到了下面的結果
平均耗時對比(js-cgi)
可以看到在不考慮圖片加載時間的情況下,用中位切分法提取的耗時相對較短,而圖片加載的耗時可以說是難以逾越的障礙了(整整拖慢了450ms),不過目前的代碼還有不錯的優化空間,比如間隔采樣,繪制到canvas時減小圖片尺寸,優化切割點查找等,就需要后續進行更深一點的探索了。
顏色偏差
所以看來準確性還是可以的,約76%的顏色與cgi提取結果相近,在大于100的中抽查后發現有部分圖片兩者提取到的主題色各有特點,或者平分秋色,比如
五、小結總結來看,通過canvas的中位切分法與cgi提取的結果相似程度還是比較高的,也有許多圖片有很大差異,需要在后續的實踐中不斷優化。同時,圖片加載時間也是一個難以逾越的障礙,不過目前的代碼還有不錯的優化空間,比如間隔采樣,繪制到canvas時減小圖片尺寸,優化切割點查找等,就需要后續進行更深一點的探索了。
參考文章http://acm.nudt.edu.cn/~twcou...
https://xcoder.in/2014/09/17/...
http://blog.rainy.im/2015/11/...
https://xinyo.org/archives/66115
https://xinyo.org/archives/66352
https://github.com/lokesh/col...
http://y.qq.com/m/demo/2018/m...
此文已由作者授權騰訊云+社區在各渠道發布
獲取更多新鮮技術干貨,可以關注我們騰訊云技術社區-云加社區官方號及知乎機構號
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/53562.html
摘要:由此,我嘗試著利用在前端進行圖片主題色的提取。一主題色算法目前比較常用的主題色提取算法有最小差值法中位切分法八叉樹算法聚類色彩建模法等。 本文由云+社區發表 圖片主題色在圖片所占比例較大的頁面中,能夠配合圖片起到很好視覺效果,給人一種和諧、一致的感覺。同時也可用在圖像分類,搜索識別等方面。通常主題色的提取都是在后端完成的,前端將需要處理的圖片以鏈接或id的形式提供給后端,后端通過運行相...
摘要:由此,我嘗試著利用在前端進行圖片主題色的提取。一主題色算法目前比較常用的主題色提取算法有最小差值法中位切分法八叉樹算法聚類色彩建模法等。 本文由云+社區發表 圖片主題色在圖片所占比例較大的頁面中,能夠配合圖片起到很好視覺效果,給人一種和諧、一致的感覺。同時也可用在圖像分類,搜索識別等方面。通常主題色的提取都是在后端完成的,前端將需要處理的圖片以鏈接或id的形式提供給后端,后端通過運行相...
閱讀 880·2021-11-15 11:38
閱讀 1599·2021-09-24 09:48
閱讀 838·2021-09-24 09:47
閱讀 2270·2021-08-26 14:15
閱讀 3497·2019-08-30 11:09
閱讀 2601·2019-08-29 16:55
閱讀 1582·2019-08-26 14:01
閱讀 3032·2019-08-23 16:47