摘要:我最近才發現在的代碼中就有圖像風格遷移的示例原諒我的后知后覺,是基于論文中的網絡模型實現。中值濾波的窗口大小,用來對結果圖像進行平滑處理,這個對結果影響不大。
現在很多人都喜歡拍照(自拍)。有限的濾鏡和裝飾玩多了也會膩,所以就有 APP 提供了 模仿名畫風格 的功能,比如 prisma、versa 等,可以把你的照片變成 梵高、畢加索、蒙克 等大師的風格。
這種功能叫做“ 圖像風格遷移 ”,幾乎都是基于 CVPR 2015 的論文《 A Neural Algorithm of Artistic Style 》和 ECCV 2016 的論文《 Perceptual Losses for Real-Time Style Transfer and Super-Resolution 》中提出的算法,以及后續相關研究的基礎上開發出來的。
通俗來講,就是借助于 神經網絡 ,預先將名畫中的風格訓練成出模型,在將其應用在不同的照片上,生成新的風格化圖像。
來自《A Neural Algorithm of Artistic Style》
而因為神經網絡在計算機視覺方面的應用越來越廣,著名的視覺開發庫 OpenCV 在 3.3 版本中正式引入 DNN(深度神經網絡) ,支持 Caffe、TensorFlow、Torch/PyTorch 等主流框架的模型,可用以實現圖像的識別、檢測、分類、分割、著色等功能。
我最近才發現在 OpenCV 的 Sample 代碼中就有圖像風格遷移的 Python 示例(原諒我的后知后覺),是基于 ECCV 2016 論文中的網絡模型實現。所以,即使作為人工智能的菜鳥,也可以拿別人訓練好的模型來玩一玩,體會下神經網絡的奇妙。
(相關代碼和模型的獲取見文末)
OpenCV 官方代碼地址: https://github.com/opencv/opencv/blob/3.4.0/samples/dnn/fast_neural_style.py
目錄下通過執行命令運行代碼:
python fast_neural_style.py --model starry_night.t7
model 參數是提供預先訓練好的模型文件路徑,OpenCV 沒有提供下載,但給出的參考項目 https://github.com/jcjohnson/fast-neural-style 中可以找到
其他可設置參數有:
input 可以指定原始圖片/視頻,如果不提供就默認使用攝像頭實時采集。
width、height,調整處理圖像的大小,設置小一點可以提高計算速度。在我自己的電腦上,300x200 的轉換視頻可以達到 15 幀/秒。
median_filter 中值濾波的窗口大小,用來對結果圖像進行平滑處理,這個對結果影響不大。
執行后的效果(取自 jcjohnson/fast-neural-style):
原始圖像ECCV16 modelsinstance_norm models
核心代碼其實很短,就是 加載模型 - > 讀取圖片 -> 進行計算 -> 輸出圖片,我在官方示例基礎上進一步簡化了一下:
import cv2 # 加載模型 net = cv2.dnn.readNetFromTorch("the_scream.t7") net.setPreferableBackend(cv2.dnn.DNN_BACKEND_OPENCV); # 讀取圖片 image = cv2.imread("test.jpg") (h, w) = image.shape[:2] blob = cv2.dnn.blobFromImage(image, 1.0, (w, h), (103.939, 116.779, 123.680), swapRB=False, crop=False) # 進行計算 net.setInput(blob) out = net.forward() out = out.reshape(3, out.shape[2], out.shape[3]) out[0] += 103.939 out[1] += 116.779 out[2] += 123.68 out /= 255 out = out.transpose(1, 2, 0) # 輸出圖片 cv2.imshow("Styled image", out) cv2.waitKey(0)
另外還改了個多效果實時對比的版本(計算量大了,很卡頓),也一并上傳在代碼中。
PS:前兩天看趙雷演唱會的時候我還說:他演唱會的背景 MV 大量使用了 圖像二值化、邊緣檢測 等操作,讓我想到以前數字圖像處理課的大作業……現在圖像風格遷移的效率達到了實時,想必以后也會經常被使用吧
獲取文中相關代碼和模型下載地址,請在公眾號( Crossin的編程教室 )對話中回復關鍵字 名畫
════
其他文章及回答:
如何自學Python | 新手引導 | 精選Python問答 | 如何debug? | Python單詞表 | 知乎下載器 | 人工智能 | 嘻哈 | 爬蟲 | 我用Python | 抓抖音 | requests | AI平臺
歡迎微信搜索及關注: Crossin的編程教室
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/44811.html
摘要:而這其中,很多應用都涉及到計算機視覺這樣一個細分領域。常見的圖像處理灰度圖二值化平滑邊緣提取這幾種都屬于數字圖像處理的常用方法。對這方面知識感興趣的,可以找本數字圖像處理的相關教材系統地看一遍,了解數字圖像處理的基礎。 人工智能 ,一個已經被談論了幾十年的概念(最早是 圖靈 在 1950年 提出)。如今這幾年,相關技術的發展速度是越來越快。高大上如無人駕駛、智能安防、AI輔助診斷,接地...
摘要:而另一款網紅產品抖音,也在去年底上線過一個尬舞機的音樂體感游戲現在成了隱藏功能游戲開始后,隨著音樂會給出不同的動作提示,用戶按照提示擺出正確動作即可得分。 如今說到體感游戲,大家一定都不陌生,比如微軟的 Kinect、任天堂的 Switch,都曾是游戲業的革命性產品。而另一款網紅產品—抖音,也在去年底上線過一個尬舞機的音樂體感游戲(現在成了隱藏功能): showImg(https://...
摘要:美國開國領袖們如果看到美國民眾只能在希拉里和川普中選擇,估計要集體氣活過來。本教程由發布在實驗樓,完整教程及在線練習地址川普撞臉希拉里基于的面部特征交換一教程介紹內容簡介通過庫來實現人臉面部特征交換。 話說這次美國大選可謂賺足了眼球,在美國史上,恐怕沒有哪一年的總統大選會像今年一樣詭譎和熱鬧。 美國開國領袖們如果看到美國民眾只能在希拉里和川普中選擇,估計要集體氣活過來。作為一個閑得蛋疼...
摘要:的文本檢測器是一種基于新穎架構和訓練模式的深度學習模型。深度學習文本檢測器圖文本檢測全卷積網絡的結構等人的圖。隨著和的發布,我們現在可以使用一種名為的基于深度學習的文本檢測器,它基于等人的年論文一種高效精確的場景文本檢測器。 by Adrian Rosebrock on August 20, 2018 in Deep Learning, Optical Character Recogn...
閱讀 3795·2021-09-29 09:34
閱讀 3770·2021-09-27 13:34
閱讀 566·2021-09-24 09:47
閱讀 3037·2019-08-30 15:53
閱讀 1808·2019-08-26 13:54
閱讀 2086·2019-08-26 13:43
閱讀 531·2019-08-23 14:47
閱讀 1740·2019-08-23 14:28