摘要:據(jù)說此部之后,不少影迷熟知的角色演員就要離開漫威世界的熒幕了。換句話說用數(shù)據(jù)說話,誰才是漫威宇宙中著墨最多的人物我之前做了個小調(diào)查僅就我這邊的采樣來看,鋼鐵俠在國內(nèi)是無法撼動的人氣王。
復(fù)聯(lián)4上映了!這次比美國還早了兩天。當然,我還沒看,不會給你們劇透,當然也不想不劇透。
這一部不僅是滅霸這一線劇情的結(jié)局,也被認為漫威第三階段的收官之作。據(jù)說此部之后,不少影迷熟知的角色(演員)就要離開漫威世界的熒幕了。因此剛上映就備受關(guān)注,今天一天國內(nèi)票房就已超5億。
上次的文章《這可能是我用過最“強大”的API:Marvel API》中,我給大家演示了 漫威開放接口(Marvel API) 的功能,并且在最后留了個“彩蛋”:爭取跟《復(fù)聯(lián)4》同步上線一個案例。
很遺憾,最近幾天忙著更新網(wǎng)站,眼看要鴿了。但慶幸的是,我們另一位實訓(xùn)生 @清風小筑 站出來把坑給填了:
對 Marvel API 中的數(shù)據(jù)進行統(tǒng)計分析,將角色之間關(guān)系進行可視化展示。 換句話說: 用數(shù)據(jù)說話,誰才是漫威宇宙中著墨最多的人物 ?
我之前做了個小調(diào)查:
僅就我這邊的采樣來看,鋼鐵俠在國內(nèi)是無法撼動的人氣王。當然,這可能因為國內(nèi)更多是漫威系列電影觀眾。
那么官方的喜好又是如何?
上文中我們說過,在 Marvel API 的開放數(shù)據(jù)中,包含了:
1491 個角色
43759 本漫畫
6200 個創(chuàng)作者
10713 個系列
96740 個故事
75 個事件
我們這次案例選取的是 角色(character) 和 故事(story) 之間的關(guān)系:
選取 故事最多的 N 個角色
根據(jù) 共同出現(xiàn)的故事數(shù) ,衡量 角色之間的關(guān)聯(lián)性
經(jīng)過統(tǒng)計發(fā)現(xiàn),故事數(shù)前3的是:
蜘蛛俠(Spider-Man)- 5192
X戰(zhàn)警(X-Men)- 4551
鋼鐵俠(Iron Man)- 3483
關(guān)聯(lián)性最高的前3位:
X戰(zhàn)警 - 金剛狼 - 1001
神奇四俠 - 霹靂火 - 817
神奇四俠- 隱形女俠 - 773
故事數(shù)最多的25個英雄/團體的關(guān)系圖:
故事數(shù)最多的99個英雄/團體的關(guān)系圖:
Data provided by Marvel. 2014 Marvel
數(shù)據(jù)由 Marvel 提供
來源:http://marvel.com
意料之外但情理之中, 蜘蛛俠是出現(xiàn)故事最多的角色 。這還只是主線角色,沒算上各個平行宇宙和衍生角色。事實上,小蜘蛛在漫威迷中一直有著超高的人氣,或許是因為他的故事更接近于現(xiàn)實中的每一個平凡人,也或許是他那份“ 能力越大,責任越大 (With great power comes great responsibility)”的堅持。而在國內(nèi)觀眾熟知的漫威系列電影中,蜘蛛俠似乎戲份不多,這是由于蜘蛛俠的電影版權(quán)很早就賣給了索尼(X戰(zhàn)警和神奇四俠也是類似)。
鋼鐵俠、美隊、金剛狼 是緊隨其后的角色, X戰(zhàn)警 是故事最多的團體。
關(guān)系圖上的顏色不是我們手動標注的,而是 Gephi 通過 聚類 自動劃分的。文字標簽的大小則體現(xiàn)故事數(shù)的多少。 X戰(zhàn)警、神奇四俠、復(fù)仇者聯(lián)盟 ,這三個團體壟斷了漫威絕大部分的故事。神奇四俠雖然人物和故事不算多,但相關(guān)關(guān)聯(lián)很緊密(大多同時出場),相反典型是 雷神(Thor) ,雖然故事很多,但大多獨來獨往。
最后來說說這個關(guān)系圖的實現(xiàn)過程。主要是兩大塊:
從 Marvel API 獲取數(shù)據(jù) 。首先是獲取所有角色,然后獲取角色相關(guān)的故事,再根據(jù)這些故事信息將角色進行關(guān)聯(lián)統(tǒng)計,最終得到 節(jié)點(角色、故事數(shù))和邊(關(guān)聯(lián)故事數(shù)) 的數(shù)據(jù)。
通過 可視化分析工具 Gephi 將節(jié)點和邊的數(shù)據(jù)進行 可視化 展示,生成關(guān)系圖表。Gephi 的功能很強大,可以調(diào)節(jié)不同的展示效果,各位可以自行體會下。
其他需要注意的:
我們沒有直接通過網(wǎng)絡(luò)請求 Marvel API,而是使用了上次文章中提到的 marvel 模塊來實現(xiàn)。(使用示例見前文)
中間的臨時數(shù)據(jù),因為是 JSON 格式,于是我們用 mongodb 進行了存儲,便于后續(xù)整理分析。如果你自己運行,也可以通過其他方式(比如文件)進行存儲。
經(jīng)過處理后的節(jié)點、邊數(shù)據(jù)我們保存成了 csv 文件,你可以在項目中獲取,直接放進 Gephi 使用。僅供學習,請勿商用。
Marvel API 需要 申請秘鑰 、有請求 速率限制 ,使用時需 標注數(shù)據(jù)出處和來源網(wǎng)址 。
相關(guān)網(wǎng)址:
Marvel API https://developer.marvel.com/docs
marvel庫 https://pypi.org/project/marvel/
Gephi操作手冊 https://gephi.org/users/quick-start/
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://specialneedsforspecialkids.com/yun/43653.html
摘要:數(shù)據(jù)庫文件已經(jīng)超過了了。復(fù)聯(lián)從開始便是漫威宇宙各路超級英雄的集結(jié),到現(xiàn)在的第部,更是全英雄的匯聚。所以,滅霸出現(xiàn)的次數(shù)居然高于了鋼鐵俠。情感分析,又稱為意見挖掘傾向性分析等。 showImg(https://segmentfault.com/img/remote/1460000019095022); 作者 | 羅昭成責編 | 唐小引 《復(fù)聯(lián) 4》國內(nèi)上映第十天,程序員的江湖里開始流傳這...
摘要:另外由于豆瓣上一些電影評分數(shù)量太少而不顯示,所以這里的電影數(shù)量會和票房數(shù)量有所差異。月度票房將類型片的票房按月劃分,得到了這張圖。 去年末的時候,我招收了新的 實訓(xùn)生 。本文是其中一位 @齊大圣 同學在實訓(xùn)兩個月時完成的項目案例。(碼上行動群里同學應(yīng)該都看過這個名字,現(xiàn)在也是助教之一。)項目最初的想法是, 從互聯(lián)網(wǎng)上的公開信息中采集2018年在國內(nèi)上映電影的票房、評分、類型、演員等信息...
摘要:上個禮拜權(quán)力的游戲第八季放出大結(jié)局,最終的結(jié)果布蘭登上了鐵王座。第二位臨冬城史塔克家族的城堡。第二位是什么都不懂的雪諾。第三位是白手起家最后又被騙的龍媽。 showImg(http://upload-images.jianshu.io/upload_images/13825820-995fbee837346456.jpg?imageMogr2/auto-orient/strip%7Ci...
摘要:昨天去看了最近火的發(fā)熱的好萊塢大片奇異博士,故事套路依舊好萊塢,特效吊炸天,看著確實挺爽。咒語是編程這個世界的源代碼的關(guān)鍵詞,或者函數(shù)。奇異博士讓我們接觸到了這個世界的底層世界,魔法師則是能夠掌握和利用這個底層世界的一群人。 昨天去看了最近火的發(fā)熱的好萊塢大片《奇異博士》,故事套路依舊好萊塢,特效吊炸天,看著確實挺爽。 showImg(/img/bVFeD0?w=640&h=360);...
閱讀 1959·2021-09-30 09:46
閱讀 1370·2019-08-30 15:43
閱讀 1129·2019-08-29 13:28
閱讀 1929·2019-08-29 11:24
閱讀 1687·2019-08-26 13:22
閱讀 3929·2019-08-26 12:01
閱讀 1823·2019-08-26 11:33
閱讀 3246·2019-08-23 15:34