摘要:本著開(kāi)源精神和方便用戶,現(xiàn)已將微信公眾號(hào)文章采集系統(tǒng)打包成虛擬機(jī),你只需下載安裝虛擬機(jī)鏡像,即可使用。規(guī)則代碼主要的邏輯是對(duì)于微信公眾號(hào)的請(qǐng)求進(jìn)行攔截,把數(shù)據(jù)轉(zhuǎn)發(fā)到。這里主要是作為服務(wù)器來(lái)處理攔截的請(qǐng)求,處理微信文章數(shù)據(jù)和點(diǎn)贊數(shù)閱讀數(shù)。
本著開(kāi)源精神和方便用戶,現(xiàn)已將"微信公眾號(hào)文章采集系統(tǒng)"打包成虛擬機(jī),你只需下載安裝虛擬機(jī)鏡像,即可使用。
系統(tǒng)鏡像有6個(gè)G,只能通過(guò)種子的形式下載了, 鏡像種子下載地址
鏈接: https://pan.baidu.com/s/1bq9rhO7 密碼: 7r4d
首先要感謝飯口組組長(zhǎng) 把他的采集方案開(kāi)源出來(lái) 。
這里能夠稱之為系統(tǒng)是因?yàn)樯婕暗降募夹g(shù)很多,這里一一羅列:
1、anyproxy 阿里巴巴開(kāi)源的代理攔截器,使用的是4.0的版本,可以很方便的修改 response 信息。anyproxy 我在系統(tǒng)中已經(jīng)安裝好了,安裝也很簡(jiǎn)單,先安裝nodejs環(huán)境,然后用npm安裝anyproxy.
anyproxy 4.0開(kāi)始規(guī)則可以作為模塊來(lái)開(kāi)發(fā),寫(xiě)好了規(guī)則代碼之后,不用動(dòng)原來(lái)的代碼,只需要在anproxy的參數(shù)帶上規(guī)則文件。這里用到的命令 anproxy --rule weixin.js。 關(guān)于anproxy如何設(shè)置https 證書(shū)問(wèn)題,可以參考官網(wǎng)。我在虛擬機(jī)中設(shè)置了全局的代理,所以需要 anyproxy 打開(kāi)后才能,8001端口可以訪問(wèn)請(qǐng)求才能成功。
規(guī)則代碼主要的邏輯是對(duì)于微信公眾號(hào)的請(qǐng)求進(jìn)行攔截,把數(shù)據(jù)轉(zhuǎn)發(fā)到 php。
2、apache+php+mysql 這里主要是作為web服務(wù)器來(lái)處理anyproxy 攔截的請(qǐng)求,處理微信文章數(shù)據(jù)和點(diǎn)贊數(shù)、閱讀數(shù)。
攔截過(guò)來(lái)的數(shù)據(jù)的處理可以看具體的php代碼,邏輯不算太復(fù)雜。這里為了方便使用的是phpstudy的集成開(kāi)發(fā)環(huán)境。
3、按鍵精靈,按鍵精靈是國(guó)產(chǎn)的一種類似vb語(yǔ)法的模擬鍵盤(pán)鼠標(biāo)的工具。這里用到按鍵精靈來(lái)模擬點(diǎn)擊windows下的微信客戶端。
在處理多個(gè)微信公眾號(hào)的時(shí)候,需要客戶端來(lái)點(diǎn)擊,把所有的手動(dòng)操作通過(guò)按鍵精靈來(lái)模擬出來(lái)。去查看具體的代碼的時(shí)候,我在處理點(diǎn)擊歷史消息使用了一個(gè)小技巧,事實(shí)是開(kāi)始想通過(guò)直接通過(guò)識(shí)別圖片的辦法來(lái)找到 “歷史消息” 按鈕的位置,但是發(fā)現(xiàn)怎么也找不到,然后只能 循環(huán)向下移動(dòng)鼠標(biāo),直到區(qū)域內(nèi)找到特定的顏色,就是“歷史消息”按鈕。
在一條思路行不通的時(shí)候,就要嘗試其他思路。整個(gè)系統(tǒng)就是做下來(lái),就是要處理這種看似行得通,實(shí)際不通,然后再去嘗試,如此反復(fù)。
4、windows 微信客戶端,其實(shí)我嘗試過(guò)用安卓模擬器,因?yàn)槲业哪繕?biāo)是開(kāi)箱即用,所以需要把所有的程序都能夠裝到一起,但是在虛擬機(jī)中是沒(méi)法安裝安卓模擬器,也就是說(shuō)虛擬機(jī)中是沒(méi)法做二次虛擬的。這個(gè)坑我已經(jīng)踩過(guò)了,大家就不用踩了,記得之前有人問(wèn)過(guò),阿里云windows服務(wù)器能不能裝 安卓模擬器,我想答案是一樣的,虛擬機(jī)不能做二次虛擬化,阿里云windows服務(wù)器不能裝安卓模擬器。
所以,當(dāng)我嘗試安卓模擬器后,發(fā)現(xiàn)原來(lái)微信pc客戶端(包括mac)的功能已經(jīng)做的很完善了,然后就去嘗試windows客戶端。
5、virtualbox 虛擬機(jī),這個(gè)是甲骨文公司出的虛擬機(jī)。會(huì)涉及到一些網(wǎng)絡(luò)的配置,比如設(shè)置為NAT模式。
現(xiàn)在把虛擬機(jī)鏡像開(kāi)源出來(lái),里面所有的代碼都在虛擬機(jī)中,大家可以隨意修改。
從最開(kāi)始知道公眾號(hào)文章采集到知道實(shí)現(xiàn)原理,再到最后做出鏡像,中間經(jīng)歷過(guò)各種困難,耗時(shí)耗力,請(qǐng)教各種人,甚至吃飯睡覺(jué)都在想某個(gè)細(xì)節(jié)的解決方案,有解決問(wèn)題的快樂(lè),有被問(wèn)題纏繞時(shí)的苦惱,感謝這個(gè)過(guò)程中給予過(guò)幫助人。
在安裝使用過(guò)程中遇到什么問(wèn)題可以加我微信 ( liuhan199012 )
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://specialneedsforspecialkids.com/yun/84447.html
摘要:本著開(kāi)源精神和方便用戶,現(xiàn)已將微信公眾號(hào)文章采集系統(tǒng)打包成虛擬機(jī),你只需下載安裝虛擬機(jī)鏡像,即可使用。規(guī)則代碼主要的邏輯是對(duì)于微信公眾號(hào)的請(qǐng)求進(jìn)行攔截,把數(shù)據(jù)轉(zhuǎn)發(fā)到。這里主要是作為服務(wù)器來(lái)處理攔截的請(qǐng)求,處理微信文章數(shù)據(jù)和點(diǎn)贊數(shù)閱讀數(shù)。 本著開(kāi)源精神和方便用戶,現(xiàn)已將微信公眾號(hào)文章采集系統(tǒng)打包成虛擬機(jī),你只需下載安裝虛擬機(jī)鏡像,即可使用。 系統(tǒng)鏡像有6個(gè)G,只能通過(guò)種子的形式下載了, ...
摘要:極致的插件機(jī)制,系統(tǒng)內(nèi)的系統(tǒng),安裝和卸載不會(huì)對(duì)原來(lái)的系統(tǒng)產(chǎn)生影響強(qiáng)大的功能完全滿足各階段的需求,支持用戶多端訪問(wèn)后臺(tái)微信前臺(tái)等,系統(tǒng)中的系統(tǒng)。多入口模式,多入口分為后臺(tái)前端,微信,對(duì)內(nèi)接口,對(duì)外接口,不同的業(yè)務(wù),不同的設(shè)備,進(jìn)入不同的入口。 RageFrame 2.0 為二次開(kāi)發(fā)而生,讓開(kāi)發(fā)變得更簡(jiǎn)單 項(xiàng)目地址:https://github.com/jianyan74/... 前言 這...
摘要:極致的插件機(jī)制,系統(tǒng)內(nèi)的系統(tǒng),安裝和卸載不會(huì)對(duì)原來(lái)的系統(tǒng)產(chǎn)生影響強(qiáng)大的功能完全滿足各階段的需求,支持用戶多端訪問(wèn)后臺(tái)微信前臺(tái)等,系統(tǒng)中的系統(tǒng)。多入口模式,多入口分為后臺(tái)前端,微信,對(duì)內(nèi)接口,對(duì)外接口,不同的業(yè)務(wù),不同的設(shè)備,進(jìn)入不同的入口。 RageFrame 2.0 為二次開(kāi)發(fā)而生,讓開(kāi)發(fā)變得更簡(jiǎn)單 項(xiàng)目地址:https://github.com/jianyan74/... 前言 這...
摘要:我從年就開(kāi)始做微信公眾號(hào)內(nèi)容的批量采集,最開(kāi)始的目的是為了做一個(gè)的垃圾內(nèi)容網(wǎng)站。經(jīng)過(guò)實(shí)測(cè)的微信客戶端在批量采集過(guò)程中崩潰率高于安卓系統(tǒng)。在年年初的時(shí)候微信公眾號(hào)和微信文章開(kāi)始使用鏈接。 我從2014年就開(kāi)始做微信公眾號(hào)內(nèi)容的批量采集,最開(kāi)始的目的是為了做一個(gè)html5的垃圾內(nèi)容網(wǎng)站。當(dāng)時(shí)垃圾站采集到的微信公眾號(hào)的內(nèi)容很容易在公眾號(hào)里面?zhèn)鞑ァ.?dāng)時(shí)批量采集特別好做,采集入口是公眾號(hào)的歷史消...
閱讀 2754·2019-08-30 15:53
閱讀 521·2019-08-29 17:22
閱讀 1038·2019-08-29 13:10
閱讀 2307·2019-08-26 13:45
閱讀 2751·2019-08-26 10:46
閱讀 3201·2019-08-26 10:45
閱讀 2503·2019-08-26 10:14
閱讀 466·2019-08-23 18:23