摘要:本著開源精神和方便用戶,現已將微信公眾號文章采集系統打包成虛擬機,你只需下載安裝虛擬機鏡像,即可使用。規則代碼主要的邏輯是對于微信公眾號的請求進行攔截,把數據轉發到。這里主要是作為服務器來處理攔截的請求,處理微信文章數據和點贊數閱讀數。
本著開源精神和方便用戶,現已將"微信公眾號文章采集系統"打包成虛擬機,你只需下載安裝虛擬機鏡像,即可使用。
系統鏡像有6個G,只能通過種子的形式下載了, 鏡像種子下載地址
鏈接: https://pan.baidu.com/s/1bq9rhO7 密碼: 7r4d
首先要感謝飯口組組長 把他的采集方案開源出來 。
這里能夠稱之為系統是因為涉及到的技術很多,這里一一羅列:
1、anyproxy 阿里巴巴開源的代理攔截器,使用的是4.0的版本,可以很方便的修改 response 信息。anyproxy 我在系統中已經安裝好了,安裝也很簡單,先安裝nodejs環境,然后用npm安裝anyproxy.
anyproxy 4.0開始規則可以作為模塊來開發,寫好了規則代碼之后,不用動原來的代碼,只需要在anproxy的參數帶上規則文件。這里用到的命令 anproxy --rule weixin.js。 關于anproxy如何設置https 證書問題,可以參考官網。我在虛擬機中設置了全局的代理,所以需要 anyproxy 打開后才能,8001端口可以訪問請求才能成功。
規則代碼主要的邏輯是對于微信公眾號的請求進行攔截,把數據轉發到 php。
2、apache+php+mysql 這里主要是作為web服務器來處理anyproxy 攔截的請求,處理微信文章數據和點贊數、閱讀數。
攔截過來的數據的處理可以看具體的php代碼,邏輯不算太復雜。這里為了方便使用的是phpstudy的集成開發環境。
3、按鍵精靈,按鍵精靈是國產的一種類似vb語法的模擬鍵盤鼠標的工具。這里用到按鍵精靈來模擬點擊windows下的微信客戶端。
在處理多個微信公眾號的時候,需要客戶端來點擊,把所有的手動操作通過按鍵精靈來模擬出來。去查看具體的代碼的時候,我在處理點擊歷史消息使用了一個小技巧,事實是開始想通過直接通過識別圖片的辦法來找到 “歷史消息” 按鈕的位置,但是發現怎么也找不到,然后只能 循環向下移動鼠標,直到區域內找到特定的顏色,就是“歷史消息”按鈕。
在一條思路行不通的時候,就要嘗試其他思路。整個系統就是做下來,就是要處理這種看似行得通,實際不通,然后再去嘗試,如此反復。
4、windows 微信客戶端,其實我嘗試過用安卓模擬器,因為我的目標是開箱即用,所以需要把所有的程序都能夠裝到一起,但是在虛擬機中是沒法安裝安卓模擬器,也就是說虛擬機中是沒法做二次虛擬的。這個坑我已經踩過了,大家就不用踩了,記得之前有人問過,阿里云windows服務器能不能裝 安卓模擬器,我想答案是一樣的,虛擬機不能做二次虛擬化,阿里云windows服務器不能裝安卓模擬器。
所以,當我嘗試安卓模擬器后,發現原來微信pc客戶端(包括mac)的功能已經做的很完善了,然后就去嘗試windows客戶端。
5、virtualbox 虛擬機,這個是甲骨文公司出的虛擬機。會涉及到一些網絡的配置,比如設置為NAT模式。
現在把虛擬機鏡像開源出來,里面所有的代碼都在虛擬機中,大家可以隨意修改。
從最開始知道公眾號文章采集到知道實現原理,再到最后做出鏡像,中間經歷過各種困難,耗時耗力,請教各種人,甚至吃飯睡覺都在想某個細節的解決方案,有解決問題的快樂,有被問題纏繞時的苦惱,感謝這個過程中給予過幫助人。
在安裝使用過程中遇到什么問題可以加我微信 ( liuhan199012 )
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/25551.html
摘要:本著開源精神和方便用戶,現已將微信公眾號文章采集系統打包成虛擬機,你只需下載安裝虛擬機鏡像,即可使用。規則代碼主要的邏輯是對于微信公眾號的請求進行攔截,把數據轉發到。這里主要是作為服務器來處理攔截的請求,處理微信文章數據和點贊數閱讀數。 本著開源精神和方便用戶,現已將微信公眾號文章采集系統打包成虛擬機,你只需下載安裝虛擬機鏡像,即可使用。 系統鏡像有6個G,只能通過種子的形式下載了, ...
摘要:極致的插件機制,系統內的系統,安裝和卸載不會對原來的系統產生影響強大的功能完全滿足各階段的需求,支持用戶多端訪問后臺微信前臺等,系統中的系統。多入口模式,多入口分為后臺前端,微信,對內接口,對外接口,不同的業務,不同的設備,進入不同的入口。 RageFrame 2.0 為二次開發而生,讓開發變得更簡單 項目地址:https://github.com/jianyan74/... 前言 這...
摘要:極致的插件機制,系統內的系統,安裝和卸載不會對原來的系統產生影響強大的功能完全滿足各階段的需求,支持用戶多端訪問后臺微信前臺等,系統中的系統。多入口模式,多入口分為后臺前端,微信,對內接口,對外接口,不同的業務,不同的設備,進入不同的入口。 RageFrame 2.0 為二次開發而生,讓開發變得更簡單 項目地址:https://github.com/jianyan74/... 前言 這...
摘要:我從年就開始做微信公眾號內容的批量采集,最開始的目的是為了做一個的垃圾內容網站。經過實測的微信客戶端在批量采集過程中崩潰率高于安卓系統。在年年初的時候微信公眾號和微信文章開始使用鏈接。 我從2014年就開始做微信公眾號內容的批量采集,最開始的目的是為了做一個html5的垃圾內容網站。當時垃圾站采集到的微信公眾號的內容很容易在公眾號里面傳播。當時批量采集特別好做,采集入口是公眾號的歷史消...
閱讀 3221·2021-11-11 16:55
閱讀 2456·2021-10-13 09:39
閱讀 2392·2021-09-13 10:27
閱讀 2155·2019-08-30 15:55
閱讀 3082·2019-08-30 15:54
閱讀 3126·2019-08-29 16:34
閱讀 1819·2019-08-29 12:41
閱讀 1064·2019-08-29 11:33