国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

2018微博詞云項目深度解析

TANKING / 2229人閱讀

摘要:最初產生這個項目的想法應該是在年月份,當時正在學習中,就萌生了這樣一個想法從一個用戶這一年發布的微博數據中,提取最有意義的個關鍵詞。這些東西提交完就可以提交審核了,微博應用審核的速度還算比較快的,一兩天基本差不多會審核完。

最初產生這個項目的想法應該是在2018年10月份,當時正在學習python中,就萌生了這樣一個想法:從一個用戶這一年發布的微博數據中,提取最有意義的top50個關鍵詞。很明顯涉及到了數據采集和自然語言處理的一些知識。
前期準備:

需要到微博開發平臺認證開發者;

在微博開發平臺創建應用;

域名1個,服務器1臺;

微博應用創建和審核

創建應用的目的就是你的網站可以接入微博,使用微博登錄授權,調用微博開放的一些api;質量高,用戶多的應用還會被推薦到微博應用廣場等等。

創建應用需要我們填寫一些信息,應用名稱,描述之類的。把準備好的文案直接粘貼進去就可以;需要不同規格的應用圖標和三張以上應用介紹的宣傳圖。這個里面有一個關鍵點就是應用地址,需要提供一個可訪問到的,并且包含微博組件的一個地址。這些東西提交完就可以提交審核了,微博應用審核的速度還算比較快的,一兩天基本差不多會審核完。

等應用審核完,你就可以拿著appkey和appsecret繼續往下開發了。

微博數據采集

因為微博開放的api接口里并不提供用戶微博數據,所以才使用了數據采集的方案。第一個版本的工具是用nodejs寫的,后來換成了python的版本。

提取關鍵詞

這里還是使用python進行處理:

預處理(去掉微博里的表情、標簽等);

分詞(將整句分割為詞匯);

加載詞庫(包括通用詞庫和用戶自定義詞庫);

去停用詞(去除一些無意義的詞匯);

計算TFIDF,按權重排序;

取前50個詞生成詞云圖片。

串聯項目

項目的基礎架構使用nodejs搭建,整個應用的路由訪問控制,視圖渲染,異常處理, 日志收集,進程管理,都是使用nodejs來完成。

大致流程:

用戶訪問應用;

引導用戶到微博授權頁;

授權成功后,后臺拿到uid,開啟一個新的子進程進行微博詞云圖片的生成;

這個時候給用戶返回一個grant頁面(此時微博詞云的進程可能還沒結束);

用戶點擊到下一個頁面,如果圖片已經生成了,就展示該展示的數據,如果還沒有,就給用戶等待的處理。

對,基本流程差不多就這些,比較簡單。下面看下最終的效果。

重要的知識點

在nodejs中調用python腳本,大致思路就是生成一個shell命令,然后nodejs開啟一個子進程,在子進程中執行這個shell即可。

h5頁面,長按保存成圖片,這里的大致思路如下:

我們將html轉為canvas,然后取出canvas數據放入一個img標簽里。將這個img放到頁面最頂層,并且將不透明度設為0就可以了。然后在微信、微博等app里面,長按就可以保存到手機了,具體實現代碼請看下圖。

總結

更多的是一些交互上的細化處理,讓用戶有更好的操作體驗,和視覺上的沖擊。這個應用視覺沖擊倒是沒有多少,哈哈。

最后,歡迎大家一起交流。

項目地址:http://yk.mcust.cn/wb

文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。

轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/42920.html

相關文章

  • 首次公開,整理12年積累的博客收藏夾,零距離展示《收藏夾吃灰》系列博客

    摘要:時間永遠都過得那么快,一晃從年注冊,到現在已經過去了年那些被我藏在收藏夾吃灰的文章,已經太多了,是時候把他們整理一下了。那是因為收藏夾太亂,橡皮擦給設置私密了,不收拾不好看呀。 ...

    Harriet666 評論0 收藏0
  • 「碼個蛋」2017年200篇精選干貨集合

    摘要:讓你收獲滿滿碼個蛋從年月日推送第篇文章一年過去了已累積推文近篇文章,本文為年度精選,共計篇,按照類別整理便于讀者主題閱讀。本篇文章是今年的最后一篇技術文章,為了讓大家在家也能好好學習,特此花了幾個小時整理了這些文章。 showImg(https://segmentfault.com/img/remote/1460000013241596); 讓你收獲滿滿! 碼個蛋從2017年02月20...

    wangtdgoodluck 評論0 收藏0
  • 用python玩微信(聊天機器人,好友信息統計)

    摘要:用實現微信好友性別及位置信息統計這里使用的庫開發。使用圖靈機器人自動與指定好友聊天讓室友幫忙測試發現發送表情發送文字還能回應,但是發送圖片可能不會回復,猜應該是我們申請的圖靈機器人是最初級的沒有加圖片識別功能。 1.用 Python 實現微信好友性別及位置信息統計 這里使用的python3+wxpy庫+Anaconda(Spyder)開發。如果你想對wxpy有更深的了解請查看:wxpy...

    Youngs 評論0 收藏0
  • 2018.11.19秋招末第二波前端實習/校招小結

    摘要:背景個人背景就讀于東北某普通二本院校計算機軟件工程專業,現大四,北京實習前端方向,自學,技術棧時間背景大概是在月日準備好簡歷開始投遞秋招差不多已經結束招聘崗位不多,投遞對象為大一些的互聯網公司事件背景第一個入職的是好未來的前端實習崗,待遇工 背景 個人背景 就讀于東北某普通二本院校計算機軟件工程專業,現大四,北京實習 前端方向,自學,vue技術棧 時間背景 大概是在11月9日準備...

    suxier 評論0 收藏0

發表評論

0條評論

TANKING

|高級講師

TA的文章

閱讀更多
最新活動
閱讀需要支付1元查看
<