完成目標:
??獲取評論并制作詞云
??畢竟會在煙臺待上三年,先了解了解煙臺這個地方。
編輯器:pycharm
用到的庫:requests、wordcloud、jieba
??爬取去哪兒網關于蓬萊島的游客評論的前20頁
def save_comment(): fp = open("comment.txt", mode="w", encoding="utf-8") for num in range(1, 20): url = "https://piao.qunar.com/ticket/detailLight/sightCommentList.json?sightId=3827&index=" + str( num) + "&page=" + str(num) + "&pageSize=10&tagType=0" headers = { "user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/93.0.4577.63 Safari/537.36 Edg/93.0.961.38", "accept": "application/json, text/javascript, */*; q=0.01", } response = requests.get(url=url, headers=headers) try: commentList = response.json()["data"]["commentList"] for comment in commentList: # content.append() fp.write(comment["content"] + "/n") except Exception as e: pass fp.close()
??讀取評論并制作詞云
def stopwordslist(): # 停用詞列表 stopwords = [line.strip() for line in open("Chinesestopword.txt", encoding="UTF-8").readlines()] return stopwordsdef get_wcd(): fp = open("comment.txt", "r", encoding="utf-8") data = fp.read() stopwords=stopwordslist() data_list = jieba.lcut(data) data_list = " ".join(data_list) outstr = "" for word in data_list: if word not in stopwords: if word != "/t": outstr += word outstr += " " wcd = wordcloud.WordCloud( font_path="simkai.ttf" , colormap="brg" , width=800 , height=400 , max_words=200 , background_color="white" , scale=16 ).generate(outstr) wcd.to_file("comment.jpg")
??還是不錯滴,有機會去~~~
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/119543.html
摘要:接著線程過來通過方式獲取鎖,獲取鎖的過程就是通過操作變量將其值從變為。線程加鎖成功后還有一步重要的操作,就是將設置成為自己。線程屁顛屁顛的就去等待區小憩一會去了。 一、寫在前面 這篇文章,我們聊一聊Java并發中的核武器, AQS底層實現。 不管是工作三四年、還是五六年的在工作或者面試中涉及到并發的是時候總是繞不過AQS這個詞。 首先,確實還有很多人連AQS是什么都不知道,甚至有的竟...
摘要:語料庫是由文本構成的數據集通過提供現成的文本數據來輔助文本處理。那么可以用來做什么呢我自己是一名從事是不錯的入門選項。大數據和人工智能是機器學習和的主要開發語言。 Python培訓有哪些內容?很多零基礎學員不知道Python軟件是干什么用的?Python軟件是Python工程師編寫代碼時所需...
摘要:月底了,又到了我們總結這一個月技術干貨的時候了,又到了我們給粉絲免費送書的日子了。 月底了,又到了我們總結這一個月 Java 技術干貨的時候了,又到了我們給粉絲免費送書的日子了。 7 月份干貨總結 Oracle 發布了一個全棧虛擬機 GraalVM 一文帶你深入拆解 Java 虛擬機 圖文帶你了解 8 大排序算法 Spring Boot 2.x 新特性總結及遷移指南 Spring B...
摘要:但是,客戶在選擇的時候,不要只看概念,一定要緊盯智能,看目標平臺是否在網絡監控大數據分析調度管理等方面下大力氣天浩提醒一個小小的秘訣,就是看其有沒有服務等巨頭,被多家巨頭選用,一般不是假融合。大型互聯網企業的一次宕機,會造成多大影響?國外有網友這么回答:(以為)世界末日來了!這是4月15日Facebook、Instagram等平臺的服務器大面積宕機故障之后,部分網民的吐槽,由此可見網絡服務穩...
閱讀 3599·2021-11-23 09:51
閱讀 2799·2021-11-23 09:51
閱讀 682·2021-10-11 10:59
閱讀 1678·2021-09-08 10:43
閱讀 3228·2021-09-08 09:36
閱讀 3294·2021-09-03 10:30
閱讀 3296·2021-08-21 14:08
閱讀 2201·2021-08-05 09:59