摘要:內容代碼打開文件讀取第一個工作表統計行數微信文章屬性每一行數據形成一個列表列表形成字典返回所有數據循環打開每個微信文章屬性按時間升序排列寫入文件顯示中文縮進為微信寫文件
excel內容:
代碼:
import xlrd import json import operator def read_xlsx(filename): # 打開excel文件 data1 = xlrd.open_workbook(filename) # 讀取第一個工作表 table = data1.sheets()[0] # 統計行數 n_rows = table.nrows data = [] # 微信文章屬性:wechat_name wechat_id title abstract url time read like number for v in range(1, n_rows-1): # 每一行數據形成一個列表 values = table.row_values(v) # 列表形成字典 data.append({"wechat_name": values[0], "wechat_id": values[1], "title": values[2], "abstract": values[3], "url": values[4], "time": values[5], "read": values[6], "like": values[7], "number": values[8], }) # 返回所有數據 return data if __name__ == "__main__": d = [] # 循環打開每個excel for i in range(1, 16): d1 = read_xlsx("./excel data/"+str(i)+".xlsx") d.extend(d1) # 微信文章屬性 # 按時間升序排列 d = sorted(d, key=operator.itemgetter("time")) # 寫入json文件 with open("article.json", "w", encoding="utf-8") as f: #ensure_ascii=False顯示中文,indent=2縮進為2 f.write(json.dumps(d, ensure_ascii=False, indent=2)) name = [] # 微信id寫文件 f1 = open("wechat_id.txt", "w") for i in d: if i["wechat_id"] not in name: name.append(i["wechat_id"]) f1.writelines(i["wechat_id"]) f1.writelines(" ") print(len(name))
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/42448.html
摘要:一大熊貓世界來去自如的老生常談,從基礎來看,我們仍然關心對于與外部數據是如何交互的。函數受限制問題唯一重要的參數,標志著一個的第個頁將會被取出。數據分析入門之總結基礎一歡迎來翔的博客查看完成版。 一.大熊貓世界來去自如:Pandas的I/O 老生常談,從基礎來看,我們仍然關心pandas對于與外部數據是如何交互的。 1.1 結構化數據輸入輸出 read_csv與to_csv 是?對...
摘要:今天要分享的是,用來寫。數據處理環節效率低下,易受干擾。問題排查難以溯源。一旦數據報告有誤,想要定位問題所在,常常需要從頭開始復盤。結果和上面結果結構是一致的。這是官網的文檔,但是卻不完全適用目前的場景。 大毛 豈安科技業務風險分析師 多年訂單業務反欺詐經驗,負責豈安科技多款產品運營工作。 上回筆者分享過一些 pandas 的常用數據查詢語法,但是數據查詢對于 pandas 而言只是冰...
摘要:今天要分享的是,用來寫。數據處理環節效率低下,易受干擾。問題排查難以溯源。一旦數據報告有誤,想要定位問題所在,常常需要從頭開始復盤。結果和上面結果結構是一致的。這是官網的文檔,但是卻不完全適用目前的場景。 大毛 豈安科技業務風險分析師 多年訂單業務反欺詐經驗,負責豈安科技多款產品運營工作。 上回筆者分享過一些 pandas 的常用數據查詢語法,但是數據查詢對于 pandas 而言只是冰...
摘要:如果該文件已存在,文件指針將會放在文件的結尾。運行結果以上是讀取文件的方法。為了輸出中文,我們還需要指定一個參數為,另外規定文件輸出的編碼。 上一篇文章:Python3網絡爬蟲實戰---30、解析庫的使用:PyQuery下一篇文章:Python3網絡爬蟲實戰---32、數據存儲:關系型數據庫存儲:MySQL 我們用解析器解析出數據之后,接下來的一步就是對數據進行存儲了,保存的形式可以...
閱讀 3621·2021-09-30 09:59
閱讀 2229·2021-09-13 10:34
閱讀 577·2019-08-30 12:58
閱讀 1507·2019-08-29 18:42
閱讀 2198·2019-08-26 13:44
閱讀 2922·2019-08-23 18:12
閱讀 3321·2019-08-23 15:10
閱讀 1625·2019-08-23 14:37