{eval=Array;=+count(Array);}
這個非常簡單,pandas內置了大量函數和類型,可以快速處理日常各種文件,下面我以txt,excel,csv,json和mysql這5種類型文件為例,簡單介紹一下pandas是如何快速讀取這些文件的:
這是最常見的一種文本文件格式,讀取的話,直接使用read_table函數就行,測試代碼如下,這里必須保證txt文件是格式化的,不然讀取的結果會有誤,filename是文件名,header是否包含列標題,sep是每行數據的分隔符,最終讀取的數據類型是DataFrame,方便后面程序進行處理:
這也是一種比較常見的文件格式,讀取的話,直接使用read_excel函數就行,測試代碼如下,非常簡單,直接傳入文件名就行,最終返回結果也是DataFrame類型:
這也是一種比較常見的文件格式,讀取的話,直接使用read_csv函數就行,測試代碼如下,也非常簡單,filename為文件名,header為是否包含列標題,最終返回結果也是DataFrame類型:
這也是一種比較常用的數據存儲格式,讀取的話,直接使用read_json函數就行,測試代碼如下,filename為文件名,如果出現中文亂碼的話,設置encoding編碼為uft-8就行,最終結果也是DataFrame類型:
這里首先需要安裝sqlalchemy框架,之后才能借助read_sql_query函數直接從mysql數據庫讀取數據,安裝的話,直接輸入命令“pip install sqlalchemy”就行,測試代碼如下,也非常簡單,先創建一個connect連接,然后根據sql查詢語句,直接從數據庫中讀取數據就行:
至此,我們就完成了利用python的pandas模塊來讀取txt,excel,csv,json和mysql這5種類型文件的數據。總的來說,pandas這個模塊功能非常強大,尤其對于數據處理來說,可以說是一個利器,在數據分析與處理中經常會用到,只要你熟悉一下相關文檔和示例,很快就能掌握的,網上也有相關資料和教程,介紹的非常詳細,感興趣的話,可以搜一下,希望以上分享的內容能對你有所幫助吧,也歡迎大家評論、留言進行補充。
0
回答0
回答0
回答0
回答0
回答0
回答0
回答0
回答0
回答10
回答