小編寫這篇文章的主要目的,主要是給大家講解關于python的一些知識,講解的內容是關于如何讀取excel表格的一些詳細方法,請大家要仔細閱讀哦。
一、python讀取excel表格數據
1、讀取excel表格數據常用操作
import xlrd #打開excel表格 data_excel=xlrd.open_workbook('data/dataset.xlsx') #獲取所有sheet名稱 names=data_excel.sheet_names() #獲取book中的sheet工作表的三種方法,返回一個xlrd.sheet.Sheet()對象 table=data_excel.sheets()[0]#通過索引順序獲取sheet table=data_excel.sheet_by_index(sheetx=0)#通過索引順序獲取sheet table=data_excel.sheet_by_name(sheet_name='Sheet1')#通過名稱獲取 #excel工作表的行列操作 n_rows=table.nrows#獲取該sheet中的有效行數 n_cols=table.ncols#獲取該sheet中的有效列數 row_list=table.row(rowx=0)#返回某行中所有的單元格對象組成的列表 cols_list=table.col(colx=0)#返回某列中所有的單元格對象組成的列表 #返回某行中所有單元格的數據組成的列表 row_data=table.row_values(0,start_colx=0,end_colx=None) #返回某列中所有單元格的數據組成的列表 cols_data=table.col_values(0,start_rowx=0,end_rowx=None) row_lenth=table.row_len(0)#返回某行的有效單元格長度 #excel工作表的單元格操作 row_col=table.cell(rowx=0,colx=0)#返回單元格對象 row_col_data=table.cell_value(rowx=0,colx=0)#返回單元格中的數據
2、xlrd模塊主要操作
import xlrd """打開excel表格""" workbook=xlrd.open_workbook("data.xlsx") print(workbook)#結果:<xlrd.book.Book object at 0x000000000291B128> """獲取所有sheet名稱""" sheet_names=workbook.sheet_names() print(sheet_names)#結果:['表1','Sheet2'] """獲取所有或某個sheet對象""" #獲取所有的sheet對象 sheets_object=workbook.sheets() print(sheets_object)#結果:[<xlrd.sheet.Sheet object at 0x0000000002956710>,<xlrd.sheet.Sheet object at 0x0000000002956AC8>] #通過index獲取第一個sheet對象 sheet1_object=workbook.sheet_by_index(0) print(sheet1_object)#結果:<xlrd.sheet.Sheet object at 0x0000000002956710> #通過name獲取第一個sheet對象 sheet1_object=workbook.sheet_by_name(sheet_name="表1") print(sheet1_object)#結果:<xlrd.sheet.Sheet object at 0x0000000002956710> """判斷某個sheet是否已導入""" #通過index判斷sheet1是否導入 sheet1_is_load=workbook.sheet_loaded(sheet_name_or_index=0) print(sheet1_is_load)#結果:True #通過sheet名稱判斷sheet1是否導入 sheet1_is_load=workbook.sheet_loaded(sheet_name_or_index="表1") print(sheet1_is_load)#結果:True """對sheet對象中的行執行操作""" #獲取sheet1中的有效行數 nrows=sheet1_object.nrows print(nrows)#結果:5 #獲取sheet1中第3行的數據 all_row_values=sheet1_object.row_values(rowx=2) print(all_row_values)#結果:[3.0,'b',1,''] row_values=sheet1_object.row_values(rowx=2,start_colx=1,end_colx=3) print(row_values)#結果:['b',1] #獲取sheet1中第3行的單元對象 row_object=sheet1_object.row(rowx=2) print(row_object)#結果:[number:3.0,text:'b',bool:1,empty:''] #獲取sheet1中第3行的單元 row_slice=sheet1_object.row_slice(rowx=2) print(row_slice)#結果:[number:3.0,text:'b',bool:1,empty:''] #獲取sheet1中第3行的單元類型 row_types=sheet1_object.row_types(rowx=2) print(row_types)#結果:array('B',[2,1,4,0]) #獲取sheet1中第3行的長度 row_len=sheet1_object.row_len(rowx=2) print(row_len)#結果:4 #獲取sheet1所有行的生成器 rows_generator=sheet1_object.get_rows() print(rows_generator)#結果:<generator object Sheet.get_rows.<locals>.<genexpr>at 0x00000000028D8BA0> """對sheet對象中的列執行操作""" #獲取sheet1中的有效列數 ncols=sheet1_object.ncols print(ncols)#結果:4 #獲取sheet1中第colx=1列的數據 col_values=sheet1_object.col_values(colx=1) print(col_values)#結果:['測試','a','b','c','d'] col_values1=sheet1_object.col_values(1,1,3) print(col_values1)#結果:['a','b'] #獲取sheet1中第2列的單元 col_slice=sheet1_object.col_slice(colx=1) print(col_slice)#結果:[text:'測試',text:'a',text:'b',text:'c',text:'d'] #獲取sheet1中第2列的單元類型 col_types=sheet1_object.col_types(colx=1) print(col_types)#結果:[1,1,1,1,1] """對sheet對象中的單元執行操作""" #獲取sheet1中第rowx=1行,第colx=2列的單元對象 cell_info=sheet1_object.cell(rowx=1,colx=2) print(cell_info)#結果:text:'m' print(type(cell_info))#結果:<class'xlrd.sheet.Cell'> #獲取sheet1中第rowx=1行,第colx=2列的單元值 cell_value=sheet1_object.cell_value(rowx=1,colx=2) print(cell_value)#結果:m #獲取sheet1中第rowx=1行,第colx=2列的單元類型值 cell_type=sheet1_object.cell_type(rowx=1,colx=2) print(cell_type)#結果:1 #單元類型ctype:empty為0,string為1,number為2,date為3,boolean為4,error為5;
3、讀取單元格內容為日期時間的方式
若單元格內容的類型為date,即ctype值為3時,則代表此單元格的數據為日期
xlrd.xldate_as_tuple(xldate,datemode):若xldate數據為日期/時間,則將轉化為適用于datetime的元組,返回值為元組,格式為:(year,month,day,hour,minute,nearest_second)
xldate:sheet對象中單元格的數據
datemode:日期模式
import xlrd import datetime """讀取sheet對象中的日期""" workbook=xlrd.open_workbook("data.xlsx") sheet2_object=workbook.sheet_by_name("Sheet2") #value_type=sheet2_object.cell(0,1).ctype value_type=sheet2_object.cell_type(0,1) print(value_type)#結果:3,表示該值為date if value_type==3: print("單元格數據為日期") cell_value=sheet2_object.cell_value(1,0) print(cell_value)#結果:43567.0 date_tuple=xlrd.xldate_as_tuple(cell_value,workbook.datemode) print(date_tuple)#結果:(2020,4,12,0,0,0) date_value=datetime.date(*date_tuple[:3]) print(date_value)#結果:2020-04-12 date_format=date_value.strftime('%Y/%m/%d') print(date_format)#結果:2020/04/12
4、讀取合并單元格的數據
若表格為xls格式的,打開workbook時需將formatting_info設置為True,然后再獲取sheet中的合并單元格;若表格有xlsx格式的,打開workbook時保持formatting_info為默認值False,然后再獲取sheet中的合并單元格;
SheetObject.merged_cells:獲取sheet中合并單元格的信息,返回值為列表;若sheet對象中無合并單元格,則返回值為空列表;列表中每個單元格信息的格式為:(row_start,row_end,col_start,col_end);row_start表示合并單元格的起始行;row_end表示合并單元格的結束行;col_start表示合并單元格的起始列;col_end表示合并單元格的結束列;合并單元格的行取值范圍為[row_start,row_end),包括row_start,不包括row_end;合并單元格的列取值范圍為[col_start,col_end),包括col_start,不包括col_end;如:(1,3,4,6):表示從第1到2行合并,從第4到第5列合并;
讀取合并單元格數據僅需merged_cells數據中的row_start和col_start這兩個索引即可
import xlrd """獲取合并的單元格并讀取單元格數據""" #獲取xlsx格式的excel文件中的合并單元格 workbook=xlrd.open_workbook("data.xlsx") sheet2_object=workbook.sheet_by_name("Sheet2") print(sheet2_object.merged_cells)#結果:[(1,2,0,2),(3,6,0,2)] #獲取xls格式的excel文件中的合并單元格 workbook1=xlrd.open_workbook("data.xls",formatting_info=True) sheet2_object1=workbook1.sheet_by_name("Sheet2") print(sheet2_object1.merged_cells)#結果:[(1,2,0,2),(3,6,0,2)] #讀取合并單元格數據(僅需“起始行起始列”即可獲取數據) print(sheet2_object.cell_value(1,0))#結果:總結1 print(sheet2_object.cell_value(3,0))#結果:總結2 #或使用for循環獲取所有的合并單元格數據 for(row_start,row_end,col_start,col_end)in sheet2_object.merged_cells: print(sheet2_object.cell_value(rowx=row_start,colx=col_start))
二、python寫入excel表格數據
1、寫入excel表格數據常用操作和格式設置
import xlwt import datetime #創建一個workbook設置編碼 workbook=xlwt.Workbook(encoding='utf-8') #創建一個worksheet worksheet=workbook.add_sheet('Sheet1') #字體樣式設置 style=xlwt.XFStyle()#初始化樣式 font=xlwt.Font()#為樣式創建字體 font.name='Times New Roman' font.height=20*11#字體大小,11為字號,20為衡量單位 font.bold=True#黑體 font.underline=True#下劃線 font.italic=True#斜體字 style.font=font#設定樣式 #數據寫入excel,參數對應行,列,值 worksheet.write(0,0,'test_data')#不帶樣式的寫入 worksheet.write(1,0,'test_data',style)#帶字體樣式的寫入 #設置單元格寬度 worksheet.col(0).width=3333 #設置單元格背景顏色 pattern=xlwt.Pattern() pattern.pattern=xlwt.Pattern.SOLID_PATTERN pattern.pattern_fore_colour=13 style=xlwt.XFStyle()#Create the Pattern style.pattern=pattern#Add Pattern to Style worksheet.write(2,0,'colour',style) #給單元格添加邊框方法一 borders=xlwt.Borders()#Create Borders borders.left=xlwt.Borders.DASHED#DASHED虛線,NO_LINE沒有,THIN實線 borders.right=xlwt.Borders.DASHED#borders.right=1表示實線 borders.top=xlwt.Borders.DASHED borders.bottom=xlwt.Borders.DASHED borders.left_colour=0x40 borders.right_colour=0x40 borders.top_colour=0x40 borders.bottom_colour=0x40 style=xlwt.XFStyle()#Create Style style.borders=borders#Add Borders to Style worksheet.write(3,0,'border1',style) #給單元格添加邊框方法二 #細實線:1,小粗實線:2,細虛線:3,中細虛線:4,大粗實線:5,雙線:6,細點虛線:7,大粗虛線:8,細點劃線:9,粗點劃線:10,細雙點劃線:11,粗雙點劃線:12,斜點劃線:13 borders=xlwt.Borders() borders.left=1#設置為細實線 borders.right=1 borders.top=1 borders.bottom=1 borders.left_colour=2#顏色設置為紅色 borders.right_colour=2 borders.top_colour=2 borders.bottom_colour=2 style=xlwt.XFStyle()#Create Style style.borders=borders#Add Borders to Style worksheet.write(4,0,'border2',style) #輸入一個日期到單元格 style=xlwt.XFStyle() style.num_format_str='M/D/YY'#Other options:D-MMM-YY,D-MMM,MMM-YY,h:mm,h:mm:ss,h:mm,h:mm:ss,M/D/YY h:mm,mm:ss,[h]:mm:ss,mm:ss.0 worksheet.write(5,0,datetime.datetime.now(),style) #單元格添加計算公式 worksheet.write(0,1,2)#Outputs 2 worksheet.write(0,2,3)#Outputs 3 worksheet.write(1,1,xlwt.Formula('B1*C1'))#Should output"6"(B1[2]*B2[6]) worksheet.write(1,2,xlwt.Formula('SUM(B1,C1)'))#Should output"5"(B1[2]+C1[3]) #向單元格添加一個超鏈接 worksheet.write(0,3,xlwt.Formula('HYPERLINK("http://www.baidu.com";"baidu")'))#Outputs the text"baidu"linking to http://www.baidu.com #單元格合并 worksheet.write_merge(0,0,4,5,'First Merge')#合并0行的4到5列 worksheet.write_merge(1,2,4,5,'Second Merge')#合并1和2行的4到5列 #設置單元格內容的對其方式 alignment=xlwt.Alignment()##Create Alignment alignment.horz=xlwt.Alignment.HORZ_CENTER alignment.vert=xlwt.Alignment.VERT_CENTER style=xlwt.XFStyle() style.alignment=alignment#Add Alignment to Style worksheet.write(0,6,'alignment',style) #保存文件 workbook.save('data_test.xls')
2、字體顏色和背景顏色對應索引號字體顏色:font.colour_index背景顏色:pattern.pattern_fore_colour
到此為止,這篇文章就給大家介紹到這里了,希望可以給大家帶來幫助。
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/128322.html
摘要:重點在自動化測試過程中,經常需要使用文件來存儲測試用例,那么在表格內設計好了測試用例數據后,如何通過自動化讀取呢此時就需要測試小姐姐動手寫代碼了本文主要介紹通過來讀取表格數據。 ...
摘要:對象也有和屬性提供該單元格的位置信息。讀取對象的屬性一個完整的案例代碼如下讀取文檔返回一個對象,有點類似于文件對象在工作薄中取得工作表返回一個列表,存儲表中所有的工作表返回一個對象,返回當前的活動表獲取工作表中,單元格的信息的屬性 Excel 是 Windows 環境下流行的、強大的電子表格應用。openpyxl 模塊讓 Python 程序能讀取和修改 Excel 電子表格文件。例如,...
摘要:還有一種特殊的情況,合并單元格的可以查看合并單元格的情況第一行第到列合并第到行第列合并前兩個參數指行范圍,后兩個參數指列范圍。合并單元格的內容取值只有合并的第一個單元格可以獲取到值,其他為空。 文章鏈接:https://mp.weixin.qq.com/s/fojkVO-AB2cCu7FtDtPBjw 之前的文章介紹過關于寫入excel表格的方法,近期自己在做一個網站,涉及到讀取ex...
摘要:一概述逗號分隔符文件是表格與數據庫操作之中最常用的輸入輸出格式。但是盡管不同規范的之中,分隔符和引用符千差萬別,他們的格式還是大體相似的,因此制作一個可以高效處理文件中的數據同時還能將讀寫的細節隱去的模塊并不是什么難事兒。 一、概述 CSV(逗號分隔符)文件是表格與數據庫操作之中最常用的輸入輸出格式。在RFC4180中的文件描述標準對CSV格式進行規范之前,CSV格式文件就已經被應用了...
閱讀 911·2023-01-14 11:38
閱讀 878·2023-01-14 11:04
閱讀 740·2023-01-14 10:48
閱讀 1983·2023-01-14 10:34
閱讀 942·2023-01-14 10:24
閱讀 819·2023-01-14 10:18
閱讀 499·2023-01-14 10:09
閱讀 572·2023-01-14 10:02