python模組之openpyxl

最後更新：2018-08-24 來源：互聯網

上載者：User

創建阿里雲帳戶，並獲得超過 40 款產品的免費試用版；而企業帳戶則可以享有總值 $1200 的免費試用版。立即註冊！

標籤：開始使用 exce 一個表示對齊字型顏色 data 合成

這是一個第三方庫，可以處理xlsx格式的Excel檔案。pip install openpyxl安裝。如果使用Aanconda，應該內建了。

讀取Excel檔案

需要匯入相關函數。

from openpyxl import load_workbook# 預設可讀寫，若有需要可以指定write_only和read_only為Truewb = load_workbook(‘mainbuilding33.xlsx‘)

預設開啟的檔案為可讀寫，若有需要可以指定參數read_only為True。

擷取工作表--Sheet

# 獲得所有sheet的名稱print(wb.get_sheet_names())# 根據sheet名字獲得sheeta_sheet = wb.get_sheet_by_name(‘Sheet1‘)# 獲得sheet名print(a_sheet.title)# 獲得當前正在顯示的sheet, 也可以用wb.get_active_sheet()sheet = wb.active 

ps：上述方法不建議使用了
直接用：sheet = workbook.worksheets[0]

擷取儲存格

# 擷取某個儲存格的值，觀察excel發現也是先字母再數位順序，即先列再行b4 = sheet[‘B4‘]# 分別返回print(f‘({b4.column}, {b4.row}) is {b4.value}‘)  # 返回的數字就是int型# 除了用下標的方式獲得，還可以用cell函數, 換成數字，這個表示B4b4_too = sheet.cell(row=4, column=2)print(b4_too.value)

b4.column返回B, b4.row返回4, value則是那個儲存格的值。另外cell還有一個屬性coordinate, 像b4這個儲存格返回的是座標B4。

獲得最大行和最大列

# 獲得最大列和最大行print(sheet.max_row)print(sheet.max_column)

擷取行和列

sheet.rows為產生器, 裡面是每一行的資料，每一行又由一個tuple包裹。
sheet.columns類似，不過裡面是每個tuple是每一列的儲存格。

# 因為按行，所以返回A1, B1, C1這樣的順序for row in sheet.rows:    for cell in row:        print(cell.value)# A1, A2, A3這樣的順序for column in sheet.columns:    for cell in column:        print(cell.value)

上面的代碼就可以獲得所有儲存格的資料。如果要獲得某行的資料呢？給其一個索引就行了，因為sheet.rows是產生器類型，不能使用索引，轉換成list之後再使用索引，list(sheet.rows)[2]這樣就擷取到第三行的tuple對象。

for cell in list(sheet.rows)[2]:    print(cell.value)

如何獲得任意區間的儲存格？

可以使用range函數，下面的寫法，獲得了以A1為左上方，B3為右下角矩形地區的所有儲存格。注意range從1開始的，因為在openpyxl中為了和Excel中的表達方式一致，並不和程式設計語言的習慣以0表示第一個值。

for i in range(1, 4):    for j in range(1, 3):        print(sheet.cell(row=i, column=j))        # out<Cell mainbuilding33.A1><Cell mainbuilding33.B1><Cell mainbuilding33.A2><Cell mainbuilding33.B2><Cell mainbuilding33.A3><Cell mainbuilding33.B3>

還可以像使用切片那樣使用。sheet[‘A1‘:‘B3‘]返回一個tuple，該元組內部還是元組，由每行的儲存格構成一個元組。

for row_cell in sheet[‘A1‘:‘B3‘]:    for cell in row_cell:        print(cell)        for cell in sheet[‘A1‘:‘B3‘]:    print(cell)# out(<Cell mainbuilding33.A1>, <Cell mainbuilding33.B1>)(<Cell mainbuilding33.A2>, <Cell mainbuilding33.B2>)(<Cell mainbuilding33.A3>, <Cell mainbuilding33.B3>)

根據字母獲得列號，根據列號返回字母

需要匯入，這兩個函數存在於openpyxl.utils

from openpyxl.utils import get_column_letter, column_index_from_string# 根據列的數字返回字母print(get_column_letter(2))  # B# 根據字母返回列的數字print(column_index_from_string(‘D‘))  # 4

將資料寫入Excel工作表相關

需要匯入WorkBook

from openpyxl import Workbookwb = Workbook()

這樣就建立了一個新的工作表（只是還沒被儲存）。

若要指定唯寫模式，可以指定參數write_only=True。一般預設的可寫可讀模式就可以了。

print(wb.get_sheet_names())  # 提供一個預設名叫Sheet的表，office2016下建立提供預設Sheet1# 直接賦值就可以改工作表的名稱sheet.title = ‘Sheet1‘# 建立一個工作表，可以指定索引，適當安排其在活頁簿中的位置wb.create_sheet(‘Data‘, index=1)  # 被安排到第二個工作表，index=0就是第一個位置# 刪除某個工作表wb.remove(sheet)del wb[sheet]

寫入儲存格

還可以使用公式哦

# 直接給儲存格賦值就行sheet[‘A1‘] = ‘good‘# B9處寫入平均值sheet[‘B9‘] = ‘=AVERAGE(B2:B8)‘

但是如果是讀取的時候需要加上data_only=True這樣讀到B9返回的就是數字，如果不加這個參數，返回的將是公式本身‘=AVERAGE(B2:B8)‘

append函數

可以一次添加多行資料，從第一行空白行開始（下面都是空白行）寫入。

# 添加一行row = [1 ,2, 3, 4, 5]sheet.append(row)# 添加多行rows = [    [‘Number‘, ‘data1‘, ‘data2‘],    [2, 40, 30],    [3, 40, 25],    [4, 50, 30],    [5, 30, 10],    [6, 25, 5],    [7, 50, 10],]

由於append函數只能按行寫入。如果我們想按列寫入呢。append能實現需求嗎？如果把上面的列表嵌套看作矩陣。只要將矩陣轉置就可以了。使用zip()函數可以實現，不過內部的列表變成了元組就是了。都是可迭代對象，不影響。

list(zip(*rows))# out[(‘Number‘, 2, 3, 4, 5, 6, 7), (‘data1‘, 40, 40, 50, 30, 25, 50), (‘data2‘, 30, 25, 30, 10, 5, 10)]

解釋下上面的list(zip(*rows))首先*rows將列表打散，相當於填入了若干個參數，zip從某個列表中提取第1個值組合成一個tuple，再從每個列表中提取第2個值組合成一個tuple，一直到最短列表的最後一個值提取完畢後結束，更長列表的之後的值被捨棄，換句話，最後的元組個數是由原來每個參數（可迭代對象）的最短長度決定的。比如現在隨便刪掉一個值，最短列表長度為2，data2那一列（豎著看）的值全部被捨棄。

rows = [    [‘Number‘, ‘data1‘, ‘data2‘],    [2, 40],    [3, 40, 25],    [4, 50, 30],    [5, 30, 10],    [6, 25, 5],    [7, 50, 10],]# out[(‘Number‘, 2, 3, 4, 5, 6, 7), (‘data1‘, 40, 40, 50, 30, 25, 50)]

最後zip返回的是zip對象，看不到資料的。使用list轉換下就好了。使用zip可以方便實現將資料按列寫入。

儲存檔案

所有的操作結束後，一定記得儲存檔案。指定路徑和檔案名稱，尾碼名為xlsx。

wb.save(r‘D:\example.xlsx‘)

設定儲存格風格--Style

先匯入需要的類from openpyxl.styles import Font, colors, Alignment

分別可指定字型相關，顏色，和對齊。

字型

bold_itatic_24_font = Font(name=‘等線‘, size=24, italic=True, color=colors.RED, bold=True)sheet[‘A1‘].font = bold_itatic_24_font

上面的代碼指定了等線24號加粗斜體，字型顏色紅色。直接使用cell的font屬性，將Font對象賦值給它。

對齊

也是直接使用cell的屬性aligment，這裡指定垂直置中和水平置中。除了center，還可以使用right、left等等參數。

# 設定B1中的資料垂直置中和水平置中sheet[‘B1‘].alignment = Alignment(horizontal=‘center‘, vertical=‘center‘)

設定行高和列寬

有時候資料太長顯示不完，就需要拉長拉高儲存格。

# 第2行行高sheet.row_dimensions[2].height = 40# C列列寬sheet.column_dimensions[‘C‘].width = 30

合并和拆分儲存格

所謂合併儲存格，即以合并地區的左上方的那個儲存格為基準，覆蓋其他儲存格使之稱為一個大的儲存格。

相反，拆分儲存格後將這個大儲存格的值返回到原來的左上方位置。

# 合併儲存格， 往左上方寫入資料即可sheet.merge_cells(‘B1:G1‘) # 合并一行中的幾個儲存格sheet.merge_cells(‘A1:C3‘) # 合并一個矩形地區中的儲存格

合并後只可以往左上方寫入資料，也就是區間中:左邊的座標。

如果這些要合并的儲存格都有資料，只會保留左上方的資料，其他則丟棄。換句話說若合并前不是在左上方寫入資料，合并後儲存格中不會有資料。

以下是拆分儲存格的代碼。拆分後，值回到A1位置。

sheet.unmerge_cells(‘A1:C3‘)

這裡就拿常用的說，具體的去看openpyxl文檔

用例    投注內容1    1|1.57|21|[email protected]@[email protected]@0#[email protected]|99|-1|20042    1|1.58|21|[email protected]@[email protected]@0#[email protected]|99|-1|20053    1|1.57|21|[email protected]@[email protected]@0#[email protected]|99|-1|2004

樣本：

from openpyxl.reader.excel import load_workbookimport json, urllib3urllib3.disable_warnings()# 預設可讀寫，若有需要可以指定write_only和read_only為Truewb = load_workbook(filename=‘D:\\qwe.xlsx‘)# 根據sheet座標獲得sheetws = wb.worksheets[0]# 擷取表名，擷取行、列print(ws.title)print(ws.max_row)print(ws.max_column)data_dic = {}for rx in range(1, ws.max_row+1):    temp_list = []    pid = rx    w1 = ws.cell(row=rx, column=1).value    w2 = ws.cell(row=rx, column=2).value    w3 = ws.cell(row=rx, column=3).value    temp_list = [w1, w2, w3]    data_dic[pid] = temp_listprint(len(data_dic))print(json.dumps(data_dic, ensure_ascii=False))

結果：

Sheet1424{"1": ["用例", "投注內容", null], "2": [1, "1|1.57|21|[email protected]@[email protected]@0#[email protected]|99|-1|2004", null], "3": [2, "1|1.58|21|[email protected]@[email protected]@0#[email protected]|99|-1|2005", null], "4": [3, "1|1.57|21|[email protected]@[email protected]@0#[email protected]|99|-1|2004", null]}

python模組之openpyxl

本文章原先以中文撰寫並發佈於 aliyun.com，亦設英文版本，僅作資訊用途。本網站不對文章的準確性，完整性或可靠性或其任何翻譯作出任何明示或暗示的陳述或保證。如對該文章有任何疑慮或投訴，請傳送電郵至 info-contact@alibabacloud.com 並提供相關疑慮或投訴的詳細說明。職員會於 5 個工作天內與您聯絡，一經驗證之後，即會刪除該侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

Get Started for Free

Sales Support

1 on 1 presale consultation

Chat Contact Sales
After-Sales Support

24/7 Technical Support 6 Free Tickets per Quarter Faster Response

Open a Ticket
Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.

Learn More