
原文非常清晰,全程无bug,调试通过,留作记录以防丢失
一、xlrd和xlwt
使用之前需要先安装,windows上如果直接在cmd中运行python则需要先执行pip3 install xlrd和pip3 install xlwt,如果使用pycharm则需要在项目的解释器中安装这两个模块,File-Settings-Project:layout-Project Interpreter,点击右侧界面的+号,然后搜索xlrd和xlwt,然后点击Install Package进行安装。
对于excel来说,整个excel文件称为工作簿,工作簿中的每个页称为工作表,工作表又由单元格组成。
对于xlrd和xlwt,行数和列数从0开始,单元格的行和列也从0开始,例如sheetrow_values(2)表示第三行的内容,sheetcell(1,2)value表示第二行第三列单元格的内容。
1xlrd模块读取excel文件
使用xlrd模块之前需要先导入import xlrd,xlrd模块既可读取xls文件也可读取xlsx文件。
获取工作簿对象 :book = xlrdopen_workbook('excel文件名称')
获取所有工作表名称 :names = booksheet_names(),结果为列表
根据索引获取工作表对象 :sheet = booksheet_by_index(i)
根据名称获取工作表对象 :sheet = booksheet_by_name('工作表名称')
获取工作表行数 :rows = sheetnrows
获取工作表列数 :cols = sheetncols
获取工作表某一行的内容 :row = sheetrow_values(i) ,结果为列表 sheetrow(i),列表
获取工作表某一列的内容 :col = sheetcol_values(i) 结果为列表 sheetcol(i),列表
获取工作表某一单元格的内容 :cell = sheetcell_value(m,n)、 sheetcell(m,n)value、sheetrow(m)[n]value,sheetcol(n)[m]value,结果为字符串或数值 sheetcell(0,0),xlrdsheetCell对象
示例:假设在py执行文件同层目录下有一fruitxls文件,有三个sheet页Sheet1、Sheet2、Sheet3,其中Sheet1内容如下:
import xlrd
book = xlrdopen_workbook('fruitxls')print('sheet页名称:',booksheet_names())
sheet = booksheet_by_index(0)
rows = sheetnrows
cols = sheetncolsprint('该工作表有%d行,%d列'%(rows,cols))print('第三行内容为:',sheetrow_values(2))print('第二列内容为%s,数据类型为%s'%(sheetcol_values(1),type(sheetcol_values(1))))print('第二列内容为%s,数据类型为%s'%(sheetcol(1),type(sheetcol(1))))print('第二行第二列的单元格内容为:',sheetcell_value(1,1))print('第三行第二列的单元格内容为:',sheetcell(2,1)value)print('第五行第三列的单元格内容为:',sheetrow(4)[2]value)print('第五行第三列的单元格内容为%s,数据类型为%s'%(sheetcol(2)[4]value,type(sheetcol(2)[4]value)))print('第五行第三列的单元格内容为%s,数据类型为%s'%(sheetcol(2)[4],type(sheetcol(2)[4])))# 执行结果# sheet页名称: ['Sheet1', 'Sheet2', 'Sheet3']# 该工作表有5行,3列# 第三行内容为: ['梨', 35, 1300]# 第二列内容为['单价/元', 80, 35, 45, 38],数据类型为<class 'list'># 第二列内容为[text:'单价/元', number:80, number:35, number:45, number:38],数据类型为<class 'list'># 第二行第二列的单元格内容为: 80# 第三行第二列的单元格内容为: 35# 第五行第三列的单元格内容为: 3000# 第五行第三列的单元格内容为3000,数据类型为<class 'float'># 第五行第三列的单元格内容为number:3000,数据类型为<class 'xlrdsheetCell'>
可以看出通过sheetrow(i)、sheetcol(i)也可获取行或列的内容,并且结果也是一个列表,但是列表中的每一项类似字典的键值对,形式为数据类型:值。
而sheetcell(0,0)获取单元格内容,结果是一个键值对,并且是一个xlrdsheetCell对象。
2xlwt写入excel文件
使用xlwt模块之前需要先导入import xlwt,xlwt模块只能写xls文件,不能写xlsx文件(写xlsx程序不会报错,但最后文件无法直接打开,会报错)。
创建工作簿 :book = xlwtWorkbook(),如果写入中文为乱码,可添加参数encoding = 'utf-8'
创建工作表 :sheet = bookadd_sheet('Sheet1')
向单元格写入内容 :sheetwrite(m,n,'内容1')、sheetwrite(x,y,'内容2')
保存工作簿 :booksave('excel文件名称'),默认保存在py文件相同路径下,如果该路径下有相同文件,会被新创建的文件覆盖,即xlwt不能修改文件。
import xlwt
book = xlwtWorkbook()
sheet = bookadd_sheet('Sheet1')
sheetwrite(0,0,'hello')
sheetwrite(1,0,'你好')
booksave('helloxls')
逐个单元格写入excel比较麻烦,可以按行或者列写入。
import xlwt
proj = ['名称','单价/元','库存/kg']
fruit = ['苹果','梨','香蕉','橘子']
price = [8,35,45,38]
storage = [150,130,100,300]
book = xlwtWorkbook()
sheet = bookadd_sheet('Sheet1')foriin range(0,len(proj)):
sheetwrite(0,i,proj[i]) #按行插入行标题foriin range(0,len(fruit)):
sheetwrite(i+1,0,fruit[i])#插入第一列水果名称foriin range(0,len(price)):
sheetwrite(i+1,1,price[i])#插入第二列单价foriin range(0,len(storage)):
sheetwrite(i+1,2,storage[i])#插入第三列库存booksave('fruit2xls')
二、openpyxl模块
openpyxl模块可实现对excel文件的读、写和修改,只能处理xlsx文件,不能处理xls文件,使用之前同样需要先安装该模块,再导入 import openpyxl。
对于openpyxl,行数和列数都从1开始,单元格的行和列也从1开始。例如sheetcell(1,2)value表示第一行第二列单元格的内容
1openpyxl读取excel文件
获取工作簿对象:book = openpyxlload_workbook('excel文件名称')
获取所有工作表名称:names = booksheetnames
获取工作表对象:sheet1 = bookworksheets[n]、sheet2 = book['工作表名称']、sheet3 = book[booksheetnames[n]]
获取工作表名称:title = sheet1title
获取工作表行数:rows = sheet1max_row
获取工作表列数:cols = sheet1max_column
获取某一单元格内容:cell = sheetcell(1,2)value、sheet['单元格']value例如sheet['B1']value
假设有一fruit2xlsx,除后缀名其他与上述fruitxls完全一样
import openpyxl
book = openpyxlload_workbook('fruit2xlsx')print('所有sheet页名称:',booksheetnames)
sheet = bookworksheets[0]
sheet2 = book['Sheet1']
sheet3 = book[booksheetnames[0]]print('工作表名称:',sheet3title)
rows = sheetmax_row
cols = sheetmax_columnprint('该工作表有%d行,%d列'%(rows,cols))# 执行结果# 所有sheet页名称: ['Sheet1', 'Sheet2', 'Sheet3']# 工作表名称: Sheet1# 该工作表有5行,3列
2行和列生成器
对于xlrd模块来说,可直接通过sheetrow[i]和sheetcol[i]获取行和列的内容,但是对于openpyxl模块来说,无法直接获取某一行或列的内容,openpyxl模块的sheetrows和sheetcolumns表示行和列的生成器,即generator object,需要通过循环或转换成列表、元组的形式得到行或列的值。
print(sheetrows,sheetcolumns)forcolin sheetcolumns:
print(col)forrowin sheetrows:
foriin row:
print(ivalue,end='')
print()# 执行结果# <generator object Worksheet_cells_by_row at 0x00000230E011A2A0> <generator object Worksheet_cells_by_col at 0x00000230E102FC00># (<Cell 'Sheet1'A1>, <Cell 'Sheet1'A2>, <Cell 'Sheet1'A3>, <Cell 'Sheet1'A4>, <Cell 'Sheet1'A5>)# (<Cell 'Sheet1'B1>, <Cell 'Sheet1'B2>, <Cell 'Sheet1'B3>, <Cell 'Sheet1'B4>, <Cell 'Sheet1'B5>)# (<Cell 'Sheet1'C1>, <Cell 'Sheet1'C2>, <Cell 'Sheet1'C3>, <Cell 'Sheet1'C4>, <Cell 'Sheet1'C5>)# 名称 单价/元 库存/kg# 苹果 8 150# 梨 35 130# 香蕉 45 100# 橘子 38 300
如果要获取某一行或者列的内容,可将行、列生成器对象转换成列表或者元组,再循环列表或者元组得到内容。
前面说过openpyxl模块的行和列都从1开始,但是由于将生成器转化成了列表list(sheetrows),而列表的索引从0开始,因此list(sheetrows)[1]还是表示第二行的内容,不是第一行的内容。
foriinlist(sheetrows)[1]:
print(ivalue,end='')print()foriin list(sheetcolumns)[0]:
print(ivalue,end='')# 执行结果# 苹果 8 150# 名称 苹果 梨 香蕉 橘子
获取单元格的内容
print(sheetcell(1,2)value)#第一行第二列单元格的内容print(sheet['a2']value)#使用excel单元格的表示法,字母不区分大小写
3openpyxl写excel文件
创建工作簿 :book = openpyxlWorkbook(),如果写入中文为乱码,可添加参数encoding = 'utf-8'
创建工作表: sheet = bookcreate_sheet('工作表名称',0),0表示创建的工作表在工作薄最前面
向单元格写入内容 :sheetcell(m,n,'内容1')、sheetcell(x,y,'内容2')
保存工作簿 :booksave('excel文件名称'),默认保存在py文件相同路径下,如果该路径下有相同文件,会被新创建的文件覆盖。
book = openpyxlWorkbook()
sheet = bookcreate_sheet('Sheet1',0)
proj = ['名称','单价/元','库存/kg']
fruit = ['苹果','香蕉','梨','橘子']
price = [8,35,45,38]
storage = [150,130,300,100]foriin range(len(proj)):
sheetcell(1,i+1,proj[i])foriin range(len(fruit)):
sheetcell(i+2,1,fruit[i])foriin range(len(price)):
sheetcell(i+2,2,price[i])foriin range(len(storage)):
sheetcell(i+2,3,storage[i])
booksave('fruit2xlsx')
4openpyxl修改excel文件
sheetinsert_rows(m)和sheetinsert_cols(n)分别表示在第m行、第n列前面插入行、列
sheetdelete_rows(m)和sheetdelete_cols(n)分别表示删除第m行、第n列
rows = sheetmax_row
sheetinsert_rows(rows+2)
cherry = ['樱桃',17,80] forjin cherry:
sheetcell(rows+1,cherryindex(j)+1,j)
booksave('fruit2xlsx')
修改单元格内容:sheetcell(m,n) = '内容1'或者sheet['B3'] = '内容2'
sheetcell(3,2,4)
sheet['B3'] = 5booksave('fruit2xlsx')
在最后追加行:sheetappend(可迭代对象)
straberry = ['草莓',20,50]
sheetappend(straberry)
booksave('fruit2xlsx')
三、xlsxwriter 模块
只能 *** 作xlsx,只能写。在excel中插入
import matplotlibpyplot as plt
2 import pandas as pd
3 import random
4 import xlsxwriter
5
6 ts = pdSeries(randomrandrange(10))
7 fig = pltfigure()
8 ax = figadd_subplot(1,1,1)
9 tsplot(ax=ax)
10 figsavefig('foopng')
11
12 workbook = xlsxwriterWorkbook('pngxlsxlsx') # 创建excel文件
13 worksheet1 = workbookadd_worksheet('png') # 括号内为工作表表名
14 # 第一个参数是插入的起始单元格,第二个参数是你文件的绝对路径
15 worksheet1write('A1','hello')
16 worksheet1insert_image('B2','foopng')
18 workbookclose()
xlrd、xlwt和openpyxl处理excel文件,在写入文件的时候不如pandas简单,pandas处理excel文件见另外一篇博客 >
最近用python处理一个小项目,其中涉及到对excel的读写 *** 作,通过查资料及实践做了一下总结,以便以后用。
python读写excel文件要用到两个库:xlrd和xlwt,首先下载安装这两个库。
1、#读取Excel
import xlrd
data = xlrdopen_workbook(excelFile)
table = datasheets()[0]
nrows = tablenrows #行数
ncols = tablencols #列数
for i in xrange(0,nrows):
rowValues= tablerow_values(i) #某一行数据
for item in rowValues:
print item
2、写Excel文件
'''往EXCEl单元格写内容,每次写一行sheet:页签名称;row:行内容列表;rowIndex:行索引;
isBold:true:粗字段,false:普通字体'''
def WriteSheetRow(sheet,rowValueList,rowIndex,isBold):
i = 0
style = xlwteasyxf('font: bold 1')
#style = xlwteasyxf('font: bold 0, color red;')#红色字体
#style2 = xlwteasyxf('pattern: pattern solid, fore_colour yellow; font: bold on;') # 设置Excel单元格的背景色为**,字体为粗体
for svalue in rowValueList:
strValue = unicode(str(svalue),'utf-8')
if isBold:
sheetwrite(rowIndex,i,strValue,style)
else:
sheetwrite(rowIndex,i,strValue)
i = i + 1
'''写excel文件'''
def save_Excel(strFile):
excelFile = unicode(strFile, "utf8")
wbk = xlwtWorkbook()
sheet = wbkadd_sheet('sheet1',cell_overwrite_ok=True)
headList = ['标题1','标题2','标题3','标题4','总计']
rowIndex = 0
WriteSheetRow(sheet,headList,rowIndex,True)
for i in xrange(1,11):
rowIndex = rowIndex + 1
valueList = []
for j in xrange(1,5):
valueListappend(ji)
WriteSheetRow(sheet,valueList,rowIndex,False)
wbksave(excelFile)
style2 = xlwteasyxf('pattern: pattern solid, fore_colour yellow; font: bold on;')
在设置上Excel单元格的背景色时,fore_colour 支持的颜色是有限的,仅支持一下颜色
aqua 0x31
black 0x08
blue 0x0C
blue_gray 0x36
bright_green 0x0B
brown 0x3C
coral 0x1D
cyan_ega 0x0F
dark_blue 0x12
dark_blue_ega 0x12
dark_green 0x3A
dark_green_ega 0x11
dark_purple 0x1C
dark_red 0x10
dark_red_ega 0x10
dark_teal 0x38
dark_yellow 0x13
gold 0x33
gray_ega 0x17
gray25 0x16
gray40 0x37
gray50 0x17
gray80 0x3F
green 0x11
ice_blue 0x1F
indigo 0x3E
ivory 0x1A
lavender 0x2E
light_blue 0x30
light_green 0x2A
light_orange 0x34
light_turquoise 0x29
light_yellow 0x2B
lime 0x32
magenta_ega 0x0E
ocean_blue 0x1E
olive_ega 0x13
olive_green 0x3B
orange 0x35
pale_blue 0x2C
periwinkle 0x18
pink 0x0E
plum 0x3D
purple_ega 0x14
red 0x0A
rose 0x2D
sea_green 0x39
silver_ega 0x16
sky_blue 0x28
tan 0x2F
teal 0x15
teal_ega 0x15
turquoise 0x0F
violet 0x14
white 0x09
yellow 0x0D"""
另外一种方式是 用pyExcelerator
from pyExcelerator import # excel 第一行数据excel_headDatas = [u'发布时间', u'文章标题', u'文章链接', u'文章简介']
articles =[
{u'发布时间':u'2017年5月9日',
u'文章标题':u'Python项目实战教程:国内就能访问的google搜索引擎',
u'
u'文章简介':u'大家可以留言、想了解python那个方向的知识、不然我也不知道'},
{u'发布时间':u'2017年5月4日',
u'文章标题':u'对于学习Django的建议、你知道的有那些',
u'文章链接':',
u'文章简介':u'随着Django14第二个候选版的发布,虽然还不支持Python3,但Django团队已经在着手计划中,据官方博客所说,Django15将会试验性的支持python3'}
]# 定义excel *** 作句柄excle_Workbook = Workbook()
excel_sheet_name = timestrftime('%Y-%m-%d')
excel_sheet = excle_Workbookadd_sheet(excel_sheet_name)
index = 0#标题for data in excel_headDatas:
excel_sheetwrite(0, index, data)
index += 1index = 1#内容for article in articles:
colIndex = 0 for item in excel_headDatas:
excel_sheetwrite(index, colIndex, article[item])
colIndex += 1
index += 1#保存testxlsx到当前程序目录excle_Workbooksave('testxlsx')# db = mongoDBmongoDbBase()# dbGet_information_stat()
以下代码调试通过:
import xlrd# 打开 xls 文件
book = xlrdopen_workbook("testxls")
print "表单数量:", booknsheets
print "表单名称:", booksheet_names()
# 获取第1个表单
sh = booksheet_by_index(0)
print u"表单 %s 共 %d 行 %d 列" % (shname, shnrows, shncols)
print "第二行第三列:", shcell_value(1, 2)
运行效果:
读取一个Excel的基本流程
1 双击打开一个Excel文件
2 选择sheet
3 对sheet里面的东西进行 *** 作
在python中我们使用第三方模块 openpyxl模块 *** 作Excel
ps:这个模块不是python自带的 是第三方模块需要我们下载的
进入终端输入: pip install openpyxl
如果想要下载快点:百度搜索 python第三方源
from openpyxl import load_workbook
# 1 打开Excel文件
workbook = load_workbook("p1xlsx")
# 2 选择sheet
# 21 获取所有sheet
# print(workbooksheetnames)
# 22 选择sheet
sheet = workbook["Sheet1"]
print(sheetmax_row) # 最大行号
print(sheetmax_column) # 最大列号
# 23 我们选择了sheet后就可以去 *** 作数据了
# cell = sheetcell(1, 1) # 获取到单元格
# print(cellvalue)
sheet 相关 *** 作
from openpyxl import load_workbook
# 1 打开Excel文件
workbook = load_workbook("p1xlsx")
# 2 选择sheet
# 21 获取所有sheet
# print(workbooksheetnames)
# 22 选择sheet
# sheet = workbook["Sheet1"]
# 23 基于索引的方式获取sheet
# sheet = workbookworksheets[0]
# 3 获取到所有的sheet
# for name in workbooksheetnames:
# sheet = workbook[name]
# cell = sheetcell(1, 1)
# print(cellvalue)
读单元格的数据
from openpyxl import load_workbook
# 1 打开Excel文件
workbook = load_workbook("p1xlsx")
# 2 获取sheet
sheet = workbookworksheets[0]
# 获取到第N行第N列的单元格
# cell = sheetcell(1, 2)
# print(cellvalue)
# 获取到某个单元格
# cell = sheet['A2']
# print(cellvalue)
# print()
# for cell in sheet[1]: # 获取到第一行的内容
# print(cellvalue)
# 获取到所有的行的数据 获取到一列的值
# for row in sheetrows:
# print(row[0]value)
# 获取到所有的列的数据 获取到一行的值
for col in sheetcolumns:
print(col[0]value)
写Excel
# 在Excel中想要写文件 大致可以分为两种
# 1 在原有的Excel的基础上写内容
# 2 在一个新的Excel里面写内容
1 打开Excel表格
2 找到单元格 修改写入内容
3 保存
# from openpyxl import load_workbook
#
# # 1 打开Excel文件
# workbook = load_workbook("p1xlsx")
# # 2 获取sheet
# sheet = workbookworksheets[0]
#
# # 获取到第N行第N列的单元格
# # cell = sheetcell(1, 2)
# # print(cellvalue)
#
# # 获取到某个单元格
#
# # cell = sheet['A2']
# # print(cellvalue)
#
# # print()
# # for cell in sheet[1]: # 获取到第一行的内容
# # print(cellvalue)
#
#
# # 获取到所有的行的数据 获取到一列的值
# # for row in sheetrows:
# # print(row[0]value)
#
# # 获取到所有的列的数据 获取到一行的值
# for col in sheetcolumns:
# print(col[0]value)
# from openpyxl import workbook
# wb = workbookWorkbook() # 创建一个Excel会默认有一个sheet 就叫 Sheet
# 1 修改sheet名称
# sheet = wbworksheets[0]
# sheettitle = '数据集'
# wbsave('p2xlsx')
# 2 创建一个新的sheet 还可以设置颜色
# sheet = wbcreate_sheet('工作计划', 1)
# sheetsheet_propertiestabColor = 'FFB6C1'
# wbsave('p2xlsx')
# 3 copy sheet
# sheet = wbcreate_sheet('工作计划')
# sheetsheet_propertiestabColor = 'FFB6C1'
#
# new_sheet = wbcopy_worksheet(wb['Sheet'])
# new_sheettitle = '新的计划'
# wbsave('p2xlsx')
# print(wbsheetnames)
# sheet = wbworksheets[0]
# cell = sheetcell(1, 1)
# cellvalue = '哈哈哈'
#
# wbsave('p2xlsx')
from openpyxl import load_workbook
# 1 打开Excel文件
workbook = load_workbook("p2xlsx")
# 2 获取sheet
sheet = workbookworksheets[0]
# 1 获取某个单元格 修改值
# cell = sheetcell(1, 1)
# cellvalue = '哈哈哈'
# wbsave('p2xlsx')
# 2 获取某个单元格 修改值
# sheet['B3'] = '光'
# workbooksave('p2xlsx')
# cell_list = sheet["B2": 'C3']
# for row in cell_list:
# for cell in row:
# cellvalue = '新的值'
# workbooksave('p1xlsx')
for row in sheetiter_rows(min_row=5, min_col=1, max_col=7, max_row=10):
for cell in row:
cellvalue = 'oo'
workbooksave('p1xlsx')
r row in sheetiter_rows(min_row=5, min_col=1, max_col=7, max_row=10):
for cell in row:
cellvalue = ‘oo’
workbooksave(‘p1xlsx’)
Python读写EXCEL文件常用方法大全
Huny 信息网络工程研究中心 2020-12-19
1 前言
python读写excel的方式有很多,不同的模块在读写的讲法上稍有区别,这里我主要介绍几个常用的方式。
用xlrd和xlwt进行excel读写;
用openpyxl进行excel读写;
用pandas进行excel读写;
参考:
>
以上就是关于python *** 作excel 读 写 xlsx全部的内容,包括:python *** 作excel 读 写 xlsx、python怎么读取excel文件、python怎么读写excel文件等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)