聊聊 Python 数据处理全家桶(Memca 篇)
点击上方“AirPython”,选择“加为星标”
第一时间关注 Python 技术干货!
1. 前言
前面谈到 Python 处理 Excel 文件最常见的两种方式,即:xlrd/xlwt、openpyxl
其中,
xlrd/xlwt 这一组合,xlrd 可以负责读取数据,而 xlwt 则负责写入数据,缺点是不支持 xlsx
openpyxl 同时支持对 Excel 文档的读取、写入操作,缺点是不支持 xls
本篇文章将继续聊聊 Python 操作 Excel 文档的其他几种方式
2. xlsxwriter
xlsxwriter 主要用于将数据、图表写入到 Excel 文件中,可以配置使用较小的内存快速写入数据
它的缺点是:无法读取、修改已有的 Excel 文件;如果需要读取修改 Excel 文件,只能搭配其他依赖库使用,比如:xlrd
首先安装 xlsxwriter 的依赖包
pip3installxlsxwriter#安装依赖包
xlsxwriter 提供了Workbook(filename) 方法,用于创建一个工作簿对象
使用工作簿对象的add_worksheet(sheet_name) 函数,就可以在工作簿中创建 Sheet 了
""" 创建工作簿和Sheet :paramfilename:文件名称 :paramworksheet_names:sheet名称列表 :return: """ wb=xlsxwriter.Workbook(filename) sheets=[] #新增sheet forworksheet_nameinworksheet_names: sheets.append(wb.add_worksheet(worksheet_name)) returnwb,sheetsdefcreate_workbook_and_worksheet(filename,worksheet_names):
接着,就可以往某个 Sheet 单元格中写入数据了
如果需要定制单元格的样式,比如:字体大小、字体、颜色、背景、是否加粗等,可以使用工作簿对象的add_format() 方法创建一个样式
""" 创建一个样式,包含:字体大小、字体、颜色、背景、是否加粗等 :paramwb: :paramformat_stuyles: :return: """ returnwb.add_format(format_stuyles) #单元格字体样式 self.title_style={'bold':True,'bg_color':'#B0C4DE','font_size':10,'font_name':'Microsoftyahei'} #创建标题字体样式 title_font_style=create_format_styles(self.wb,self.title_style)defcreate_format_styles(wb,format_stuyles):
Sheet 对象的write(...) 函数用于向单元格中写入数据,参数包含:行索引、列索引、值、字体样式等
需要注意的是,默认 xlsxwriter 的行索引、列索引都是从 0 开始,即: 0 代表第一行
写入数据的同时配置单元格样式的写法如下:
""" 往单元格中写入数据 :paramrow_index:行索引,1:第一行 :paramcolumn_index:列索引,1:第一列 :paramformat_styles字体样式 :return: """ ifrow_index1orcolumn_index1: print('参数输入不正确,写入失败!') else: #注意:默认xlsxwriter的行索引、列索引从0开始 sheet.write(row_index-1,column_index-1,value,format_styles) #往worksheet中写入数据 #第一行 write_to_cell(self.current_sheet,1,1,"姓名",title_font_style) write_to_cell(self.current_sheet,1,2,"年龄",title_font_style) #第二行 write_to_cell(self.current_sheet,2,1,'xingag') write_to_cell(self.current_sheet,2,2,23)defwrite_to_cell(sheet,row_index,column_index,value,format_styles=None):
xlsxwriter 同样支持在单元格中插入图片,包含:本地图片和网络图片
使用的方法是:insert_image()
参数包含:单元格行索引(索引从 0 开始)、单元格列索引、图片文件、可选参数(图片位置、缩放、url 超链接、image_data图片字节流等)
以插入一张网络图片为例
首先,定义一个图片展示可选参数,指定图片的缩放比、url 超链接
positioning=None): """ 插入图片的参数配置 包含:偏移量、缩放比、网络图片链接、超链接、悬停提示灯 :paramx_offset: :paramy_offset: :paramx_scale: :paramy_scale: :paramurl: :paramtip: :paramimage_data: :parampositioning: :return: """ image_options={ 'x_offset':x_offset, 'y_offset':y_offset, 'x_scale':x_scale, 'y_scale':y_scale, 'url':url, 'tip':tip, 'image_data':image_data, 'positioning':positioning, } returnimage_options image_options=create_image_options(x_scale=0.5,y_scale=0.5,url='/u/f3b476549169')defcreate_image_options(x_offset=0,y_offset=0,x_scale=1,y_scale=1,url=None,tip=None,image_data=None,
接着,将网络图片转为字节流
importssl defget_image_data_from_network(url): """ 获取网络图片字节流 :paramurl:图片地址 :return: """ ssl._create_default_https_context=ssl._create_unverified_context #获取网络图片的字节流 image_data=BytesIO(urlopen(url).read()) returnimage_datafromioimportBytesIO
最后,将图片插入到单元格中
""" 插入网络图片 :paramsheet: :paramrow_index: :paramcolumn_index: :paramurl: :paramfilepath: :paramimage_options: :return: """ ifrow_index1orcolumn_index1: return"参数输入有误,插入失败!" #获取图片字节流 image_data=get_image_data_from_network(url) ifimage_options: image_options['image_data']=image_data print(image_options) sheet.insert_image(row_index-1,column_index-1,filepath,image_options) insert_network_image(self.current_sheet,1,1,url,'1.png',image_options4)definsert_network_image(sheet,row_index,column_index,url,filepath,image_options=None):
使用 set_column() 方法可以设置列宽
和 openpyxl 类似,有 2 种使用方式,分别是:字符串索引、列索引数字索引
""" 设置列宽 :paramsheet: :paramindex_start:开始位置,从1开始 :paramindex_end:结束位置 :paramwidth:宽度 :return: """ #方式二选一 #self.current_sheet.set_column('A:C',width) #默认0代表第一列 sheet.set_column(index_start-1,index_end-1,width) #设置列宽度 #设置第1列到第3列的宽度为:100 set_column_width(self.current_sheet,1,3,100)defset_column_width(sheet,index_start,index_end,width):
行高使用set_row() 方法,传入行索引和高度即可
""" 设置行高 :paramsheet: :paramrow_index:行索引,从1开始 :paramheight: :return: """ sheet.set_row(row_index-1,height) #设置行高 set_row_height(self.current_sheet,1,50) set_row_height(self.current_sheet,2,100)defset_row_height(sheet,row_index,height):
写入数据完毕之后,将工作簿关闭,文件会自动保存到本地
#写入文件,并关闭文件 self.wb.close()defteardown(self):
xlsxwriter 还支持插入图表,比如:条形图、柱状图、雷达图等,受限于篇幅,这部分内容就不展开说明了
3. 其他方式
还有一种比较常见的方式是:xlwings
xlwings 是一款开源免费的依赖库,同时支持 Excel 文件的读取、写入、修改
它功能非常强大,还可以和 Matplotlib、Numpy 和Pandas 无缝连接,支持读写 Numpy、Pandas 数据类型;同时,xlwings 可以直接调用 Excel 文件中 VBA 程序
需要注意的是,xlwings 依赖于 MicrosoftExcel 软件,所以使用 WPS 的用户建议直接使用openpyxl
官方文档:
/zh_CN/latest/quickstart.html
另外,还有一个操作 Excel 比较强大的方式,即:Pywin32
其中,
Pywin32 相当于调用 Win 下的系统 API 来操作 Excel 文件
优点是:可以处理复杂图表的数据表
缺点也非常明显,包含:速度慢、占用 CPU 高,仅支持 Win 系统
4. 最后
综合发现,xlrd/xlwt、openpyxl、xlsxwriter 基本上可以满足大部分的日常 Excel 文档操作
要获取全部源码,关注公众号,后台回复「excel」即可获得全部源码
如果你觉得文章还不错,请大家点赞、分享、留言下,因为这将是我持续输出更多优质文章的最强动力!
推荐阅读最全总结 | 聊聊 Python 办公自动化之 Excel(上)最全总结 | 聊聊 Python 办公自动化之 Excel(中)