参考链接:
/levy_cui/article/details/82252183
/levy_cui/article/details/86590614
将txt文件转换为Excel格式的xls文件或者xlsx文件,需要用到xlwt模块写入。
Excel文件的读取(xlrd)和写入模块(xlwt)可参考:/hedeyong/p/7646125.html
下面用Python将txt文件转为xls文件,txt2xls.py 代码如下:
#!/bin/env python# -*- encoding: utf-8 -*-#-------------------------------------------------------------------------------# Purpose:txt转换成xls# use: python txt2xls.py filename xlsname#-------------------------------------------------------------------------------import datetimeimport timeimport osimport sysimport xlwt #需要的模块def txt2xls(filename,xlsname): #文本转换成xls的函数,filename 表示一个要被转换的txt文本,xlsname 表示转换后的文件名if os.path.exists(filename):print('Converting xls ... ')f = open(filename, 'r', encode='UTF-8') #打开txt文本进行读取x = 0#在excel开始写的位置(y)y = 0#在excel开始写的位置(x)xls=xlwt.Workbook()sheet = xls.add_sheet('sheet1',cell_overwrite_ok=True) #生成excel的方法,声明excelwhile True: #循环,读取文本里面的所有内容line = f.readline() #一行一行读取if not line: #如果没有内容,则退出循环breakfor i in line.split('\t'):#读取出相应的内容写到xitem=i.strip()sheet.write(x,y,item)y += 1 #另起一列x += 1 #另起一行y = 0 #初始成第一列f.close()xls.save(xlsname+'.xls') #保存if __name__ == "__main__":filename = sys.argv[1]xlsname = sys.argv[2]txt2xls(filename,xlsname)print('Our task has been completed!')
然而,使用xlwd模块写入xls文件,当文件写入超过65536行的时候就会报错,无法转换成功。改用openpyxl这个模块写入xls可以解决这个问题。(当数据行超过一定数量,xls文件是存不下的。显然无法满足我们的大量数据存储需求,这个时候需要改用xlsx。xlsx文件最大行数是1048576行,而xlsx文件则用到了openpyxl模块来进行读入和写入。)
1、导入openpyxl模块:pip install openpyxl
2、txt2xls.py代码中需要修改的地方包括:get_sheet_by_name,sheet.cell(row=x,column=y,value=item), xls.save
修改后代码如下:
#!/bin/env python# -*- encoding: utf-8 -*-#-------------------------------------------------------------------------------# Purpose:txt转换成xlsx# use: python txt2xlsx.py filename xlsxname#-------------------------------------------------------------------------------import datetimeimport timeimport osimport sys#import xlwt import openpyxl #需要的模块def txt2xls(filename,xlsxname): #文本转换成xls的函数,filename 表示一个要被转换的txt文本,xlsname 表示转换后的文件名if os.path.exists(filename):print('Converting xlsx ... ')f = open(filename, 'r', encode='UTF-8') #打开txt文本进行读取x = 1#在excel开始写的位置(y)y = 1#在excel开始写的位置(x)xls=openpyxl.Workbook()sheet = xls.get_sheet_by_name('Sheet') while True: #循环,读取文本里面的所有内容line = f.readline() #一行一行读取if not line: #如果没有内容,则退出循环breakfor i in line.split('\t'):#读取出相应的内容写到xitem=i.strip()sheet.cell(row=x,column=y,value=item)y += 1 #另起一列x += 1 #另起一行y = 1 #初始成第一列f.close()xls.save(xlsname+'.xlsx') #保存if __name__ == "__main__":filename = sys.argv[1]xlsname = sys.argv[2]txt2xls(filename,xlsname)print('Our task has been completed!')