1200字范文,内容丰富有趣,写作的好帮手!
1200字范文 > pandas库读取多个excel文件数据并进行筛选合并处理后导入到新表格中

pandas库读取多个excel文件数据并进行筛选合并处理后导入到新表格中

时间:2021-06-09 12:31:08

相关推荐

pandas库读取多个excel文件数据并进行筛选合并处理后导入到新表格中

一、说明:

通过pandas库解决生活中的实际问题,关键词:pandas:Series/DataFrame

实际场景:

①前几日家中的服装店部分库存需要补货,店长向厂家下了部分订单;

②几日后到了一批货物,其中系统中共收到3张收货明细单;

③收到后业务员对实际的货物进行了清点,最终形成了一张纸质的收货单据,样式如下:

货号00000001:15件;货号000000002:13件…

④我打开系统中的收货单发现问题,店长下的订单厂家部分缺货并未发货,但是在其发货清单中这部分数据中的发货数量为0,且其中存在大量统计时的无效数据;

⑤通过Python实现高效率的从三张电子货单中筛选所需数据并进行合并计算,最终得出厂家的发货单明细数据;

⑥同业务员的纸质单据进行逐一核实。

二、数据截图:

取出图片中部分数据经过处理后导出到新表格中

三、代码实现

# 日期:-11-05# 作者:Skyler# 说明:读取多个表格中指定列数据并进行筛选计算,最终将结果导出到excel表格# 方法:如需求和我一致(具体可参考图片内容),则修改路径变量即可:1.将所有文件放到指定路径的文件夹内;2.注意最终输出的路径#导入所需要的模块import pandas as pdimport os#定义文件路径path='E:/4.Python/8.files/'#通过函数取出所有文件名称files=os.listdir(path)df4=pd.DataFrame()#循环拼接路径>读取所有文件>条件筛选所需数据>分组聚合进行计算>转换数据类型>添加到定义的变量中for i in range(0,len(files)):file_name=path+files[i]df=pd.read_excel(file_name)df=df[df['数量']>0]df=df[df['标准价']>0]df2=df.groupby(['商品','标准价'])['数量'].sum()print('----------------------------------------------------------')df3=pd.DataFrame(df2)#print(df3)df4=df4.append(df3) #print(df4) #导出最终结果到excel表格中 df4.to_excel(r'C:\Users\Skyler\Desktop\info.xlsx')

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。