使用python统计excel两文件的数据并匹配地市
需求:给出的详单为0712.xls文件,统计地市列北京、上海、广州、深圳一线的数据有多少?
源文件数据0712.xls
import pandas as pddf = pd.read_excel('0712.xls')city = pd.DataFrame({'地市': ['北京', '上海', '广州', '深圳', '全区']})# 自定义统计方法def total_sj(data, name):""":param data::param name::return:"""table = data.groupby(['地市']).size().reset_index(name=name)table = table.append([{'地市': '全区', name: table.apply(lambda x: x.sum())[name]}], ignore_index=True)return table# 统计数据table_tj = pd.merge(city, total_sj(df, '一线数据'),on=['地市'], how='left') # 一线数据# 数据写入excel文件table_tj.to_excel("一线数据写入.xlsx", sheet_name='地市', startcol=0, index=False)print(table_tj)print("写入完毕")print("数据写入成功,文件输出成功")
结果截图:
如有需要请留言评论哦。