一、简介
pd.concat()函数可以沿着指定的轴将多个dataframe或者series拼接到一起。
基本语法:
pd.concat( objs, axis=0, join=‘outer’, join_axes=None,ignore_index=False, keys=None, levels=None, names=None, verify_integrity=False, sort=None, copy=True,)
objs表示需要连接的对象,比如:[df1, df2],需要将合并的数据用综括号包围;
axis=0表拼接方式是上下堆叠,当axis=1表示左右拼接;
join参数控制的是外连接还是内连接,join='outer’表示外连接,保留两个表中的所有信息;join="inner"表示内连接,拼接结果只保留两个表共有的信息;
join_axes参数是在内连接时选择要完整保留哪个表的索引,但是这个参数在官方文档中提醒即将被弃用,所以不做详细讲解,只看一下join参数的表现吧;
二 、代码
例1:上下堆叠拼接
import pandas as pdd1 = [["xiaolei",20,10081],["xiaowu",30,10082]]t1 = pd.DataFrame(d1)print(t1)print('*'*50)d2 = [["xiaowang",22,10083],["xiaoming",25,10084]]t2 = pd.DataFrame(d2)print(t2)print('*'*25+'合并结果如下(默认是上下堆叠)'+'*'*25)t = pd.concat([t1,t2])print(t)
运行结果:
0 120 xiaolei 20 100811 xiaowu 30 10082**************************************************0 120 xiaowang 22 100831 xiaoming 25 10084********************合并结果如下(默认是上下堆叠)********************0 120 xiaolei 20 100811 xiaowu 30 100820 xiaowang 22 100831 xiaoming 25 10084
例2:axis=1 左右拼接
import pandas as pdd1 = [["xiaolei",20,10081],["xiaowu",30,10082]]t1 = pd.DataFrame(d1)print(t1)print('*'*50)d2 = [["xiaowang",22,10083],["xiaoming",25,10084]]t2 = pd.DataFrame(d2)print(t2)print('*'*20+'合并结果如下(左右拼接)'+'*'*20)t = pd.concat([t1,t2], axis=1)print(t)
运行结果:
0 120 xiaolei 20 100811 xiaowu 30 10082**************************************************0 120 xiaowang 22 100831 xiaoming 25 10084********************合并结果如下(左右拼接)********************0 12 0 120 xiaolei 20 10081 xiaowang 22 100831 xiaowu 30 10082 xiaoming 25 10084