matplotlib.pyplot里的函数scatter( )用于绘制散点图。学习Matplotlib绘图其实就是学习绘图函数中的参数,不同的参数搭配会产生不同的化学效应!
scatter( )函数包含的参数如下所示:
matplotlib.pyplot.scatter(x, y, s=None, c=None, marker=None, cmap=None, norm=None, vmin=None, vmax=None, alpha=None, linewidths=None, verts=None, edgecolors=None, hold=None, data=None, **kwargs)
(1)基本参数讲解
x, y → 各散点的横坐标与纵坐标,x与y应当是向量,向量的大小要相同
s → 各散点的面积,可以为固定值,代表所有散点面积相同,也可以为一向量,向量的大小与x相同,代表不同的散点面积不同
c → 散点的颜色(默认值为蓝色,'b'),可以为固定值,代表所有散点颜色相同,也可以为一向量,向量的大小与x相同,代表不同的散点颜色不同
marker → 散点样式(默认值为实心圆,'o')
alpha → 散点透明度([0, 1]之间的数,0表示完全透明,1则表示完全不透明)
linewidths →散点的边缘线宽
edgecolors → 散点的边缘颜色
cmap → 指的是matplotlib.colors.Colormap,相当于多个调色盘的合集
norm、vmin、vmax → 散点颜色亮度设置
import matplotlib.pyplot as pltimport numpy as np#如果不传参数,则每次运行得到的随机数不同,传了参数后,每次运行得到的随机数相同rng = np.random.RandomState(2)x = rng.randn(50) # 随机产生50个X轴坐标,各坐标值在[0,1]之间y = rng.randn(50) # 随机产生50个Y轴坐标colors = rng.rand(50) # 随机产生50个用于颜色映射的数值sizes = 700 * rng.rand(50) # 随机产生50个用于改变散点面积的数值#每个点对应的颜色与大小各不相同plt.scatter(x, y, c=colors, s=sizes, alpha=0.3, cmap='viridis')plt.colorbar() #显示颜色条plt.show()
效果图如下:
颜色映射的这维属性数据(颜色条表示),其值主要集中于[0.4, 0.8]之间,参数 vmin、vmax 分别为要设置的数据范围的最小值和最大值(注意:设置之后,原来大于vmax的值被“拉低”成vmax;原来小于vmin的值被“拉高”成vmin)。代码和可视化结果图如下所示:
import matplotlib.pyplot as pltimport numpy as nprng = np.random.RandomState(2)#如果不传参数,则每次运行得到的随机数不同,传了参数后,每次运行得到的随机数相同x = rng.randn(50) # 随机产生50个X轴坐标,各坐标值在[0,1]之间y = rng.randn(50) # 随机产生50个Y轴坐标colors = rng.rand(50) # 随机产生50个用于颜色映射的数值sizes = 700 * rng.rand(50) # 随机产生50个用于改变散点面积的数值plt.scatter(x, y, c=colors, s=sizes, alpha=0.3, cmap='viridis',vmin=0.4, vmax=0.8)plt.colorbar()plt.show()
用scatter函数绘制双月形数据集# make_moons是函数用来生成数据集
from sklearn import datasets
x,y = datasets.make_moons(n_samples=800,noise=0.3,shuffle=True,random_state=42)
x,y = datasets.make_moons(n_samples=800,noise=None,shuffle=False,random_state=None)
基中函数的具体参数如下:
n_samples:生成样本的数量,默认是100个样本
shuffle:数据是否打乱
noise:默认是false,数据集是否加入高斯噪声
random_state:生成随机种子,给定一个int型数据,能够保证每次生成数据相同。
from sklearn import datasetsimport matplotlib.pyplot as pltx, y = datasets.make_moons(noise=0.05)plt.scatter(x[:,0], x[:,1],c=y )plt.show()
效果图如下:
如果想让不同的类别显示不同的形状,可以针对不同的类别各画一次,每次用不同的点的形状即可,代码及效果图如下:
from sklearn import datasetsimport matplotlib.pyplot as pltimport numpy as npx, y = datasets.make_moons(noise=0.05)counts = np.bincount(y) #统计每一类别的样本个数,此例只有两个类别,每类各50个样本x0 = np.zeros((counts[0],x.shape[1]))x1 = np.zeros((counts[1],x.shape[1]))index1 = 0index2 = 0for i in range(x.shape[0]):if y[i]==0:x0[index1] = x[i,:]index1 = index1+1elif y[i] == 1:x1[index2] = x[i]index2 = index2+1plt.scatter(x0[:,0], x0[:,1],c='r',marker='*')plt.scatter(x1[:,0], x1[:,1],c='g',marker='<')plt.show()