Matplotlib入门

via: 保罗的酒吧 https://paul.pub/matplotlib-basics/

入门代码示例

import matplotlib.pyplot as plt
import numpy as np

data = np.arange(100,201)
plt.plot(data)
plt.show()

image.png

x = np.linspace(0, 2*np.pi,50)  # 50个元素均匀分布在[0,2pi]上
plt.plot(x, np.sin(x))
plt.show()

image.png

一次绘制多个图形

有些时候,我们可能希望一次绘制多个图形,例如:两组数据的对比,或者一组数据的不同展示方式等。

多个figure

可以简单的理解为一个figure就是一个图形窗口。matplotlib.pyplot会有一个默认的figure,我们也可以通过plt.figure()创建更多个。如下面的代码所示:

import matplotlib.pyplot as plt
import numpy as np

data = np.arange(100,201)
plt.plot(data)

data2 = np.arange(200,301)
plt.figure()
plt.plot(data2)

plt.show()

image.png

多个subplot

有些情况下,我们是希望在同一个窗口显示多个图形。此时就这可以用多个subplot。 subplot函数的前两个参数指定了subplot数量,即:它们是以矩阵的形式来分割当前图形,两个整数分别指定了矩阵的行数和列数。而第三个参数是指矩阵中的索引。 下面是一段代码示例:

import matplotlib.pyplot as plt
import numpy as np

data = np.arange(100,201)
plt.subplot(2,1,1)
plt.plot(data)

data2 = np.arange(200,301)
plt.subplot(2,1,2)
plt.plot(data2)

plt.show()

image.png
subplot函数的参数不仅仅支持上面这种形式,还可以将三个整数(10之内的)合并一个整数。例如:2, 1, 1可以写成211,2, 1, 2可以写成212。

subplot函数的详细说明参见这里:matplotlib.pyplot.subplot

在一张图上绘制多个数据集

x = np.linspace(0, 2*np.pi,150)
plt.plot(x, np.sin(x), x, np.sin(2*x), x, np.sin(3*x))
plt.show()

image.png

x = np.linspace(0, 2*np.pi, 50)
plt.plot(x, np.sin(x), 'r-^', x, np.sin(2*x), 'g--')
plt.show()

image.png

自定义图形的外观

上述代码展示了两种不同的曲线样式:'r-o' 和 'g--'。字母 'r' 和 'g' 代表线条的颜色,后面的符号代表线和点标记的类型。例如 '-o' 代表包含实心点标记的实线,'--' 代表虚线。

颜色: 蓝色 – 'b' 绿色 – 'g' 红色 – 'r' 青色 – 'c' 品红 – 'm' 黄色 – 'y' 黑色 – 'k''b'代表蓝色,所以这里用黑色的最后一个字母) 白色 – 'w'

线: 直线 – '-' 虚线 – '--' 点线 – ':' 点划线 – '-.'

常用点标记 点 – '.' 像素 – ',' 圆 – 'o' 方形 – 's' 三角形 – '^'

https://matplotlib.org/api/markers_api.html

常用图形实例

Matplotlib可以生成非常多的图形式样,多到令人惊叹的地步。

https://matplotlib.org/gallery/index.html

线性图

前面的例子中,线性图的横轴的点都是自动生成的,而我们很可能希望主动设置它。另外,线条我们可能也希望对其进行定制。看一下下面这个例子:

import matplotlib.pyplot as plt
plt.plot([1,2,3],[3,6,9],'r')  # red
plt.plot([1,2,3],[2,4,9],':g')  # :(点) green

plt.show()

image.png

散点图

scatter函数用来绘制散点图。同样,这个函数也需要两组配对的数据指定x和y轴的坐标。下面是一段代码示例:

N = 20  # 点的个数

plt.scatter(np.random.rand(N)*100,
           np.random.rand(N)*100,
           c='r',s=100,alpha=0.5)  # c:点的颜色  s:点的大小  alpha:点的透明度

plt.scatter(np.random.rand(N)*100,
           np.random.rand(N)*100,
           c='g',s=200,alpha=0.5)

plt.scatter(np.random.rand(N)*100,
           np.random.rand(N)*100,
           c='b',s=300,alpha=0.5)

plt.show()

image.png

饼状图

pie函数用来绘制饼状图。饼状图通常用来表达集合中各个部分的百分比。

In [27]:

labels = ['Mon','Tue','Wed','Thu','Fri','Sat','Sun']

data = np.random.rand(7)*100

plt.pie(data, labels=labels, autopct='%1.1f%%')  # autopct 指定数值的精度
plt.axis('equal')  # 设置坐标轴大小一致
plt.legend()  # 指明要绘制图例

plt.show()

image.png

条形图

bar函数用来绘制条形图。条形图常常用来描述一组数据的对比情况,例如:一周七天,每天的城市车流量。

N = 7

x = np.arange(7)
data = np.random.randint(low=0, high=100, size=N)  # 生成7个0-100的随机数
colors = np.random.rand(N*3).reshape(N,-1)  # 先生成21(N x 3)个随机数,然后将它们组装成7行,那么每行就是三个数,这对应了颜色的三个组成部分。
labels = ['Mon','Tue','Wed','Thu','Fri','Sat','Sun']

plt.title('Weekday Data')
plt.bar(x, data, alpha=0.8, color=colors, tick_label=labels)
plt.show()

image.png

直方图

hist函数用来绘制直方图。直方图看起来是条形图有些类似。但它们的含义是不一样的,直方图描述了数据中某个范围内数据出现的频度。

data = [np.random.randint(0,n,n) for n in [3000,4000,5000]]
labels = ['3K','4K','5K']
bins = [0,100,500,1000,2000,3000,4000,5000]

plt.hist(data, bins=bins, label=labels)
plt.legend()
plt.show()

image.png
上面的这些代码中,[np.random.randint(0, n, n) for n in [3000, 4000, 5000]]生成了包含了三个数组的数组,这其中:
– 第一个数组包含了3000个随机数,这些随机数的范围是 [0, 3000)
– 第二个数组包含了4000个随机数,这些随机数的范围是 [0, 4000)
– 第三个数组包含了5000个随机数,这些随机数的范围是 [0, 5000)
bins数组用来指定我们显示的直方图的边界,即:[0, 100) 会有一个数据点,[100, 500)会有一个数据点,以此类推。所以最终结果一共会显示7个数据点。同样的,我们指定了标签和图例。

在这幅图中,我们看到,三组数据在3000以下都有数据,并且频度是差不多的。但蓝色条只有3000以下的数据,橙色条只有4000以下的数据。这与我们的随机数组数据刚好吻合。

留下评论