如何用 Python 制作 ECDF 与海伯恩的剧情?
原文:https://www.geesforgeks.org/how-make-ecdf-plot-with-seaborn-in-python/
先决条件: 海伯恩
在这篇文章中,我们将与西伯恩图书馆制作 ECDF 情节。
ECDF 情节
- ECDF 代表经验交换分布。更有可能使用而不是直方图来可视化数据,因为 ECDF 图直接可视化数据集的每个数据点,这使得用户可以轻松地与图进行交互。
- 此图包含更多信息,因为它没有媒体夹大小设置,这意味着它没有任何平滑参数。
- 因为它的曲线是单调递增的,所以它非常适合同时比较多个分布。
- 在 ECDF 图中,x 轴对应于变量的值范围,而 y 轴对应于小于或等于 x 轴对应值的数据点比例。
- 我们可以使用 ecdfplot()函数直接制作 ECDF 图,也可以在新的 Seaborn 版本中使用 displot()函数制作图。
安装:
要安装 Seaborn 库,请在命令提示符下编写以下命令。
pip install seaborn
此 ECDF 绘图和显示()功能仅在 0.11.0 版或更高版本的 Seaborn 中可用。如果已经安装了 Seaborn,请编写以下命令进行升级。
pip install seaborn==0.11.0
为了更好地理解 ECDF 的阴谋。让我们使用数据集绘制和做一些例子。
逐步方法:
- 导入海底图书馆。
- 从 seaborn 库中创建或加载数据集。
- 选择要为其绘制 ECDF 图的列。
- 对于 ECDF 阴谋的策划有以下两种方式:
- 第一种方法是使用 ecdfplot()函数直接绘制 ECDF 图,并在函数中传递您要绘制的数据和列名。
语法:
seaborn.ecdfplot(数据='dataframe ',x='column_name ',y='column_name ',hue='color_column ')
- 第二种方法是使用 displot()函数,传递您正在进行绘图的数据和列,并传递 displot kind='ecdf '的参数。
语法:
seaborn.displot(数据='dataframe ',x='column_name ',y = ' column_name ' kind = ' type_of_plot ',色相='color_column ',调色板='color '
下表显示了本文中使用的参数列表。
方法 1:使用 ecdfplot()方法
在这种方法中,我们使用的是由 seaborn 提供的“excerise”数据。
计算机编程语言
# importing library
import seaborn as sns
# loading exercise dataset provided by seaborn
excr = sns.load_dataset('exercise')
# printing the dataset
print(excr)
输出:
例 1:利用海鸟提供的演习数据集制作 ECDF 地块。
计算机编程语言
# importing libraries
import seaborn as sns
import matplotlib.pyplot as plt
# loading exercise dataset provided by seaborn
excr = sns.load_dataset('exercise')
# making ECDF plot
sns.ecdfplot(data=excr,x='pulse')
# visualizing the plot using matplotlib.pyplot
# show() function
plt.show()
输出:
例 2:互换地块轴线制作 ECDF 地块。
计算机编程语言
# importing libraries
import seaborn as sns
import matplotlib.pyplot as plt
# loading exercise dataset provided by seaborn
excr = sns.load_dataset('exercise')
# making ECDF plot
sns.ecdfplot(data=excr,y='pulse')
# visualizing the plot using matplotlib.pyplot
# show() function
plt.show()
输出:
例 3:当我们有多个分布时,制作 ECDF 图。
计算机编程语言
# importing libraries
import seaborn as sns
import matplotlib.pyplot as plt
# loading exercise dataset provided by seaborn
excr = sns.load_dataset('exercise')
# making ECDF plot when we have multiple
# distributions
sns.ecdfplot(data=excr, x='pulse', hue='kind')
# visualizing the plot using matplotlib.pyplot
# show() function
plt.show()
输出:
上面的图显示了人的脉搏率相对于休息、行走、跑步的分布。
方法二:使用 displot()方法
在这种方法中,我们使用由 seaborn 提供的“钻石”数据。
计算机编程语言
# importing library
import seaborn as sns
# loading diamonds dataset provided by seaborn
diam = sns.load_dataset('diamonds')
# printing the dataset
print(diam)
输出:
示例 1:在 seaborn 提供的企鹅数据集上使用 displot()绘制 ECDF 图。
计算机编程语言
# importing libraries
import seaborn as sns
import matplotlib.pyplot as plt
# loading diamonds dataset provided by seaborn
diam = sns.load_dataset('diamonds')
# making ECDF plot using displot() on depth
# of the diamonds
sns.displot(data=diam,x='depth',kind='ecdf')
# visualizing the plot using matplotlib.pyplot
# show() function
plt.show()
输出:
示例 2:当我们有多个默认设置的分布时,使用 displot()绘制 ECDF 图。
计算机编程语言
# importing libraries
import seaborn as sns
import matplotlib.pyplot as plt
# loading diamonds dataset provided by seaborn
diam = sns.load_dataset('diamonds')
# making ECDF plot using displot() on depth
# of the diamond on the basis of cut
sns.displot(data=diam,x='depth',kind='ecdf',hue='cut')
# visualizing the plot using matplotlib.pyplot
# show() function
plt.show()