用成对绘图海鸟和熊猫进行数据可视化
原文:https://www.geesforgeks.org/data-visualization-with-pair plot-seaborn-and-pandas/
数据可视化是以图片形式呈现数据。这对于数据分析极其重要,主要是因为以数据为中心的 Python 包的奇妙生态系统。它有助于理解数据,无论数据多么复杂,通过以简单易懂的格式总结和呈现大量数据来理解数据的意义,并有助于清晰有效地交流信息。
熊猫和海鸟 就是其中之一,它让数据的导入和分析变得更加容易。在本文中,我们将使用 Pandas 和pair plotSeaborn 来分析数据。
熊猫
【熊猫】 提供清理和处理数据的工具。它是最流行的用于数据分析的 Python 库。在熊猫中,数据表被称为数据框。
那么,让我们从创建 熊猫数据框开始:
例 1:
蟒蛇 3
# Python code demonstrate creating
import pandas as pd
# initialise data of lists.
data = {'Name':[ 'Mohe' , 'Karnal' , 'Yrik' , 'jack' ],
'Age':[ 30 , 21 , 29 , 28 ]}
# Create DataFrame
df = pd.DataFrame( data )
# Print the output.
display(df)
输出:
例 2: 从系统加载 CSV 数据,通过熊猫显示。
蟒蛇 3
# import module
import pandas
# load the csv
data = pandas.read_csv("nba.csv")
# show first 5 column
data.head()
输出:
seaborn.pairplot()
要绘制数据集中的多个成对二元分布,可以使用 pairplot()函数。这将数据框中(n,2)个变量组合的关系显示为一个矩阵图,对角线图是单变量图。
语法: seaborn.pairplot(数据,**kwargs)
参数:
数据:整齐(长格式)的数据框,其中每一列是一个变量,每一行是一个观察值。
色调:变量在“数据”中,将图面映射到不同的颜色。
调色板:迪克特或海鸟调色板
{x,y}_vars: 变量名列表,可选
滴答声:布尔型,可选
例 1:
蟒蛇 3
# importing packages
import seaborn
import matplotlib.pyplot as plt
# loading dataset using seaborn
df = seaborn.load_dataset('tips')
# pairplot with hue sex
seaborn.pairplot(df, hue ='size')
plt.show()
输出:
用成对绘图海鸟和熊猫进行数据可视化
我们看到如何创建熊猫数据框和配对图。我们将使用熊猫来可视化数据
例 1:
在这个例子中,我们将简单地用熊猫数据框绘制一个配对图。在这里,我们只是加载 nba.csv 数据并创建一个数据框,虽然在 pairplot 中作为参数传递。
蟒蛇 3
# importing packages
import seaborn
import pandas
# load the csv
data = pandas.read_csv("nba.csv")
# pairplot
seaborn.pairplot(data)