跳转至

使用 Python Seaborn 进行数据可视化

原文:https://www.geesforgeks.org/data-visualization-with-python-seaborn/

数据可视化是以图像形式呈现数据。这对于数据分析极其重要,主要是因为以数据为中心的 Python 包的奇妙生态系统。它有助于理解数据,无论数据多么复杂,通过以简单易懂的格式总结和呈现大量数据来理解数据的意义,并有助于清晰有效地交流信息。

熊猫和海鸟就是其中的一个包,让导入和分析数据变得更加容易。在本文中,我们将使用熊猫和海鸟来分析数据。

熊猫

【熊猫】 提供清理和处理数据的工具。它是最流行的用于数据分析的 Python 库。在熊猫中,数据表被称为数据框。

那么,让我们从创建熊猫数据框开始:

例 1:

蟒蛇 3

# Python code demonstrate creating

import pandas as pd

# initialise data of lists.
data = {'Name':[ 'Mohe' , 'Karnal' , 'Yrik' , 'jack' ],
        'Age':[ 30 , 21 , 29 , 28 ]}

# Create DataFrame
df = pd.DataFrame( data )

# Print the output.
df

输出:

例 2: 从系统加载 CSV 数据,通过熊猫显示。

蟒蛇 3

# import module
import pandas

# load the csv
data = pandas.read_csv("nba.csv")

# show first 5 column
data.head()

输出:

海伯恩

Seaborn 是一个用 Python 绘制统计图形的惊人可视化库。它建立在 matplotlib 库的基础上,也与熊猫的数据结构紧密结合。

安装

对于 python 环境:

pip install seaborn

对于 conda 环境:

conda install seaborn

让我们用海鸟来创建一些基本的地块:

蟒蛇 3

# Importing libraries
import numpy as np
import seaborn as sns

# Selecting style as white,
# dark, whitegrid, darkgrid 
# or ticks
sns.set( style = "white" )

# Generate a random univariate 
# dataset
rs = np.random.RandomState( 10 )
d = rs.normal( size = 50 )

# Plot a simple histogram and kde 
# with binsize determined automatically
sns.distplot(d, kde = True, color = "g")

输出:

Seaborn:统计数据可视化

Seaborn 有助于可视化统计关系,为了理解数据集中的变量如何相互关联,以及这种关系如何依赖于其他变量,我们执行统计分析。这种统计分析有助于可视化趋势并识别数据集中的各种模式。

这些情节将有助于形象化:

  • 线图
  • 散点图
  • 箱线图
  • 点图
  • 计数图
  • 小提琴情节
  • 群体图
  • 条形图
  • KDE 情节

线图:

Lineplot 是最流行的绘制 x 和 y 之间关系的图,可能有几个语义分组。

语法:SNS.line plot(x =无,y =无)

参数:

x,y: 输入数据变量;必须是数字。可以直接传递数据或引用数据中的列。

让我们用线图和熊猫来可视化数据:

例 1:

蟒蛇 3

# import module
import seaborn as sns
import pandas

# loading csv
data = pandas.read_csv("nba.csv")

# ploting lineplot
sns.lineplot( data['Age'], data['Weight'])

输出:

示例 2: 使用色调参数绘制图形。

蟒蛇 3

# import module
import seaborn as sns
import pandas

# read the csv data
data = pandas.read_csv("nba.csv")

# plot
sns.lineplot(data['Age'],data['Weight'], hue =data["Position"])

输出:

散点图:

散点图可以与几个语义分组一起使用,这有助于根据连续/分类数据很好地理解图形。它可以画一个二维图形。

语法: seaborn .散点图(x =无,y =无)

参数: x,y: 输入应该是数值的数据变量。

返回:该方法返回绘制了绘图的坐标轴对象。

让我们用散点图和熊猫来可视化数据:

例 1:

蟒蛇 3

# import module
import seaborn
import pandas

# load csv
data = pandas.read_csv("nba.csv")

# plotting
seaborn.scatterplot(data['Age'],data['Weight'])

输出:

示例 2: 使用色调参数绘制图形。

蟒蛇 3

import seaborn
import pandas
data = pandas.read_csv("nba.csv")

seaborn.scatterplot( data['Age'], data['Weight'], hue =data["Position"])

输出:

箱线图:

一个方框图(或方框-触须图)s 是通过连续/分类数据的四分位数描绘数字数据组的视觉表示。

方框图由 5 个部分组成。

  • 最低限度
  • 第一个四分位数或 25%
  • 中位数(第二四分位数)或 50%
  • 第三个四分位数或 75%
  • 最高的

语法:

seaborn.box plot(x =无,y =无,色调=无,数据=无)

参数:

  • x,y,色调:用于绘制长格式数据的输入。
  • 数据:用于绘图的数据集。如果 x 和 y 不存在,这被解释为宽形。

返回:返回绘制了绘图的坐标轴对象。

用熊猫画方框图:

例 1:

蟒蛇 3

# import module
import seaborn as sns
import pandas

# read csv and ploting
data = pandas.read_csv( "nba.csv" )
sns.boxplot( data['Age'] )

输出:

例 2:

蟒蛇 3

# import module
import seaborn as sns
import pandas

# read csv and ploting
data = pandas.read_csv( "nba.csv" )
sns.boxplot( data['Age'], data['Weight'])

输出:

Voilin 情节:

沃伊林情节类似于盒子情节。它显示了跨越一个或多个分类变量的几个定量数据,以便可以比较这些分布。

语法:seaborn.violinplot(x =无,y =无,色相=无,数据=无)

参数:

  • x,y,色调:用于绘制长格式数据的输入。
  • 数据:用于标绘的数据集。

用熊猫画小提琴剧情:

例 1:

蟒蛇 3

# import module
import seaborn as sns
import pandas

# read csv and plot
data = pandas.read_csv("nba.csv")
sns.violinplot(data['Age'])

输出:

例 2:

蟒蛇 3

# import module
import seaborn

seaborn.set(style = 'whitegrid')

# read csv and plot
data = pandas.read_csv("nba.csv")
seaborn.violinplot(x ="Age", y ="Weight",data = data)

输出:

群体图:

群体图类似于带状图,我们可以针对分类数据绘制具有非重叠点的群体图。

语法:海鸟群图(x =无,y =无,色相=无,数据=无)

参数:

  • x,y,色调:用于绘制长格式数据的输入。
  • 数据:用于标绘的数据集。

用熊猫画蜂群图:

例 1:

蟒蛇 3

# import module
import seaborn

seaborn.set(style = 'whitegrid')

# read csv and plot
data = pandas.read_csv( "nba.csv" )
seaborn.swarmplot(x = data["Age"])

输出:

例 2:

蟒蛇 3

# import module
import seaborn

seaborn.set(style = 'whitegrid')

# read csv and plot
data = pandas.read_csv("nba.csv")
seaborn.swarmplot(x ="Age", y ="Weight",data = data)


回到顶部