在本课程中,您已经学习了如何创建许多不同的图表类型。现在,您将在学习一些可用于更改图表样式的快速命令之前,对知识进行组织。
你学到了什么?

由于并不总是容易决定如何最好地讲述数据背后的故事,我们将图表类型分为三个广泛的类别来帮助解决这个问题。
- 趋势 - 趋势被定义为变化的模式。
sns.lineplot
- 折线图最适合展示一段时间内的趋势,多条线可以用来展示多个组的趋势。
- 关系 - 有很多不同的图表类型可以用来理解数据中变量之间的关系。
sns.barplot
- 条形图用于比较不同组对应的数量。sns.heatmap
- 热力图可用于在数字表格中查找色彩编码模式。sns.scatterplot
- 散点图展示两个连续变量之间的关系;如果使用颜色编码,我们还可以展示与第三个分类变量的关系。sns.regplot
- 在散点图中包含一个回归线可以更容易地看到两个变量之间的线性关系。sns.lmplot
- 如果散点图包含多个颜色编码的组,则此命令用于绘制多条回归线。sns.swarmplot
- 分类散点图展示连续变量和分类变量之间的关系。
- 分布 - 我们可视化分布以展示变量中可能出现的值,以及它们出现的可能性。
sns.histplot
- 直方图展示单个数值变量的分布。sns.kdeplot
- KDE图(或2D KDE图)展示单个数值变量(或两个数值变量)的估计平滑分布。sns.jointplot
- 如果同时显示一个2D KDE图和每个单独变量的相应KDE图,则此命令很有用。
使用seaborn更改样式
所有命令都为每个图表提供了漂亮的默认样式。但是,您可能会发现自定义图表外观很有用,幸运的是,这可以通过添加一行代码来完成!
像往常一样,我们需要开始设置编码环境。
import pandas as pd
pd.plotting.register_matplotlib_converters()
import matplotlib.pyplot as plt
%matplotlib inline
import seaborn as sns
print("Setup Complete")
Setup Complete
我们将使用与前一个教程中创建线图相同的代码。下面的代码加载数据集并创建图表。
# Path of the file to read
spotify_filepath = "../input/spotify.csv"
# Read the file into a variable spotify_data
spotify_data = pd.read_csv(spotify_filepath, index_col="Date", parse_dates=True)
# Line chart
plt.figure(figsize=(12,6))
sns.lineplot(data=spotify_data)
我们只需要一行代码就可以快速地将图形的样式更改为不同的主题。
# Change the style of the figure to the "dark" theme
sns.set_style("dark")
# Line chart
plt.figure(figsize=(12,6))
sns.lineplot(data=spotify_data)
Seborn 有五个不同的主题: (1)"darkgrid"
, (2)"whitegrid"
, (3)"dark"
, (4)"white"
, and (5)"ticks"
,你只需要使用一个类似于上面代码单元格中的命令(填充所选主题)来更改它。
标题:Kaggle数据可视化(六)选择图表类型并定制样式
作者:Departure
地址:https://www.unreachablecity.club/articles/2023/04/20/1682051382800.html
Comments | 0 条评论