使用Pearson相关系数与热力图进行相关性分析:附Python完整代码
使用Pearson相关系数进行相关性分析是统计分析中的一种常用方法。我们可以使用Python的pandas
和seaborn
库来计算相关系数,并通过热力图进行可视化。以下是一个完整的代码示例:
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
# 创建一个示例数据集
data = {
'A': [1, 2, 3, 4, 5],
'B': [5, 4, 3, 2, 1],
'C': [2, 3, 4, 5, 6],
'D': [5, 3, 6, 2, 4]
}
df = pd.DataFrame(data)
# 计算Pearson相关系数
corr_matrix = df.corr(method='pearson')
# 使用Seaborn绘制热力图
plt.figure(figsize=(8, 6))
sns.heatmap(corr_matrix, annot=True, fmt=".2f", cmap='coolwarm', cbar=True)
plt.title("Pearson Correlation Coefficient Heatmap")
plt.show()
代码说明:
数据创建:首先,我们创建一个示例数据集,该数据集是一个字典,然后将其转换为DataFrame。
计算相关系数:使用
pandas
的corr
方法计算DataFrame中各列之间的Pearson相关系数。绘制热力图:使用
seaborn
库中的heatmap
函数绘制相关系数矩阵的热力图。参数annot=True
用于在每个单元格中显示数值,fmt=".2f"
控制数值格式,cmap
参数选择了一个颜色映射方案 ('coolwarm'),cbar=True
显示颜色条。
通过这个简单的代码,你可以轻松地分析和可视化数据中不同变量之间的线性关系。根据需要,你可以替换数据集或调整绘图参数以适应你的具体需求。