Skip to main content
 Web开发网 » 编程语言 » Python语言

手把手教你使用Python进行数据分析和可视化

2021年11月27日6420百度已收录

Python是进行数据分析的一种很不错的语言,主要是因为以数据为中心的#python#库非常适合。 Pandas是其中的一种,使导入和分析数据更加容易。 在本文中,我使用了来分析斯坦福网站的公共数据集中的Country Data.csv文件中的数据。

安装安装Pandas:

pip install pandas在Pandas中创建DataFrame通过使用pd.Series方法将多个Series传递到DataFrame类中来完成数据帧的创建。 在这里,它在两个Series对象中传递,s1作为第一行,s2作为第二行。

例子:

s1 = pd.Series([1,2]) s2 = pd.Series(["Ashish", "Sid"]) df = pd.DataFrame([s1,s2]) df dframe = pd.DataFrame([[1,2],["Ashish", "Sid"]], index=["r1", "r2"], columns=["c1", "c2"]) dframe dframe = pd.DataFrame({ "c1": [1, "Ashish"], "c2": [2, "Sid"]}) dframe 输出:

手把手教你使用Python进行数据分析和可视化  Python数据分析 第1张

手把手教你使用Python进行数据分析和可视化  Python数据分析 第2张

手把手教你使用Python进行数据分析和可视化  Python数据分析 第3张

用Pandas导入数据

第一步是读取数据。数据存储为逗号分隔值或csv文件,其中每行用换行分隔,每列用逗号(,)分隔。为了能够使用Python中的数据,需要将csv文件读取到Pandas DataFrame中。DataFrame是表示和处理表格数据的一种方式。

例子:

import pandas as pd df = pd.read_csv("IND_data.csv") df.head() df.shape 输出:

手把手教你使用Python进行数据分析和可视化  Python数据分析 第4张

29,10用Pandas索引DataFrames

可以使用pandas.DataFrame.iloc方法建立索引。iloc方法允许按位置检索多达行和列。

例子:

df.iloc[0:5,:] df.iloc[:,:] df.iloc[5:,:5] 如果大家在学习中遇到困难,想找一个python学习交流环境,可以加入我们的python裙,关注小编,并私信“01”即可进裙,领取python学习资料,会节约很多时间,减少很多遇到的难题。

在Pandas中使用标签建立索引

可以使用pandas.DataFrame.loc方法对标签进行索引,该方法允许使用标签而不是位置进行索引。例子:

df.loc[0:5,:] df = df.loc[5:,:] 上面的内容实际上与df.iloc [0:5 ,:]并没有太大区别。这是因为尽管行标签可以采用任何值,但我们的行标签与位置完全匹配。但是,列标签可以使处理数据时变得更加容易。例子:

df.loc[:5,"Time period"]

手把手教你使用Python进行数据分析和可视化  Python数据分析 第5张

DataFrame Math与Pandas

数据帧的计算可以通过使用pandas工具的统计功能来完成。例子:

df.describe() df.corr() df.rank()

手把手教你使用Python进行数据分析和可视化  Python数据分析 第6张

手把手教你使用Python进行数据分析和可视化  Python数据分析 第7张

手把手教你使用Python进行数据分析和可视化  Python数据分析 第8张

Pandas图

这些示例中的图是使用用于引用matplotlib API的标准约定制作的,该API提供了Pandas的基础知识,可轻松创建美观地图。例子:

import the required module import matplotlib.pyplot as plt df['Observation Value'].hist(bins=10) df.boxplot(column='Observation Value', by = 'Time period') x = df["Observation Value"] y = df["Time period"] plt.scatter(x, y, label= "stars", color= "m", marker= "*", s=30) plt.xlabel('Observation Value') plt.ylabel('Time period') plt.show()

手把手教你使用Python进行数据分析和可视化  Python数据分析 第9张

手把手教你使用Python进行数据分析和可视化  Python数据分析 第10张

手把手教你使用Python进行数据分析和可视化  Python数据分析 第11张

最后多说一句,小编是一名python开发工程师,这里有我自己整理的整套python学习资料和路线,想要这些资料的都可以关注小编,并私信“01”领取。

评论列表暂无评论
发表评论
微信