1200字范文,内容丰富有趣,写作的好帮手!
1200字范文 > pandas字符串分割str.split()函数

pandas字符串分割str.split()函数

时间:2024-01-14 12:07:46

相关推荐

pandas字符串分割str.split()函数

为了介绍python语言中pandas库在数据分析中的重要作用,本人打算以NBA球星勒布朗詹姆斯在-赛季常规赛个人数据为例对pandas相关函数进行详细说明。利用爬虫技术,在知名篮球网站虎扑爬取了勒布朗詹姆斯的数据,稍后会将数据上传至csdn,以供大家下载。

这篇文章,详细介绍了pandas字符串分割函数---str.split()的用法。

DataFrame.str.split(pa,n,expand)

pat:字符串分隔符,默认为空格。

n:用于指定需要分割的次数,默认为-1。其中,None,0和-1都被解释为返回所有分割的字符串。

expand:将拆分的字符串展开为单独的列,默认为False。

True:返回DataFrame / MultiIndex;

False:返回包含字符串列表的Series / Index。

1、常规赛数据格式

勒布朗詹姆斯-赛季常规赛个人数据的数据结构如下:

2、计算詹姆斯常规赛命中率

勒布朗詹姆斯-赛季常规赛个人数据中只有每场比赛的命中率,数据的第4列为每场比赛的投篮数和命中数,格式为"命中数-投篮数"。如果想要计算詹姆斯整个常规赛的命中率,则需要算出他常规赛的投篮数和命中数。此时,需要用到pandas分割字符串函数str.split()。

import numpy as npimport pandas as pddf = pd.read_csv(“lbj---regular.csv”,encoding="gbk")df0 = df['投篮'].str.split("-",expand=True)df0.columns = ['命中数','投篮数']

DataFrame类型的df0即为詹姆斯常规赛的命中数和投篮数,如下所示:

因为要分别求取命中数和投篮数的总和,所以需要将df0的列转化为整型,继而可得到詹姆斯整个常规赛的命中率。

df0['命中数'] = df0['命中数'].astype('int')df0['投篮数'] = df0['投篮数'].astype('int')ShootRate = df0['命中数'].sum() / df0['投篮数'].sum()

计算得到,詹姆斯-常规赛投篮命中率为51.34%,还是很不错的水平。

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。