JRS直播吧

NBA运动员球员数据分析

NBA 24直播网 2024-10-16 02:09:23

当前,篮球运动是最受欢迎的运动之一。在此万受瞩目的运动下,我打算针对篮球运动员个人的信息,技能水平等各项指标进行相关的分析与统计。例如,我们可能会关注如下的内容: 哪些球员从2014年到2019年近6年连续在榜?对比各球员在2019年的各项数据如何?詹姆斯-哈登随年份数据如何变化?2019年球员数据分布如何?篮球运动员的失误与上场时长有什么联系?球员的各项数据之间的相关性如何?哪些数据会对球员的得分有什么影响? 数据分析是指用适当的方法与工具,对收集来的大量数据进行分析,提取其中有意义的信息,从而形成有价值的结论的过程。 在进行数据分析之前,需要清楚数据分析的基本流程。 明确需求与目的 分析篮球运动员,得出结论 数据收集 爬取新浪体育网站数据 数据预处理 特征筛选 降维 数据清洗 缺失值异常值重复值 数据分析 数据建模数据可视化 编写报告总结 导入相关库 需要爬取的数据 爬虫思路分析: 1.需求获取新浪体育网站的球员信息2.寻找网址(球员的不同赛季的信息在展示html页面找不到) 可判断该信息是一个Ajax请求通过浏览器抓包,和多次尝试在Postman软件上发送request请求寻得球员分页信息的request发送相应url的规律,并循环遍历 3.获取request返回的内容4.使用正则表达式对request返回信息进行筛选5.将筛选的数据以csv格式储存在本地文件中 3 rows × 29 columns 特征筛选 数据集中的列,并非都是我们分析所需要的可以有选择性的进行加载,只加载我们需要的信息列 3 rows × 23 columns 数据清洗 缺失值处理 通过info查看数据信息。可以通过isnull与sum结合,查看缺失值情况。 ==2014年= rank 0 player_name 0 team_name 0 score 0 minutes 0 field_goals_made 0 field_goals_att 0 field_goals_pct 0 three_points_made 0 three_points_att 0 three_points_pct 0 free_throws_made 0 free_throws_att 0 free_throws_pct 0 offensive_rebounds 0 defensive_rebounds 0 rebounds 0 assists 0 turnovers 0 assists_turnover_ratio 0 steals 0 blocks 0 personal_fouls 0 dtype: int64 2015年 rank 0 player_name 0 team_name 0 score 0 minutes 0 field_goals_made 0 field_goals_att 0 field_goals_pct 0 three_points_made 0 three_points_att 0 three_points_pct 0 free_throws_made 0 free_throws_att 0 free_throws_pct 0 offensive_rebounds 0 defensive_rebounds 0 rebounds 0 assists 0 turnovers 0 assists_turnover_ratio 0 steals 0 blocks 0 personal_fouls 0 dtype: int64 2016年 rank 0 player_name 0 team_name 0 score 0 minutes 0 field_goals_made 0 field_goals_att 0 field_goals_pct 0 three_points_made 0 three_points_att 0 three_points_pct 0 free_throws_made 0 free_throws_att 0 free_throws_pct 0 offensive_rebounds 0 defensive_rebounds 0 rebounds 0 assists 0 turnovers 0 assists_turnover_ratio 0 steals 0 blocks 0 personal_fouls 0 dtype: int64 2017年 rank 0 player_name 0 team_name 0 score 0 minutes 0 field_goals_made 0 field_goals_att 0 field_goals_pct 0 three_points_made 0 three_points_att 0 three_points_pct 0 free_throws_made 0 free_throws_att 0 free_throws_pct 0 offensive_rebounds 0 defensive_rebounds 0 rebounds 0 assists 0 turnovers 0 assists_turnover_ratio 0 steals 0 blocks 0 personal_fouls 0 dtype: int64 2018年 rank 0 player_name 0 team_name 0 score 0 minutes 0 field_goals_made 0 field_goals_att 0 field_goals_pct 0 three_points_made 0 three_points_att 0 three_points_pct 0 free_throws_made 0 free_throws_att 0 free_throws_pct 0 offensive_rebounds 0 defensive_rebounds 0 rebounds 0 assists 0 turnovers 0 assists_turnover_ratio 0 steals 0 blocks 0 personal_fouls 0 dtype: int64 异常值处理 通过describe查看数值信息。可配合箱线图辅助。异常值可以删除,视为缺失值,或者不处理。 8 rows × 21 columns {‘SCR’: ‘score’, ‘MIE’: ‘minutes’, ‘FID’: ‘field_goals_made’, ‘FIT’: ‘field_goals_att’, ‘FIC’: ‘field_goals_pct’, ‘THD’: ‘three_points_made’, ‘THT’: ‘three_points_att’, ‘THC’: ‘three_points_pct’, ‘FRD’: ‘free_throws_made’, ‘FRT’: ‘free_throws_att’, ‘FRC’: ‘free_throws_pct’, ‘OFD’: ‘offensive_rebounds’, ‘DED’: ‘defensive_rebounds’, ‘RED’: ‘rebounds’, ‘AST’: ‘assists’, ‘TUR’: ‘turnovers’, ‘ASI’: ‘assists_turnover_ratio’, ‘STL’: ‘steals’, ‘BLK’: ‘blocks’, ‘PEL’: ‘personal_fouls’} 重复值处理 使用duplicate检查重复值。可配合keep参数进行调整。使用drop_duplicate删除重复值。 列名英文名词解释 哪些球员近6年连续在榜 19年球员各项数据对比 19年球员数据分布箱型图 詹姆斯-哈登随年份数据变化折线图 篮球运动员的失误与上场时长有什么联系? 0.13196323727585887 各数据的相关性图 画决策树分析影响得分的因素 (152, 24) {2014, 2015, 2016, 2017, 2018, 2019} Index([‘rank’, ‘player_name’, ‘team_name’, ‘score’, ‘minutes’, ‘field_goals_made’, ‘field_goals_att’, ‘field_goals_pct’, ‘three_points_made’, ‘three_points_att’, ‘three_points_pct’, ‘free_throws_made’, ‘free_throws_att’, ‘free_throws_pct’, ‘offensive_rebounds’, ‘defensive_rebounds’, ‘rebounds’, ‘assists’, ‘turnovers’, ‘assists_turnover_ratio’, ‘steals’, ‘blocks’, ‘personal_fouls’, ‘year’], dtype=‘object’) Index([‘score’, ‘minutes’, ‘field_goals_made’, ‘field_goals_att’, ‘field_goals_pct’, ‘three_points_made’, ‘three_points_att’, ‘three_points_pct’, ‘free_throws_made’, ‘free_throws_att’, ‘free_throws_pct’, ‘offensive_rebounds’, ‘defensive_rebounds’, ‘rebounds’, ‘assists’, ‘turnovers’, ‘assists_turnover_ratio’, ‘steals’, ‘blocks’, ‘personal_fouls’, ‘year’], dtype=‘object’) score float64 minutes float64 field_goals_made float64 field_goals_att float64 field_goals_pct float64 three_points_made float64 three_points_att float64 three_points_pct float64 free_throws_made float64 free_throws_att float64 free_throws_pct float64 offensive_rebounds float64 defensive_rebounds float64 rebounds float64 assists float64 turnovers float64 assists_turnover_ratio float64 steals float64 blocks float64 personal_fouls float64 year float64 dtype: object 5 rows × 21 columns 拉塞尔-威斯布鲁克、詹姆斯-哈登、达米安-利拉德这三人连续6年从2014年到2020年都在榜上,可以说明这三人在当下球员竞技状态非常稳定 对比2019年各球员各项数据,可知球员与球员之间相同数据项的差异 针对詹姆斯-哈登,分析其六年的各项数据的变化,2016年其各项正数据普偏高,而负数据普偏低,所有该年是詹姆斯-哈登的巅峰期。从宏观上看,从2014年打篮球能力从2014年到2016年逐步提高,到2016年达到巅峰,之后下降,最后趋向与平稳 可根据箱型图可视化所有球员各项数据分布 篮球运动员的失误与上场时长成正相关 分析球员的各项数据之间的相关性,可知得分与投球的数据关系非常大,其次是投球命中率 根据决策树逐步分析各项因素决定得分情况,由此可以对球员各项训练计划表进行优化

NBA运动员球员数据分析

NBA运动员球员数据分析

相关阅读:

热门