上期介绍了足球大数据软件开发、网站建设——数据更新速度策略_sundayhost的专栏-CSDN博客,这期接着讲足球大数据预测有关时间函数的 *** 作处理。这也是许多用户在分析足球结果时参考很多的一条要素。
上周接到一用户要求比较某机构在终盘前的多条水位变化情况,达到条件要求时记录下来,进行结果比较分析。
一场比赛的信息存放在数据库的多个表中,无论是进行联合多表 *** 作还是拆分表格,很多场赛事数据都是同时 *** 作的。这个时候可以选择用pandas、Groupby进行不同场次的分类,再利用apply函数对其具体 一场比赛进行数据挖掘。
def function(x): print(x) #可以查看分割后的小表模样 # t = x.reset_index() #可以格式索引 if condition1: #按照条件将小表进行数据处理即可 k = 'b' elif condition2: k = 's' else: k = '' return kk dd = df_league.groupby(['gameid']).apply(get_d2) #按照字段进行分类形成多个小表,带入到function自定义函数中的是小表,多少个小表就相当于处理多少次function函数 df = {'gameid':dd.index,'max':dd.values} #此处返回的是series,需要转化为dataframe与之前的大表df_league进行合并 *** 作 df2 = pd.Dataframe(df)
欢迎技术交流,需要数据验证,数据采集或者数据分析的,可以留言或私信。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)