本文主要是針對(duì) cumsum函數(shù)的一些用法。具體應(yīng)用場(chǎng)景看下面的數(shù)據(jù)集。
第一列是userID,第二列是安裝的時(shí)間,第三列是安裝的次數(shù)。
我們現(xiàn)在想做一件事情。就是統(tǒng)計(jì)用戶在某一天前累計(jì)的安裝次數(shù)。
譬如,對(duì)userID為20的用戶,問在16天前,其安裝次數(shù)為多少? 答案應(yīng)該是4次。用python的實(shí)現(xiàn)也很簡(jiǎn)單。
又譬如,userID為44在19天前安裝的次數(shù),那就應(yīng)該是1+3+1+1=6次。
具體代碼:(假設(shè)數(shù)據(jù)集為data)
由于是針對(duì)每個(gè)userID,所以是需要將userID劃分一下(這個(gè)方法在組內(nèi)排序的時(shí)候有提到,可以參考前面的文章)。
所以才有下面這一句
groupby(['userID'])
然后,分完組后需要統(tǒng)計(jì)的Times,所以就是下面這一句
data['Times'].groupby(['userID'])
最后,我們需要的是累加量,所以,用cumsum()這個(gè)函數(shù)。
data['sum_Times']=data['Times'].groupby(['userID']).cumsum()
用得到的結(jié)果放在一列。
最后得到結(jié)果如下:
可以從sum_Times這列看到,每一個(gè)值都是相應(yīng)userID在前一行的累加值。
以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號(hào)聯(lián)系: 360901061
您的支持是博主寫作最大的動(dòng)力,如果您喜歡我的文章,感覺我的文章對(duì)您有幫助,請(qǐng)用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點(diǎn)擊下面給點(diǎn)支持吧,站長(zhǎng)非常感激您!手機(jī)微信長(zhǎng)按不能支付解決辦法:請(qǐng)將微信支付二維碼保存到相冊(cè),切換到微信,然后點(diǎn)擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對(duì)您有幫助就好】元
