日韩久久久精品,亚洲精品久久久久久久久久久,亚洲欧美一区二区三区国产精品 ,一区二区福利

python數(shù)據(jù)處理之如何選取csv文件中某幾行的數(shù)據(jù)

系統(tǒng) 1882 0

前言

有些人看到這個(gè)問題覺得不是問題,是嘛,不就是df.col[]函數(shù)嘛,其實(shí)忽略了一個(gè)重點(diǎn),那就是我們要省去把csv文件全部讀取這個(gè)過程,因?yàn)槿绻诿媾R億萬級(jí)別的大規(guī)模數(shù)據(jù),得到的結(jié)果就是boom,boom,boom。

我們要使用一下現(xiàn)成的函數(shù)里面的參數(shù)nrows,和skiprows,一個(gè)代表你要讀幾行,一個(gè)代表你從哪開始讀,這就可以了,比如從第3行讀取4個(gè)

示例代碼

            
import pandas as pd
df = pd.DataFrame({'a':[1,2,3,4,5,6,7,8,9],'b':[22,33,44,55,66,77,88,99,10]})
df.to_csv('test.csv')
dt = pd.read_csv('test.csv',skiprows=5,nrows=3)
 
print(dt)
 
 
out:
 4 5 66
0 5 6 77
1 6 7 88
2 7 8 99
3 8 9 10
          

就可以了,不過這個(gè)列頭不知道是怎么回事,順便如果想根據(jù)列值找index,可以參考下面的

然后

            
df = pd.DataFrame({'BoolCol': [1, 2, 3, 3, 4],'attr': [22, 33, 22, 44, 66]},
  index=[10,20,30,40,50])
print(df)
a = df[(df.BoolCol==3)&(df.attr==22)].index.tolist()
print(a)
 
 
df = pd.DataFrame({'BoolCol': [1, 2, 3, 3, 4],'attr': [22, 33, 22, 44, 66]},
  index=[10,20,30,40,50])
print(df)
a = df[(df.BoolCol==3)&(df.attr==22)].index.tolist()
print(a)
          

問題得到了解決

總結(jié)

以上就是這篇文章的全部?jī)?nèi)容了,希望本文的內(nèi)容對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,謝謝大家對(duì)腳本之家的支持。


更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號(hào)聯(lián)系: 360901061

您的支持是博主寫作最大的動(dòng)力,如果您喜歡我的文章,感覺我的文章對(duì)您有幫助,請(qǐng)用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點(diǎn)擊下面給點(diǎn)支持吧,站長(zhǎng)非常感激您!手機(jī)微信長(zhǎng)按不能支付解決辦法:請(qǐng)將微信支付二維碼保存到相冊(cè),切換到微信,然后點(diǎn)擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對(duì)您有幫助就好】

您的支持是博主寫作最大的動(dòng)力,如果您喜歡我的文章,感覺我的文章對(duì)您有幫助,請(qǐng)用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長(zhǎng)會(huì)非常 感謝您的哦!!!

發(fā)表我的評(píng)論
最新評(píng)論 總共0條評(píng)論
主站蜘蛛池模板: 那曲县| 志丹县| 兴国县| 集贤县| 格尔木市| 田林县| 台中市| 乡宁县| 那曲县| 荥经县| 岐山县| 江华| 平和县| 江川县| 同江市| 华蓥市| 玛曲县| 乐亭县| 柏乡县| 宿州市| 麻阳| 济阳县| 永福县| 丰城市| 古田县| 安庆市| 五台县| 正阳县| 南郑县| 镇巴县| 邛崃市| 英吉沙县| 东丰县| 拜泉县| 教育| 雅江县| 崇阳县| 寿宁县| 镇宁| 高密市| 渝北区|