一、為什么要使用Python進(jìn)行數(shù)據(jù)分析?
python擁有一個(gè)巨大的活躍的科學(xué)計(jì)算社區(qū),擁有不斷改良的庫,能夠輕松的集成C,C++,Fortran代碼(Cython項(xiàng)目),可以同時(shí)用于研究和原型的構(gòu)建以及生產(chǎn)系統(tǒng)的構(gòu)建。
二、Python的優(yōu)勢與劣勢:
1.Python是一種解釋型語言,運(yùn)行速度比編譯型數(shù)據(jù)慢。
2.由于python有一個(gè)全局解釋器鎖(GIL),防止解釋器同時(shí)執(zhí)行多條python字節(jié)碼,所以python不適用于高并發(fā)、多線程的應(yīng)用程序。
三、使用Python進(jìn)行數(shù)據(jù)分析常用的擴(kuò)展包。
目前初始階段的學(xué)習(xí)主要涉及4個(gè)包的安裝:numpy、scipy、pandas、matplotlib
我筆記本里安裝的是Python2.7版本,在安裝了pip和setuptools工具,關(guān)于pip和setuptools工具的安裝詳見相關(guān)筆記。
最初使用的安裝命令很簡單:
pip install pandas pip install numpy pip install scipy pip install matplotlib
但是只安裝成功了numpy和matplotlib兩個(gè)包,pandas和scipy安裝失敗,查閱了相關(guān)資料發(fā)現(xiàn)可能是版本問題或者包的依賴相關(guān)。
最終在stack overflow發(fā)現(xiàn)了一個(gè)很棒的Python包提供網(wǎng)址:http://www.lfd.uci.edu/~gohlke/pythonlibs/#scipy
--這里要Mark一下,后邊爭取寫一個(gè)爬蟲,搞下來所有的包防止丟失。
以上網(wǎng)址是加州大學(xué)歐文分校提供的Python相關(guān)庫的下載地址,修改#后邊的名字可以進(jìn)去其他包的下載頁面,此頁面中提供了安裝某個(gè)包需要依賴的前置包的說明,非常友好。
依賴包說明類似:
Pandas, a cross-section and time series data analysis toolkit. Requires numpy, dateutil, pytz, setuptools, and optionally numexpr, bottleneck, scipy, matplotlib, pytables, lxml, xarray, blosc, backports.lzma, statsmodels, sqlalchemy and other dependencies.
然后就是一堆的pandas下載地址。
最終根據(jù)各個(gè)包的相關(guān)性先安裝了numpy+mkl的whl文件,然后是安裝scipy最后是pandas。
安裝的方法如下:
1.下載對應(yīng)的4個(gè)包放在D:\目錄下(很奇怪我筆記本是AMD64位的但是安裝amd64版本的包報(bào)不支持的platform的錯(cuò)誤,安裝了32位的可以正常import)
2.cmd命令行進(jìn)入D:\目錄執(zhí)行:pip install <包的全名>進(jìn)行安裝。(如果已安裝了其他錯(cuò)誤的版本,使用pip uninstall卸載)
最后使用如下類似命令查看包的安裝位置:
以上這篇對Python進(jìn)行數(shù)據(jù)分析_關(guān)于Package的安裝問題就是小編分享給大家的全部內(nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號聯(lián)系: 360901061
您的支持是博主寫作最大的動(dòng)力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點(diǎn)擊下面給點(diǎn)支持吧,站長非常感激您!手機(jī)微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點(diǎn)擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對您有幫助就好】元
