來(lái)源 | 高級(jí)農(nóng)民工(ID:Mocun6)
責(zé)編 | 胡巍巍
長(zhǎng)時(shí)間使用瀏覽器會(huì)積累大量瀏覽器歷史記錄,這些是很隱私的數(shù)據(jù),里面甚至可能有一些不可描述的網(wǎng)站或者搜索記錄不想讓別人知道。不過(guò),我們自己可能會(huì)感興趣,天天都在上網(wǎng),想知道長(zhǎng)期下來(lái)是都在摸魚(yú)還是有認(rèn)真工作。
其次,了解下自己每天打開(kāi)多少次網(wǎng)頁(yè)、哪些網(wǎng)站上的最多、常搜哪些關(guān)鍵詞,這些也很有趣。
下面就來(lái)給大家介紹一款 Python 編寫(xiě)的神工具,可以一鍵分析你的上網(wǎng)行為。我用了后發(fā)現(xiàn)了很多不可思議的結(jié)論。
比如訪問(wèn)次數(shù)最多的網(wǎng)站居然是微信公眾號(hào),7000 多次,看來(lái)弄自媒體占了大量上網(wǎng)時(shí)間。
瀏覽次數(shù)最多的十個(gè)網(wǎng)站
看到了每天打開(kāi)網(wǎng)站的次數(shù),平均都有好幾百次,8 月 8 號(hào)那天發(fā)生了什么,竟打開(kāi)了 1600 多次!
每日訪問(wèn)網(wǎng)站次數(shù)
然后又統(tǒng)計(jì)了停留時(shí)間最長(zhǎng)的網(wǎng)頁(yè)頁(yè)面,在 http://md.aclickall.com/ 這個(gè)網(wǎng)站居然停留了 660 小時(shí),這是個(gè)文章排版網(wǎng)站,因?yàn)榻?jīng)常要排版所以把該頁(yè)面固定了起來(lái)。
停留時(shí)間最長(zhǎng)的 URL 排名
然后統(tǒng)計(jì)出了搜索最多的十個(gè)關(guān)鍵詞,python 居然是第一位!前十中基本都是數(shù)據(jù)編程相關(guān)的,沒(méi)想到自己這么愛(ài)學(xué)習(xí)。
搜索最多的十個(gè)關(guān)鍵詞
最后統(tǒng)計(jì)出了各大搜索引擎的使用率。google 的使用率達(dá)到了 97.3%,而百度只有不到 3%,大概是偶爾無(wú)法科學(xué)上網(wǎng)的時(shí)候用了下百度。
各搜索引擎使用占比
怎么樣是不是挺有意思?下面就來(lái)說(shuō)說(shuō)怎么用這款工具,讓你也可以分分鐘了解自己的上網(wǎng)行為,非常簡(jiǎn)單。
這款 Python 工具其實(shí)就是分析瀏覽器的歷史記錄數(shù)據(jù)庫(kù)文件然后可視化。這里的瀏覽器只支持 Chrome 和以 Chrome 為內(nèi)核的瀏覽器,比如 Centbrower 、360極速瀏覽器等,其他瀏覽器比如 ie、Firefox 不支持。如果有登陸賬號(hào),桌面端和電腦端會(huì)一起分析,更全面。
第一步,打開(kāi)網(wǎng)站:(公眾號(hào)后臺(tái)回復(fù) 813得到)
接著上傳你的瀏覽器歷史記錄文件,這個(gè)歷史記錄文件怎么獲得呢?
新建一個(gè)標(biāo)簽頁(yè),輸入 chrome://version/?回車(chē),可以打開(kāi)你的瀏覽器詳細(xì)信息:
復(fù)制「?jìng)€(gè)人資料路徑」到資源管理器打開(kāi),然后找到 history 文件復(fù)制一份到桌面。
接著就在剛才的網(wǎng)站中上傳該文件(我的文件有 15MB 大),稍等片刻就可以得到上門(mén)的那些可視化分析結(jié)果。
你可能會(huì)擔(dān)心上傳瀏覽器歷史記錄是否安全,盡管放心,這個(gè)程序是開(kāi)源的。
下面再簡(jiǎn)單說(shuō)下如何用 python 一步步實(shí)現(xiàn)的這個(gè)程序功能的,這是一個(gè)很棒的 python 練手項(xiàng)目,涉及到了前后端的知識(shí),整個(gè)程序包含多個(gè)文件:
每個(gè)程序?qū)崿F(xiàn)的功能:
具體實(shí)現(xiàn)思路大致分為下面幾點(diǎn):
- 解析歷史記錄文件數(shù)據(jù)
歷史記錄 history 是一個(gè) sqllite 數(shù)據(jù)庫(kù)文件,連接數(shù)據(jù)庫(kù)查詢(xún)?nèi)缓笳{(diào)用數(shù)據(jù)庫(kù)中的信息并存儲(chǔ)。
- 配置 web 服務(wù)器和前端頁(yè)面
- 可視化繪圖函數(shù)
可視化圖形使用的是可交互式的 plotly 庫(kù)。
作者簡(jiǎn)介:高級(jí)農(nóng)民工( 蘇克 ),985 碩士轉(zhuǎn)行 Python,熱愛(ài)爬蟲(chóng)、數(shù)據(jù)分析和挖掘,本文首發(fā)于個(gè)人公眾號(hào)「mocun6」。
1.國(guó)產(chǎn)嵌入式操作系統(tǒng)技術(shù)與產(chǎn)業(yè)發(fā)展論壇暨嵌入式系統(tǒng)聯(lián)誼會(huì)主題討論會(huì)嘉賓揭曉!
2.
編程語(yǔ)言趨勢(shì)預(yù)測(cè):Rust 將成為主流,React 繼續(xù)統(tǒng)治編程世界
3. 教你如何使用TouchGFX之快速創(chuàng)建滑動(dòng)應(yīng)用
4 .如今的FPGA走錯(cuò)路了嗎?
5. 華為手機(jī)到底用了多少美國(guó)芯?
6. 10.3mmx11.5mm的Arduino,見(jiàn)過(guò)嗎?
免責(zé)聲明:本文系網(wǎng)絡(luò)轉(zhuǎn)載,版權(quán)歸原作者所有。如涉及作品版權(quán)問(wèn)題,請(qǐng)與我們聯(lián)系,我們將根據(jù)您提供的版權(quán)證 明材料確認(rèn)版權(quán)并支付稿酬或者刪除內(nèi)容。
更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號(hào)聯(lián)系: 360901061
您的支持是博主寫(xiě)作最大的動(dòng)力,如果您喜歡我的文章,感覺(jué)我的文章對(duì)您有幫助,請(qǐng)用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點(diǎn)擊下面給點(diǎn)支持吧,站長(zhǎng)非常感激您!手機(jī)微信長(zhǎng)按不能支付解決辦法:請(qǐng)將微信支付二維碼保存到相冊(cè),切換到微信,然后點(diǎn)擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對(duì)您有幫助就好】元
