???????? 爬蟲即網(wǎng)絡(luò)爬蟲,英文是
Web Spider
。翻譯過來就是網(wǎng)絡(luò)上爬行的蜘蛛,如果把互聯(lián)網(wǎng)看作一張大網(wǎng),那么爬蟲就是在大網(wǎng)上爬來爬去的蜘蛛,碰到想要的食物,就把他抓取出來。
我們?cè)跒g覽器中輸入一個(gè)網(wǎng)址,敲擊回車,看到網(wǎng)站的頁面信息。這就是瀏覽器請(qǐng)求了網(wǎng)站的服務(wù)器,獲取到網(wǎng)絡(luò)資源。那么,爬蟲也相當(dāng)于模擬瀏覽器發(fā)送請(qǐng)求,獲得到
HTML
代碼。
HTML
代碼里通常包含了標(biāo)簽和文字信息,我們就從中提取到我們想要的信息。
通常爬蟲是從某個(gè)網(wǎng)站的某個(gè)頁面開始,爬取這個(gè)頁面的內(nèi)容,找到網(wǎng)頁中的其他鏈接地址,然后從這個(gè)地址爬到下一個(gè)頁面,這樣一直不停的爬下去,進(jìn)去批量的抓取信息。那么,我們可以看出網(wǎng)絡(luò)爬蟲就是一個(gè)不停爬取網(wǎng)頁抓取信息的程序。
更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號(hào)聯(lián)系: 360901061
您的支持是博主寫作最大的動(dòng)力,如果您喜歡我的文章,感覺我的文章對(duì)您有幫助,請(qǐng)用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點(diǎn)擊下面給點(diǎn)支持吧,站長非常感激您!手機(jī)微信長按不能支付解決辦法:請(qǐng)將微信支付二維碼保存到相冊(cè),切換到微信,然后點(diǎn)擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對(duì)您有幫助就好】元
