一個小需求,獲取遠程頁面的源碼,主要用于抓數據。原來用的好好的,最近突然不能獲取頁面源碼了,但是仍然可以用瀏覽器正常瀏覽。(文后附源碼下載。^_^)
經過分析,原來用的代碼如下:
查了下資料,原來需要加參數。
修正后的代碼如下:
問題是解決了,后來再想了想,可以用WebClient先把頁面download到本地臨時文件,再讀取文本內容。
代碼如下:
結果不能獲取源碼。錯誤如下:
再想想,還有Webbrowser控件可以用啊。在WinFrom下只要在主線程前加[STAThread]即可。
在WebForm就麻煩些了,出現錯誤,
線程不在單線程單元中,故無法實例化ActiveX控件“8856f961-340a-11d0-a96b-00c04fd705a2”
代碼如下:
后來搜索N小時(N>=5)后,終于找到可行解決方案,在WebPage頁面頭部加入 AspCompat="true"
即<%@ Page Language="C#"
AspCompat="true"
******/>
MSDN給出的解釋是:
在 ASP .NET 網頁的 <%@Page> 標記中包含兼容性屬性 aspcompat=true,如 <%@Page aspcompat=true Language=VB%>。使用此屬性將強制網頁以 STA 模式執(zhí)行,從而確保您的組件可以繼續(xù)正確運行。如果試圖使用 STA 組件但沒有指定此標記,運行時將會發(fā)生異常情況。
將此屬性的值設置為 true 時,將允許網頁調用 COM+ 1.0 組件,該組件需要訪問非管理的 ASP 內置對象??梢酝ㄟ^ ObjectContext 對象進行訪問。
如果將此標記的值設為 true,性能會稍微有些下降。建議只在確實需要時才這樣做。
終于可以了! 不知道有沒有更好的方法??
附:
源碼下載。
邀月注:
如果不能測試,請注意是否在域(AD)環(huán)境下,如果是! 請注意設置代理和防火墻
請參考:
http://dev.csdn.net/article/83914.shtm
或 http://blog.csdn.net/downmoon/archive/2006/04/14/663337.aspx
或 http://www.cnblogs.com/downmoon/archive/2007/12/29/1019701.html
在webForm中WebRequest/WebClient/WebBrowser獲取遠程頁面源碼的三種方式(downmoon)
更多文章、技術交流、商務合作、聯(lián)系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號聯(lián)系: 360901061
您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對您有幫助就好】元
