日韩久久久精品,亚洲精品久久久久久久久久久,亚洲欧美一区二区三区国产精品 ,一区二区福利

一步步構(gòu)建大型網(wǎng)站架構(gòu)

系統(tǒng) 1784 0

有幸接確到了架構(gòu)這個(gè)詞的玩意,這幾天有時(shí)間就網(wǎng)上游離一下相關(guān)資料,看到不錯(cuò)就收藏一下,作為以后學(xué)習(xí)的方向:


之前我簡單向大家介紹了各個(gè)知名大型網(wǎng)站的架構(gòu), MySpace的五個(gè)里程碑 Flickr的架構(gòu) YouTube的架構(gòu) PlentyOfFish的架構(gòu) WikiPedia的架構(gòu) 。這幾個(gè)都很典型,我們可以從中獲取很多有關(guān)網(wǎng)站架構(gòu)方面的知識(shí),看了之后你會(huì)發(fā)現(xiàn)你原來的想法很可能是狹隘的。


  今天我們來談?wù)勔粋€(gè)網(wǎng)站一般是如何一步步來構(gòu)建起系統(tǒng)架構(gòu)的,雖然我們希望網(wǎng)站一開始就能有一個(gè)很好的架構(gòu),但事物是在發(fā)展中不 斷前進(jìn)的,網(wǎng)站架構(gòu)也是隨著業(yè)務(wù)的擴(kuò)大、用戶的需求不斷完善的,下面是一個(gè)網(wǎng)站架構(gòu)逐步發(fā)展的基本過程,讀完后,請(qǐng)思考,你現(xiàn)在在哪個(gè)階段。


  架構(gòu)演變第一步:物理分離WebServer和數(shù)據(jù)庫

  最開始,由于某些想法,于是在互聯(lián)網(wǎng)上搭建了一個(gè)網(wǎng)站,這個(gè)時(shí)候甚至有可能主機(jī)都是租借的,但由于這篇文章我們只關(guān)注架構(gòu)的演變歷程,因此就假 設(shè)這個(gè)時(shí)候已經(jīng)是托管了一臺(tái)主機(jī),并且有一定的帶寬了。這個(gè)時(shí)候由于網(wǎng)站具備了一定的特色,吸引了部分人訪問,逐漸你發(fā)現(xiàn)系統(tǒng)的壓力越來越高,響應(yīng)速度越 來越慢,而這個(gè)時(shí)候比較明顯的是數(shù)據(jù)庫和應(yīng)用互相影響,應(yīng)用出問題了,數(shù)據(jù)庫也很容易出現(xiàn)問題,而數(shù)據(jù)庫出問題的時(shí)候,應(yīng)用也容易出問題。于是進(jìn)入了第一 步演變階段:將應(yīng)用和數(shù)據(jù)庫從物理上分離,變成了兩臺(tái)機(jī)器,這個(gè)時(shí)候技術(shù)上沒有什么新的要求,但你發(fā)現(xiàn)確實(shí)起到效果了,系統(tǒng)又恢復(fù)到以前的響應(yīng)速度了,并 且支撐住了更高的流量,并且不會(huì)因?yàn)閿?shù)據(jù)庫和應(yīng)用形成互相的影響。


  看看這一步完成后系統(tǒng)的圖示:



  架構(gòu)演變第二步:增加頁面緩存

  好景不長,隨著訪問的人越來越多,你發(fā)現(xiàn)響應(yīng)速度又開始變慢了,查找原因,發(fā)現(xiàn)是訪問數(shù)據(jù)庫的操作太多,導(dǎo)致數(shù)據(jù)連接競(jìng)爭激烈,所以響應(yīng)變慢。 但數(shù)據(jù)庫連接又不能開太多,否則數(shù)據(jù)庫機(jī)器壓力會(huì)很高,因此考慮采用緩存機(jī)制來減少數(shù)據(jù)庫連接資源的競(jìng)爭和對(duì)數(shù)據(jù)庫讀的壓力。這個(gè)時(shí)候首先也許會(huì)選擇采用 squid等類似的機(jī)制來將系統(tǒng)中相對(duì)靜態(tài)的頁面(例如一兩天才會(huì)有更新的頁面)進(jìn)行緩存(當(dāng)然,也可以采用將頁面靜態(tài)化的方案),這樣程序上可以不做修 改,就能夠很好的減少對(duì)WebServer的壓力以及減少數(shù)據(jù)庫連接資源的競(jìng)爭,OK,于是開始采用squid來做相對(duì)靜態(tài)的頁面的緩存。


  看看這一步完成后系統(tǒng)的圖示:


一步步構(gòu)建大型網(wǎng)站架構(gòu)


  這一步涉及到了這些知識(shí)體系:

  前端頁面緩存技術(shù),例如squid,如想用好的話還得深入掌握下squid的實(shí)現(xiàn)方式以及緩存的失效算法等。


  架構(gòu)演變第三步:增加頁面片段緩存

  增加了squid做緩存后,整體系統(tǒng)的速度確實(shí)是提升了,WebServer的壓力也開始下降了,但隨著訪問量的增加,發(fā)現(xiàn)系統(tǒng)又開始變的有些 慢了。在嘗到了squid之類的動(dòng)態(tài)緩存帶來的好處后,開始想能不能讓現(xiàn)在那些動(dòng)態(tài)頁面里相對(duì)靜態(tài)的部分也緩存起來呢,因此考慮采用類似ESI之類的頁面 片段緩存策略,OK,于是開始采用ESI來做動(dòng)態(tài)頁面中相對(duì)靜態(tài)的片段部分的緩存。


  看看這一步完成后系統(tǒng)的圖示:


一步步構(gòu)建大型網(wǎng)站架構(gòu)


  這一步涉及到了這些知識(shí)體系:

  頁面片段緩存技術(shù),例如ESI等,想用好的話同樣需要掌握ESI的實(shí)現(xiàn)方式等;


  架構(gòu)演變第四步:數(shù)據(jù)緩存

  在采用ESI之類的技術(shù)再次提高了系統(tǒng)的緩存效果后,系統(tǒng)的壓力確實(shí)進(jìn)一步降低了,但同樣,隨著訪問量的增加,系統(tǒng)還是開始變慢。經(jīng)過查找,可 能會(huì)發(fā)現(xiàn)系統(tǒng)中存在一些重復(fù)獲取數(shù)據(jù)信息的地方,像獲取用戶信息等,這個(gè)時(shí)候開始考慮是不是可以將這些數(shù)據(jù)信息也緩存起來呢,于是將這些數(shù)據(jù)緩存到本地內(nèi) 存,改變完畢后,完全符合預(yù)期,系統(tǒng)的響應(yīng)速度又恢復(fù)了,數(shù)據(jù)庫的壓力也再度降低了不少。


  看看這一步完成后系統(tǒng)的圖示:


一步步構(gòu)建大型網(wǎng)站架構(gòu)


  這一步涉及到了這些知識(shí)體系:

  緩存技術(shù),包括像Map數(shù)據(jù)結(jié)構(gòu)、緩存算法、所選用的框架本身的實(shí)現(xiàn)機(jī)制等。


  架構(gòu)演變第五步: 增加WebServer

  好景不長,發(fā)現(xiàn)隨著系統(tǒng)訪問量的再度增加,webserver機(jī)器的壓力在高峰期會(huì)上升到比較高,這個(gè)時(shí)候開始考慮增加一臺(tái) webserver,這也是為了同時(shí)解決可用性的問題,避免單臺(tái)的webserver down機(jī)的話就沒法使用了,在做了這些考慮后,決定增加一臺(tái)webserver,增加一臺(tái)webserver時(shí),會(huì)碰到一些問題,典型的有:


1、如何讓訪問分配到這兩臺(tái)機(jī)器上,這個(gè)時(shí)候通常會(huì)考慮的方案是Apache自帶的負(fù)載均衡方案,或LVS這類的軟件負(fù)載均衡方案;
2、如何保持狀態(tài)信息的同步,例如用戶session等,這個(gè)時(shí)候會(huì)考慮的方案有寫入數(shù)據(jù)庫、寫入存儲(chǔ)、cookie或同步session信息等機(jī)制等;
3、如何保持?jǐn)?shù)據(jù)緩存信息的同步,例如之前緩存的用戶數(shù)據(jù)等,這個(gè)時(shí)候通常會(huì)考慮的機(jī)制有緩存同步或分布式緩存;
4、如何讓上傳文件這些類似的功能繼續(xù)正常,這個(gè)時(shí)候通常會(huì)考慮的機(jī)制是使用共享文件系統(tǒng)或存儲(chǔ)等;
在解決了這些問題后,終于是把webserver增加為了兩臺(tái),系統(tǒng)終于是又恢復(fù)到了以往的速度。


  看看這一步完成后系統(tǒng)的圖示:


一步步構(gòu)建大型網(wǎng)站架構(gòu)


  這一步涉及到了這些知識(shí)體系:

  負(fù)載均衡技術(shù)(包括但不限于硬件負(fù)載均衡、軟件負(fù)載均衡、負(fù)載算法、linux轉(zhuǎn)發(fā)協(xié)議、所選用的技術(shù)的實(shí)現(xiàn)細(xì)節(jié)等)、主備技術(shù)(包括但不限于 ARP欺騙、linuxheart-beat等)、狀態(tài)信息或緩存同步技術(shù)(包括但不限于Cookie技術(shù)、UDP協(xié)議、狀態(tài)信息廣播、所選用的緩存同步 技術(shù)的實(shí)現(xiàn)細(xì)節(jié)等)、共享文件技術(shù)(包括但不限于NFS等)、存儲(chǔ)技術(shù)(包括但不限于存儲(chǔ)設(shè)備等)。


  架構(gòu)演變第六步:分庫

  享受了一段時(shí)間的系統(tǒng)訪問量高速增長的幸福后,發(fā)現(xiàn)系統(tǒng)又開始變慢了,這次又是什么狀況呢,經(jīng)過查找,發(fā)現(xiàn)數(shù)據(jù)庫寫入、更新的這些操作的部分?jǐn)?shù) 據(jù)庫連接的資源競(jìng)爭非常激烈,導(dǎo)致了系統(tǒng)變慢,這下怎么辦呢?此時(shí)可選的方案有數(shù)據(jù)庫集群和分庫策略,集群方面像有些數(shù)據(jù)庫支持的并不是很好,因此分庫會(huì) 成為比較普遍的策略,分庫也就意味著要對(duì)原有程序進(jìn)行修改,一通修改實(shí)現(xiàn)分庫后,不錯(cuò),目標(biāo)達(dá)到了,系統(tǒng)恢復(fù)甚至速度比以前還快了。


  看看這一步完成后系統(tǒng)的圖示:


一步步構(gòu)建大型網(wǎng)站架構(gòu)


  這一步涉及到了這些知識(shí)體系:

  這一步更多的是需要從業(yè)務(wù)上做合理的劃分,以實(shí)現(xiàn)分庫,具體技術(shù)細(xì)節(jié)上沒有其他的要求;

  但同時(shí)隨著數(shù)據(jù)量的增大和分庫的進(jìn)行,在數(shù)據(jù)庫的設(shè)計(jì)、調(diào)優(yōu)以及維護(hù)上需要做的更好,因此對(duì)這些方面的技術(shù)還是提出了很高的要求的。


  架構(gòu)演變第七步:分表、DAL和分布式緩存

  隨著系統(tǒng)的不斷運(yùn)行,數(shù)據(jù)量開始大幅度增長,這個(gè)時(shí)候發(fā)現(xiàn)分庫后查詢?nèi)匀粫?huì)有些慢,于是按照分庫的思想開始 做分表的工作。當(dāng)然,這不可避免的會(huì)需要對(duì)程序進(jìn)行一些修改,也許在這個(gè)時(shí)候就會(huì)發(fā)現(xiàn)應(yīng)用自己要關(guān)心分庫分表的規(guī)則等,還是有些復(fù)雜的。于是萌生能否增加 一個(gè)通用的框架來實(shí)現(xiàn)分庫分表的數(shù)據(jù)訪問,這個(gè)在ebay的架構(gòu)中對(duì)應(yīng)的就是DAL,這個(gè)演變的過程相對(duì)而言需要花費(fèi)較長的時(shí)間。當(dāng)然,也有可能這個(gè)通用 的框架會(huì)等到分表做完后才開始做。同時(shí),在這個(gè)階段可能會(huì)發(fā)現(xiàn)之前的緩存同步方案出現(xiàn)問題,因?yàn)閿?shù)據(jù)量太大,導(dǎo)致現(xiàn)在不太可能將緩存存在本地,然后同步的 方式,需要采用分布式緩存方案了。于是,又是一通考察和折磨,終于是將大量的數(shù)據(jù)緩存轉(zhuǎn)移到分布式緩存上了。


  看看這一步完成后系統(tǒng)的圖示:


一步步構(gòu)建大型網(wǎng)站架構(gòu)


  這一步涉及到了這些知識(shí)體系:

  分表更多的同樣是業(yè)務(wù)上的劃分,技術(shù)上涉及到的會(huì)有動(dòng)態(tài)hash算法、consistenthash算法等;

  DAL涉及到比較多的復(fù)雜技術(shù),例如數(shù)據(jù)庫連接的管理(超時(shí)、異常)、數(shù)據(jù)庫操作的控制(超時(shí)、異常)、分庫分表規(guī)則的封裝等;


  架構(gòu)演變第八步:增加更多的WebServer

  在做完分庫分表這些工作后,數(shù)據(jù)庫上的壓力已經(jīng)降到比較低了,又開始過著每天看著訪問量暴增的幸福生活了。突然有一天,發(fā)現(xiàn)系統(tǒng)的訪問又開始有 變慢的趨勢(shì) 了,這個(gè)時(shí)候首先查看數(shù)據(jù)庫,壓力一切正常,之后查看webserver,發(fā)現(xiàn)apache阻塞了很多的請(qǐng)求,而應(yīng)用服務(wù)器對(duì)每個(gè)請(qǐng)求也是比較快的,看來 是請(qǐng)求數(shù)太高導(dǎo)致需要排隊(duì)等待,響應(yīng)速度變慢。這還好辦,一般來說,這個(gè)時(shí)候也會(huì)有些錢了,于是添加一些webserver服務(wù)器,在這個(gè)添加 webserver服務(wù)器的過程,有可能會(huì)出現(xiàn)幾種挑戰(zhàn):


  1、Apache的軟負(fù)載或LVS軟負(fù)載等無法承擔(dān)巨大的web訪問量(請(qǐng)求連接數(shù)、網(wǎng)絡(luò)流量等)的調(diào)度了,這個(gè)時(shí)候如果經(jīng)費(fèi)允許的話,會(huì)采取 的方案是購買硬件負(fù)載平衡設(shè)備,例如F5、Netsclar、Athelon之類的,如經(jīng)費(fèi)不允許的話,會(huì)采取的方案是將應(yīng)用從邏輯上做一定的分類,然后 分散到不同的軟負(fù)載集群中;

  2、原有的一些狀態(tài)信息同步、文件共享等方案可能會(huì)出現(xiàn)瓶頸,需要進(jìn)行改進(jìn),也許這個(gè)時(shí)候會(huì)根據(jù)情況編寫符合網(wǎng)站業(yè)務(wù)需求的分布式文件系統(tǒng)等;

  在做完這些工作后,開始進(jìn)入一個(gè)看似完美的無限伸縮的時(shí)代,當(dāng)網(wǎng)站流量增加時(shí),應(yīng)對(duì)的解決方案就是不斷的添加webserver。


  看看這一步完成后系統(tǒng)的圖示:


一步步構(gòu)建大型網(wǎng)站架構(gòu)


  這一步涉及到了這些知識(shí)體系:

  到了這一步,隨著機(jī)器數(shù)的不斷增長、數(shù)據(jù)量的不斷增長和對(duì)系統(tǒng)可用性的要求越來越高,這個(gè)時(shí)候要求對(duì)所采用的技術(shù)都要有更為深入的理解,并需要根據(jù)網(wǎng)站的需求來做更加定制性質(zhì)的產(chǎn)品。


  架構(gòu)演變第九步:數(shù)據(jù)讀寫分離和廉價(jià)存儲(chǔ)方案

  突然有一天,發(fā)現(xiàn)這個(gè)完美的時(shí)代也要結(jié)束了,數(shù)據(jù)庫的噩夢(mèng)又一次出現(xiàn)在眼前了。由于添加的webserver太多了,導(dǎo)致數(shù)據(jù)庫連接的資源還是 不夠用,而這個(gè)時(shí)候又已經(jīng)分庫分表了,開始分析數(shù)據(jù)庫的壓力狀況,可能會(huì)發(fā)現(xiàn)數(shù)據(jù)庫的讀寫比很高,這個(gè)時(shí)候通常會(huì)想到數(shù)據(jù)讀寫分離的方案。當(dāng)然,這個(gè)方案 要實(shí)現(xiàn)并不容易,另外,可能會(huì)發(fā)現(xiàn)一些數(shù)據(jù)存儲(chǔ)在數(shù)據(jù)庫上有些浪費(fèi),或者說過于占用數(shù)據(jù)庫資源,因此在這個(gè)階段可能會(huì)形成的架構(gòu)演變是實(shí)現(xiàn)數(shù)據(jù)讀寫分離, 同時(shí)編寫一些更為廉價(jià)的存儲(chǔ)方案,例如BigTable這種。


  看看這一步完成后系統(tǒng)的圖示:


一步步構(gòu)建大型網(wǎng)站架構(gòu)


  這一步涉及到了這些知識(shí)體系:

  數(shù)據(jù)讀寫分離要求對(duì)數(shù)據(jù)庫的復(fù)制、standby等策略有深入的掌握和理解,同時(shí)會(huì)要求具備自行實(shí)現(xiàn)的技術(shù);

  廉價(jià)存儲(chǔ)方案要求對(duì)OS的文件存儲(chǔ)有深入的掌握和理解,同時(shí)要求對(duì)采用的語言在文件這塊的實(shí)現(xiàn)有深入的掌握。


  架構(gòu)演變第十步:進(jìn)入大型分布式應(yīng)用時(shí)代和廉價(jià)服務(wù)器群夢(mèng)想時(shí)代

  經(jīng)過上面這個(gè)漫長而痛苦的過程,終于是再度迎來了完美的時(shí)代,不斷的增加webserver就可以支撐越來越高的訪問量了。對(duì)于大型網(wǎng)站而言, 人氣的重要毋庸置疑,隨著人氣的越來越高,各種各樣的功能需求也開始爆發(fā)性的增長。這個(gè)時(shí)候突然發(fā)現(xiàn),原來部署在webserver上的那個(gè)web應(yīng)用已 經(jīng)非常龐大 了,當(dāng)多個(gè)團(tuán)隊(duì)都開始對(duì)其進(jìn)行改動(dòng)時(shí),可真是相當(dāng)?shù)牟环奖悖瑥?fù)用性也相當(dāng)糟糕,基本是每個(gè)團(tuán)隊(duì)都做了或多或少重復(fù)的事情,而且部署和維護(hù)也是相當(dāng)?shù)穆闊?因?yàn)辇嫶蟮膽?yīng)用包在N臺(tái)機(jī)器上復(fù)制、啟動(dòng)都需要耗費(fèi)不少的時(shí)間,出問題的時(shí)候也不是很好查,另外一個(gè)更糟糕的狀況是很有可能會(huì)出現(xiàn)某個(gè)應(yīng)用上的bug就導(dǎo) 致了全站都不可用,還有其他的像調(diào)優(yōu)不好操作(因?yàn)闄C(jī)器上部署的應(yīng)用什么都要做,根本就無法進(jìn)行針對(duì)性的調(diào)優(yōu))等因素,根據(jù)這樣的分析,開始痛下決心,將 系統(tǒng)根據(jù)職責(zé)進(jìn)行拆分,于是一個(gè)大型的分布式應(yīng)用就誕生了,通常,這個(gè)步驟需要耗費(fèi)相當(dāng)長的時(shí)間,因?yàn)闀?huì)碰到很多的挑戰(zhàn):


1、拆成分布式后需要提供一個(gè)高性能、穩(wěn)定的通信框架,并且需要支持多種不同的通信和遠(yuǎn)程調(diào)用方式;
2、將一個(gè)龐大的應(yīng)用拆分需要耗費(fèi)很長的時(shí)間,需要進(jìn)行業(yè)務(wù)的整理和系統(tǒng)依賴關(guān)系的控制等;
3、如何運(yùn)維(依賴管理、運(yùn)行狀況管理、錯(cuò)誤追蹤、調(diào)優(yōu)、監(jiān)控和報(bào)警等)好這個(gè)龐大的分布式應(yīng)用。
經(jīng)過這一步,差不多系統(tǒng)的架構(gòu)進(jìn)入相對(duì)穩(wěn)定的階段,同時(shí)也能開始采用大量的廉價(jià)機(jī)器來支撐著巨大的訪問量和數(shù)據(jù)量,結(jié)合這套架構(gòu)以及這么多次演變過程吸取的經(jīng)驗(yàn)來采用其他各種各樣的方法來支撐著越來越高的訪問量。


  看看這一步完成后系統(tǒng)的圖示:


一步步構(gòu)建大型網(wǎng)站架構(gòu)


  這一步涉及到了這些知識(shí)體系:

  這一步涉及的知識(shí)體系非常的多,要求對(duì)通信、遠(yuǎn)程調(diào)用、消息機(jī)制等有深入的理解和掌握,要求的都是從理論、硬件級(jí)、操作系統(tǒng)級(jí)以及所采用的語言的實(shí)現(xiàn)都有清楚的理解。


  最后,附上一張大型網(wǎng)站的架構(gòu)圖:


一步步構(gòu)建大型網(wǎng)站架構(gòu)



轉(zhuǎn)載自: 第九街-PHP [ http://www.9streets.cn/ ]




一步步構(gòu)建大型網(wǎng)站架構(gòu)


更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號(hào)聯(lián)系: 360901061

您的支持是博主寫作最大的動(dòng)力,如果您喜歡我的文章,感覺我的文章對(duì)您有幫助,請(qǐng)用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點(diǎn)擊下面給點(diǎn)支持吧,站長非常感激您!手機(jī)微信長按不能支付解決辦法:請(qǐng)將微信支付二維碼保存到相冊(cè),切換到微信,然后點(diǎn)擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對(duì)您有幫助就好】

您的支持是博主寫作最大的動(dòng)力,如果您喜歡我的文章,感覺我的文章對(duì)您有幫助,請(qǐng)用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會(huì)非常 感謝您的哦!!!

發(fā)表我的評(píng)論
最新評(píng)論 總共0條評(píng)論
主站蜘蛛池模板: 梅河口市| 登封市| 双桥区| 凤山市| 息烽县| 和林格尔县| 佛学| 教育| 万载县| 宝山区| 手游| 女性| 老河口市| 武平县| 嘉定区| 华坪县| 天峻县| 鹿邑县| 扎兰屯市| 历史| 滁州市| 元氏县| 龙陵县| 奉贤区| 清流县| 大关县| 普定县| 石景山区| 高唐县| 延川县| 柏乡县| 南投县| 鹤岗市| 武宁县| 平阴县| 淮安市| 桐梓县| 新乡县| 漳平市| 盱眙县| 苍溪县|