日本訪問量百億級的應用_一個web伺服器能承受多少訪問量

1. 哪個網站的訪問量最高

下面是全球訪問量最大的十個網站，看他們是如何做到訪問量達到全球之最的。
NO1、Facebook
Facebook於2004年2月4日上線如同國內的人人網類似，一個照片分享的社交網站，截至2012年5月，Facebook注冊用戶約9億。其中Facebook之所以能夠得到全球訪問量網站最高的原因不僅是Facebook創建的時間較早。而是在Facebook上你能夠看到世界的另一面。這也就是在國內無法打開Facebook的重點原因。據爆料Facebook的每個月的流量高達8.367億訪問量，其中Facebook年收入高達10-11億美元。

NO2、Google
雖然谷歌退出了中國，即使谷歌經常打不開，但是還是得到了國人對谷歌的支持，當然還有太多人放棄進入谷歌，因為對於用戶來說網站打不開是極其不利於用戶體驗的。好了廢話不多說，谷歌是全球最大的搜索引擎，成立於1998年9月份。同時谷歌還提高多樣產品如：Gmail、 Google Maps、Google+、安卓等。雖然不知道谷歌現在年收入是多少，在2013年1月份谷歌的年收入已經超過了500億美元。其中谷歌月訪問量高達7.828億。

NO3、YouTube
YouTube要全球最大的視頻分享網站，公司注冊於2005年2月份，2006年11月，Google以16.5億美元收購了YouTube，大大提高了YouTube的知名度的同時，也帶動了YouTube的訪問量，個人認為發展到如此地步的原因為Google的帶動。在2013年12月份騰訊爆料YouTube年收入高達56億美元。其中網站月訪問量為7.219億。

NO4、Yahoo
自從2013年馬雲放棄雅虎，可能對雅虎的流量有所影響，但是個人認為僅中國的流量可能對雅虎營銷不是很大，從2013年的數據可以看到Yahoo訪問量在全球排名第四位。雅虎主要包括搜索引擎、電郵、新聞等。業務普遍24個國家。全球注冊用戶達到5億。雖然沒有統計出來雅虎的年收入情況，從雅虎月訪問量（4.699億）可以看出雅虎的年收入不會低於10億美元。

NO5、維基網路
國內外如果你有不懂的詞，如果你有不懂的產品，基維網路是絕對可以替你找到答案的。基維網路類似於網路，也被稱作「人民的網路全書」。基維網路的主要流量來源於Google，因為基維網路的答案大部分都能夠滿足Google的需求，可謂是谷歌的好基友。在網路我無法查閱出來基維網路的年收入情況，但是在國內一個二級域名的權重9告訴我們，基維網路的年收入絕對不低。其中基維網路的月訪問量為4.696億。

NO6、Live
Live是微軟創建的電子郵件服務，相當於我們國內的126郵箱，其中包括MSN，Space，郵箱，由微軟MSN推出的提供網頁、圖片搜索服務。可能在國內使用的電子郵箱相對較少，但是國外一般的情況下交流均通過電子郵箱，所以在國外電子郵件營銷是一個非常不錯的辦法，而國內的情況就不同了。Live的月訪問量3.895億。

NO7、騰訊網
不丟國人的臉，騰訊網在流量方面排名在世界的第七位，騰訊主要是提高門戶同時騰訊還提高搜索、QQ空間、微博等多項產品。QQ客戶端擁有7億多活躍用戶，所以在流量方面得到了國人的支持。騰訊在官方網站發出2013年全年業績看出，2013年騰訊總收入為99.13億美元。流量高達2.841億。

NO8、微軟網站
藉助Windows的力量，微軟的網站流量也不甘落後，我不知道那些用戶訪問微軟官網的目的是什麼，微軟的官方僅提供用戶購買微軟產品、下載微軟軟體及更新的網站。難道微軟的生意這么好？但是實際卻告訴我們，微軟官網的流量確實驚人。其中微軟的月訪問量達到2.717億。

NO9、網路
1999年李彥宏看到了中國的搜索引擎具有強大的發展空間，在2000年建立的網路。從最初的不足10人發展至今，員工人數超過18000人。這里的員工僅為他們公司上班的員工，其實還有太多的SEOER在幫網路忙碌著，比如說我。2013年網路官方得出數據顯示，網路年收入94.62億元人民幣。其網站月訪問量為2.687億。

NO10、MSN
MSN類似於騰訊QQ，但是個人在使用MSN的時候還是有少許的不方便，畢竟外國人口味相對較重，MSN同時提供各類資訊，購物，游戲方面的內容，以及電子郵件、即時通訊、博客門戶服務。我查不到MSN的年收入，僅知道四年的時間MSN僅廣告收入達到了190億美元，同時月訪問量為2.541億。

2. 搭建一個日點擊量百萬以上的電子商務網站，它的硬體設備投資大概會是多少

百萬級訪問量網站的技術准備工作
當今從純網站技術上來說，因為開源模式的發展，現在建一個小網站已經很簡單也很便宜，所以很多人都把創業方向定位在互聯網應用。這些人里大多數不是很懂技術，或者不是那麼精通，而網站開發維護方面的知識又很分散，學習成本太高，所以這篇文章將這些知識點結合起來，系統的來說，一個從日幾千訪問的小小網站，到日訪問一兩百萬的小網站，中間可能會產生什麼問題，以及怎麼才能在一開始做足工作盡量避免這些問題。

你的網站因為努力經營，訪問量逐漸升高，在升高的過程中，問題也可能開始顯現了。因為帶寬的增加、硬體的擴展、人員的擴張所帶來的成本提高是顯而易見的，而還有相當大的一部分成本是因為代碼重構、架構重構，甚至底層開發語言更換引起的，最壞的情況就是數據丟失，所有努力付之一炬。這類成本支出大多數在一開始就可以避免，先打好基礎，往後可以省很多精力，少操很多心。

對於不同的初期投資成本，技術路線的選擇是不同的。這里假設網站剛剛只是一個構想，計劃第一年伺服器硬體帶寬投入5萬左右。對於這個資金額度，有很多種方案可選擇，例如租用虛擬主機、租用單獨伺服器，或者流行的私有雲，或者託管伺服器。前兩種選擇，網站發展到一定規模時需遷移，那時再重做規劃顯然影響更大。伺服器託管因為配置自主、能完全掌握控制權，所以有一定規模的網站基本都是這種模式。採用自己託管伺服器的網站，一開始要注意以下幾點——

一、開發語言
一般來說，技術人員（程序員）都是根據自己技術背景選擇自己最熟悉的語言，不過不可能永遠是一個人寫程序，所以在語言的選擇上還要是要費些心思。首先明確一點，無論用什麼語言，最終代碼質量是看管理，因此我們從前期開發成本分析。現在國內流行的適用於網站的語言，大概有java、php、.net、 python、ruby這五大陣營。python和ruby因為在國內流行的比較晚，現在人員還是相對難招一些。.net平台的人相對多，但是到後期需要解決性能問題時，對人員技能的要求比較高。剩餘的java、php用人可以說是最多的。java和php無法從語言層面做比較，但對於初期，應用幾乎都是靠前端支撐的網站來說，php入門簡單、編寫快速，優勢相對大一點。至於後端例如行為分析、銀行介面、非同步消息處理等，等真正需要時，就要根據不同業務需求來選擇不同語言了。

二、代碼版本管理
稍微有點規模的網站就需要使用代碼版本管理了。代碼版本管理兩點最大的好處，一是方便協同工作，二是有歷史記錄可查詢比較。代碼版本管理軟體有很多，vss/cvs/svn/hg等，目前國內都比較流行，其中svn的普及度還是很高的。

假設選了svn，那麼有幾點考慮。一是採用什麼樹結構。初期可能只有一條主幹，往後就需要建立分支，例如一條開發分支，一條上線分支，再往後，可能要每個小組一個分支。建議一開始人少時選擇兩條分支，開發和線上，每個功能本地測試無誤後提交到開發分支，最後統一測試，可以上線時合並到上線分支。如果每人都建自己的分支，合並時會浪費很大精力，對於幾乎每天都要修改幾次的WEB應用來說，所費時間太多。

向伺服器部署代碼，可以手工部署也可以自動部署。手工部署相對簡單，一般可直接在伺服器上svn update，或者找個新目錄svn checkout，再把web root給ln -s過去。應用越復雜，部署越復雜，沒有什麼統一標准，只是別再用ftp上傳那種形式，一是上傳時文件引用不一致錯誤率增加，二是很容易出現開發人員的版本跟線上版本不一致，導致本來想改個錯字結果變成回滾。如果有多台伺服器還是建議自動部署，更換代碼的機器從當前服務池中臨時撤出，更新完畢後再重新加入。

三、伺服器硬體
在各個機房裡，靠一台伺服器孤獨支撐的網站數不清，但如果資金稍微充足，建議至少三台的標准配置，分別用作web處理、資料庫、備份。web伺服器至少要8G內存，雙sata raid1，如果經濟稍微寬松，或靜態文件或圖片多，則15k sas raid10。資料庫至少16G內存，15k sas raid 10。備份伺服器最好跟資料庫伺服器同等配置。硬體可以上整套品牌，也可以兼容機，也可以半品牌半組裝，取決於經濟能力。當然，這是典型的搭配，有些類型應用的性能瓶頸首先出現在web上，那種情況就要單獨分析了。

web伺服器可以既跑程序又當內存緩存，資料庫伺服器則只跑主資料庫（假如是Mysql的話），備份伺服器所承擔就相對多一些，web配置、緩存配置、資料庫配置都要跟前兩台一致，這樣WEB和資料庫任意一台出問題，很容易就可以將備份伺服器切換過去臨時頂替，直到解決完問題。要注意，硬體是隨時可能壞掉的，特別是硬碟，所以寧可WEB伺服器跟資料庫伺服器放在一起，也一定不能省掉備份，備份一定要異機，並且有非同步，電力故障、誤操作都可能導致一台機器上的所有數據丟失。很多的開源備份方案可選擇，最簡單的就是rsync，寫crontab里，定時同步。備份和切換，建議多做測試，選最安全最適合業務的，並且盡可能異地備份。

四、機房
三種機房盡量不要選：聯通訪問特別慢的電信機房、電信訪問特別慢的聯通機房、電信聯通訪問特別慢的移動或鐵通機房。機房要盡可能多的實地參觀，多測試，找個網路質量好，管理嚴格的機房。機房可以說是非常重要，直接關繫到網站訪問速度，網站訪問速度直接關繫到用戶體驗，訪問速度很慢的網站，很難獲得用戶青睞。

五、架構
在大方向上，被熟知的架構是web負載均衡+資料庫主從+緩存+分布式存儲+隊列。在一開始，按照可擴展的原則設計和編程就可以。只是要多考慮緩存失效時的雪崩效應、主從同步的數據一致性和時間差、隊列的穩定性和失敗後的重試策略、文件存儲的效率和備份方式等等意外情況。緩存失效、資料庫復制中斷、隊列寫入錯誤、電源損壞，在實際運維中經常發生，如果不注意這些，出現問題時恢復期可能會超出預期很長時間。

六、伺服器軟體
操作系統Linux很流行。在沒有專業運維人員的情況下，應傾向於擇使用的人多、社區活躍、配置方便、升級方便的發行版，例如RH系列、 debian、ubuntu server等，硬體和操作系統要一起選擇，看是否有適合的驅動，如果確定用某種商業軟體或解決方案，也要提前知曉其對哪種操作系統支持最佳。web伺服器方面，apache、nginx、lighttpd三大系列中，apache佔有量還是最大，但是想把性能調教好還是需要很專業的，nginx和 lighttpd在不需要太多調整的情況下可以達到一個比較不錯的性能。無論選擇什麼軟體，除非改過這些軟體或你的程序真的不兼容新版本，否則盡量版本越新越好，版本新，意味著新特性增多、BUG減少、性能增加。一個典型的php網站，基本上大多數人都沒改過任何伺服器軟體源代碼，絕大多數情況是能平穩的升級到新版本的。類似於jdk5到 jdk6，python2到python3這類變動比較大的升級還是比較少見的。看看ChangeLog，看看升級說明，結合自己情況評估測試一下，越早升級越好，升級的越晚，所花費的成本越高。對於軟體包，盡量使用發行版內置的包管理工具，沒有特殊要求時不建議自己編譯，那樣對將來運維不利。

七、資料庫
幾乎所有操作最後都要落到資料庫身上，它又最難擴展（存儲也挺難）。資料庫常見的擴展方法有復制、分片，設計時要考慮到每種應用的數據如何復制、分片，當然這種考慮一般會推遲到技術設計時期。在初期進行資料庫結構設計時，要根據不同的業務類型和增長量預期來考慮是否要分庫、分區，並且盡量不要使用聯合查詢、不使用自增ID以方便分片。復制延時問題、主從資料庫數據一致性問題，可以自己寫或者用已有的運維工具進行檢測。

用存儲過程是比較難擴展的，這種情形多發生於傳統C/S，特別是OA系統轉換過來的開發人員。低成本網站不是一兩台小型機跑一個資料庫處理所有業務的模式，是機海作戰。方便水平擴展比那點預分析時間和網路傳輸流量要重要的多的多。

另外，現在流行一種概念叫NoSQL，可以理解為非傳統關系型資料庫。實際應用中，網站有著越來越多的密集寫操作、上億的簡單關系數據讀取、熱備等，這都不是傳統關系資料庫所擅長的，於是就產生了很多非關系型資料庫，比如Redis/TC&TT/MongoDB/Memcachedb等，在測試中，這些幾乎都達到了每秒至少一萬次的寫操作，內存型的甚至5萬以上。在設計時，可根據業務特點和性能要求來選擇是否使用這類資料庫。例如 MongoDB，幾句配置就可以組建一個復制+自動分片+failover的環境，文檔化的存儲也簡化了傳統設計庫結構再開發的模式。但是當你決定採用一項技術時，一定要真正了解其優劣，例如可能你所選擇的技術並不能支持你所需要的事務和數據一致性要求。

八、文件存儲
存儲的分布幾乎跟資料庫擴展一樣困難，不過只有百萬的PV的情況下，磁碟IO方面一般不會成大問題，一兩台採用SATA做條帶RAID的機器可以應付，反而是自己做非同步備份比較復雜，因為小文件多。如果只有一台機器做存儲，可以做簡單的優化，例如放最小縮略圖的分區和放中等縮略圖的分區，根據平均大小調整一下塊大小。存儲要規劃好目錄結構，否則文件增多後維護起來復雜，也不利於擴展。同時還要考慮將來擴容，例如採用LVM，或者把文件根據不同規則散列到不同機器。磁碟IO繁重的情況下更容易出現故障，所以要做好備份，若發現有盤壞掉，要馬上行動更換，很多人的硬碟都是壞了一塊之後，接二連三的壞下去。

為了將來圖片走cdn做准備，一開始最好就將圖片的域名分開，且不用主域名。因為很多網站都將cookie設置到了.domain.ltd，如果圖片也在這個域名下，很可能因為cookie而造成緩存失效，並且佔多餘流量，還可能因為瀏覽器並發線程限製造成訪問緩慢。

九、程序
一定硬體條件下，應用能承載多少訪問量，很大一部分也取決於程序如何寫。程序寫的不好，可能一萬的訪問都承載不了，寫的好，可能一兩台機器就能承擔幾百萬PV。越是復雜、數據實時性要求越高的應用，優化起來越難，但對普通網站有一個統一的思路，就是盡量向前端優化、減少資料庫操作、減少磁碟IO。向前端優化指的是，在不影響功能和體驗的情況下，能在瀏覽器執行的不要在服務端執行，能在緩存伺服器上直接返回的不要到應用伺服器，程序能直接取得的結果不要到外部取得，本機內能取得的數據不要到遠程取，內存能取到的不要到磁碟取，緩存中有的不要去資料庫查詢。減少資料庫操作指減少更新次數、緩存結果減少查詢次數、將資料庫執行的操作盡可能的讓你的程序完成（例如join查詢），減少磁碟IO指盡量不使用文件系統作為緩存、減少讀寫文件次數等。程序優化永遠要優化慢的部分，換語法是無法「優化」的。

然而編程時不應該把重點放在優化上，應該關注擴展性。當今的WEB應用，需求變化非常之快，適應多種需求的架構是不存在的，我們的擴展性就要把要點放在跟底層交互的架構上，例如持久化數據的存取規則、緩存的存取規則等，還有一些共用服務，例如用戶信息等。先把不變的部分做完善，剩下的部分就很容易將精力放在業務邏輯上面了。

3. 電子商務的應用現狀與發展前景的探討,怎麼寫

據中國物品編碼中心抽樣調查，2002年，全國62.7%的零售企業建成了區域網，38.8%的零售企業在網上公布商品信息；17.9%的零售企業提供網上購物方式；只有3%的零售企業實施了供應商管理庫存（VMI）。我國農業網站發展很快。不僅各省市普遍建立了《農業信息網》，還涌現了類似《中華十億農副產品網》《福州亞峰》《南京白雲亭》這樣一些大型網上市場。網上經營的品種一改去年以糧食，化肥為主的局面。副料、家禽、農葯、土特產、花卉、園林、水產品、茶葉、鮮果等全部上網。江蘇目前已有九大類，三十個農產品市場實現了連網。沛縣率先在全國實現全縣28個鄉鎮連網。網上銷售菜糧等農產品23億公斤。《環球農商網》、《中青農網》、《中國農村星火數據廣播網》讓農民用電視機即可走進網路時空。成為面向九億農民的數字化信息網路。農業監測預警系統已開始按月提供小麥、玉米、大豆、棉花、糖料的監測報告，年底可建立幾個品種的數據平台。農村供求信息服務系統，農村供求信息全國聯播系統（農村供求一站通），一年來已有注冊會員18000家，每月頒布信息6000條，內容詳查13萬條，已成為中國最全面、權威的農業信息網路，每月點擊已達到1000萬次，農產品價格供求信息還通過中國聯通的尋呼機向全國用戶發送，2002年改進了對網站信息管理，建立了三層結構內容管理系統，推進縣、鄉信息服務點建設，年底預計完成60%縣級、20%鄉鎮農村經濟信息服務站建設任務
網上農產品超市開通，位於北京市大興縣的北京萬福喜食品公司的員工在其配送中心內為網上訂貨的顧客准備農產品。該公司從2002年5月起利用互聯網銷售農副產品，就可以看到圖文並貌的大興蔬菜、瓜果、肉食等農副產品的介紹，公司設立配送站點的小區居民通過網路訂貨後，該公司針對顧客的要求進行清洗、加工和配送，市民不出小區就可購買到新鮮、便宜的優質農副產品。目前，已有6萬戶北京市民成為該公司會員。自1997年至今，南通市農民通過上網銷售的農產品累計達到200多個品種，實現銷售額近1億元，通過信息搭橋，農民走上了致富快車道。

2.5.省市地區電子商務取得不少進展

北京、上海、湖南、徐州、海南等地電子商務已取得不少進展。

北京首都電子商務工程取得較大進展，首都電子商城作為首都電子商務主要基礎設施，已開始為國內外企業、商戶開展全國性和全球性電子商務發揮作用，每月訪問者達數百萬人次，每月網上經營額已達數百萬元人民幣。2002年北京電子商務逐步建立和形成了具有首都特色的電子商務體系，電子商務服務平台-首都電子商城的功能進一步完善，四級社區電子商務服務信息網路系統全面開通。在2002年1至9月，BtoB、BtoC電子商務交易額分別為360.1億元和3.83億元，分別比去年同期增長121.87%和164.14%，電子商務市場前景看好。西單商場於2001年底投資900萬元成立了電子商務公司（igo5.com）。到2002年6月，igo5.com月銷售額已超過400萬元。2002年9月，實華開以單筆跨國網上采購額超過千萬人民幣而刷新亞洲網上開放式純電子商務采購新紀錄，此次交易開設四個競價市場，對四種不同的特製塑料進行拍賣。總成交額超過千萬，為采購方節省金額百萬餘人民幣，節省比例達到10.72%.至此，實華開已成功地為包括美國最大的辦公文具連鎖店以及德國最大的零售商，舉行了十幾場中國出口商品網上競價訂貨會。網易2001年初易趣合作網上拍賣，2002年7月5日，合同期滿，雙方拍賣合作正式到期。2002年7月9日網易的主頁上出現了網易拍賣推出了自己的拍賣服務。2002年3月18日美國eBay公司為易趣注資3000萬美元易趣與美國eBay公司合作eBay獲得了易趣的33%股權，使易趣成為國內最大的CtoC網上拍賣網站。2002年，中國互聯網上的手機銷量增長了近150％，目前國內外各種品牌的手機型號有264種，都可以通過互聯網來銷售；同樣一部手機網上銷售價格比傳統的專賣店銷售價格要低1％至2％，手機配件的網上銷售能比傳統專賣店便宜到40％至50％。北京社區電子商務工程一年來取得顯著成果：依託首都公用信息平台將18個區縣、149個街道連接成一個整體，實現互聯互通、在169個社區服務中心建立169個網站，形成覆蓋全市社區服務信息網站群，安裝了149套街道熱線呼叫系統，在1200個社區安裝了管理軟體，開發社區電子商務支撐平台，在2400個社區實現了網路接入，採用96156熱線電話和信息亭三種接入方式。上海社保卡工程幾年來取得成效，累計發卡800萬張，600萬人用於醫保結算。

濟南市電子商務及現代物流應用示範工程一年來，以三聯集團為龍頭與22家家電生產廠家和20多個銷售商建立家電電子商務聯盟，對34家連鎖店進行改造，24家實施緊密分銷商管理系統，10家實施核心分銷商管理系統（即由ERP統一管理）。總部與連銷店分銷效率大為提高，訂單處理由來1.5天縮短到5分鍾，實現了商流、信息流、物流全面集成，資源共享。海南在旅遊業電子商務、農產品網上營銷，重慶在網上農，貿超市、網上輕工市場，徐州淮海食品商城，天津在物流配送方面進行了試點，積累了有益的經驗，中國電信湖南電子商務中心建立了179門戶網站，開展在線安全交易、安全支付、證券、銀行、購物與CA論證等安全服務。

2.6我國B2B、B2C市場的發展現狀

根據CCID的研究分析資料：2002年12月，我國電子商務網站3804家，比2001年3391家增長12%，能有效運行的1533家，比2001年1326家增長16%；消費類電子商務網站2277家，其中綜合類網站285家，專業類網站1992家，能有效運行的737家；B2B網站1527家，其中綜合類網站189家，專業類網站1338家，能有效運行的796家；電子商務市場規模，電子商務交易額2002年1809億元，比2001年1088億元增長66.2%；B2C交易額2001年為13.15億元，2002年25億元，年增長率90%；B2B交易額2001年為1075億元，2002年1784億元，年增長率65.9%.

4. 日本訪問量第一的網站是什麼

雅虎

5. 中葯材起源於中國，為什麼被日本賣向全世界

近年來，幾乎每隔一段時間，網路媒體和微信朋友圈都會被「日本的中葯侵略戰」、「神奇的日本漢方葯XXX」等網文刷屏。這些文章往往盛贊日本的漢方葯風行世界，技術如何先進，質量如何優異；此外，文中還指出「日本漢方葯出口量佔世界中葯市場的80%以上」，「日本改造中葯『六神丸』，開發為漢方葯『救心丹』，年銷售額上億美元」……這樣的報道令許多國內中醫葯界人士感到不安和憂慮。事實果真如此嗎？多位專家對此持不同意見，認為這種過分誇大日本漢方葯影響的做法，有嘩眾取寵之嫌。

數說現實中的漢方葯

漢方醫學是日本化了的中國傳統醫學，漢方葯是在漢方醫學理論指導下應用的葯物，與我國的中葯同源異流，同根異枝。

在很多報道中，漢方葯占據國際市場的主流。如今國人出國出境漸多，經常出國的人都有這樣的體會，在日本以外，從美國、歐洲到日本周邊的韓國、東南亞、香港、台灣，包括中國大陸都很難見到漢方葯的影子。那麼，傳說中占據國際市場主流的漢方葯到底出口到了哪裡？

其實，根據日本厚生勞動省《葯事工業生產動態統計年報》顯示，1992年漢方葯的產值達到17億美元，為歷史最高峰，後因「小柴胡湯」事件影響而陡然下降，2000年以來基本維持在每年10億美元。漢方葯生產企業中，津村制葯一家獨大，長期占據75%以上的市場份額，其他如鍾紡、小太郎、帝國等規模都不大。因此，了解津村制葯的現狀，基本就能掌握漢方葯的大體情況。

其次，中醫葯界誇大甚至神化美日歐等發達國家對中國的科技領先優勢，幾十年來一直是中國知識界、媒體界的傳統。在過去，這樣的觀念有其合理之處，畢竟中國跟發達國家的技術差距確實很大，而且幾乎是全方位的。如今，此消彼長，天翻地覆，中國在產業鏈的很多領域、環節都取得了非常大的成績，有很多方面已經開始在世界領先。但很多人對這一變化卻缺乏足夠的認識和感知，觀念還停留在過去，神話漢方葯，如同誇大日本電飯煲、馬桶蓋的神奇一樣，成為另外一種「日吹」。

如果不能正視自己的弱點，那麼就不能取得進步。但如果我們不能看清楚自己的優點，那麼我們前進的方向就會出現錯誤。過分誇大漢方葯，反映出對中醫葯缺少自信和自覺，發展理念和發展決心不堅定。客觀分析、理性看待漢方葯的不足，摒棄誇誕虛飾之詞，是應該甚至必須的。

6. 日本境內用的最多的網路聊天工具是什麼

日本境內用的最多的網路聊天工具是msn，MSN MESSENGER是微軟發布一款即時通訊軟體，可以與親人、朋友、工作夥伴進行文字聊天、語音對話、視頻會議等即時交流。

(6)日本訪問量百億級的應用擴展閱讀：

2003年12月3日，MSN宣布MSN服務創造了新的里程碑，世界范圍內每個月有1億4500萬用戶訪問MSN Hotmail，1億1000萬用戶登陸MSN Messenger即時通訊軟體。

MSN同時宣布，MSN Hotmail將在報告和防止垃圾郵件，聯系人列表和日程安排等方面做出改進。這些改進包括一個更加人性化的outlook式界面的郵件編輯器，和MSN Messenger的高度整合，新的『今日』頁面和新的聯系人管理功能。

在2013年11月24日微軟正式接手之前，很難獲知關於微軟如何運營Skype業務的細節，更難了解未來的Skype在華是否繼續保有VoIP業務，但有一點可以確定，中國這個唯一的「MSN特區」即將消亡，MSN終將成為歷史。

7. 大數據在電子商務中應用體現在哪些方面

1、通過大數據進行市場營銷

通過大數據進行市場營銷能夠有效的節約企業或是電子商務平台的營銷成本，還能夠通過大數據來實現營銷的精準化，達成精準營銷。

通過分析大數據對消費者的消費偏好進行分析，在消費者輸入關鍵詞之後，提供與消費者消費偏好匹配程度較高的產品，節約了消費者的尋找商品的時間成本，使交易雙方實現快速的對接。實現電子商務平台或是企業營銷的高效化。在數據化時代，針對消費者進行針對性的營銷能夠實現精準營銷，提升產品的下單率，提升電子商務的營銷效率。

2、實現導購服務的個性化

對於電子商務的平台來講，往往都會針對用戶提供一些推薦和導購服務。通過大數據的分析和挖掘能夠實現導購服務的個性化。針對消費者的年齡、性別、職業、購買歷史、購買商品種類、查詢歷史等信息，對消費者的消費意向、消費習慣、消費特點進行系統性的分析，根據大數據的分析針對消費者個人制定個性化的推薦和導購服務。

大數據的運用能夠抵消電子商務虛擬性所帶來的影響，提升競爭力，挖掘更多的潛在消費者。針對消費者的消費偏好，進行適宜的廣告推廣，提升產品的廣告轉化率，同時提供個性化的導購服務。

對於一些大型的電子商務平台來講，產品種類繁多，想要提升消費者的消費量，提升消費者的下單率就要通過分析消費者的消費偏好，主動進行商品的推送。這種通過大數據進行分析的方式不僅僅能提升產品的瀏覽量，還能針對消費者的消費需求提供商品的推送，提升消費者的用戶體驗，進而提升消費者的忠誠度。

3、為商家提供數據服務

大數據的分析不僅僅能夠幫助電子商務平台提升下單率和銷售額，還能將大數據的分析作為產品和服務向中小型的電子商務商家進行銷售。這樣不僅僅能夠提昇平台的收益，還能幫助商家了解消費者的消費偏好、消費者對於該類產品的喜好等信息，來幫助商家及時針對大部分消費者的消費偏好以及市場的動態，針對產品的性能等進行研發和調整。

(7)日本訪問量百億級的應用擴展閱讀：

大數據的應用：

1、洛杉磯警察局和加利福尼亞大學合作利用大數據預測犯罪的發生。

2、google流感趨勢(Google Flu Trends)利用搜索關鍵詞預測禽流感的散布。

3、統計學家內特.西爾弗(Nate Silver)利用大數據預測2012美國選舉結果。

4、麻省理工學院利用手機定位數據和交通數據建立城市規劃。

5、梅西百貨的實時定價機制。根據需求和庫存的情況，該公司基於SAS的系統對多達7300萬種貨品進行實時調價。

6、醫療行業早就遇到了海量數據和非結構化數據的挑戰，而近年來很多國家都在積極推進醫療信息化發展，這使得很多醫療機構有資金來做大數據分析。

8. php怎麼處理高並發

以下內容轉載自徐漢彬大牛的博客億級Web系統搭建——單機到分布式集群

當一個Web系統從日訪問量10萬逐步增長到1000萬，甚至超過1億的過程中，Web系統承受的壓力會越來越大，在這個過程中，我們會遇到很多的問題。為了解決這些性能壓力帶來問題，我們需要在Web系統架構層面搭建多個層次的緩存機制。在不同的壓力階段，我們會遇到不同的問題，通過搭建不同的服務和架構來解決。

Web負載均衡

Web負載均衡（Load Balancing），簡單地說就是給我們的伺服器集群分配「工作任務」，而採用恰當的分配方式，對於保護處於後端的Web伺服器來說，非常重要。

負載均衡的策略有很多，我們從簡單的講起哈。

1.HTTP重定向

當用戶發來請求的時候，Web伺服器通過修改HTTP響應頭中的Location標記來返回一個新的url，然後瀏覽器再繼續請求這個新url，實際上就是頁面重定向。通過重定向，來達到「負載均衡」的目標。例如，我們在下載PHP源碼包的時候，點擊下載鏈接時，為了解決不同國家和地域下載速度的問題，它會返回一個離我們近的下載地址。重定向的HTTP返回碼是302

這個重定向非常容易實現，並且可以自定義各種策略。但是，它在大規模訪問量下，性能不佳。而且，給用戶的體驗也不好，實際請求發生重定向，增加了網路延時。

2. 反向代理負載均衡

反向代理服務的核心工作主要是轉發HTTP請求，扮演了瀏覽器端和後台Web伺服器中轉的角色。因為它工作在HTTP層（應用層），也就是網路七層結構中的第七層，因此也被稱為「七層負載均衡」。可以做反向代理的軟體很多，比較常見的一種是Nginx。

Nginx是一種非常靈活的反向代理軟體，可以自由定製化轉發策略，分配伺服器流量的權重等。反向代理中，常見的一個問題，就是Web伺服器存儲的session數據，因為一般負載均衡的策略都是隨機分配請求的。同一個登錄用戶的請求，無法保證一定分配到相同的Web機器上，會導致無法找到session的問題。

解決方案主要有兩種：

1.配置反向代理的轉發規則，讓同一個用戶的請求一定落到同一台機器上（通過分析cookie），復雜的轉發規則將會消耗更多的CPU，也增加了代理伺服器的負擔。

2.將session這類的信息，專門用某個獨立服務來存儲，例如redis/memchache，這個方案是比較推薦的。

反向代理服務，也是可以開啟緩存的，如果開啟了，會增加反向代理的負擔，需要謹慎使用。這種負載均衡策略實現和部署非常簡單，而且性能表現也比較好。但是，它有「單點故障」的問題，如果掛了，會帶來很多的麻煩。而且，到了後期Web伺服器繼續增加，它本身可能成為系統的瓶頸。

3. IP負載均衡

IP負載均衡服務是工作在網路層（修改IP）和傳輸層（修改埠，第四層），比起工作在應用層（第七層）性能要高出非常多。原理是，他是對IP層的數據包的IP地址和埠信息進行修改，達到負載均衡的目的。這種方式，也被稱為「四層負載均衡」。常見的負載均衡方式，是LVS（Linux Virtual Server，Linux虛擬服務），通過IPVS（IP Virtual Server，IP虛擬服務）來實現。

在負載均衡伺服器收到客戶端的IP包的時候，會修改IP包的目標IP地址或埠，然後原封不動地投遞到內部網路中，數據包會流入到實際Web伺服器。實際伺服器處理完成後，又會將數據包投遞回給負載均衡伺服器，它再修改目標IP地址為用戶IP地址，最終回到客戶端。

上述的方式叫LVS-NAT，除此之外，還有LVS-RD（直接路由），LVS-TUN（IP隧道），三者之間都屬於LVS的方式，但是有一定的區別，篇幅問題，不贅敘。

IP負載均衡的性能要高出Nginx的反向代理很多，它只處理到傳輸層為止的數據包，並不做進一步的組包，然後直接轉發給實際伺服器。不過，它的配置和搭建比較復雜。

4. DNS負載均衡

DNS（Domain Name System）負責域名解析的服務，域名url實際上是伺服器的別名，實際映射是一個IP地址，解析過程，就是DNS完成域名到IP的映射。而一個域名是可以配置成對應多個IP的。因此，DNS也就可以作為負載均衡服務。

這種負載均衡策略，配置簡單，性能極佳。但是，不能自由定義規則，而且，變更被映射的IP或者機器故障時很麻煩，還存在DNS生效延遲的問題。

5. DNS/GSLB負載均衡

我們常用的CDN（Content Delivery Network，內容分發網路）實現方式，其實就是在同一個域名映射為多IP的基礎上更進一步，通過GSLB（Global Server Load Balance，全局負載均衡）按照指定規則映射域名的IP。一般情況下都是按照地理位置，將離用戶近的IP返回給用戶，減少網路傳輸中的路由節點之間的跳躍消耗。

「向上尋找」，實際過程是LDNS（Local DNS）先向根域名服務（Root Name Server）獲取到頂級根的Name Server（例如.com的），然後得到指定域名的授權DNS，然後再獲得實際伺服器IP。

CDN在Web系統中，一般情況下是用來解決大小較大的靜態資源（html/Js/Css/圖片等）的載入問題，讓這些比較依賴網路下載的內容，盡可能離用戶更近，提升用戶體驗。

例如，我訪問了一張imgcache.gtimg.cn上的圖片（騰訊的自建CDN，不使用qq.com域名的原因是防止http請求的時候，帶上了多餘的cookie信息），我獲得的IP是183.60.217.90。

這種方式，和前面的DNS負載均衡一樣，不僅性能極佳，而且支持配置多種策略。但是，搭建和維護成本非常高。互聯網一線公司，會自建CDN服務，中小型公司一般使用第三方提供的CDN。

Web系統的緩存機制的建立和優化

剛剛我們講完了Web系統的外部網路環境，現在我們開始關注我們Web系統自身的性能問題。我們的Web站點隨著訪問量的上升，會遇到很多的挑戰，解決這些問題不僅僅是擴容機器這么簡單，建立和使用合適的緩存機制才是根本。

最開始，我們的Web系統架構可能是這樣的，每個環節，都可能只有1台機器。

我們從最根本的數據存儲開始看哈。

一、 MySQL資料庫內部緩存使用

MySQL的緩存機制，就從先從MySQL內部開始，下面的內容將以最常見的InnoDB存儲引擎為主。

1. 建立恰當的索引

最簡單的是建立索引，索引在表數據比較大的時候，起到快速檢索數據的作用，但是成本也是有的。首先，佔用了一定的磁碟空間，其中組合索引最突出，使用需要謹慎，它產生的索引甚至會比源數據更大。其次，建立索引之後的數據insert/update/delete等操作，因為需要更新原來的索引，耗時會增加。當然，實際上我們的系統從總體來說，是以select查詢操作居多，因此，索引的使用仍然對系統性能有大幅提升的作用。

2. 資料庫連接線程池緩存

如果，每一個資料庫操作請求都需要創建和銷毀連接的話，對資料庫來說，無疑也是一種巨大的開銷。為了減少這類型的開銷，可以在MySQL中配置thread_cache_size來表示保留多少線程用於復用。線程不夠的時候，再創建，空閑過多的時候，則銷毀。

其實，還有更為激進一點的做法，使用pconnect（資料庫長連接），線程一旦創建在很長時間內都保持著。但是，在訪問量比較大，機器比較多的情況下，這種用法很可能會導致「資料庫連接數耗盡」，因為建立連接並不回收，最終達到資料庫的max_connections（最大連接數）。因此，長連接的用法通常需要在CGI和MySQL之間實現一個「連接池」服務，控制CGI機器「盲目」創建連接數。

建立資料庫連接池服務，有很多實現的方式，PHP的話，我推薦使用swoole（PHP的一個網路通訊拓展）來實現。

3. Innodb緩存設置（innodb_buffer_pool_size）

innodb_buffer_pool_size這是個用來保存索引和數據的內存緩存區，如果機器是MySQL獨占的機器，一般推薦為機器物理內存的80%。在取表數據的場景中，它可以減少磁碟IO。一般來說，這個值設置越大，cache命中率會越高。

4. 分庫/分表/分區。

MySQL資料庫表一般承受數據量在百萬級別，再往上增長，各項性能將會出現大幅度下降，因此，當我們預見數據量會超過這個量級的時候，建議進行分庫/分表/分區等操作。最好的做法，是服務在搭建之初就設計為分庫分表的存儲模式，從根本上杜絕中後期的風險。不過，會犧牲一些便利性，例如列表式的查詢，同時，也增加了維護的復雜度。不過，到了數據量千萬級別或者以上的時候，我們會發現，它們都是值得的。

二、 MySQL資料庫多台服務搭建

1台MySQL機器，實際上是高風險的單點，因為如果它掛了，我們Web服務就不可用了。而且，隨著Web系統訪問量繼續增加，終於有一天，我們發現1台MySQL伺服器無法支撐下去，我們開始需要使用更多的MySQL機器。當引入多台MySQL機器的時候，很多新的問題又將產生。

1. 建立MySQL主從，從庫作為備份

這種做法純粹為了解決「單點故障」的問題，在主庫出故障的時候，切換到從庫。不過，這種做法實際上有點浪費資源，因為從庫實際上被閑著了。

2. MySQL讀寫分離，主庫寫，從庫讀。

兩台資料庫做讀寫分離，主庫負責寫入類的操作，從庫負責讀的操作。並且，如果主庫發生故障，仍然不影響讀的操作，同時也可以將全部讀寫都臨時切換到從庫中（需要注意流量，可能會因為流量過大，把從庫也拖垮）。

3. 主主互備。

兩台MySQL之間互為彼此的從庫，同時又是主庫。這種方案，既做到了訪問量的壓力分流，同時也解決了「單點故障」問題。任何一台故障，都還有另外一套可供使用的服務。

不過，這種方案，只能用在兩台機器的場景。如果業務拓展還是很快的話，可以選擇將業務分離，建立多個主主互備。

三、 MySQL資料庫機器之間的數據同步

每當我們解決一個問題，新的問題必然誕生在舊的解決方案上。當我們有多台MySQL，在業務高峰期，很可能出現兩個庫之間的數據有延遲的場景。並且，網路和機器負載等，也會影響數據同步的延遲。我們曾經遇到過，在日訪問量接近1億的特殊場景下，出現，從庫數據需要很多天才能同步追上主庫的數據。這種場景下，從庫基本失去效用了。

於是，解決同步問題，就是我們下一步需要關注的點。

1. MySQL自帶多線程同步

MySQL5.6開始支持主庫和從庫數據同步，走多線程。但是，限制也是比較明顯的，只能以庫為單位。MySQL數據同步是通過binlog日誌，主庫寫入到binlog日誌的操作，是具有順序的，尤其當SQL操作中含有對於表結構的修改等操作，對於後續的SQL語句操作是有影響的。因此，從庫同步數據，必須走單進程。

2. 自己實現解析binlog，多線程寫入。

以資料庫的表為單位，解析binlog多張表同時做數據同步。這樣做的話，的確能夠加快數據同步的效率，但是，如果表和表之間存在結構關系或者數據依賴的話，則同樣存在寫入順序的問題。這種方式，可用於一些比較穩定並且相對獨立的數據表。

國內一線互聯網公司，大部分都是通過這種方式，來加快數據同步效率。還有更為激進的做法，是直接解析binlog，忽略以表為單位，直接寫入。但是這種做法，實現復雜，使用范圍就更受到限制，只能用於一些場景特殊的資料庫中（沒有表結構變更，表和表之間沒有數據依賴等特殊表）。

四、在Web伺服器和資料庫之間建立緩存

實際上，解決大訪問量的問題，不能僅僅著眼於資料庫層面。根據「二八定律」，80%的請求只關注在20%的熱點數據上。因此，我們應該建立Web伺服器和資料庫之間的緩存機制。這種機制，可以用磁碟作為緩存，也可以用內存緩存的方式。通過它們，將大部分的熱點數據查詢，阻擋在資料庫之前。

1. 頁面靜態化

用戶訪問網站的某個頁面，頁面上的大部分內容在很長一段時間內，可能都是沒有變化的。例如一篇新聞報道，一旦發布幾乎是不會修改內容的。這樣的話，通過CGI生成的靜態html頁面緩存到Web伺服器的磁碟本地。除了第一次，是通過動態CGI查詢資料庫獲取之外，之後都直接將本地磁碟文件返回給用戶。

在Web系統規模比較小的時候，這種做法看似完美。但是，一旦Web系統規模變大，例如當我有100台的Web伺服器的時候。那樣這些磁碟文件，將會有100份，這個是資源浪費，也不好維護。這個時候有人會想，可以集中一台伺服器存起來，呵呵，不如看看下面一種緩存方式吧，它就是這樣做的。

2. 單台內存緩存

通過頁面靜態化的例子中，我們可以知道將「緩存」搭建在Web機器本機是不好維護的，會帶來更多問題（實際上，通過PHP的apc拓展，可通過Key/value操作Web伺服器的本機內存）。因此，我們選擇搭建的內存緩存服務，也必須是一個獨立的服務。

內存緩存的選擇，主要有redis/memcache。從性能上說，兩者差別不大，從功能豐富程度上說，Redis更勝一籌。

3. 內存緩存集群

當我們搭建單台內存緩存完畢，我們又會面臨單點故障的問題，因此，我們必須將它變成一個集群。簡單的做法，是給他增加一個slave作為備份機器。但是，如果請求量真的很多，我們發現cache命中率不高，需要更多的機器內存呢？因此，我們更建議將它配置成一個集群。例如，類似redis cluster。

Redis cluster集群內的Redis互為多組主從，同時每個節點都可以接受請求，在拓展集群的時候比較方便。客戶端可以向任意一個節點發送請求，如果是它的「負責」的內容，則直接返回內容。否則，查找實際負責Redis節點，然後將地址告知客戶端，客戶端重新請求。

對於使用緩存服務的客戶端來說，這一切是透明的。

內存緩存服務在切換的時候，是有一定風險的。從A集群切換到B集群的過程中，必須保證B集群提前做好「預熱」（B集群的內存中的熱點數據，應該盡量與A集群相同，否則，切換的一瞬間大量請求內容，在B集群的內存緩存中查找不到，流量直接沖擊後端的資料庫服務，很可能導致資料庫宕機）。

4. 減少資料庫「寫」

上面的機制，都實現減少資料庫的「讀」的操作，但是，寫的操作也是一個大的壓力。寫的操作，雖然無法減少，但是可以通過合並請求，來起到減輕壓力的效果。這個時候，我們就需要在內存緩存集群和資料庫集群之間，建立一個修改同步機制。

先將修改請求生效在cache中，讓外界查詢顯示正常，然後將這些sql修改放入到一個隊列中存儲起來，隊列滿或者每隔一段時間，合並為一個請求到資料庫中更新資料庫。

除了上述通過改變系統架構的方式提升寫的性能外，MySQL本身也可以通過配置參數innodb_flush_log_at_trx_commit來調整寫入磁碟的策略。如果機器成本允許，從硬體層面解決問題，可以選擇老一點的RAID（Rendant Arrays of independent Disks，磁碟列陣）或者比較新的SSD（Solid State Drives，固態硬碟）。

5. NoSQL存儲

不管資料庫的讀還是寫，當流量再進一步上漲，終會達到「人力有窮時」的場景。繼續加機器的成本比較高，並且不一定可以真正解決問題的時候。這個時候，部分核心數據，就可以考慮使用NoSQL的資料庫。NoSQL存儲，大部分都是採用key-value的方式，這里比較推薦使用上面介紹過Redis，Redis本身是一個內存cache，同時也可以當做一個存儲來使用，讓它直接將數據落地到磁碟。

這樣的話，我們就將資料庫中某些被頻繁讀寫的數據，分離出來，放在我們新搭建的Redis存儲集群中，又進一步減輕原來MySQL資料庫的壓力，同時因為Redis本身是個內存級別的Cache，讀寫的性能都會大幅度提升。

國內一線互聯網公司，架構上採用的解決方案很多是類似於上述方案，不過，使用的cache服務卻不一定是Redis，他們會有更豐富的其他選擇，甚至根據自身業務特點開發出自己的NoSQL服務。

6. 空節點查詢問題

當我們搭建完前面所說的全部服務，認為Web系統已經很強的時候。我們還是那句話，新的問題還是會來的。空節點查詢，是指那些資料庫中根本不存在的數據請求。例如，我請求查詢一個不存在人員信息，系統會從各級緩存逐級查找，最後查到到資料庫本身，然後才得出查找不到的結論，返回給前端。因為各級cache對它無效，這個請求是非常消耗系統資源的，而如果大量的空節點查詢，是可以沖擊到系統服務的。

在我曾經的工作經歷中，曾深受其害。因此，為了維護Web系統的穩定性，設計適當的空節點過濾機制，非常有必要。

我們當時採用的方式，就是設計一張簡單的記錄映射表。將存在的記錄存儲起來，放入到一台內存cache中，這樣的話，如果還有空節點查詢，則在緩存這一層就被阻擋了。

異地部署（地理分布式）

完成了上述架構建設之後，我們的系統是否就已經足夠強大了呢？答案當然是否定的哈，優化是無極限的。Web系統雖然表面上看，似乎比較強大了，但是給予用戶的體驗卻不一定是最好的。因為東北的同學，訪問深圳的一個網站服務，他還是會感到一些網路距離上的慢。這個時候，我們就需要做異地部署，讓Web系統離用戶更近。

一、核心集中與節點分散

有玩過大型網游的同學都會知道，網游是有很多個區的，一般都是按照地域來分，例如廣東專區，北京專區。如果一個在廣東的玩家，去北京專區玩，那麼他會感覺明顯比在廣東專區卡。實際上，這些大區的名稱就已經說明了，它的伺服器所在地，所以，廣東的玩家去連接地處北京的伺服器，網路當然會比較慢。

當一個系統和服務足夠大的時候，就必須開始考慮異地部署的問題了。讓你的服務，盡可能離用戶更近。我們前面已經提到了Web的靜態資源，可以存放在CDN上，然後通過DNS/GSLB的方式，讓靜態資源的分散「全國各地」。但是，CDN只解決的靜態資源的問題，沒有解決後端龐大的系統服務還只集中在某個固定城市的問題。

這個時候，異地部署就開始了。異地部署一般遵循：核心集中，節點分散。

·核心集中：實際部署過程中，總有一部分的數據和服務存在不可部署多套，或者部署多套成本巨大。而對於這些服務和數據，就仍然維持一套，而部署地點選擇一個地域比較中心的地方，通過網路內部專線來和各個節點通訊。

·節點分散：將一些服務部署為多套，分布在各個城市節點，讓用戶請求盡可能選擇近的節點訪問服務。

例如，我們選擇在上海部署為核心節點，北京，深圳，武漢，上海為分散節點（上海自己本身也是一個分散節點）。我們的服務架構如圖：

需要補充一下的是，上圖中上海節點和核心節點是同處於一個機房的，其他分散節點各自獨立機房。
國內有很多大型網游，都是大致遵循上述架構。它們會把數據量不大的用戶核心賬號等放在核心節點，而大部分的網游數據，例如裝備、任務等數據和服務放在地區節點里。當然，核心節點和地域節點之間，也有緩存機制。

二、節點容災和過載保護

節點容災是指，某個節點如果發生故障時，我們需要建立一個機制去保證服務仍然可用。毫無疑問，這里比較常見的容災方式，是切換到附近城市節點。假如系統的天津節點發生故障，那麼我們就將網路流量切換到附近的北京節點上。考慮到負載均衡，可能需要同時將流量切換到附近的幾個地域節點。另一方面，核心節點自身也是需要自己做好容災和備份的，核心節點一旦故障，就會影響全國服務。

過載保護，指的是一個節點已經達到最大容量，無法繼續接接受更多請求了，系統必須有一個保護的機制。一個服務已經滿負載，還繼續接受新的請求，結果很可能就是宕機，影響整個節點的服務，為了至少保障大部分用戶的正常使用，過載保護是必要的。

解決過載保護，一般2個方向：

·拒絕服務，檢測到滿負載之後，就不再接受新的連接請求。例如網游登入中的排隊。

·分流到其他節點。這種的話，系統實現更為復雜，又涉及到負載均衡的問題。

小結

Web系統會隨著訪問規模的增長，漸漸地從1台伺服器可以滿足需求，一直成長為「龐然大物」的大集群。而這個Web系統變大的過程，實際上就是我們解決問題的過程。在不同的階段，解決不同的問題，而新的問題又誕生在舊的解決方案之上。

系統的優化是沒有極限的，軟體和系統架構也一直在快速發展，新的方案解決了老的問題，同時也帶來新的挑戰。

9. 一個web伺服器能承受多少訪問量

沒有固定，需要看伺服器配置高低。

不僅僅是訪問量問題，主要是數據，如果站點數據量不是太大。沒有太多的查詢。一台P4的普通電腦可以承受成千上萬的上網用戶。（還有帶寬問題，比如共享的100兆位。高帶寬。在線人數更多）

如果您有一個幾百兆位元組或幾十億位元組的資料庫。這是另一回事。伺服器的內存必須至少是資料庫的3倍才能運行。

無論如何。常見的企業網站。幾百米的股票。P4的平台。網上幾千個就足夠了（沒有下載，沒有視頻）。

(9)日本訪問量百億級的應用擴展閱讀：

WEB伺服器類型：

1，IIS

IIS伺服器稱為:Internet信息服務。它是微軟公司擁有的web伺服器，是目前最流行的web伺服器產品之一。

2、康樂

Kanglewebserver（Kangle）是一款跨平台、功能強大、安全穩定、易於操作的高性能web伺服器和反向代理伺服器軟體。

3，WebSphere

WebSphereApplicationServer是一個功能齊全的開放Web應用程序伺服器，它是IBM電子商務計劃的核心部分。它是一個基於java的應用程序環境，用於構建、部署和管理Internet和IntranetWeb應用程序。

4，WebLogic

BEAWebLogicServer是一個多功能的、基於標準的web應用程序伺服器，為企業構建自己的應用程序提供了堅實的基礎。

5，Apache

Apache是世界上使用最多的Web伺服器，佔有大約60％的市場份額。

6，Tomcat

Tomcat是一個開源的基於java的Web應用程序容器，它運行servlet和JSPWeb應用程序。

7，Jboss

它是一個基於J2EE的開源應用伺服器。JBoss代碼是在LGPL下授權的，可以在任何商業應用程序中免費使用，而不需要支付任何費用。

10. 大數據時代，我國數據量究竟有多大

從2013年初開始，對於大數據爆發的焦慮感，緊迫感，不由自主地被捲入的甚至無力的感覺，驅動眾多行業、企業和團體去關注和開始接觸和了解大數據，自覺或不自覺的，主動或不得已地去融入這波洪流。但是，真的說到大數據，我們中國到底有多少數據量，它們都分布在哪些行業，哪些數據是目前可用的，哪些行業已經在使用數據，進入產業互聯網和數據引導的變革了？
可能看到的版圖依舊模糊。因此，我們懷抱很好的希望，以第一個吃螃蟹並期待來自行業的矯正和拍磚的態度，首先嘗試對於國內各個領域，行業以及機構的數據擁有情況，使用情況以及未來路徑做一個粗獷地調研、梳理和判斷，對大數據時代我國各個領域數據資產的擁有和使用情況，也就是我們數據資產的家底做個盤點，也對各個行業、系統進軍大數據，以及擁抱產業互聯網的進度和未來做個簡單判斷。事實上，大數據之題無疑繁若星辰，然而只有在相對完整的視圖下，繁星若塵，我們才可得以一窺天機。
從我們手頭掌握的數據來看，2013年度，中國存儲市場出貨容量超過1個EB（1EB=多少），存儲總量而IDC曾經發布的預測表明在未來的3-4年，中國存儲總容量可能達到18個EB。從數據存儲市場的需求來看，互聯網、醫療健康、通信、公共安全以及軍工等行業的需求是主要的，且上升態勢明顯。
鑒於存儲和伺服器的緊密相關，我們從已經獲得的資料可以知道，目前全球運行的伺服器總量超過5000萬台，美國國內運行的伺服器總體容量接近 1000萬台。從各種市場公開數據來看，2013年中國內地伺服器銷售總數接近為100萬台。大體估算，截止到2013年底，中國內地整體在運行的伺服器總數量在300萬台以上。
從現有存儲容量看，中國目前可存儲數據容量大約在8EB-10EB左右，現有的可以保存下來的數據容量大約在5EB左右，且每兩年左右會翻上一倍。這些被存儲數據的大體分布為：媒體/互聯網占據現有容量的1/3，政府部門/電信企業占據1/3，其他的金融、教育、製造、服務業各部分佔據剩餘1/3數據量。
公開數據顯示，互聯網搜索巨頭網路2013年擁有數據量接近EB級別、阿里、騰訊聲明自己存儲的數據總量都達到了百PB以上。此外，電信、醫療、金融、公共安全、交通、氣象等各個方面保存的數據量也都達到數十或者上百PB級別。
在目前被廣泛引用的IDC和EMC聯合發布的「2020年的數字宇宙」報告預測到2020年，全球數字宇宙將會膨脹到40ZB，均攤每個人身上是5200GB以上，這個量將會如何被有效存儲和應用，我們眼下還很難想像。然而我們看到該報告指出，從現在起到2020年，全球數字宇宙的膨脹率大約為每兩年翻一番。事實上，根據上述調查結論和伺服器容量調查，我們也能做出個相對合理的推斷：目前，全球產生的數據量中僅有1%左右的數據能夠被保存下來，也就是說今天全球能夠被保存下來的數據也就是在50EB左右，而其中被標記並用於分析的數據更是不到10%。
作為全球人口和計算設備保有量的大國，我國每年所能產生的數據量也極為龐大，有數據說2014年甚至可能達到ZB級別，但是真正被有效存儲下來的數據僅僅是其中極微少部分，中國保存下來數據佔全球數據的比例大約在10%左右，也就是上面說的5EB。這些數據中，目前已被標記並用於分析的數據僅達到500PB左右，也是接近10%的一個比例。
伴隨著雲計算迅速普及和各行業，各企業和部門對於數據資產保存和利用意識的增強，以及通過互聯網、大數據對產業進行變革的意願，未來2-3年一定會有越來越多的行業、大企業步入到PB、百PB、甚至EB級別數據俱樂部，未來3-3年中國的數據總量也將呈翻倍上升態勢，我們預測2015年中國就可能突破10EB數據保有量，被標簽和分析利用數據量也將上升到EB級別，這些數據增長中互聯網、政務、醫療、教育、安全等行業和領域所做貢獻最大，而相對傳統的物流、生產製造、甚至農業等領域數據擁有量的增長將更加明顯。

日本訪問量百億級的應用

(7)日本訪問量百億級的應用擴展閱讀：

與日本訪問量百億級的應用相關的內容