Node.js從2009年誕生至今,已經發展了兩年有余,其成長的速度有目共睹。從在github的訪問量超過Rails,到去年底Node.jsS創始人Ryan Dalh加盟Joyent獲得企業資助,再到今年發布Windows移植版本,Node.js的前景獲得了技術社區的肯定。InfoQ一直在關注Node.js的發展,在今年的兩次Qcon大會(北京站和杭州站)都有專門的講座。為了更好地促進Node.js在國內的技術推廣,我們決定開設“深入淺出Node.js”專欄,邀請來自Node.js領域的布道師、開發人員、技術專家來講述Node.js的各方面內容,讓讀者對Node.js有更深入的了解,并且能夠積極投入到新技術的討論和實踐中。
專欄的第一篇文章《什么是Node.js》嘗試從各個角度來闡述Node.js的基本概念、發展歷史、優勢等,對該領域不熟悉的開發人員可以通過本文了解Node.js的一些基礎知識。
從名字說起有關Node.js的技術報道越來越多,Node.js的寫法也是五花八門,有寫成NodeJS的,有寫成Nodejs的,到底哪一種寫法最標準呢,我們不妨遵循官方的說法。在Node.js的官方網站上,一直將其項目稱之為”Node“或者”Node.js“,沒有發現其他的說法,”Node“用的最多,考慮到Node這個單詞的意思和用途太廣泛,容易讓開發人員誤解,我們采用了第二種稱呼——”Node.js“,js的后綴點出了Node項目的本意,其他的名稱五花八門,沒有確切的出處,我們不推薦使用。
Node.js不是JS應用、而是JS運行平臺看到Node.js這個名字,初學者可能會誤以為這是一個Javascript應用,事實上,Node.js采用C++語言編寫而成,是一個Javascript的運行環境。為什么采用C++語言呢?據Node.js創始人Ryan Dahl回憶,他最初希望采用Ruby來寫Node.js,但是后來發現Ruby虛擬機的性能不能滿足他的要求,后來他嘗試采用V8引擎,所以選擇了C++語言。既然不是Javascript應用,為何叫.js呢?因為Node.js是一個Javascript的運行環境。提到Javascript,大家首先想到的是日常使用的瀏覽器,現代瀏覽器包含了各種組件,包括渲染引擎、Javascript引擎等,其中Javascript引擎負責解釋執行網頁中的Javascript代碼。作為Web前端最重要的語言之一,Javascript一直是前端工程師的專利。不過,Node.js是一個后端的Javascript運行環境(支持的系統包括*nux、Windows),這意味著你可以編寫系統級或者服務器端的Javascript代碼,交給Node.js來解釋執行,簡單的命令類似于:
#node helloworld.jsNode.js
采用了Google Chrome瀏覽器的V8引擎,性能很好,同時還提供了很多系統級的API,如文件操作、網絡編程等。瀏覽器端的Javascript代碼在運行時會受到各種安全性的限制,對客戶系統的操作有限。相比之下,Node.js則是一個全面的后臺運行時,為Javascript提供了其他語言能夠實現的許多功能。
Node.js采用事件驅動、異步編程,為網絡服務而設計事件驅動這個詞并不陌生,在某些傳統語言的網絡編程中,我們會用到回調函數,比如當socket資源達到某種狀態時,注冊的回調函數就會執行。Node.js的設計思想中以事件驅動為核心,它提供的絕大多數API都是基于事件的、異步的風格。以Net模塊為例,其中的net.Socket對象就有以下事件:connect、data、end、timeout、drain、error、close等,使用Node.js的開發人員需要根據自己的業務邏輯注冊相應的回調函數。這些回調函數都是異步執行的,這意味著雖然在代碼結構中,這些函數看似是依次注冊的,但是它們并不依賴于自身出現的順序,而是等待相應的事件觸發。事件驅動、異步編程的設計(感興趣的讀者可以查閱筆者的另一篇文章《Node.js的異步編程風格》),重要的優勢在于,充分利用了系統資源,執行代碼無須阻塞等待某種操作完成,有限的資源可以用于其他的任務。此類設計非常適合于后端的網絡服務編程,Node.js的目標也在于此。在服務器開發中,并發的請求處理是個大問題,阻塞式的函數會導致資源浪費和時間延遲。通過事件注冊、異步函數,開發人員可以提高資源的利用率,性能也會改善。
從Node.js提供的支持模塊中,我們可以看到包括文件操作在內的許多函數都是異步執行的,這和傳統語言存在區別,而且為了方便服務器開發,Node.js的網絡模塊特別多,包括HTTP、DNS、NET、UDP、HTTPS、TLS等,開發人員可以在此基礎上快速構建Web服務器。以簡單的helloworld.js為例:
var http = require("http"); http.createServer(function (req, res) { res.writeHead(200, {"Content-Type": "text/plain"}); res.end("Hello World "); }).listen(80, "127.0.0.1");
上面的代碼搭建了一個簡單的http服務器(運行示例部署在http://helloworld.cnodejs.net/中,讀者可以訪問),在本地監聽80端口,對于任意的http請求,服務器都返回一個頭部狀態碼為200、Content-Type"值為text/plain"的”Hello World“文字響應。從這個小例子中,我們可以看出幾點:
Node.js的網絡編程比較便利,提供的模塊(在這里是http)開放了容易上手的API接口,短短幾行代碼就可以構建服務器。
體現了事件驅動、異步編程,在createServer函數的參數中指定了一個回調函數(采用Javascript的匿名函數實現),當有http請求發送過來時,Node.js就會調用該回調函數來處理請求并響應。當然,這個例子相對簡單,沒有太多的事件注冊,在以后的文章中讀者會看到更多的實際例子。
Node.js的特點下面我們來說說Node.js的特點。事件驅動、異步編程的特點剛才已經詳細說過了,這里不再重復。
Node.js的性能不錯。按照創始人Ryan Dahl的說法,性能是Node.js考慮的重要因素,選擇C++和V8而不是Ruby或者其他的虛擬機也是基于性能的目的。Node.js在設計上也是比較大膽,它以單進程、單線程模式運行(很吃驚,對吧?這和Javascript的運行方式一致),事件驅動機制是Node.js通過內部單線程高效率地維護事件循環隊列來實現的,沒有多線程的資源占用和上下文切換,這意味著面對大規模的http請求,Node.js憑借事件驅動搞定一切,習慣了傳統語言的網絡服務開發人員可能對多線程并發和協作非常熟悉,但是面對Node.js,我們需要接受和理解它的特點。由此我們是否可以推測出這樣的設計會導致負載的壓力集中在CPU(事件循環處理?)而不是內存(還記得Java虛擬機拋出OutOfMemory異常的日子嗎?),眼見為實,不如來看看淘寶共享數據平臺團隊對Node.js的性能測試:
物理機配置:RHEL 5.2、CPU 2.2GHz、內存4G
Node.js應用場景:MemCache代理,每次取100字節數據
連接池大小:50
并發用戶數:100
測試結果(socket模式):內存(30M)、QPS(16700)、CPU(95%)
從上面的結果,我們可以看到在這樣的測試場景下,qps能夠達到16700次,內存僅占用30M(其中V8堆占用22M),CPU則達到95%,可能成為瓶頸。此外,還有不少實踐者對Node.js做了性能分析,總的來說,它的性能讓人信服,也是受歡迎的重要原因。既然Node.js采用單進程、單線程模式,那么在如今多核硬件流行的環境中,單核性能出色的Node.js如何利用多核CPU呢?創始人Ryan Dahl建議,運行多個Node.js進程,利用某些通信機制來協調各項任務。目前,已經有不少第三方的Node.js多進程支持模塊發布,專欄后面的文章會詳細講述Node.js在多核CPU下的編程。
Node.js的另一個特點是它支持的編程語言是Javascript。關于動態語言和靜態語言的優缺點比較在這里不再展開討論。只說三點:
var hostRequest = http.request(requestOptions,function(response) { var responseHTML =""; response.on("data", function (chunk) { responseHTML = responseHTML + chunk; }); response.on("end",function(){ console.log(responseHTML); // do something useful }); });
在上面的代碼中,我們需要在end事件中處理responseHTML變量,由于Javascript的閉包特性,我們可以在兩個回調函數之外定義responseHTML變量,然后在data事件對應的回調函數中不斷修改其值,并最終在end事件中訪問處理。
Javascript作為前端工程師的主力語言,在技術社區中有相當的號召力。而且,隨著Web技術的不斷發展,特別是前端的重要性增加,不少前端工程師開始試水”后臺應用“,在許多采用Node.js的企業中,工程師都表示因為習慣了Javascript,所以選擇Node.js。
Javascript的匿名函數和閉包特性非常適合事件驅動、異步編程,從helloworld例子中我們可以看到回調函數采用了匿名函數的形式來實現,很方便。閉包的作用則更大,看下面的代碼示例:
Javascript在動態語言中性能較好,有開發人員對Javacript、Python、Ruby等動態語言做了性能分析,發現Javascript的性能要好于其他語言,再加上V8引擎也是同類的佼佼者,所以Node.js的性能也受益其中。
Node.js發展簡史2009年2月,Ryan Dahl在博客上宣布準備基于V8創建一個輕量級的Web服務器并提供一套庫。
2009年5月,Ryan Dahl在GitHub上發布了最初版本的部分Node.js包,隨后幾個月里,有人開始使用Node.js開發應用。
2009年11月和2010年4月,兩屆JSConf大會都安排了Node.js的講座。
2010年年底,Node.js獲得云計算服務商Joyent資助,創始人Ryan Dahl加入Joyent全職負責Node.js的發展。
2011年7月,Node.js在微軟的支持下發布Windows版本。
雖然Node.js誕生剛剛兩年多,但是其發展勢頭逐漸趕超Ruby/Rails,我們在這里列舉了部分企業應用Node.js的案例,聽聽來自客戶的聲音。
在社交網站LinkedIn最新發布的移動應用中,NodeJS是該移動應用的后臺基礎。LinkedIn移動開發主管Kiran Prasad對媒體表示,其整個移動軟件平臺都由NodeJS構建而成:
LinkedIn內部使用了大量的技術,但是在移動服務器這一塊,我們完全基于Node。
(使用它的原因)第一,是因為其靈活性。第二,如果你了解Node,就會發現它最擅長的事情是與其他服務通信。移動應用必須與我們的平臺API和數據庫交互。我們沒有做太多數據分析。相比之前采用的Ruby on Rails技術,開發團隊發現Node在性能方面提高很多。他們在每臺物理機上跑了15個虛擬服務器(15個實例),其中4個實例即可處理雙倍流量。容量評估基于負載測試的結果。
企業社會化服務網站Yammer則利用Node創建了針對其自身平臺的跨域代理服務器,第三方的開發人員可以通過該服務器實現從自身域托管的Javascript代碼與Yammer平臺API的AJAX通信。Yammer平臺技術主管Jim Patterson對Node的優點和缺點提出了自己的看法:
(優點)因為Node是基于事件驅動和無阻塞的,所以非常適合處理并發請求,因此構建在Node上的代理服務器相比其他技術實現(如Ruby)的服務器表現要好得多。此外,與Node代理服務器交互的客戶端代碼是由javascript語言編寫的,因此客戶端和服務器端都用同一種語言編寫,這是非常美妙的事情。
(缺點)Node是一個相對新的開源項目,所以不太穩定,它總是一直在變,而且缺少足夠多的第三方庫支持。看起來,就像是Ruby/Rails當年的樣子。
知名項目托管網站GitHub也嘗試了Node應用。該Node應用稱為NodeLoad,是一個存檔下載服務器(每當你下載某個存儲分支的tarball或者zip文件時就會用到它)。GitHub之前的存檔下載服務器采用Ruby編寫。在舊系統中,下載存檔的請求會創建一個Resque任務。該任務實際上在存檔服務器上運行一個git archive命令,從某個文件服務器中取出數據。然后,初始的請求分配給你一個小型Ruby Sinatra應用等待該任務。它其實只是在檢查memcache flag是否存在,然后再重定向到最終的下載地址上。舊系統運行大約3個Sinatra實例和3個Resque worker。GitHub的開發人員覺得這是Node應用的好機會。Node基于事件驅動,相比Ruby的阻塞模型,Node能夠更好地處理git存檔。在編寫新下載服務器過程中,開發人員覺得Node非常適合該功能,此外,他們還里利用了Node庫socket.io來監控下載狀態。
不僅在國外,Node的優點也同樣吸引了國內開發人員的注意,淘寶就實際應用了Node技術:
小結MyFOX 是一個數據處理中間件,負責從一個MySQL集群中提取數據、計算并輸出統計結果。用戶提交一段SQL語句,MyFOX根據該SQL命令的語義,生成各個數據庫分片所需要執行的查詢語句,并發送至各個分片,再將結果進行匯總和計算。 MyFOX的特點是CPU密集,無文件IO,并只處理只讀數據。起初MyFOX使用PHP編寫,但遇到許多問題。例如PHP是單線程的,MySQL又需要阻塞查詢,因此很難并發請求數據,后來的解決方案是使用nginx和dirzzle,并基于HTTP協議實現接口,并通過curl_multi_get命 令進行請求。不過MyFOX項目組最終還是決定使用Node.js來實現MyFOX。
選擇Node.js有許多方面的原因,比如考慮了興趣及社區發展,同時也希望可以提高并發能力,榨干CPU。例如,頻繁地打開和關閉連接會讓大量端口處于等待狀態,當并發數量上去之后,時常會因為端口不夠用(處于TIME_WAIT狀態)而導致連接失敗。之前往往是通過修改系統設置來減少等待時間以繞開這個錯誤,然而使用連接池便可以很好地解決這個問題。此外,以前MyFOX會在某些緩存失效的情況下出現十分密集的訪問壓力,使用 Node.js便可以共享查詢狀態,讓某些請求“等待片刻”,以便系統重新填充緩存內容。
本文簡要介紹了Node.js的基本知識,包括概念、特點、歷史、案例等等。作為一個僅僅2歲的平臺,Node.js的發展勢頭有目共睹,越來越多的企業開始關注并嘗試Node.js,前后端開發人員應該了解相關的內容。
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/80377.html
摘要:單線程使用單線程來運行,而不是向之類的其它服務器,每個請求將生產一個線程,這種方法避免了上下文切換和內存中的大量執行堆棧,這也是和其它服務器為解決上一個年,著名的并發連接問題而采用的方法。 showImg(https://segmentfault.com/img/remote/1460000019968794?w=1080&h=675);當我們學習一項新的事物的時候,我們首先要知道它來...
摘要:什么是在中什么時候需要是中的包管理器。允許我們為安裝各種模塊,這個包管理器為我們提供了安裝刪除等其它命令來管理模塊。 showImg(https://user-gold-cdn.xitu.io/2019/7/11/16bde5b2df52a924?w=4000&h=2667&f=jpeg&s=450648); 本文為您分享「Node.js 入門你需要知道的 10 個問題」這些問題可能也...
摘要:大家都知道是另一家遷移到平臺的大型公司,的這篇博文解釋了為什么從遷移出來的原因開發效率提高一倍個人用更少的時間干了個人的活,性能提高一倍,代碼量減少文件減少。性能性能是一個非常有意思和具有爭議性的話題。對于來說這是一個另人激動的時刻。 大家都知道 PayPal 是另一家遷移到 Node.js 平臺的大型公司,Jeff Harrell 的這篇博文 Node.js at PayPal 解釋...
摘要:究竟是什么是一個運行時環境。對此請求的響應需要時間,但兩個用戶數據請求可以獨立并同時執行。所以這會使不太適合多線程任務。這種非阻塞消除了多線程的需要,因為服務器可以同時處理多個請求。該事件將等待毫秒,然后回調函數。系統事件來自庫的核心。 Node.js究竟是什么? Node.js是一個JavaScript運行時環境。聽起來不錯,但這是什么意思?這是如何運作的? Node運行時環境包含執...
摘要:究竟是什么是一個運行時環境。對此請求的響應需要時間,但兩個用戶數據請求可以獨立并同時執行。所以這會使不太適合多線程任務。這種非阻塞消除了多線程的需要,因為服務器可以同時處理多個請求。該事件將等待毫秒,然后回調函數。系統事件來自庫的核心。 Node.js究竟是什么? Node.js是一個JavaScript運行時環境。聽起來不錯,但這是什么意思?這是如何運作的? Node運行時環境包含執...
閱讀 2976·2023-04-25 19:45
閱讀 2694·2021-11-19 09:40
閱讀 697·2021-10-14 09:49
閱讀 2692·2021-09-30 09:47
閱讀 2221·2021-09-26 09:55
閱讀 1230·2021-09-22 16:01
閱讀 2814·2019-08-30 14:19
閱讀 710·2019-08-29 16:44