浅谈Node.js实现原理
本文部分转自某博客,以及自己的汇总,仅做知识梳理归纳用,不作为个人版权,欢迎批评指正
Node.js是啥?
Nodejs 不是一种独立的语言,
Nodejs 是一个让JavaScript运行在服务端的开发的平台,服务器端的JavaScript,
允许开发人员使用JavaScript语言写服务器端代码的框架(其实Nodejs是对Commonjs规范的一种很好的实现)
其本身利用Google V8 JavaScript引擎,所以速度和性能非常好,而且Nodejs又对其进行了封装,同时还改进了其处理二进制数据的能力(Nodejs对引入过的模块都会进行缓存,且核心模块的缓存检查先于文件模块的缓存检查)
Nodejs不是一个web服务器,只是计算机上执行代码的另一种方式,它是一个简单的JavaScript Runtime.
js是由客户端而产生,Nodejs为网络而生。
Node能做什么?
具有复杂逻辑的网站
局域社交网站的大web的应用
Web Scoket服务器
TCP/UDP套接字应用程序
命令行工具
交互式终端程序
Node的特性:
它是一个JavaScript运行环境 (Nodejs采用C++语言编写而成)
依赖于浏览器V8引擎进行代码解释
事件驱动
非阻塞
异步I/O
轻量、可伸缩,适于实时数据交互应用
单进程,单线程
Node.Js最大特性是采用异步式I/O与事件驱动的架构设计。对于高并发的解决方案,传统的架构是多线程模型,也就是每个业务逻辑提供一个系统线程,通过系统线程切换来弥补同步式I/O调用时的时间开销.
Node.Js采用的是单线程模型,在执行过程中会维护一个事件队列,程序在执行时在进入事件循环等待下一个事件的到来。
NODE.JS真正强大的是对于网络协议的封装,包括对于http的封装。
异步编程对性能提升、对用户体验有了革命性的提高,所以NodeJS的 异步特性相当明显。
Node的优缺点:
- 简单
- 高性能,避免了频繁的线程切换开销
- 占用资源小,因为是单线程,在大负荷情况下,对内存占用仍然很低
- 线程安全,没有加锁、解锁、死锁这些问题
php 运行示意图
_Node.js运行示意图_
NODE.JS虽然有以上优点,但却没有其他的技术成熟,NODE.JS最多也就是做了其他工具早已经可以完成的事情。V8是c\c++写的,难道c\c++做不到NODE.JS在服务器端可以做到的事情么?NODE.JS的这种异步编程模型早就存在了,好多的web服务器早已经将其应用到生产环境中了,C#, JAVA,C++ 也早就存在这方面的支持,从哪来的优越感呢?
异步I/O
其实在操作系统层面上,只有两种:I/O方式,堵塞和非堵塞。
在堵塞模型中,应用程序需要等待I/O完成才返回结果,他的特点是调用后要等待系统完成所有操作才行,这个会造成CPU的等待。
而非堵塞模型,调用后会马上返回。
堵塞造成CPU等待浪费,非堵塞打乱逻辑不说可能还需要轮询以确认是否完成加载(曾经我使用轮询检测一个dom是否生成)
node.js的异步机制是基于事件的,所有的I/O、网络通信、数据库查询都以非阻塞的方式执行,返回结果由事件循环来处理。node.js在同一时刻只会处理一个事件,完成后立即进入事件循环检查后面事件。这样CPU和内存在同一时间集中处理一件事,同时尽量让耗时的I/O等操作并行执行。
事件循环机制
所谓事件循环是指node.js会把所有的异步操作使用事件机制解决,有个线程在不断地循环检测事件队列。
NodeJs在进程启动时,Node会创建一个死循环,每执行一次循环体的过程就是一次Tick,每个Tick的过程就是才看是否有事件需要处理。
如果有就取出事件相关,执行之,然后进入下一逻辑,没有就退出循环。
每个Tick过程中,每个事件循环中有一个或者多个观察者,判断是否有事件要处理的过程就是向这些观察者询问是否需要处理这个事件。
node.js中所有的逻辑都是事件的回调函数,所以node.js始终在事件循环中,程序入口就是事件循环第一个事件的回调函数。事件的回调函数中可能会发出I/O请求或直接发射( emit)事件,执行完毕后返回事件循环。事件循环会检查事件队列中有没有未处理的事件,直到程序结束。node.js的事件循环对开发者不可见,由libev库实现,libev不断检查是否有活动的、可供检测的事件监听器,直到检查不到时才退出事件循环,程序结束。
如图所示
libuv 是一个高性能事件驱动的程序库,封装了 Windows 和 Unix 平台一些底层特性,为开发者提供了统一的 API.
因此,node.js 是单线程,异步非阻塞。
但毕竟,如何弥补单线程缺陷?是不是有异步非阻塞,就可以高枕无忧了?
不是的。
1)CPU密集型任务存在短板
如上所述,nodejs的机制是单线程,这个线程里面,有一个事件循环机制,处理所有的请求。如图所示。在事件处理过程中,它会智能地将一些涉及到IO、网络通信等耗时比较长的操作,交由worker threads去执行,执行完了再回调,这就是所谓的异步IO非阻塞吧。但是,那些非IO操作,只用CPU计算的操作,它就自己扛了,比如算什么斐波那契数列之类。它是单线程,这些自己扛的任务要一个接着一个地完成,前面那个没完成,后面的只能干等。因此,对CPU要求比较高的CPU密集型任务多的话,就有可能会造成号称高性能,适合高并发的node.js服务器反应缓慢。
2)无法利用CPU的多核
最开始,线程只是用于分配单个处理器处理时间的一种机制。但假如操作系统本身支持多个CPU/内核,那么每个线程都可以得到一个不同自己的CPU/内核,实现真正的“并行运算”。在这种情况下,多线程程序可以提高资源使用效率。Node.js是单线程程序,它只有一个event loop,也只占用一个CPU/内核。现在大部分服务器都是多CPU或多核的,当Node.js程序的event loop被CPU密集型的任务占用,导致有其它任务被阻塞时,却还有CPU/内核处于闲置的状态,造成资源的浪费。
解决方案
利用原生模块或第三方模块,开辟进程或子进程,用于处理这些特殊的任务。
3)如果有异常抛出,因为是单线程,整个项目将不可用。但这归根到底是代码的问题,糟糕的代码,不管什么体系,都会有问题,即使不崩溃。解决办法是用pm2等工具来运行?
nodejs与javascript的关系
nodejs本身不是开发语言,它是一个工具或者平台,在服务器端解释、运行javascript;coffeescript属于nodejs体系,算是一种新的开发语言,但它的目的在于最后编译成javascript。
nodejs利用Google V8来解释运行javascript,但是系统真正执行的代码是用C++写的。javascript做的只是调用这些API而已。因此,并无执行效率的问题。
nodejs适用场景
既然NodeJS处理并发的能力强,但处理计算和逻辑的能力反而很弱,因此,如果我们把复杂的逻辑运算都搬到前端(客户端)完成,而NodeJS只需要提供异步I/O,这样就可以实现对高并发的高性能处理。情况就很多,如下:
1、RESTful API
这是适合 Node 的理想情况,因为您可以构建它来处理数万条连接。它仍然不需要大量逻辑;它本质上只是从某个数据库中查找一些值并将它们组成一个响应。由于响应是少量文本,入站请求也是少量的文本,因此流量不高,一台机器甚至也可以处理最繁忙的公司的 API 需求。
2、实时程序
比如聊天服务
聊天应用程序是最能体现 Node.js 优点的例子:轻量级、高流量并且能良好的应对跨平台设备上运行密集型数据(虽然计算能力低)。同时,聊天也是一个非常值得学习的用例,因为它很简单,并且涵盖了目前为止一个典型的 Node.js 会用到的大部分解决方案。
3、单页APP
ajax很多。现在单页的机制似乎很流行,比如phonegap做出来的APP,一个页面包打天下的例子比比皆是。比如:本地化的在线音乐应用,本地化的在线搜索应用,本地化的在线APP等。
总而言之,NodeJS适合运用在高并发、I/O密集、少量业务逻辑的场景。顺便提一下Apache由于其多线程高并发共享内存地址空间的特性,那就意味着如果服务器足够强大,处理器足够高核,Apache的运作将会非常良好,所以适用于(并发)异步处理相对较少,后台计算量大,后台业务逻辑复杂的应用程序。