什么是Nginx代理代理服务器,它和Apache相比又有什么区别呢?你又该如何选择使用呢,用其中一个还是两者都用?我们将会在这里探索一下这些问题的答案。 Apache服务器从1995年就开始使用了。相比其他产品,Apache服务器是使用最多的,其次是微软的IIS服务器。 由于开源的Apache服务器已经被使用多年,并且有众多的用户,人们开发出了很多的模块来扩展它的功能,其中的大多数模块也是开源的。举例来说,一个比较常见的配置是使用Apache来为静态页面提供服务,并使用mod_jk模块来运行Tomcat上的Java和JSP代码,以便使程序具有交互功能。另一个例子是使用mod_php模块来执行php代码,而不用去使用cgi。 但是,Apache在高负载的情况下表现的差强人意,原因是它需要去运行新的进程,因此要消耗更多的内存。同时,他还要产生新的线程来与其他的线程竞争内存和CPU。当进程的流量达到了管理员设置的上限时,Apache会拒绝新的连接。 Nginx是一个开源的服务器,用来解决一些Apache在性能和扩展性方面的问题的。Nginx是开源并且免费的,但是如果你购买了它的Nginx Plus版本的话是可以享受到服务支持的。 Nginx声称它的服务器是用来解决C10K问题(出自Daniel Kegel发表的一篇关于如何使一个服务器处理10000个连接——假设的操作系统的上限的论文)的。在他的论文中,他引用了另一篇由Dean Gaudet写的论文,其中写到“你们为什么不使用一个像Zeus那样的选择/事件(select/event)为基础的模型呢?很明显那是最快的”。 Nginx 确实是以事件为基础的(event-based)。他们把他们的架构称为“事件驱动且异步”(event-driven and asynchronous)。Apache 依赖于进程和线程。那么,区别是什么呢? Apache是如何工作的,为什么会有极限Apache通过创建进程和线程来处理其他的连接。管理员可以通过设置来控制服务器所能允许的最大进程数量。这个配置因机器的可用内存而异。过多的进程会耗尽内存从而使得机器使用磁盘上的交换内存,这严重的降低了性能。而且,当达到进程的上限之后,Apache会拒绝新的连接。 Apache可以通过设置来运行在pre-forked 模式或worker multi-process 模式(MPM)。当其他的用户连接时,两种方式都会创建新的进程。区别在于,pre-forked模式为每一个进程创建一个线程,用来处理一个用户的请求。worker模式也创建新的进程,但是每一个进程至少有一个线程,每一个线程用来处理单个用户的单个请求。所以,一个worker mode 的进程处理至少一个连接,而一个per-fork 模式的进程只处理一个连接。 相比于forked 模式,worker 模式使用更少的内存,原因是进程比线程消耗更多的内存,线程只是运行在进程中的代码。 此外,worker模式不是线程安全的。这意味着如果你使用像mod_php这样的非线程安全的模块来服务php页面时,你需要使用pre-forked模式,因此要消耗更多的内存。所以,当选择模块和配置服务器时,你必须要面对是线程还是进程更优的问题以及一些约束的问题。 在调整Apache时的一个限制因素是内存以及当争夺同一个CPU和内存时潜在的线程死锁问题。如果一个线程停止了,用户会一直处于等待页面出现的状态,直到进程将该线程回收,以便可以发回页面。如果一个线程发生了死锁,它不知道如何重启,因此会一直处于卡住状态。 Nginx和Apache相比,Nginx的工作方式有很大不同,主要是在于它如何处理线程。 Nginx并不会为每一个的web请求创建新的进程,相反,管理员可以配置Nginx主进程的工作进程的数量(一个常见的做法是为每一个CPU配置一个工作进程)。所有这些进程都是单线程的。每一个工作进程可以处理数千个并发的请求。它通过一个线程来异步的完成了这些工作,而没有使用多线程的编程模型。 Nginx还拆分了缓存加载器(cache loader)和缓存管理器(cache manager)进程用来从磁盘中读取数据并将其加载到缓存中,当缓存直接读取的时候缓存过期。 Nginx有一系列的模块组成,这些模块在编译的时候就被包含进去了。这意味着,用户下载源码并选择他们要编译的模块。这些模块中包括连接后端应用服务器,负载均衡,代理服务器以及其他。并没有PHP的模块,因为Nginx可以自己编译PHP代码。 这里有一张图描述了Nginx的架构,该图来自Andrew Alexeev的深入分析Nginx及其工作方式。
从这个图表中我们可以看出,Nginx使用FastCGI进程来执行Python,Ruby以及其他代码,使用Memcached对象缓存系统。工作进程为HTTP请求加载ht_core Nginx进程。我们还可以看到,Nginx和Windows以及Linux内核的功能紧密的集成在了一起,以便提升性能。这些内核功能已经经过长时间的改良,而Nginx正是利用了这一点。 Nginx声称是事件驱动,异步且无阻塞的。“事件(Event)”指的是一个用户的连接。“异步(Asynchronous)”指的是它一次处理多个用户连接的用户交互。“无阻塞(Non-blocking)”指的是它不会由于CPU处于忙状态而停止磁盘的I/O,在这种情况下,它会处理其他事件,直到I/O资源得到释放。 Nginx 与 Apache 2.4 MPMApache 2.4包含多路处理事件模块(MPM event module)。它能处理在异步方式下的连接类型,Niginx同样也能做,但是在方式上是不一样的。目的是在负载增长的时候,压缩对内存的需求。 在早期的版本中,Apache 2.4包含工作者(worker)和前复制叉(pre-forked)模式,除了我们之前提到那些,还包括已经被添加的mpm_event_module(Apache MPM event module),它被用来解决为了保活而等待这个连接的线程问题(等待是因为这个连接是用户额外的请求)。MPM致力于一个线程能处理套接字(sockets)中监听(listening)和保活(keep-alive)这两者的状态。这个关于地址的内存问题与旧版本的Apache相关,通过减少线程数量以及进程的创建次数。正是这一点,管理员可能要下载Apache的源代码并且包括mem_event_module,还要编译Apache,用以代替正在使用的二进制发行版。
Apache的MPM事件模型与Nginx的并不完全相同,这是因为当Apache接收到新的请求(请求的数量受到管理员所设置的限制)时,它就会产生新的进程。Nginx不会为每个用户创建多个进程。在Apache 4.2上做了如下改进:与Apache通常的工作者模式相比 ,这个版本里所创建的服务进程将会生成更少的线程。这是因为一个线程可以处理多个连接,而不是每个连接需要一个进程为其提供服务。 |