高性能负载均衡之算法

昨天说的是高性能负载均衡之分类架构

今天的内容可以说是昨天的扩展和补充,主要跟大家讲将高性能负载均衡的算法,高性能负载均衡算法数量也不少,而且可以根据一些业务特性进行定制开发,抛开细节上的差异,根据算法期望达到的目的,大体可以分为这么几类:

(1)任务平分类:负载均衡系统将接收到的任务平均分配给服务器进行处理,这里的“平均”可以是绝对数量的平均,也可以是比例或者权重上的平均;

(2)负载均衡类:负载均衡系统根据服务器的负载来进行分配,这里的负载并不一定是通常意义上我们说的“CPU负载”,而是系统当前的压力,可以用CPU负载来衡量,也可以用连接数、I/O使用率、网卡吞吐量等来衡量系统的压力;

(3)性能最优类:负载均衡系统根据服务器的响应时间来进行任务分配,优先将新任务分配给响应最快的服务器;

(4)Hash类:负载均衡系统根据任务中的某些关键信息进行Hash运算,将相同Hash值的请求分配到统一台服务器上。常见的源地址Hahs、目标地址Hahs、session id hash、用户IDHash等;

下面介绍一下负载均衡常用算法和它们的优缺点。

 

1.轮询

负载均衡系统收到请求后,安卓顺序轮流分配到服务器上。

轮询是最简单的一个策略,无需关注服务器本身的状态,例如:

(1)某个服务器当前因为触发了程序Bug进入了死循环导致CPU负载很高,负载均衡系统是不感知的,还是会继续将请求源源不断地发送给它;

(2)集群中有新的机器是32核的,老的机器是16核的,负载均衡系统也不是关注的,新老机器分配的任务数是一样的;

需要注意的是负载均衡系统无须关注“服务器本身状态”,这里的关键词是“本身”。也就是说,只要服务器在运行,运行状态是不关注的。但如果服务器直接宕机了,或者服务器和负载均衡系统断连了,这时负载均衡系统是能够感知的,也需要做出相应的处理。例如,将服务器从可分配服务器列表中删除,否则就会出现服务器都宕机了,任务还不断分配给它,这即不合理,又影响用户使用的体验。

轮询的优点和缺点,用一个词来表示,那就是“简单”。

 

2.加权轮询

负载均衡系统根据服务器权重进行任务分配,这里的权重一般是根据硬件配置进行静态配置的,采用的动态的方式计算会更加契合业务,但复杂度也会更高。

加权轮询是轮询的一种特殊形式,其主要目的就是为了解决不同服务器处理能力有差异的问题。例如,前面的例子说到过集群中有新的机器是32核的,老的机器是16核的,那么理论上我们以假设新系统的处理能力是老机器的2倍,负载均衡系统就可以按照2:1的比例分配更多任务给新机器,从而充分利用新机器的性能。

加权轮询解决了轮询算法中无法根据服务器的配置差异进行任务分配问题,但同样存在无法根据服务器的状态差异进行任务分配的问题。

 

3.负载均衡最低优先

负载均衡系统将任务分配给当前负载最低的服务器,这里的负载根据不同的任务类型和业务场景,可以用不同的指标来衡量。

例如:

(1)Nginx这种7层网络负载系统,可以以“HTTP请求数”来判断服务器状态(Nginx内置的负载均衡算法不支持这种方式,需要进行扩展);

(2)LVS这种4层网站负载设备,可以以“连接数”来判断服务器的状态,服务器连接数越大,表明服务器压力越大;

(3)如果我们自己开发负载均衡系统,可以根据业务特点来选择指标衡量系统压力。如果是CPU密集型,可以以“CPU负载”来衡量系统压力;如果是I/O密集型,可以以“I/O负载”来衡量系统压力;

 

负载最低优先的算法解决了轮询算法中无法感知服务器状态的问题,由此带来的代价是复杂度要增加很多。例如:

(1)最少连接数优先的算法要求负载均衡系统统计每个服务器当前建立的连接,其应用场景仅限于负载均衡接收的任何连接请求都会转发给服务器进行处理,否则,如果负载均衡系统和服务器之间是固定的连接池方式,就不适合采取这种算法。例如,LVS可以采取这种算法进行负载均衡,而一个通过连接池的方式连接MySQL集群的负载均衡系统就不适合采取这种算法进行负载均衡;

(2)CPU最低优先的算法要求负载均衡系统以某种方式手机每个服务器的CPU负载,而且要确定是以1分钟的负载为标准,还是以15分钟的负载为标准,不存在1分钟肯定比15分钟要好或者要差。不同业务最优的时间间隔是不一样的,时间间隔太短容易造成频繁波动,时间间隔太长又可能造成峰值来临时响应缓慢。

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/wpwswg.html