http cache的实现方式有两种: Squid、Varnish;一般被称为缓存服务器
Squid:支持正向和反向代理、是一款重量级的缓存服务器,在高负载的情况下,性能非常的稳定
Varnish:支持反向代理;相比于Squid是非常轻量级的缓存服务器,在高负载情况下,性能较差,没有Squid稳定;一般被称为http加速器;
Varnish的特点:
一、组成部分
Management:作为主控进程;提供命令行接口、管理各种子进程、初始化,加载文件等等
Child/Cache:缓存管理、日志数据统计、接受用户请求、对所有缓存做有效性在验证,清理
VCL:Varnish的配置语言;缓存控制机制,调用C编译器,生成二进制程序,让子进程加载
二、工作模式:
1、请求的资源可缓存:
(1)当客户端请求的资源命中了Varnish缓存且缓存未过期时,将直接响应给客户端;
(2)Varnish作为一台反向代理缓存服务器,当客户端请求的资源未命中Varnish缓存时,Varnish会扮演客户端角色去后端主机请求数据,将请求到的资源先缓存到本地,随后再将请求到的资源发送给客户端。
(3)当客户端请求的资源命中了Varnish缓存,但是Varnish上的缓存已过期时,则Varnish会去后端主机确认请求原始资源是否更新;如果未更新,则后端主机仅响应资源首部给Varnish,随后Varnish再将响应资源发送给客户端;如果请求原始资源更新,则后端主机将会响应新的资源给Varnish,Varnish将响应的资源缓存在本地之后再响应给客户端;如果请求的资源后端主机已删除,则Varnish中的缓存也会被删除,响应给客户端404页面
2、请求的资源不可缓存:
(1)当客户端请求的资源为不可缓存时,Varnish会直接去后端主机取得相应内容直接返回给客户端;而不是先缓存到本地再响应给客户端
衡量一个缓存的有效性:
缓存的命中率:
文档命中率:也称为资源命中率,从文档的个数进行衡量
字节命中率:从内容的大小进行衡量
缓存的生命周期:
缓存项过期:惰性清理
缓存空间用尽:使用LRU算法(最近最少使用算法)
注意:当一个缓存项过期时并不会真正从内存中青旅,只是标记为失效,而不是把它删除;当内存空间用尽时,才会真正的删除缓存项
三、缓存模式:
(1)file:缓存再磁盘的文件中,自行管理的关键系统
(2)malloc:内存缓存;使用malloc()库调用,在varnish启动时向内存申请指定大小的空间进行缓存
(3)presistent:存储在磁盘上;
四、缓存新鲜度检测机制
有效性在验证:
如果原始内容发生改变,则仅响应首部(不用到body部分;响应码为304(Not Modified)
如果原始内容发生了改变,则正常响应给客户端,响应码为200
如果原始内容消失,则响应404,此时缓存中的缓存项(object)也应该被删除
条件式请求首部:
If-Modified_Since:基于原始内容的最近一个修改的时间戳进行验证
If-Ummodified_since:如果缓存发生了改变,响应304
If-Match:基于请求内容的匹配做验证
If-None_match:基于Etag比较进行内容验证
五、缓存控制机制
过期日期:
HTTP/1.0 Expires:给与的是绝对时长
例如:Expires:Thu, 04 Jun 2015 23:38:18 GMT
HTTP/1.1 Cache-Control: max-age:给与的是相对时长,从接受到相应报文开始
例如:Cache-Control:max-age=700
六、VCL相关的状态引擎
vcl_recv:接受请求
vcl_hash:
hit:vcl_hit:命中缓存
miss:vcl_miss:未命中缓存
purge:vcl_purge:清除缓存
pipe:vcl_pipe:管道;直接发送给后端主机
pass、hit_for_pass:vcl_pass ##跳过,直接请求后端主机
vcl_backend_fetch:读取数据
vcl_backend_response:后端主机响应
vcl_backend_error:后端主机响应错误码
vcl_synth:同步
vcl_deliver:响应给客户端
七、VCL的语法格式
(1)表示注释://、#、/*……*/
(2)定义子例程
(3)不支持循环、支持条件判断
(4)具有内建变量
(5)使用终止语句return,没有返回值
(6)支持操作符:=、==、!=、&&、||
八、VCl内建变量
req.*:只匹配客户端发来的请求
req.http.*:匹配http请求报文的任何首部
bereq.*:由varnish向后端主机发出http请求
beresp.*:由后端主机发来http的响应报文首部
resp.*:由varnish响应给客户端的http的响应报文
obj.*:存储在缓存空间中的缓存的对应属性
常用的变量:
berep:varnish向后端主机请求资源
bereq.request:请求方法(向后端主机发送请求报文)
bereq.url:请求的url
bereq.proto:请求协议
bereq.backend:指明要调用的后端主机是那个
beresp:后端主机向varnish响应资源
beresp.proto:响应协议
beresp.status:响应的状态码
beresp.reason:响应原因
beresp.backend.name:后端主机名称
beresp.ttl:后端主机请求中的内容的余下的生存时长
obj.hits:此对象从缓存中命中的次数
obj.ttl:对象的ttl值;也被称为缓存时长