大型网站的特点
大型网站一般有如下特点:
用户多,分布广泛
大流量,高并发
海量数据,服务高可用
安全环境恶劣,易受网络攻击
功能多,变更快,频繁发布
从小到大,渐进发展
以用户为中心
免费服务,付费体验
大型网站架构目标
大型网站的架构目标有如下几个:
高性能:提供快速的访问体验。
高可用:网站服务一直可以正常访问。
可伸缩:通过硬件增加/减少,提高/降低处理能力。
扩展性:方便地通过新增/移除方式,增加/减少新的功能/模块。
安全性:提供网站安全访问和数据加密、安全存储等策略。
敏捷性:随需应变,快速响应。
大型网站架构模式
如上图是大型网站的架构模式:
分层:一般可分为应用层、服务层、数据层、管理层与分析层。
分割:一般按照业务/模块/功能特点进行划分,比如应用层分为首页、用户中心。
分布式:将应用分开部署(比如多台物理机),通过远程调用协同工作。
集群:一个应用/模块/功能部署多份(如:多台物理机),通过负载均衡共同提供对外访问。
缓存:将数据放在距离应用或用户最近的位置,加快访问速度。
异步:将同步的操作异步化。客户端发出请求,不等待服务端响应,等服务端处理完毕后,使用通知或轮询的方式告知请求方。一般指:请求——响应——通知模式。
冗余:增加副本,提高可用性、安全性与性能。
安全:对已知问题有有效的解决方案,对未知/潜在问题建立发现和防御机制。
自动化:将重复的、不需要人工参与的事情,通过工具的方式,使用机器完成。
敏捷性:积极接受需求变更,快速响应业务发展需求。
高性能架构
高性能的架构是以用户为中心,提供快速的网页访问体验,主要参数有较短的响应时间、较大的并发处理能力、较高的吞吐量与稳定的性能参数。
可分为前端优化、浏览器优化、应用层优化、代码层优化与存储层优化:
前端优化:网站业务逻辑之前的部分。
浏览器优化:减少 HTTP 请求数,使用浏览器缓存,启用压缩,CSS JS 位置,JS 异步,减少 Cookie 传输;CDN 加速,反向代理。
应用层优化:处理网站业务的服务器。使用缓存,异步,集群。
代码优化:合理的架构,多线程,资源复用(对象池,线程池等),良好的数据结构,JVM调优,单例,Cache 等。
存储优化:缓存、固态硬盘、光纤传输、优化读写、磁盘冗余、分布式存储(HDFS)、NoSQL 等。
高可用架构
大型网站应该在任何时候都可以正常访问,正常提供对外服务。因为大型网站的复杂性,分布式,廉价服务器,开源数据库,操作系统等特点,要保证高可用是很困难的,也就是说网站的故障是不可避免的。
如何提高可用性,就是需要迫切解决的问题。首先,需要从架构级别考虑,在规划的时候,就考虑可用性。
行业内一般用几个 9 表示可用性指标,比如四个 9(99.99),一年内允许的不可用时间是 53 分钟。
不同层级使用的策略不同,一般采用冗余备份和失效转移解决高可用问题:
应用层:一般设计为无状态的,对于每次请求,使用哪一台服务器处理是没有影响的。一般使用负载均衡技术(需要解决 Session 同步问题)实现高可用。
服务层:负载均衡,分级管理,快速失败(超时设置),异步调用,服务降级,幂等设计等。