大型网站高性能架构!

img

网站性能测试

性能测试指标:

  • 响应时间,并发数,吞吐量,性能计数器

性能测试方法:

  • 性能测试,负载测试,压力测试,稳定性测试

性能优化策略:

  • 性能分析:

    • 检查请求处理各个环节的日志,分析哪个环节响应时间不合理,检查监控数据分析影响性能的因素
  • 性能优化:

    • Web前端优化,应用服务器优化,存储服务器优化

Web前端性能优化

浏览器访问优化

CDN加速:

  • CDN(内容分发网络)仍然是一个缓存,它将数据缓存在离用户最近的地方,便于用户以最快速度获取数据

反向代理:

  • 反向代理服务器位于网站机房,代理网站Web服务器接收Http请求,对请求进行转发

反向代理服务器具有以下功能:

  • 保护网站安全:
    • 任何来自Internet的请求都必须先经过代理服务器
  • 通过配置缓存功能加速Web请求:
    • 减轻真实Web服务器的负载压力
  • 实现负载均衡:
    • 均衡地分发请求,平衡集群中各个服务器的负载压力

应用服务器性能优化

分布式缓存:

  • 缓存本质是一个内存Hash表,数据以(Key,Value)形式存储在内存中

  • 缓存主要用来存放那些读写比很高、很少变化的数据,如商品的类目信息、热门商品信息等

这样,应用程序读取数据时,先到缓存中取,如缓存中没有或失效,再到数据库中取出,重新写入缓存以供下一次访问

因此,可以很好地改善系统性能,提高数据读取速度,降低存储访问压力

分布式缓存架构:

  • 一方面是以以JBoss Cache为代表的互相通信

  • 另一方面是以Memcached为代表的互不通信

JBoss Cache需要将缓存信息同步到集群中的所有机器,代价比较大

而Memcached采用一种集中式的缓存集群管理,缓存与应用分离部署

  • 应用程序通过一致性Hash算法选择缓存服务器远程访问缓存数据,缓存服务器之间互不通信

  • 因而集群规模可以轻易地扩容,具有良好的伸缩性

异步操作:

  • 使用消息队列将调用异步化,可改善网站的扩展性,还可改善网站性能

  • 消息队列具有削峰的作用->将短时间高并发产生的事务消息存储在消息队列中,从而削平高峰期的并发事务

使用集群:

  • 在高并发场景下,使用负载均衡技术为一个应用构建多台服务器组成的服务器集群
  • 可以避免单一服务器因负载压力过大而响应缓慢,使用户请求具有更好的响应延迟特性

代码优化:

  • 多线程:

    • 使用多线程的原因:一是IO阻塞,二是多CPU,都是为了最大限度地利用CPU资源,提高系统吞吐能力,改善系统性能
  • 资源复用:

    • 目的是减少开销很大的系统资源的创建和销毁
  • 数据结构:

    • 在不同场合合理使用恰当的数据结构,可以极大优化程序的性能
  • 垃圾回收:

    • 理解垃圾回收机制有助于程序优化和参数调优,以及编写内存安安全的代码

存储性能优化

机械硬盘 还是 固态硬盘?

机械硬盘:通过马达驱动磁头臂,带动磁头到指定的磁盘位置访问数据

  • 它能够实现快速顺序读写,慢速随机读写

固态硬盘(又称SSD):

  • 无机械装置,数据存储在可持久记忆的硅晶体上,因此可以像内存一样快速随机访问

在目前的网站应用中,大部分应用访问数据都是随机的,这种情况下SSD具有更好的性能表现,但是性价比有待提升

NoSQL(例如:HBase)产品广泛采用LSM