2007-09-26

web软件设计时考虑你的性能解决方案

关键字: 性能, web

前段时间搜罗了一些大型web应用程序开发的性能提升方案文章,但是一直不够系统。若现在让我设计一个支持大访问量的系统,仍然难于下手(以前没做过啊)

于是我把这些文章梳理了一下加入了自己的理解,记录了关键准则:

* 关键准则:
 1. 选择什么编程语言不是问题
 2. 选择的框架才可能影响系统的扩展和性能
 3. 我倾向于以数据库为中心设计数据结构。
 4.  分从两个方面提升性能:
  1) . 软件设计方面
        * 网页静态化
        * 独立的图片服务器
        * 可能采用中间缓存层服务器,最可能采用第三方成熟的软件
        * 数据库分表(水平分割是最终方案)
  2).  系统、网络、硬件结构
        * 集群:数据库集群,WEB集群
        * 采用:SAN
        * 提升网络接入带宽
   ........
其实,我最担心程序的设计架构问题成为制约将来系统扩展和性能提升时的因素。所以,这里也写出一个软件设计方面性能考虑的Step By Step实施方案供自己参考(而硬件扩展则可以根据并发用户数的升高随时调整):   
* Step By Step
假设采用Java语言作为主要开发语言,将Tapestry + Spring + Hibernate + Mysql作为基本架构.
阶段I:
   1. 以数据库为中心设计数据结构。最开始可以选择Hibernate作为Persistency,如果需要切换(包括编程语言切换),这种设计思路会最大地减少移植障碍。
   2. 基本的性能考虑:是否使用OpenSessionView. 数据库设计一定的冗余度等。
阶段II:
   1. 网页静态化。
   2. 独立的图片服务器。
阶段III:
   1. 中间缓存层组件的使用
阶段IV:
   1. 数据库分表:在软件设计上,我认为这几乎是提升性能的最后一个方法。

我认为每个阶段软件设计方面的修正,都将导致部分先期代码的更改,如果我们预先考虑到网站的可能的设计方案更改,那么在软件代码实现的时候就会考虑到将来的修改,使将来的修改尽可能地少。
那么为什么我们不一开始就让系统构架适应巨大并发量的访问呢? 对于像我这样没有大型网站开发经验的人,或者还不确定系统的访问量会达到多大的前提下,又想尽快让网站上线,而且又不至于担心将来的扩展问题,那么我的做法未尝不是一个折衷呢?



草稿2007-09-26

评论
koda 2007-09-26
ror为什么会损失性能?能给出详细点的理由吗?
Lucas Lee 2007-09-26
我认为目前还没有这种简单的框架能优雅的支持巨大访问量的。
为了高性能,总是有很多权衡的东西,需要额外的处理,想想EJB的机制吧,它就是为了高访问量设计的,但是不论访问量的大小一律都用它,则明显的使开发成本上升。
一般都会有这种多方面的权衡,ROR在开发速度上的优势,是在损失了不少性能的前提下得到的,尽管它可能在中小访问量之下区别不算明显,但性能绝不会是它的优势。
ahuaxuan 2007-09-26
说实话,我觉得楼主想了这么多还是没有抓住要领,任何一个软件,它的架构一定是在它的需求确定之后(指总体的业务需求,网站要达到的一个指标,包括业务特性),没有需

求就定架构是一种危险行为。楼主没有把自己网站性质,预期性能先确定就来谈用什么技术了,让人觉得有点空洞。
如果硬要给个方针,那么,应用集群+数据库集群就可以了

说到细节方面,第一个是OpenSessionView的问题,不会用hibernate的人老是说OpenSessionView有问题,OpenSessionView没有问题,说OpenSessionView有问题的人基本上都是用

hibernate用得有问题得人。

第二个是缓存,缓存可以加到很多层面,二级缓存和页面缓存得适用场景是不一样的,如果楼主在作架构的时候提到性能问题立刻就是中间层使用缓存,那么基本上可以说明楼主

对缓存的各种适用场景还不是非常了解,因为这些都是和业务相关(问题又回到了架构的确定需要在需求的确定之后)

第三在没有确定需求之前就一口咬定数据访问层是性能的瓶颈所在是站不住脚的。

那么在楼主现有的描述上,我也发表一下自己的看法:
1,因为不是非常确定以后的访问量,那么为了便于扩展,应用在开发之初应该可以考虑使应用非常容易作集群部署(是农场,还是状态复制,如果是农场如何保证状态,是cookie

,还是memcached,还是用blob放到db)

2,在集群的环境下,使用如何使用缓存,哪些页面需要使用页面缓存page cache,哪些业务对象需要使用hibernate的二级缓存等

我觉得楼主还是把网站得业务特性描述一下,这样才能更好得决定架构的设计。
timerri 2007-09-26
影响性能的因素有哪些?其实只有下面几个方面:
1.持久性数据查找速度
2.持久性数据读写速度
3.逻辑复杂度
4.物理内存不够导致的虚拟存储频繁交换.

对应的解决方法:
1.建立最合适的索引,建立缓存
2.建立缓存,升级硬件
3.精简,优化逻辑
4.减少内存使用。


可以看出来,其实最需要做的,就是如何搞好缓存.......

为什么计算机界没有一个新职位,叫缓存工程师的??
bluepoint 2007-09-26
大体上这么玩可以,不过具体业务具体对待,这没有什么标准.
wl95421 2007-09-26
还是先想清楚你要做的网站对session的相关性有多大
能不能尽量将模块进行无关性分离
这样才是比较好的解决方案

如购物网站和论坛网站,对session的要求肯定不一致
架构也肯定不一样
发表评论

提醒: 该博客已发表在公共论坛,博客所有留言会成为论坛回贴,留言请注意遵守论坛发贴规则

您还没有登录,请登录后发表评论

koda
搜索本博客
我的相册
89b88261-4413-36d3-a261-60afc611610b-thumb
xcart_logo.gif
共 82 张
最近加入圈子
存档
最新评论