测试数据是结构很简单的一个20M的XML文档,里面的数据来自我的一个项目。测试程序很简单,就是读取这个XML文件,把里面的链接写入到一个文本文件。然后把数据原样重复了一遍,然后又测试了一次,下面是测试结果。
| 方法 | 数据大小 | 内存峰值 | CPU峰值 | 耗时 |
| SAX | 20M | 20M | 30% | 142秒 |
| DOM | 20M | 152M | 100% | 171秒 |
| SAX | 40M | 20M | 30% | 290秒 |
| DOM | 40M | 345M | 100% | 376秒 |
表1 SAX和DOM的性能比较
结论:SAX的内存消耗稳定,CPU占用率低,耗时短,大数据量XML的简单处理一定首选SAX。DOM的性能受到内存的严重影响,内存消耗受到数据量的影响,大数据量XML的读处理最好不要用DOM。
technorati tags:


请不要吝惜您的评论,每一条评论,都是我在漫漫长夜前行的力量
4 条评论:
这个比较不公平呀 DOM 是要建一个文档树的. 要是提链接, 我想正则是最快的 :)
3:01 上午
正则应该跟SAX差不多,这里比较又不是说谁好,呵呵
只是对大文件处理的具体性能做一个量化的比较而已。
DOM比较简单,所以一般程序用的比较多,这对大多数的情形是没有问题的。但是遇到了大XML,DOM的内存占用往往会造成问题。比如我的测试数据有20M,放置在了DreamWeaver设置的一个site里面,结果这个文件造成我的DreamWeaver在site caching过程失去响应……测试文件删除后,DreamWeaver启动完全正常。
3:08 上午
当然DreamWeaver遇到我的大XML失去响应不光是因为DOM模式处理XML,应该因为它要比较所有的链接(正常情况下,倒不是不可完成的任务)。
3:09 上午
还有一个VTD-XML的库 官方说的是和DOM SAX不一样的方法
http://vtd-xml.sourceforge.net/
3:34 上午
发表评论
<< 主页