通过DataSet读取XML的效率问题

转载

biyusr216 2022-04-29 15:46:57

文章标签 dataset xml scheme schema 测试 文章分类 Java 后端开发

一直以来读取xml都是通过DataSet的ReadXML方法来解决，其他属性也都没有使用。在数据量小的时候倒也相安无事，直到今天读取一个20M的XML流才发现实在太影响效率了。

默认情况下，ReadXML缺省情况下使用XmlReadMode.Auto方式读取，用以前的作法，由于xml文件里没有包含Scheme,DataSet会先推断xml的结构，然后再加载数据。可是对一个20M的流推断其结构效率可想而知。如果XmlReadMode采用的是除Auto和InferSchema（同样根据数据推断结构）之外的成员，那么除了行数会相应增加外，内容都被忽略。

如何解决这个讨厌的问题呢，其实也很简单先给DataSet提供Schema（ReadXmlSchema方法），XmlReadMode设为IgnoreSchema即可。经过测试处理时间由几分钟提高到几秒通过DataSet读取XML的效率问题_scheme 。示例如下:

DataSet ds  =   new  DataSet();
            using  (StringReader sr  =   new  StringReader( xxx ))
            {
 ds.ReadXmlSchema(sr);
  }
   ds.Tables[ 0 ].BeginLoadData();
   
   
   using  (StringReader sr  =   new  StringReader( xxx ))
    {
    ds.ReadXml(sr, XmlReadMode.IgnoreSchema);
     }
     ds.Tables[ 0 ].EndLoadData();