浅析 js 实现网页截图的两种方式
转载
<p>Web端的截图(生成图片)并不算是个高频的需求,资料自然也不算多,查来查去,也不过Canvas 和 SVG两种实现方案,原理大概相似,都非真正义上的截图而是把DOM转为图片,然而实现方式却截然不同。</p>
<h3 id="user-content-canvas" data-id="heading-0">Canvas 实现</h3>
<p>如何将dom转换成canvas图片?自然是要一点点画到canvas里,想想都是件麻烦事。通过分析github的知名截图库<a href="tml2canvas" target="_blank" title="https://github.com/niklasvh/html2canvas" ref="nofollow noopener noreferrer"> niklasvh/html2canvas</a> (7k+ star)的源码,梳理了其大致的思路:</p>
<ul>
<li>
<p>递归取出目标模版的所有DOM节点,填充到一个<code>rederList</code>,并附加是否为顶层元素/包含内容的容器 等信息</p>
</li>
<li>
<p>通过<code>z-index</code> <code>postion</code> <code>float</code>等css属性和元素的层级信息将<code>rederList</code>排序,计算出一个canvas的renderQueue</p>
</li>
<li>
<p>遍历renderQueue,将css样式转为<code>setFillStyle</code>可识别的参数,依据nodeType调用相对应canvas方法,如文本则调用<code>fillText</code>,图片<code>drawImage</code>,设置背景色的div调用<code>fillRect</code>等 </p>
</li>
<li>
<p>将画好的canvas填充进页面</p>
</li>
</ul>
<p>无论是排序优先级的计算还是从css到canvas的转换,毫无疑问都是些巨麻烦的事,尤其是放在真实的业务场景里,DOM模版中往往会包含复杂的样式与排版,html2canvas 足足用了20多个js来实现这层转换,复杂成度可见一斑。索性,我们不需要再重新造一遍轮子。</p>
<p>使用canvas转化的话灵活性较高,环境依赖上也只需要确保浏览器支持canvas就可以了,但它有个显著的缺点:慢。原因自然是因为大量的计算与递归调用,这是无可避免的。不过html2canvas代码中大量使用了Promise,所以html2canvas 支持异步操作。</p>
<p>限制:</p>
<ul>
<li>
<p>无法跨域跨域资源</p>
</li>
<li>
<p>无法渲染iframe,flash等内容,但目前支持svg</p>
</li>
</ul>
<p>值得一提的是,尽管<code>html2canvas</code>主页表示它还处于实验室环境,但自14年起便已经被Twitter 等用在了生产环境,所以虽然有诸多限制,稳定性应该还是保障的。</p>
<p>canvas如此复杂,那么有没有一种更简单的方法呢?</p>
<p>自然是有的,那便是SVG</p>
<h3 id="user-content-svg" data-id="heading-1">SVG实现</h3>
<p>首先,svg本来就是矢量图形;其次,svg是可以用xml描述的;再其次,用来描述svg的标签里有个 <code>foreignObject</code>标签,这个标签可以加载其它命名空间的xml(xhtml)文档。也就是说,如果使用svg的话,我们不再需要一点点的遍历,转换节点;不用再计算复杂的元素优先级,只需要一股脑的将要渲染的DOM扔进<code><foreignObject></foreignObject></code>就好了,剩下的就交给浏览器去渲染。</p>
<p>让我们理一理思路:</p>
<ul>
<li>
<p>首先,我们要声明一个基础的svg模版,这个模版需要一些基础的描述信息,最重要的,它要有<code><foreignObject></foreignObject></code>这对标签</p>
</li>
<li>
<p>将要渲染的DOM模版模版嵌入<code>foreignObject</code></p>
</li>
<li>
<p>利用<code>Blob</code>构建svg图像</p>
</li>
<li>
<p>取出URL,赋值给<img src="" loading="lazy" ></p>
</li>
</ul> <pre><code class="hljs language-css copyable" lang="css"> <<span class="hljs-selector-tag">div</span> id='text'>
<<span class="hljs-selector-tag">h1</span> style="<span class="hljs-attribute">background-color</span>: <span class="hljs-number">#ccc</span>;<span class="hljs-attribute">width</span>: <span class="hljs-number">200px</span>;<span class="hljs-attribute">height</span>: <span class="hljs-number">200px</span>;" >Hello World</<span class="hljs-selector-tag">h1</span>>
</<span class="hljs-selector-tag">div</span>>
复制代码
//此代码仅在chrome测试下通过
function html2Svg (domStr) {
//创建模版字符串
var svgXML=
<svg <span >xmlns</span>=<span >"http://www.w3.org/2000/svg"</span> width=<span >"200"</span> height=<span >"200"</span>> <foreignObject <span >width</span>=<span >"100%"</span> height=<span >"100%"</span>><span class="hljs-variable">${generateXML(html)}</span></foreignObject> </svg>
//利用Blob创建svg
var svg = new Blob([svgXML], {type: 'image/svg+xml'})
//利用DOMURL.createObjectURL取出对象
var url = window.URL.createObjectURL(svg);
var img = new Image()
img.src = url
return img
}
<svg <span >xmlns</span>=<span >"http://www.w3.org/2000/svg"</span> width=<span >"200"</span> height=<span >"200"</span>> <foreignObject <span >width</span>=<span >"100%"</span> height=<span >"100%"</span>><span class="hljs-variable">${generateXML(html)}</span></foreignObject> </svg>
// 由于foreignObject只能引用XML文档,
// 所以我们需要对DOM进行格式化
function generateXML (domStr) {
var doc = document.implementation.createHTMLDocument('');
doc.write(html);
doc.documentElement.setAttribute('xmlns', doc.documentElement.namespaceURI);
doc = parseStyle(doc)
console.log(doc)
html = (new XMLSerializer).serializeToString(doc).replace('<!DOCTYPE html>','');
return html
}
复制代码
foreignObject
可以看到按这个思路来实现非常简单,并且没有了复杂的计算和递归,渲染速度自然要优于前者。然而使用svg,需要考虑诸多的限制问题。一个最为严肃的问题在于:SVG无法加载外部资源,也就是说,在svg里面,无论是还是
或者css中的背景图,这些资源都是无法加载的。在使用canvas实现时,因为我们是一个node一个node去画,所以不存在资源引用的问题。但使用svg实现,相当于我们把文档交给SVG再来来渲染一遍,这对于我们来说是其实是无法控制的黑盒操作,是受SVG限制的
万幸,一个昵称为Christoph Burgmer的小哥写了一个名为 rasterizeHTML.js 的库,通过一系列的hack技巧替我们绕过了许多限制。我知道你很好奇他是怎么做到的。 简单来讲,rasterizeHTML.js
在我们的基础实现上做了这些hack:
- 将
<img/>
的url 转为 dataURI - 将background-color从style中取出,修改url后重新插入样式表
- 将link的的样式通过ajax down下来然后注入
<style></sytle>
- 详见源码...
当然, rasterizeHTML.js
能帮我们做的也不过是处理资源引用问题和浏览器兼容问题,更多的SVG的限制是无法绕过的,该库的文档正式列出了足足一整页的限制,让人读完后心中一凉。比如:
- 跨域资源无法加载
- 如lazyload等通过js加载的资源无法加载
- 内联或js操作background-image无法加载
- 详见文档
思考下rasterizeHTML.js
的原理便可理解这些限制无法避免的原因: rasterizeHTML.js
只能对已经存在的静态资源进行处理,而对js动态生成并不能实时处理。
目前rasterizeHTML.js
已经被用于知乎-意见反馈功能。
参考
源码 developer.mozilla.org/en-US/docs/…API/DrawingDOMobjectsintoacanvas