最近在做一个小项目,期间需要用到C#去操作IE页面中的元素,实现自动填写表单并且提交的功能,想这网上关于这方面的东西肯定很多,于是开始在网上找资料。

在逆心的博客上找到些东西对自己帮助很大

 

1.首先添加必须的两个控件的引用

Microsoft Internet Controls

Microsoft HTML Object Library

 

2.遍历所有的IE窗口

SHDocVw.ShellWindows shellWindows = new SHDocVw.ShellWindowsClass();

foreach (InternetExplorer Browser in shellWindows)

{

if (Browser.Document is HTMLDocument && Browser.LocationURL.Contains("ra207.com"))

{

mshtml.IHTMLDocument2 doc2 = (mshtml.IHTMLDocument2)Browser.Document;

//...

}

}

3.通过DOM操作IE页面

mshtml.IHTMLElementCollection inputs = (mshtml.IHTMLElementCollection)doc2.all.tags("INPUT");

mshtml.HTMLInputElement input1 = (mshtml.HTMLInputElement)inputs.item("kw1", 0);

input1.value = "test";

mshtml.IHTMLElement element2 = (mshtml.IHTMLElement)inputs.item("su1", 0);

element2.click();

4.遍历操作IFrame中的元素

很不巧的是原作者也没有实现直接对IFrame中元素的操作,在网上找了很久也没有找到相关的文章,没有办法,只能自己搞了。

分析网页结构,是多层IFrame相互嵌套的复杂结构,并且上层是无法获取子层的元素的,真是麻烦~

后来转念一想,既然是多层嵌套,那不正好可以用递归来实现么,遍历所有的IFrame应该可行,暴力美学~

//遍历IFrame

public static bool FramesRecursion(ref IHTMLWindow2 frame)

{

IHTMLDocument2 frameDoc = frame.document;

if (null == frameDoc) return false;

if (null == frameDoc.body.innerHTML) return false;


if (frameDoc.body.innerHTML.Contains("确定交易")) //找到目标

{

FindAndClickTheButton(ref frame); //操作目标

return true;

}

//遍历该IFrame包含的所有子IFrame

IHTMLFramesCollection2 frames = (IHTMLFramesCollection2)frameDoc.frames;

int len = frames.length;

if (len <= 0) return false;

object i = 0;

object olen = len;

while ((int)i < (int)olen)

{

IHTMLWindow2 frame2 = frames.item(ref i) as IHTMLWindow2;

if (FramesRecursion(ref frame2))

return true;

i = (object)((int)i + 1);

}

return false;

}

最后打包程序的时候需要这两个库对应的Dll放在exe同一个目录下面,否则很可能因为dll版本的不同造成不报错的失败。

---------------------