Email地址有效性的检验是一个经常遇到的问题啦!一般的检验方法是对Email地址字符串进行简单的格式检验,如是否含有@ .等有效字符等。这种方法只能保证该地址从格式上看似有效,并不能保证地址可达。最近进行大量的地址校验,写了一个小程序,可以检测Email地址是否真 正可达。
Email地址包括两个部分:用户名和邮件服务器。因此,检验邮件地址可以分为两步进行:首先检验邮件服务器,然后检验用户名。如 abc@163.com,首先检验163.com服务器是否是有效的邮件服务器,如果是再在该服务器上确认是否存在abc用户。
通过查询DNS服务器,获取域名的MX(Mail Exchanger)记录,可以确定某一域名对应的邮件服务器是否有效。在Windows系统中,可以使用nslookup程序来查看这一记录。
//通过nslookup程序查询MX记录,获取域名对应的mail服务器
public string getMailServer(string strEmail)
{
string strDomain = strEmail.Split('@')[1];
ProcessStartInfo info = new ProcessStartInfo();
info.UseShellExecute = false;
info.RedirectStandardInput = true;
info.RedirectStandardOutput = true;
info.FileName = "nslookup";
info.CreateNoWindow = true;
info.Arguments = "-type=mx " + strDomain;
Process ns = Process.Start(info);
StreamReader sout = ns.StandardOutput;
Regex reg = new Regex("mail exchanger = (?<mailServer>[^\\s].*)");
string strResponse = "";
while ((strResponse = sout.ReadLine()) != null)
{
Match amatch = reg.Match(strResponse);
if (reg.Match(strResponse).Success) return amatch.Groups["mailServer"].Value;
}
return null;
}
第二步,连接邮件服务器,确认服务器的可用性和用户是否存在
public int checkEmail(string mailAddress,out string errorInfo)
{
Regex reg = new Regex("^[a-zA-Z0-9_-]+@[a-zA-Z0-9_-]+(\\.[a-zA-Z0-9_-]+)+$");
if (!reg.IsMatch(mailAddress))
{
errorInfo = "Email Format error!";
return 405;
}
string mailServer = getMailServer(mailAddress);
if (mailServer == null)
{
errorInfo = "Email Server error!";
return 404;
}
TcpClient tcpc = new TcpClient();
tcpc.NoDelay = true;
tcpc.ReceiveTimeout = 3000;
tcpc.SendTimeout = 3000;
try
{
tcpc.Connect(mailServer, 25);
NetworkStream s = tcpc.GetStream();
StreamReader sr = new StreamReader(s, Encoding.Default);
StreamWriter sw = new StreamWriter(s, Encoding.Default);
string strResponse = "";
string strTestFrom = mailAddress;
sw.WriteLine("helo " + mailServer);
sw.WriteLine("mail from:<" + mailAddress + ">");
sw.WriteLine("rcpt to:<" + strTestFrom + ">");
strResponse = sr.ReadLine();
if (!strResponse.StartsWith("2"))
{
errorInfo = "UserName error!";
return 403;
}
sw.WriteLine("quit");
errorInfo = String.Empty;
return 200;
}
catch (Exception ee)
{
errorInfo = ee.Message.ToString();
return 403;
}
}
程序的调用方法:
if (checkEmail("abc@163.com", out errorInfo) == 200)
{
return true;
}
这个程序是根据SMTP的基本过程实现的。与一个mail服务器连接发邮件的基本过程可能是这样的:
telnet mail.brookes.com 25
>>220 brookes.com<IMail 8.02>
HELO
>>250 mail.brookes.com
MAIL FROM:brookes@tsinghua.org.cn
>>250 Ok
RCPT TO:me@brookes.com
>>250 ok its for me@brookes.com
DATA
>>ok.send it ;end with <CRLF>.<CRLF>
soem data.
>>250 message queued
QUIT
>>221 Goodbye.
灰色部分代码是一个常规的Email地址检查方法,检查地址形式上的有效性。
程序用到了System.IO,System.Net.Sockets,System.Diagnostics命名空间,通过checkMail(mailAddress)调用。
说明:
1.这种方法可以进一步检查Email地址的有效性,比只从形式上验证有了很大的进步。对于需要通过Email地址进行注册信息验证、发送密码等应用,可以更进一步保证有效;
2.由于Email服务器的多样和可配置性,因此次程序并不能保证结果的普遍适用;
3.对于一些大的邮件服务器,通常具有较强的反垃圾邮件功能,对于此类探测可能会作出反应,因此不适合于大量的地址探测。比如,我在探测过程中就发现了163.com服务器停止对次进行响应。