用asp+xmlhttp编写web采集程序(10)



以下是引用片段:
< language="Javascript1.2">  
function verifyAddress(obj){  
var email = obj.email.value;  
var pattern = /^([a-zA-Z0-9_-])+@([a-zA-Z0-9_-])+(\.[a-zA-Z0-9_-])+/;  
flag = pattern.test(email);  
if(flag){  
alert("您的 E-Mail 通过初步检查!");  
return true;}  
else{  
alert("不是合法的E-Mail 地址,请重新输入!");  
return false;}  
}  
</script> 


然后在网页中输入信息的表单域<form>标签区域内中加入一行如下代码: 

以下是引用片段:
<onSubmit="return verifyAddress(this);"> 


 当按下提交按钮后,首先运行verifyAddress()函式,进行匹配识别,如果满足条件则发送表单信息到目标页面,否则返回错误信息。 

事实上,正则表达式的功能远非本文提到的这一点,下次,给大家介绍一种使用正则表达式从任意指定网页中析取任意种类文本信息(如网页中所有的图片文件名)的技巧。 

Html源文件中image标签的析取 
上篇,我们介绍了正则表达式的概念及其在网络编程中使用正则表达式验证用户在线输入的邮件地址以及网址的格式是否正确的应用实例,今天介绍一种从指定网页源文件中析取image标签的的编程技巧,即从网页源文件中,解析出所有的插图文件名(包括图片路径),也就是标签<img src=".../.../abc.jpg"> 中的文件名".../.../abc.jpg"(有的可能是gif格式)。编程环境:PHP+Apache for Win98。 

首先, 用文本编辑器新建一个PHP类型的文件:abstractSRCfrompage.php3。为了方便讲解,我们打算是在浏览器表单域中输入需要析取image标签的网页的URL(或本机文档),提交后执行析取操作,所以在该文件中,我们要建立一个用于输入网址的表单,举例如下: 

以下是引用片段:
<form action=" abstractSRCfrompage.php3" method="post"> 
输入网址<input type=text name=filename><br> 
<input type=submit name=submit value="提交"> 
</form> 


输入正确的网址,提交后表单信息被送到abstractSRCfrompage.php3页面,由于表单本身就在该页面,所以相当于被送到自身页面,下面我们需要编写析取处理的PHP代码,紧接着表单代码段后写入如下代码:

以下是引用片段:
<?php 
if ($filename!=""){ 
$fp = fopen($filename, "r"); file://若输入不为空,开启本地或者远程档案; 
while ($buffer = fgets($fp, 1024)) { 

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:http://www.heiqu.com/3140.html