网普技术论坛 网普科技  
» 游客:   网普主页 | 注册 | 登录 | 帮助
 

作者:
标题: 原创:如何写ASP入库小偷程序 上一主题 | 下一主题
??????
网普成员





积分 100
发贴 99
注册 2004-10-10
状态 离线
#1  原创:如何写ASP入库小偷程序

作者:allen
个人主页:http://www.cnmaya.org
转载请注明出自玛雅论坛


最近大家都对小偷程序感兴趣,尤其是入库类的,在这里我简单的介绍一下。希望大家对这个能有所了解,如果您还不知道什么叫小偷,请参考我写的另外一片文章(小偷程序原理和简单示例
):http://www.im286.com/viewthread.php?tid=407182&fpage=2

个人认为小偷只是一个很通俗的说法,也给很多人带来了误解,认为小偷是什么不好的东西,其实不然,用数据采集程序来形容应该更准确些。


这里是我昨天刚完成的新浪娱乐入库小偷程序::http://www.saynew.com/news/Class/popjb/popjb02.html
在这里我根据该程序的制作简单介绍一下:

入库小偷的原理也很简单:就是用XMLHTTP远程读取网页的内容,然后根据需要,对读到的内容进行加工(过滤,替换,分类),最后得到自己需要的数据,加入到数据库中。

首先:我们先用XMLHTTP读取远程网页(我的另一片文章中有介绍)。
其次:对内容进行过滤,这个是比较关键的步骤,比如说,我要从远程网页上提取出所有url连接,我应该怎么做呢?


  Code: [Copy to clipboard]   
‘这里用的是正则式
Set objRegExp = New Regexp   '建立对象
objRegExp.IgnoreCase = True    '大小写忽略
objRegExp.Global = True          '全局为真
objRegExp.Pattern = "http://.+?"   '匹配字段
set mm=objRegExp.Execute(str)    '执行查找,str为输入参数
For Each Match in mm      '进入循环
        Response.write(Match.Value)   '输出url地址
next



然后,我们需要根据需要做一些替换功能,把不必要的数据替换掉,这个比较简单,用Replace函数即可。
最后,进行数据库操作,这个我想大家应该都会,就不做介绍了。


暂时就想到这些,大家在实际操作中有什么问题,欢迎一起探讨,也欢迎来我的论坛一起讨论,地址是:http://www.cnmaya.org

2004-10-12 12:16 PM
查看资料  发送邮件  发短消息   编辑帖子  引用回复 顶部
茱莉娅
THE BODY SHOP美容顾问

茱莉娅美体小铺


积分 100
发贴 99
注册 2009-5-21
来自 茱莉娅美体小铺
状态 离线
#1  赞助商信息The body shop

茱莉娅美体小铺
茱莉娅美体小铺淘宝店
茱莉娅美体小铺
2004-10-12 12:16 PM
查看资料  发送邮件  发短消息   编辑帖子  引用回复 顶部


可打印版本 | 推荐给朋友 | 订阅主题 | 收藏主题



论坛跳转:  




Powered by Discuz! 2.5 © 2001-2005 Comsenz Technology Ltd.
Processed in 0.008784 second(s), 7 queries, Gzip enabled
------------------------------------------------------------------------------
本论坛属网普科技交流与技术支持论坛!
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论!
美国主机, 美国虚拟主机, cPanel+PHP+Mysql+Ftp+Email+Zend+GD2+国际域名支持
技术支持 QQ: 126818 EMail & MSN: support[AT]netpu.net
[ 联系我们 ] - [ 网普科技 ]