在网站建设行业中,不仅是
成都网站建设市场,在国内来说phpcms 都算的上是主流的cms系统,我们今天来看下php网站建设中,phpcms 采集规则是怎样的.
文章采集
phpcms v9默认内置有文章、图片、下载3个内容模型,先来看最普通的文章采集。以采集新浪互联网频道,国内滚动新闻栏目为例http://roll.tech.sina.com.cn/internet_chinalist/index_1.shtml
1、进入后台,内容——内容发布管理——采集管理——添加采集点。(不同于phpcms以往版本,采集管理在模块菜单内)
2、网址规则。采集项目名随便填,采集页面编码默认GbK,具体采集页面的时候可以通过查看其网页源代码。
网址采集,没有大的特色,通过查看所要采集页面的网址规则填写。分析目标页面得出是序列网址,且所要获取内容的网址都在和两个标签之间。无其他干扰链接,所以就无需定义网址中必须包含和不得包含的字符了。如果目标网站配置了base,那么也要配置好。
网址采集配置结束,但是如果目标网站列表页用js实现上下页,或者所要获取网址深度超过2级,用此自带采集就很难实现了。
3、内容规则。phpcms是用“[内容]”作为通配符,然后设置好开始结束的字符,再过滤不要的代码来实现内容的采集。分析目标页的title标签比较有规律,可以直接如图设置。
其实网上有大量的图文来讲解怎么做采集,我们所讲的是根据理解来得出的一些,希望您够理解。
分享文章:phpcms网站建设中采集的方法,怎么样做采集?
网页地址:
http://shouzuofang.com/article/sccpoh.html