重庆分公司,新征程启航
为企业提供网站建设、域名注册、服务器等服务
采集列表页只要是为了获取对应内容页的链接
创新互联建站IDC提供业务:西信服务器托管,成都服务器租用,西信服务器托管,重庆服务器租用等四川省内主机托管与主机租用业务;数据中心含:双线机房,BGP机房,电信机房,移动机房,联通机房。
获取到内容页链接后 然后使用正则匹配 你要采集的信息
采集原理 可以参考(获取列表页的所有图片)
帝国cms的采集 在教程里有 需要查看对方网页的源文件 提取列表部分 内容页部分 仔细看下教程吧
这个原因很多
1 采集规则写的不正确 无法采集
2 没有采集到标题 无标题则无法采集
3 采集规则正确 预览也正常 无法采集 这个还不知道什么原因
4 各种都正确 就是无法采集 这种情况也有 程序这东西 邪的很