请教个采集问题。

返回逐浪CMS技术讨论区
4回复贴,共1页,点击数:659

我看了视频教程后,能够获取到正确的连接,但是采集字段的时候就会报错,请管理员有空的时候帮忙解答下。谢谢。

这是北京大学的一个简单的新闻列表。

http://pkunews.pku.edu.cn/2014zt/node_5177.htm

1.jpg

2.jpg

标题也能采集到

3.jpg

但是如果使用“开始字符串”和“结束字符串”就会报错。尝试更改元素类型和填写class也不行。

下图使用采集规则不修改元素类型,默认DIV,会报错,改成TD,也会报错。如果是body,就是空的。


5.jpg

点击测试获取后就报错了。

6.jpg

如果是body。测试结果就是空的。

7.jpg

1楼 2017/02/25 23:18

并不需要指定元素类型,如果是商业版可让官方做规则。

2楼 2017/02/27 14:30 收起回复

3.8免费版的。如果不指定元素类型,就是空白的。

比如采集文章发布日期。

1.jpg



然后设定开始字符串和结束字符串

2.jpg


点击测试获取,获取不到信息。能帮忙看看是我哪里做错了吗?谢谢。

3.jpg

3楼 2017/02/28 09:32 收起回复
CMS小朱: 亲,我们现在已更新为3.9版本,您可以下载我们的最新版本:版本管理+微建站+头条号接入-Zoomla!逐浪CMS2 x3.9.0发布https://www.z01.com/down/3116.shtml
2017/02/28 14:05 回复

这个采集,跟源网站也有很大关系,如果源站不规范,需要再处理,程序员得脑洞大开一下的。

4楼 2017/03/01 09:36 收起回复

那我自己琢磨下,还有。“下一页”怎么办?再新建一个采集吗?

5楼 2017/03/01 11:34 收起回复
您未登录,没有发贴权限[点此登录]