帝国cms怎么采集信息

作者 : 青柠哥 本文共956个字,预计阅读时间需要3分钟 发布时间: 2023-07-5 共142人阅读

帝国cms怎么采集信息

帝国cms如何收集信息?

帝国cms是一个我们大量使用PHP的建站系统。在网站建设过程中,如果我们没有信息来源,只能手工反复复制粘贴,费时费力,只好借助帝国cms的收藏功能来完成信息录入。为了深入了解帝国cms的收藏功能,我们以“新浪新闻”栏目为例进行实际收藏。

首先,添加采集节点

1.添加节点:

c77d6e04a858022556bc3a180b83195.png

2、选择要增加收藏的栏目:

97a8187103a04ad212e8b3ecf53fc08.png

3.进入添加节点表单:

366c3de5f80ae0263fb5dcc1318857e.png

4.在节点名称框中给一个名称,然后复制要收藏的新浪周边新闻列表的地址:

a9ad05387bd3a6c99116b1bbf0545ab.png

5.下来的时候发现很多选项,比如“收集页面地址模式2,内容页面地址前缀…”先不理他,然后再一一详细解释,直接拉到“信息链接区常规”这里:

03707487ddcd4a693891b2548711e8e.png

6.这里是将收集的列表信息的链接区域设置为常规。让我们点击查看新浪“源文件”周边新闻列表:

5ca6e61b74f083434f194c444078e17.png

7.将源代码复制到Dreamweaver中,并选择要在Dreamweaver中收集的信息链接区域:

35bdb053e864053e228914162e994ef.png

8.切换到Dreamweaver代码模式。

是信息链接区:

46a21ae7480eabdee4d58f357845e1f.png

9.获取信息链接区域的规律性:

2700a9f7f3c3829d23ba2c239236123.png

10.获取常规信息页面链接:

0adde0683505e75ded9eb6f02fe770d.png

11.注意:如果信息页面链接是相对地址,例如,则“内容页面地址前缀”要添加的域名:

3f346f41c072d6c2e6911f9bc9bddd3.png

12、现在要收集内容页的标题和内容:

451b33318001c03fd88cd2779925480.png

13、查看新闻页面“源文件”,找到标题标签:

e1aae957ecb2a4a3b765a3c0928a873.png

14、得到的标题是正规的:

015d08fbd6c09cbd9bdd053187348f4.png

15.这里是要收集的内容区域:

d7de2b2c6798ef0fa83933fe37cf8f8.png

16、获取常规新闻内容:

56419f99bfbba2e9a4cd86308c9dfea.png

(注:d_id=#39在新闻内容正规化;*#39;使用通配符,因为每条新闻的d_id值不一样,所以可以用*代替,“*”可以代替任何字符。)

17.点击提交按钮完成整个采集节点:

3179db0ad7e4eb76ddd80266d436d99.png

第二,预习采集节点是否正确。

1.单击提交按钮后,返回管理节点:

2860bbb31f72d3bc7c3c82aabdb1f9a.png

2.点击“预览”采集,进入预览结果节点:

94dde933c97b75d64160c78458ca5bf.png

3.收藏内容页面列表:

f2715a844224b60fc9990b507eee524.png

4.收藏内容页面:

93641ec11c00928da6b9c90f6b9fb18.png

第三,收藏

1.预览收款节点后,返回“管理节点”,点击“开始收款”链接开始收款:

d1b0992cd2df13e95f59e92f669d530.png

2.系统正在收集:

5edfd08d00999b5a157f0a8e82782c9.png

3.收集后,将显示本地临时存储的信息。此时,可以修改或删除临时存储的信息:

88018aecfa3f81988f5bd821cd72001.png

4.修改信息页面如下图所示:

fb4b442b48999bed6d73d18d07f39d7.png

5.查看收集的信息并将其存储,然后单击按钮“存储所有信息”:

689f7faaba9903653db396f0f6a8e1b.png

6.确认操作:

cca441b91e0c086d0a8af862b9ec62b.png

7.信息入库完成提示:

58f5d91dc63c6427f633690bf3d41ad.png

信息存储后,单击”管理信息“:

2e19fe433b30ca821f414427319a117.png

我们可以看到刚刚采集入库的新闻信息:

e51a4d71b9f7b42ea158487c4ce53e7.png

最后通过“数据更新,”刷新首页、栏目、内容页,完成网站的信息采集。

以上是帝国cms如何收集信息的细节。更多信息请关注php中文网其他相关文章!

青柠资源网专注于CMS网站模板,主流语言整站网站源码下载,网站建设相关教程分享,好用的软件素材整合下载,提供一站式便捷自助服务。
1. 本站所有资源来源于用户上传和网络,如有侵权请邮件联系站长!
2. 分享目的仅供大家学习和交流,您必须在下载后24小时内删除!
3. 不得使用于非法商业用途,不得违反国家法律。否则后果自负!
4. 本站提供的源码、模板、插件等等其他资源,都不包含技术服务请大家谅解!
5. 如有链接无法下载、失效或广告,请联系管理员处理!
6. 本站资源售价只是赞助,收取费用仅维持本站的日常运营所需!
7. 如遇到加密压缩包,默认解压密码为"www.qnziyw.cn",如遇到无法解压的请联系管理员!


青柠资源网 » 帝国cms怎么采集信息

常见问题FAQ

免费下载或者VIP会员专享资源能否直接商用?
本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考 VIP介绍
提示下载完但解压或打开不了?
最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量,若小于网盘提示的容量则是这个原因。这是浏览器下载的bug,建议用百度网盘软件或迅雷下载。 若排除这种情况,可在对应资源底部留言,或 联络我们。
找不到素材资源介绍文章里的示例图片?
对于会员专享、整站源码、程序插件、网站模板、网页模版等类型的素材,文章内用于介绍的图片通常并不包含在对应可供下载素材包内。这些相关商业图片需另外购买,且本站不负责(也没有办法)找到出处。 同样地一些字体文件也是这种情况,但部分素材会在素材包内有一份字体下载链接清单

发表回复