大家好,欢迎收看WMCMS火车头采集视频教程
首先下载WMCMS最新版本和火车头软件。
我已经下载好了火车头和WMCMS程序。
输入www.weimengcms.com即可下载最新的程序。
桌面的WMCMS文件夹是我下载安装好的程序,右边的图标是火车头图标。
采集和发布规则都已经内置在程序/files/collect/locay文件夹下面。
下面我们首先看一下网站的内容。 都是空的。
现在正式进行采集教程。
哦,忘了说,火车头采集的流程为:先采集书籍发布,然后再采集章节发布。
我们新建两个分组,一个采集书籍。一个采集章节。
我们只采集前两页的,然后随便选择一个地址点击测试,查看数据是否正确。
完全正确就进入第三步。
导入发布规则的时候可以把书籍和章节的都一起导入了。
首先,我们选择书籍发布。测试的时候出现了200就表示发布成功!
现在让我们看一下刚才测试的数据。
注意:方式二一定要勾选。
保存到桌面,点击查看默认模版,修改txt的模版,里面内容为:[标签:目录]。 记得有一个回车。
现在已经在开始采集书籍了,采集完成会自动发布。
书籍已经全部发布成功。那个文件就是发布完成后的小说章节目录地址。
下面我们来配置章节采集发布。
注意:采集发布的章节必须是已经存在的小说,不然会发布失败。
登录的时候要出现了cookie才行。
我们测试一下章节,200,表示发布成功。
章节发布我们只需要勾选方式一即可!
现在配置已经完成,我们把以前的规则全部删除。占地方。然后再把章节采集发布导出一份。
可以多复制几分,然后导入可以同时进行,加快采集速度,只要你的电脑够好,可以开十几二十个任务。
这里我们复制四分,同时进行五个采集任务。
已经使用过的目录地址文件可以删除了。
现在就等待采集完成。
独家推荐可以设置首页封面推荐
火车头可以定时采集更新章节,可以无人值守进行更新数据。具体功能请自行摸索。
计划任务,可以指定任何时间进行更新操作。
同样,书本采集也可以同时进行多个任务。
其实,一万本书也就十来分钟可以采集完成,主要是章节采集比较慢,一百万数据5个任务同时进行大概需要24小时。
期间你可以挂在服务器上。
由于时间关系我们只采集一个,刚才这个任务已经采集了几千章节,我们就不进行继续采集了,直接发布测试。、
现在全部发布成功。
由于下载会占用大量带宽,所以我建议关闭小说的下载功能。
好了,采集教程至此全部结束。
谢谢收看!