本文作者:随便撸源码

易得网站数据采集系统 v1.07 UTF-8

随便撸源码12个月前 ( 10-03 )93
易得网站数据采集系统通用版,通过编写或者下载规则,对所选网站进行数据采集的系统,可以采集大部分网站的数据,并保存图片文件。是建站不可或缺的数据采集利器。而且该采集器为开源代码,符中文注释,方便修改和学习。该采集系统有如下特点:

主流语言 - 采用php+mysql编写而成,安装对应服务器即可。
完全开源 - 开源代码,且代码均有中文注释,方便管理与学习交流。
规则自定义 - 可以自定义采集规则,可以采集大部分网站内容。
数据修改 - 自定义修改规则,优化数据内容。
数据保存 - 数组形态,系列化数据保存至文件或数据库,方便上传、调用。
图片读取 - 可以读取内容的图片,并保持至本地。
编码控制 - 转换编码,可以保存gb2312,gbk等编码至utf-8。
标签清理 - 可以自定义保留的标签,清理掉不必要标签。
安全性能 - 通过密码控制读取,远程读取亦安全。
操作简单 - 一键读取操作,可以按规则分组读取,或指定规则id读取,单一id读取。
规则分组 - 按规则分组读取数据,及时更新采集数据。
自定义读取 - 按自定义规则id读取数据,有效更及时。
JS读取 - 运用js控制读取时效,降低服务器负载。
超时控制 - 可设定页面执行时间, 减少timeout错误。
多次读取 - 可设定对网页多次读取控制,可以更有效的读取数据。
错误控制 - 如果多次出错,可以停止读取,减小服务器资源占用。
负载控制 - 多文件夹保存数据,可以有效的解决多文件下服务器负载。
数据修改 - 不仅可以浏览数据,而且可以对主体数据进行修改。
规则分析 - 可以向其他人分享您的规则,让更多人使用。
规则下载 - 下载分享规则,快速获取需要的内容。

易得网站数据采集系统 v1.07 UTF-8 第1张易得网站数据采集系统 v1.07 UTF-8 第2张