说明:
1. 前端采用纯HTML+JS+JSON (链接统计除外),后端采用Python生成标准JSON
2. 自带30多个常用网站采集规则
3. 多线程抓取,30多个网站在5秒内采集完毕
4. 相同网站放在一个框架内,可局部刷新和滚动
5. 更新时间显示,按照采集页的自带更新时间或按时间排序的第一条时间采集,没有的则为采集完成时间
6. 内容链接防盗链,链接通过base64+字符逆序+大小写反转+base64实现加密(更换大小写转换顺序或增加数字替换可实现不同密码加密)
7. 内容链接点击统计
8. 部分内容鼠标悬停提示,例如在appstore排行中提示更新内容、时间、版本号 安装:
1. 运行 python3 caiji.py 进行采集(保持后台运行请使用screen或nohup)
2. 打开首页进行访问 注意事项:
– caiji.py 为后端采集程序,其余为前端,需在同一目录下
– 相应设置修改请查看源码中的注释
– admin.php 为第三方数据库管理程序,用于内容链接统计查看(默认密码为admin,请在文件中修改)
– 点击统计 log log.db生成生成生成生成生成生成生成生成生成生成生成,如未建立请保证主目录可写
– 为了安全起见,建议将后端程序 caiji.py 和数据库查看程序 admin.php 改为复杂文件名,或移动到非目目录(需同时修改文件内的生成json保存目录为网站根录录,默认为当前录录)
– 默认使用多线程抓取,如有问题请改为单线程
– 今日头条的采集请更换为自己的 cookie,头条短时间采集内容相同的太多(目前1分钟采一次合并10次数据),相同cookie分段采集后几乎不会有重复的,但采集一段时间后推荐的都是杂七杂八无关的垃圾内容(请定期更换cookie或自行加入随机的头条cookie生成规则)
– 采集站的logo大部分已修改为透明图层png,在非白色背景下可能会很难看
链接:https://pan.baidu.com/s/1pVOMjesQLeYTrOZaOveLrQ
附件下载:
|