wordpress调整 让它更适合采集入库

调整wordpress来让它更适合作采集发布的一个文章系统

  1. 要修改“PHP.INI”来增加PHP运行的时间;
  2. 安装插件“wp slug translate”来解决火车采集免费版不支持翻译的功能,该插件发布时自动翻译标题为英文并做为别名;
  3. 使用“<!—nextpage–>”标签,让长文章分页;
  4. 修改“wp-includes/cron.php”解决定时文章出现的任务丢失
  5. 安装插件“WP Cleaner”处理一些垃圾文档和自动保存文档;
  6. 过滤掉一些内容和标题包含的特殊符号如”[]<>”和一些常用字如“的”让你的内容更加伪原创;
  7. 添加wordpress后台投稿权限的用户,采集时自动更换这些用户为发布作者;
  8. 用火车的正则采集功能把内容分段采集,然后整合并发布,用标签功能可以很好的处理出来减少搜索对相识度判断;
  9. 安装插件“WP No Category Base”去除分类的链接包含有Category;
  10. 安装插件“WP Kit CN”让文章自动截取摘要,如果你采集时包含有摘要的采集,可以不使用该插件;
  11. 使用Firefox并安装YSlow和Page speed来检查你的网站;
  12. 安装wordpress的Cache插件加速网站如:W3 Total Cache;
  13. 安装插件“Search and Replace”可以批量查找替换修改网站内容和评论;
  14. 建议采集时先采集到本地检查所有的内容预防某些内容过滤和采集时有瑕疵。

基本上了,这样做其实只是一个欺骗爬虫,网名的眼睛是雪亮的,网站内容好不好,能不能让你有固定的客户群还要你后天的修炼,伸手党的日子在黑暗时期挺挺,不要过分依赖。

去打赏

您的支持将鼓励我们继续创作!

[微信] 扫描二维码打赏

[支付宝] 扫描二维码打赏

正在跳转到PayPal...

Author: 飞翔线