火车头采集某论坛时,出现“请开启JavaScript并刷新该页”的解决方法
其实说穿了,这个论坛就是著名的52pojie。小白有个软件资源分享站,一直在采集它上面的最新帖子。每天采集一次。 讲道理。它这个论坛虽然采用是dz论坛程序,但是在反爬虫方面还是做得很到位的。我之前就遇到过一次问题(详情参考这篇文章:火车头采...
其实说穿了,这个论坛就是著名的52pojie。小白有个软件资源分享站,一直在采集它上面的最新帖子。每天采集一次。 讲道理。它这个论坛虽然采用是dz论坛程序,但是在反爬虫方面还是做得很到位的。我之前就遇到过一次问题(详情参考这篇文章:火车头采...
其实一直以来,我都是用火车头采集器半自动更新几个网站内容。为什么说是半自动?我之前的操作手法是:从火车头将内容采集到本地,保存为html文件。然后手动发布,在wordpress编辑器发布文章时复制内容到里面,适当编辑一下内容,像修改一下标题...