请将要扒取的网站页面的网址粘贴到这里 点击下方的“开始抓取”按钮 等待抓取完毕,会自动打开已下载的文件夹 例如,若要获取 qiye1.wscso.com 网站中的首页、关于我们、新闻列表三个页面,可以按以下方式在扒网站工具中设置URL:
http://qiye1.wscso.com
http://qiye1.wscso.com/gongsijieshao.html
http://qiye1.wscso.com/xinwenzixun.html
设置好后,点击左下角的“开始提取”按钮,程序便开始自动扒这几个设置好的网页。
扒完后,会自动打开已下载好的文件夹。例如,上述拔取的结果
可以发现,下载的网页是一个非常标准的模板页面,可以直接打开模板页进行查看。
该软件界面左下方有两个按钮:开始抓取和更多设置。
点击更多设置按钮,就可以打开Cookies设置界面。
Cookies设置界面如下图所示:
当您要抓取需要登录才能访问的网页时,您可以使用浏览器登录目标网页,然后获取该网站的Cookies,并将其填写在此处即可。
如果Cookies有a、b、c三个参数,那么填入的格式为:
a=1;b=2;c=3
每个参数中间用 ; 分割。
获取地址:
© 版权声明
THE END
- 最新
- 最热
只看作者