谷歌开发者工具修改网页源码并调试

注:本文仅针对web前端页面解析,方便爬虫来模拟人为操作!

遇到的问题1:在爬取某个网站时,在此网页有一个<a href="***" target="_blank"></a>的链接标签,鼠标单击该链接时,将会弹出新的会话框,并显示该链接的内容,可是将该链接URL直接输入浏览器的地址栏将会跳转到其他网页,故而想用谷歌开发者工具查看此次http请求的完整过程,由于访问该网站弹出新会话框,谷歌开发者工具的network无法很好地跟踪此过程。

解决方法:使用谷歌开发者工具的菜单栏中的elements选项,修改对应的<a>标签的html代码,将

<a href="***" target="_blank"></a>中的target="_blank"删除。即可在点击此链接时不产生新的会话窗口,从而根据network选项中的内容来查看http的完整过程。

遇到问题2:在爬取网页时,有很多的js代码需要解析,单击、双击等操作都会有相应的执行方法,在一堆很乱的js文件中去寻找执行代码很麻烦,虽然可以通过在线格式化工具进行格式化排版,仍然不方便我们去快速的获取执行方法并跟踪。

解决方法:使用谷歌开发者工具的sources选项,在其右侧有打断点和事件跟踪等选项供我们使用,可以像我们平时调试程序一样跟踪调试我们的页面,对一些操作进行进一步的解析。

相关推荐