昨天在某公众号看见一篇关于用python爬为什么王者荣耀进不去中所有英雄的皮肤的文章
感觉挺有趣的,下载来当壁纸也不错就动手一波,环境用的是python3过程中也遇到了一點问题,所以记录下来
第一步首先打开
F12分析一波网页结构。
通常写这种爬虫,一般都是先分析结构简单判断下是否有反爬机制。看下正则表达式怎么写或者使用beatifulsoup的解析器然后再用urllib的套件下载。。但是在经过数次尝试后发现其中有点坑。原因是这个页面有些英雄的链接及图片是通过js加载出来的,源代码里面根本没有。比如这个新出的英雄司马懿。右键直接查看源代码。发现第一个显示嘚英雄是狂铁。(扎心)