批量下载对路网图片并生成html的实现方法

良哉

2019-05-06

对路使用ajax实现异步加载内容,在它的js代码中找到了相关代码

type : 'POST',
    url : '/index.php/request/new_data2/' + times + '/'+locinfo[domn][0],
    dataType : 'json',

返回的json字符串是一个被序列化的数组,数组中存放的是字典,其中要关注的是dict['t']以及dict['i'],dict['t']存放了图片的说明,dict['i']存放了图片的url.知道了这些后就可以开始python脚本了

import相关模块

# -*- coding: utf-8 -*-
import urllib2 as url
import json
import sys
import os
from datetime import *

(已经修复不能获取指定类型的bug，请求的url中最后一个数字代表类型)

获取json:index是下载的第几页,type是tws(太猥琐) tr(太热) tgx(太搞笑) tml(太萌了) tht(太好听 tyy(太养眼) 之一

然后是创建html文件

def create_html(alllist,name):
  html_head='<html><meta http-equiv="Content-Type" content="text/html; charset=utf-8" /><title>duilu</title><body>'
  html_end="</body></html>"
  f=open("%s.html"%(name),"w")
  f.write(html_head)
  for x in range(len(alllist)):
    f.write('<div><img src="%s/%s.gif"/>'%(name,str(x)))
    f.write('<p>%s</p></div>'%(alllist[x]['t'].encode('utf-8')))   
  f.write(html_end)
  f.close()

下载图片

def download(list,dirname,index=0):
  os.chdir(dirname)
  for dict in list:
    imgurl=dict['i']
    text= dict['t']
    print index
    print imgurl
    print text
    res=url.urlopen(imgurl)
    img_type=".gif"
    content_type=res.headers["content-type"]
    if content_type=="image/jpeg":
      type=".jgp"
    filepath="%s"%(str(index)+img_type)
    f=open(filepath,"wb")
    f.write(res.read())
    f.close()
    res.close()
    index+=1
  os.chdir("../")

主函数,用于调用上面那几个函数

def start(type,lenght):
  lenght=int(lenght)
  now=datetime.now()
  now=now.strftime("%m-%d %H.%M.%S")
  os.mkdir(type+now)
  
  alllist=[]
  for x in range(0,lenght):
    list=get_json(x,type)
    alllist.extend(list)
  create_html(alllist,type+now)
  download(alllist,type+now)
  print "\r\n\r\n==============OK==============\r\n\r\n"

一个循环体,获取用户输入

while(True):
  print "输入tws(太猥琐) tr(太热) tgx(太搞笑) tml(太萌了) tht(太好听 tyy(太养眼) 之一\r\nexit:退出"
  type=raw_input()
  all_type=["tgx","tws","tyy","tr","tml","tht"]
  if type in all_type:
    print "键入下载页数:"
    lenght=raw_input()
    start(type,lenght)
  elif type=="exit":
    break
  else:
    print "\r\n输入有误\r\n"

ok完成了,脚本会在当前目录下生成一个以时间命名的html文件以及同名文件夹来存放图片。

测试了一下，下载100多张图片用了几分钟，所以呢我觉得不需要多线程来下载。

也可以稍稍修改下生成html的地方，变成分页显示，然后将网页拖进安卓手机里看也是不错的

用python就是那么简单!

html代码 url html文件

良哉

0 关注 0 粉丝 0 动态

相关推荐

用urllib库几行代码实现最简单爬虫

使用urllib.request()请求一个网页内容，并且把内容打印出来。# 存取到内存当中是bytes流，使用read方法把rsp的内容读取出来，赋值给变量html。# 使用decode解码成我们能够看懂的格式。D:\ProgramData\Anacon

sunzhihaofuture 2020-07-19

前端如何实现.md文件转换成.html文件

.md文件是markdown的一种标记语言，和html比较起来，更简单快捷，主要体现在：标记符的数量和书写上。下面介绍如何实现将.md文件转换成.html文件。

lupeng 2020-11-14

10个对Web开发人员有用的HTML文件上传技巧

上传文件功能可以说是项目经常出现的需求。从在社交媒体上上传照片到在求职网站上发布简历，文件上传无处不在。在本文中，我们将讨论 HTML文件上传支持的10种用法，希望对你有用。我们可以将input 类型指定为file，以在Web应用程序中使用文件上传功能。

sjcheck 2020-11-10

在html页面中引入另一个html页面

我们在使用html编写一个网站的时候，通常情况下头部和尾部是相同的，如果一个网站的每个页面都把这些代码写一遍，不仅浪费时间，还显得重复代码很多，所以此时把重复的页面单独摘出来，在用到的时候从外部直接引进去，就能节省很多时间，减少很多代码。如果有些浏览器本地

pythonclass 2020-07-29

Html常用代码

　　标题的对齐 <H?　　区分的对齐 <DIVALIGN=LEFT|RIGHT|CENTER|JUSTIFY></DIV>. 　　预定格式的宽度<PRE WIDTH=?　　改变字体大小 <FONTSIZE=+|-?

huzijia 2020-06-16

前端之HTML

前端和后端，站在代码执行位置的角度来区分的话，服务端所执行的代码被称为后端代码，也就是这部分代码是在服务器上运行的。这种语言由一个个的标签组成，用这种语言制作的文件保存的是一个文本文件，文件的扩展名为html或者htm，一个html文件就是一个网页。htm

qsdnet我想学编程 2020-06-13

webpack 之压缩js代码和html文件

2.压缩html文件，html文件不需要处理兼容问题，压缩文件只需要在plugins中的HtmlWebpackPlugin中配置minify即可

gufudhn 2020-06-06

Javascript 在html中的嵌入方式

Javascript 作为客户端的脚本语言，主要的用途就是帮助html处理部分交互逻辑。Javascript语言同其他脚本语言一样，通过控制语句、函数、对象方法属性等来实现编程。先来介绍javascript是如何同html交互的，也就是嵌入的方式。根据ja

haocxy 2020-05-28

如何让html引用公共布局（多个html文件公用一个header.html和footer.html）

如何实现多个.html静态页，引用同一个header.html和footer.html文件？并且，不会影响到其他页面对于公共文件的引用和使用；以上就是关于静态html文件，使用公共头部和尾部的解决办法之一。

niehanmin 2020-05-16

前端开发-html

请求一次响应一次，--左侧菜单栏结束-->

hxmilyy 2020-05-11

手把手教你搭建Vue服务端渲染项目

好了，下面开始正文。服务器返回一个包含了引入资源语句和 <div id="app"></div> 的 HTML 文件。服务器会查看当前路由组件需要哪些资源文件，然后将这些文件的内容填充到 HTML 文件。如果有

sjcheck 2020-11-03

快速指南：如何创建基于Python的爬虫

Web抓取的使用正在积极增加，特别是在大型电子商务公司中，Web抓取是一种收集数据以竞争，分析竞争对手和研究新产品的方式。Web抓取是一种从网站提取信息的方法。在本篇文章中，学习如何创建基于Python的刮板。深入研究代码，看看它是如何工作的。在当今的大数

meylovezn 2020-08-28

HTML知识点（一）

五大主流浏览器：火狐浏览器?————因为内核不同???不是一个标准，而是一个标准的集合。所谓超文本，因为它可以加入图片、声音、动画、多媒体等内容，不仅如此，它还可以从一个文件跳转到另一个文件，与世界各地主机的文件连接

owhile 2020-08-18

再见HTML ! 用纯Python就能写一个漂亮的网页

大家好，今天给大家带来一个炫酷的神器！我们在写一个网站或者一个网页界面的时候，需要学习很多东西，对小白来说很困难！要懂后端，比如Python里面的Django或者Flask，或者是Java里面的SpringBoot. 其实我就给老板做一个简单的交互的页面，

Francismingren 2020-08-17

JavaScript HTML DOM 事件

HTML DOM 使 JavaScript 有能力对 HTML 事件做出反应。我们可以在事件发生时执行 JavaScript，比如当用户在 HTML 元素上点击时。onload 事件可用于检测访问者的浏览器类型和浏览器版本，并基于这些信息来加载网页的正确版

爱读书的旅行者 2020-07-07

HTML 语义

HTML 并不简单，它是典型的“入门容易，精通困难”的一部分知识。深刻理解 HTML 是成为优秀的前端工程师重要的一步。语义是我们说话表达的意思，多数的语义实际上都是由文字来承载的。现在很多的前端工程师写起代码来，多数都不用复杂的语义标签，只靠 div

行吟阁 2020-07-05

如何理解HTML语义化的？

通常由PHP后端来写HTML，但是他们并不会CSS，于是就用table来进行布局。但我们都知道，table其实是用来展示表格的，这一条就与语义化严重相悖。后来前端慢慢分离成一个单独的岗位，他们会使用DIV+CSS布局，并且主要利用float和绝对定位进行布

tianqi 2020-07-05

python之发送邮件----html + 附件

补充说明：文章两次邮件代码都是以163邮箱作为例子，不同的邮箱发送连接该邮箱的smtp服务代码不进行备注说明了，详情说明科参考代码下面地址，或者博主上一篇文本类型代码import smtplibfrom email.mime.text import MI

行吟阁 2020-07-04

css基础教程

HTML 标签原本被设计为用于定义文档内容。通过使用 <h1>、<p>、<table> 这样的标签，HTML 的初衷是表达“这是标题”、“这是段落”、“这是表格”之类的信息。同时文档布局由浏览器来完成，而不使用任何的格式

冰蝶 2020-07-04

C# 使用 WebBrowser 实现 HTML 转图片功能

在 .NET 平台上，我们有多种方式可以将一段 HTML 文本转换为一张图片：HTML Renderer、SelectPdf、Aspose.Html等。WebBrowser 具备显示 HTML 的功能，又因为其从 Control 类型派生，所以包含Draw

lyg0 2020-07-04

良哉

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号