python小白学习记录多线程爬取ts片段

kikaylee

2020-02-23

from lxml import etree
import requests
from urllib import request
import time
import os
from queue import Queue
import threading
import re
from multiprocessing import pool
from urllib import request
def download(urls):
    for index in range(0,1342):
        n = index
        if(index<=999):
            n = str(n).zfill(3)
        else:
            n = str(n)
        # print(n)
        url = "https://zy.512wx.com/20171106/vM1OOVna/1200kb/hls/ppvod1983%s.ts" %n
        print("url",url)
        urls.put(url)
class Consumer(threading.Thread):
    def __init__(self,urls,*args,**kwargs):
        super(Consumer, self).__init__(*args,**kwargs)
        self.urls = urls
        self.queueLock = threading.Lock()
    def run(self):
        while True:
            if self.urls.empty():
                break
            else:
                self.queueLock.acquire()
                file = self.urls.get()
                self.queueLock.release()
                name = file.split(‘/‘)[-1]
                print("name",name)
                with open("./video/{}".format(name), "wb") as fp:
                    if os.access("./video/{}".format(name), os.F_OK):
                        pass
                    else:
                        resp = requests.get(file,verify = False)
                        fp.write(resp.content)
                print(name + "下载完成")
def get_ts(urls):
    with open("./video/kuiba.ts","wb") as fp:
        for index in range(0, len(urls)):
            resp =  requests.get(urls[index])
            fp.write(resp.content)
            print(str(index)+"下载完成")
def main():
    urls = Queue(2000)
    download(urls)
    # while not urls.empty():
    #     print(urls.get())
    for index in range(0,16):
        x = Consumer(urls)
        x.start()
if __name__ == ‘__main__‘:
    main()

此处开了16个子线程

python多线程多线程 python

kikaylee

0 关注 3 粉丝 0 动态

相关推荐

多线程真的比单线程快？

事实上，Python 多线程另一个很重要的话题叫，GIL。在Python中，可以通过多进程、多线程和多协程来实现多任务。难道多线程就一定比单线程快?下面我用一段代码证明我自己得观点。GIL 的工作原理：比如下面这张图，就是一个 GIL 在 Python 程

farewellpoem 15评论 2020-11-09

多线程中如何使用gdb精确定位死锁问题

本文转载自微信公众号「程序喵大人」，作者程序喵大人。在多线程开发过程中很多人应该都会遇到死锁问题，死锁问题也是面试过程中经常被问到的问题，这里介绍在c++中如何使用gdb+python脚本调试死锁问题，以及如何在程序运行过程中检测死锁。当两个以上的运算单

lhtzbj 2020-08-13

Python多线程

多任务可以由多进程完成，也可以由一个进程内的多线程完成。进程是由若干线程组成的，一个进程至少有一个线程。# target=线程需执行的方法， name=线程的名字， args=. # 任何进程都会默认启动一个线程，这里启动的就是 MainThread ，

learnpy 2020-07-19

python 多线程 QTimer实现多线程

使用线程可以把占据长时间的程序中的任务放到后台去处理。程序的运行速度可能加快。每个独立的线程有一个程序运行的入口、顺序执行序列和程序的出口。但是线程不能够独立执行，必须依存在应用程序中，由应用程序提供多个线程执行控制。每个线程都有他自己的一组CPU寄存器，

kyelu 2020-07-09

Python-多线程

使用线程可以把占据长时间的程序中的任务放到后台去处理。在一些等待的任务实现上如用户输入、文件读写和网络收发数据等，线程就比较有用了。线程在执行过程中与进程还是有区别的。但是线程不能够独立执行，必须依存在应用程序中，由应用程序提供多个线程执行控制。每个线程都

举 2020-06-14

第54天：Python 多线程 Event

Event 是一个事务处理的机制，用于通知多个异步任务某个事件已经发生了。比如在交通红绿灯中多辆在行驶中的汽车可以表示成程序中的多个异步任务，红绿灯的亮起可以表示成一个通知，红灯通知这个汽车的行驶任务必须停止了，绿灯通知这个汽车的行驶任务可以继续驾驶了。E

haokele 2020-05-31

第53天： Python 线程池

大家都知道当任务过多，任务量过大时如果想提高效率的一个最简单的方法就是用多线程去处理，比如爬取上万个网页中的特定数据，以及将爬取数据和清洗数据的工作交给不同的线程去处理，也就是生产者消费者模式，都是典型的多线程使用场景。那是不是意味着线程数量越多，程序的执

fengling 2020-05-31

第49天：Python 多线程之 threading 模块

在之前的文章中，我们已经介绍了 Python 通过 _thread 和 threading 模块提供了对多线程的支持，threading 模块兼具了 _thread 模块的现有功能，又扩展了一些新的功能，具有十分丰富的线程操作功能，本节我们就来详细学习一下

maimang00 2020-05-30

Python多线程之死锁

死锁是由于两个或以上的线程互相持有对方需要的资源，且都不释放占有的资源，导致这些线程处于等待状态，程序无法执行。　　　1.互斥性：线程对资源的占有是排他性的，一个资源只能被一个线程占有，直到释放。这样线程A和线程B相互持有对方需要的锁，从而发生阻塞，最终变

坚持是一种品质 2020-05-28

Python中的多线程如何正确运用？案例详解

function 是开发者定义的线程函数，args 是传递给线程函数的参数，必须是tuple类型，kwargs 是可选参数，字典类型。调用 threading.Thread 之后，会创建一个新的线程，参数 target 指定线程将要运行的函数，args 和

laityc 2020-05-27

Python 多线程

使用线程可以把占据长时间的程序中的任务放到后台去处理。在一些等待的任务实现上如用户输入、文件读写和网络收发数据等，线程就比较有用了。线程在执行过程中与进程还是有区别的。但是线程不能够独立执行，必须依存在应用程序中，由应用程序提供多个线程执行控制。每个线程都

jling 2020-05-19

Python中的多处理与多线程：新手简介

你为什么想要它?Python是一种线性语言。但是，当您需要更多的处理能力时，线程模块就派上用场了。Python中的线程不能用于并行CPU计算。但是它非常适合于I/O操作，比如web抓取，因为处理器处于空闲状态，等待数据。线程化改变了游戏规则，因为许多与网络

YENCSDN 2020-05-14

多线程默认情况,守护线程及join对子线程运行的影响

Python多线程与多进程中join()方法的效果是相同的。此时join的作用就凸显出来了，join所完成的工作就是线程同步，即主线程任务结束之后，进入阻塞状态，一直等待其他的子线程执行结束之后，主线程在终止，例子见下面三。当设置守护线程时，含义是主线程对

singer 2020-04-30

Python中多线程和多处理的初学者指南

使用Python分析数据，如果使用了正确的数据结构和算法，有时可以大量提高程序的速度。实现此目的的一种方法是使用Muiltithreading(多线程)或Multiprocessing。在这篇文章中，我们不会详细讨论多线程或多处理的内部原理。相反，我们举一

举 2020-04-29

python多线程实现方式，最基础的实现方式模块是什么

python3.x中通过threading模块创建新的线程有两种方法：一种是通过threading.Thread-即传递给Thread对象一个可执行方法（或对象）;第二种是继承threading.Thread定义子类并重写run()方法。第二种方法中，唯一

学习备忘录 2020-04-20

代码详解Python多线程、多进程、协程

很多时候我们写了一个爬虫，实现了需求后会发现了很多值得改进的地方，其中很重要的一点就是爬取速度。本文就通过代码讲解如何使用多进程、多线程、协程来提升爬取速度。下面代码的目的是访问300次百度页面并返回状态码，其中parse_1函数可以设定循环次数，每次循环

CloudXli 2020-04-07

区分python中的进程与线程

今天整理的文章是给大家梳理Python的进程与线程的区别，没什么代码，希望大家能清楚知道他们的区别，什么情况用线程，什么情况用进程做到心中有数，希望大家能熟练掌握.进程一般由程序、数据集、进程控制块三部分组成。提高并发性,通过线程可方便有效地实现并发性。在

chunjiekid 2020-08-16

python 锁

每个线程在执行的过程都需要先获取GIL，保证同一时刻只有一个线程可以执行代码。计数器不能为0，当计数器为0时acquire（）将阻塞线程，直到其他线程调release（）。

小菜鸟的代码世界 2020-06-17

线程-GIL、锁

Python 解释器中可以“运行”多个线程，但在任意时刻只有一个线程在解释器中运行。对Python虚拟机的访问由全局解释器锁来控制，正是这个锁能保证同一时刻只有一个线程在运行。c、运行指定数量的字节码指令或者线程主动让出控制；d、把线程设置为睡眠状态；d、

bizercsdn 2020-06-06

Python当中的线程模块threading【多测师】

在Python语言中，对线程的操作使使用的是threading，下面首先通过一个案例来测试进程和线程的。从输出结果来来看，进程的效率更搞点，在进程中，主要使用的是threading里面的Thread类，下面还是以访问。最终输出的结果是0。因为守护进程1秒就

usepython 2020-05-31

kikaylee

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号