开发scrapy web界面（一）

andrewwf

2020-02-02

scrapy 是一个很强大的爬虫框架，可以自定义很多插件，满足我们不同的需求....

首先我们应该要会用twisted 写web service

其实scrapy 已经帮我们做了整理了

from scrapy.utils.reactor import listen_tcp

listen_tcp就可以开启web service

所以web 插件可以这样写

class WebService(server.Site):
    name = ‘WebService‘
    def __init__(self, crawler):
        self.crawler = crawler
        self.crawler.itemData = []
        
        portal = Portal(PublicHTMLRealm(Root(self.crawler)),
                        [StringCredentialsChecker(‘test‘, ‘tset‘)])
        credential_factory = BasicCredentialFactory("Auth")
        resource = HTTPAuthSessionWrapper(portal, [credential_factory])
        
        server.Site.__init__(self,resource)

        self.crawler.signals.connect(self.start_listening, signals.engine_started)
        self.crawler.signals.connect(self.stopService, signals.engine_stopped)
        self.crawler.signals.connect(self.item_scraped, signals.item_scraped)
        self.crawler.signals.connect(self.spider_idle, signal=signals.spider_idle)

    @classmethod
    def from_crawler(cls, crawler):
        return cls(crawler)

    def start_listening(self):
        self.port = listen_tcp([8000,8070], ‘127.0.0.1‘,self)
        h = self.port.getHost()
        logger.info("scrapy web console available at http://%(host)s:%(port)d",
                    {‘host‘: h.host, ‘port‘: h.port},
                    extra={‘crawler‘: self.crawler})
        import webbrowser
        webbrowser.open("http://%(host)s:%(port)d"%{‘host‘: h.host, ‘port‘: h.port})

    def stopService(self):
        self.port.stopListening()

    def item_scraped(self,item, response, spider):
        try:
            self.crawler.itemData.append(item)
        except:
            pass
    
    def spider_idle(self):
        raise DontCloseSpider

然后界面可以在Root里实现。

以下是实现的界面

开发scrapy web界面（一）

可以添加控制爬虫的一些操作，如爬虫暂停、添加开始爬的内容等

开发scrapy web界面（一）

当然、还可以做一些调试的界面或是其他有趣的

web开发 scrapy host

andrewwf

0 关注 0 粉丝 0 动态

相关推荐

全栈、均栈、MERN栈，哪个才是下一代Web项目的正确栈？

到底什么是技术栈?作为一种数据类型，技术栈实际上是一些组件的集合。它具有两个主要功能。一个是以推送的形式，向集合中添加组件;另一个是以弹窗的方式，删除最近添加的，但尚未删除的组件。前端技术-HTML、JavaScript、CSS、PostgreSQL、jQ

chenhaotao 2020-11-13

项目推荐：快速生成一个全栈 Web 项目

Goxygen 致力于节省你搭建一个项目的时间。它自动生成一个完全配置好的项目骨架，以方便你可以立即着手实现你的业务逻辑。Goxygen 生产后端的 Go 代码，并将其与前端组件相连，并且为生成的项目提供 Dockerfile 和 docker-compo

liaochaowu 2020-11-12

10个对Web开发人员有用的HTML文件上传技巧

上传文件功能可以说是项目经常出现的需求。从在社交媒体上上传照片到在求职网站上发布简历，文件上传无处不在。在本文中，我们将讨论 HTML文件上传支持的10种用法，希望对你有用。我们可以将input 类型指定为file，以在Web应用程序中使用文件上传功能。

sjcheck 2020-11-10

使用Node.js原生API写一个Web服务器

Node.js是JavaScript基础上发展起来的语言，所以前端开发者应该天生就会一点。一般我们会用它来做CLI工具或者Web服务器，做Web服务器也有很多成熟的框架，比如Express和Koa。所以本文其实是这两个源码解析的前置知识，可以帮我们更好的理

huangliuyu00 2020-10-29

移动前端开发和Web前端开发的区别是什么？

前端这门技术，从诞生发展至今不过寥寥十余年。如果说前十年是 PC 前端的时代，那后十年一定是属于移动前端的时代。特别是随着网络制式的发展，移动设备在全球范围内得到了空前的普及，在前端领域，Hybird Web、React Native、Weex、Flutt

PncLogon 2020-09-24

Web前端和后端的区别是什么？如何区分？

从前端和后端两者工作内容和负责项目是完全不同。前后端开发的相似点：函数式编程、模块化思想、分层思想、单元测试、lint、assert 方法、日志、声明式和命令式的实践经验、数据处理的本质实践与思考、部分库的使

杏仁技术站 2020-09-18

如何使用Edge DevTools分析Web应用程序API

是的，这过于简单，但实际上很少有场合需要全新的东西。HTTP是一种简化，但也是一种混淆。如果我们使用的一切其底层都是HTTP，我们为何构建可处理那些API的测试和开发工具?虽然Open API Initiative及其他方法对于规范如何描述和实现基于HT

fubrty 2020-09-08

快速入门Web前端开发的正确姿势

入门标准很简单，就一条：达到能参与 Web 前端实际项目的开发水平。请注意，是实际项目，这就需要了解如今的实际项目开发都用了哪些技术栈。几年前， jQuery + Bootstrap 可以说是一统江湖，是前端领域的绝对霸主。而这几年，随着 Angular

颤抖吧腿子 5评论 2020-09-04

Web前端学习是属于阶段性的吗？

相信前端的学习会给大家带来可观的收入，在前端行业发光发热。其中的内容包含了三个方面,一个是网站的布局,一个是基础项目,另一个是页面布局的项目。第二个阶段是高级程序的设计,有以下几个内容1.原生Java的交互项目开发功能,2.面向对象进阶,3.ls6、ls5

liangjielaoshi 2020-08-19

Web前端学习是属于阶段性的吗？

相信前端的学习会给大家带来可观的收入，在前端行业发光发热。其中的内容包含了三个方面,一个是网站的布局,一个是基础项目,另一个是页面布局的项目。第二个阶段是高级程序的设计,有以下几个内容1.原生Java的交互项目开发功能,2.面向对象进阶,3.ls6、ls5

viewerlin 2020-08-19

10行Python代码实现Web自动化管控的示例代码

本博客将为各位分享Python Helium库，其是在 Selenium库基础上封装的更加高级的 Web 自动化工具，它能够通过网页端可见的标签、名称来和 Web 进行交互，据说比Selenium库简单50%，Helium库主要功能包括：模拟鼠标点击、滑动

hfuturer 2020-08-16

Nodejs 与 Golang 的比较：Web 开发人员选择哪个最佳？

全球的开发人员都关注技术趋势，这些技术最终将帮助他们在非常短的时间内设计出优秀的软件。Web 开发是发展最快的领域之一。每个行业都希望通过在线渠道扩展业务，以赢得更多的客户并加强营销。继续向下阅读，以了解有关平台发展的更多信息。此外，移动应用程序的顺利运

Lzs 2020-08-14

移动端跨平台技术之下的变与不变

跨 Native 与 Web：商品详情页等要求有一套功能差不多的 Web 页能够在端外访问，需要跨 Native App 与 Web. 容器化 Native 跨端：将 Native App 改造成标准化的容器，进而允许一套代码跨多端标准容器运行，如 Rea

一青年 2020-08-13

Web前端学多久能参加工作呢？

爱创课堂在各地开设了分校，很多慕名来的学员到爱创来学习前端，都能找到一份不错的工作。并且爱创对学员是非常负责任的，我们爱创学员就业有保障，入学签订就业协议，就业问题不用担心。爱创在学习中通过全面实战的教学理念，结合多个用人单位的项目对学员进行教学，学成后直

SHINESUNNY 2020-08-11

Web容器Web服务器及常见的Web容器有哪些？

　　首先来理解一下简单的一个请求发送到响应的过程。而我们的服务器通常要分为两个部分，一部分是服务器硬件，有了硬件之后还有有硬件上对应运行的软件。其次，服务器的硬件部分接收到了这一段请求，将其递交给对应的进程，服务器软件。此时这个服务器软件即为Web服务器，

lantingyue 2020-07-30

Web前端 Web前端和Web后端的区分

为什么jsp是后端呢？主要是jsp的运行原理是在tomcat服务器运行的。

元元 2020-07-30

WEB前端第十三课——浏览器内核、位置

　　在CSS中新的属性标准尚未明确的情况下，各浏览器厂商对新属性的支持情况也不相同，这个阶段会对属性加厂商前缀进行区分。　　根据不同的浏览器内核，CSS前缀有所不同，最基本的浏览器内核有四种，其他内核都是基于此四种进行再研发的。　　②Webkit内核，前缀

RainyX 2020-07-26

10个很棒的JavaScript库，提升Web开发效率

JavaScript是最流行的编程语言之一。过去的20年中程序员们见证了它的爆发式增长。现在，JavaScript几乎可以执行任何操作，并且可以在包括物联网在内的多个平台和设备上运行。其流行的原因之一是大量框架和库的可用性。作为程序员，拥有和使用正确的Ja

adentheima 2020-07-25

接口测试2-开发WEB接口

首先要安装flask包:pip install flask. 开发一个简单的API接口。# 3. 编写一个接口处理方法。@app.route # 4. 挂载路由, 声明接口接受的方法。# 3.1 从请求中获取参数。# 3.3 组装响应并返回。app.run

JessePinkmen 2020-07-19

web前端程序员代码编辑器推荐

Visual Studio Code中文版是微软推出的带 GUI 的代码编辑器，软件功能非常强大，界面简洁明晰、操作方便快捷，设计得很人性化。软件主要改进了文档视图，完善了对 Markdown的支持，新增php语法高亮。支持html、css、js、php的

学习web前端 2020-07-18

andrewwf

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号