Python爬虫实践 —— 3.利用爬虫提取返回值，模拟有道词典接口

zhouhaihua00

2019-12-15

有道词典的web接口，实际上可以用爬虫模拟，输入key，拼接为有道词典接口的formdata，爬取返回值，实际为Ajax动态生成的translation，这样外部来看实现了翻译接口的模拟，相当于爬虫模拟浏览器调用了有道词典web接口，其实讲真的话来说，直接调用有道web接口，传json参数就可以了，不用这么费事，但爬虫模拟了人登陆web，输入关键词，获得翻译结果的过程。

浏览器输入操作，解析有道词典翻译的web接口url和格式

Python爬虫实践 —— 3.利用爬虫提取返回值，模拟有道词典接口

#爬虫模拟调用有道词典web接口调用
from urllib import request
from urllib import parse
import re


class YoudaoTranslator:

    def __init__(self, key):
        self.key = key

    def __getData(self):
        # 构造 有道词典web接口所需的Form data
        formdata = {
            "i": self.key,
            "from": "AUTO",
            "to": "AUTO" ,
            "smartresult": "dict",
            "client": "fanyideskweb",
            "salt": "15763837022114",
            "sign": "2b12fd214e066f53bc3455a126d7a509",
            "ts": "1576383702211",
            "bv": "5575008ba9785f184b106838a72d6536",
            "doctype": "json",
            "version": "2.1",
            "keyfrom": "fanyi.web",
            "action": "FY_BY_REALTlME"
        }
        data = parse.urlencode(formdata).encode(encoding="utf-8")
        return data

    def __getPage(self):
        #获得模拟浏览器请求，获得Ajax返回值
        header = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.79 Safari/537.36"}
        url = "http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule"

        req = request.Request(url, data=YoudaoTranslator.__getData(self), headers=header)
        res = request.urlopen(req).read().decode()
        return res

    def __Pat(self):
        #解析ajax返回json字符串，正则匹配获取翻译值
        pat = r‘"tgt":"(.*?)"}]]‘
        result = re.findall(pat, YoudaoTranslator.__getPage(self))
        print(result[0])
        return result

    def Translator(self):
        YoudaoTranslator.__Pat(self)


if __name__ == ‘__main__‘:

    i = YoudaoTranslator("人格心理学")
    i.Translator()

然后是运行结果

Python爬虫实践 —— 3.利用爬虫提取返回值，模拟有道词典接口

有道 python python爬虫接口 formdata

zhouhaihua00

0 关注 0 粉丝 0 动态

相关推荐

Python反编译调用有道翻译（附完整代码）

网易有道翻译是一款非常优秀的产品，他们的神经网络翻译真的挺无敌。无奈有道客户端实在是太难用了，而且在某些具体场景无法使用，而有道的云服务又特别的贵，一般人是无法支付得起的。然而理论上而言，所有看得见的东西都是爬得到的，有道翻译接口也一样。为了祖国未来花

Airuio 2020-02-13

分享AI有道干货 | 126 篇 AI 原创文章精选（ML、DL、资源、教程）

今天，红色石头特此将以前所有的原创文章整理出来，组成一个比较合理、完整的机器学习、深度学习的学习路线图，希望能够帮助到大家。机器学习实用指南：这些基础盲点请务必注意！2018 最好的机器学习实用指南书籍来了！干货 | 机器学习正在面临哪些主要挑战？机器学习

AmbiRF 2019-11-19

eclipse查看英文源码时有道词典划词问题

由于英文水平不太好，所以使用eclipse查看英文源码时总是先把单词或句子复制下来然后贴到有道词典里边去查询，但是这样做的效率很低，需要不停复制粘贴，真的很累。有道词典其实也蛮强大的，基本上大部分软件都能进行划词翻译，但是就是不支持这个eclipse，猜想

SUDevops 2019-11-03

Python制作有道翻译小工具

之后request响应网页，并分析网页，定位到翻译结果。期间遇到的一个问题则是如何刷新翻译的结果，否则的话会在text里一直累加翻译结果。于是，在mainloop里面用到了T1.delete方法，来每次删除TEXT里的内容。‘smartresult‘: ‘

wordmhg 2019-10-19

90天净赚100多万，90后农村小伙致富有道，轻松抱得美人归

TyroneYang 2019-10-20

Python 20行简单实现有道在线翻译的详解

主要是尝试简单的使用pyhton的爬虫功能，于是使用有道进行尝试，并没有进行深入的诸如相关api的调用。

Laozizuiku 2019-05-15

详解Python3网络爬虫(二)：利用urllib.urlopen向有道翻译发送数据获得翻译结果

上一篇内容，已经学会了使用简单的语句对网页进行抓取。接下来，详细看下urlopen的两个重要参数url和data，学习如何发送数据data. url也可以是一个Request对象，这就需要我们先定义一个Request对象，然后将这个Request对象作为u

sharkandshark 2019-05-07

百度，来一场华丽的视觉盛宴吧

　据媒体报道，黑莓CEO海因斯指出：“我觉得，历史正再次重演。在这个行业中，创新的速度如此之快。如果你不迅速创新，很快就会被淘汰。iPhone用户界面的开创性应该受到尊重，但现在它已经5年未变了。”苹果iPhone以其迅雷不及掩耳之势，在短短几年内上演逆袭

ibatsiSpring 2013-06-01

将网站免费推广到百度、谷歌、雅虎、新浪、有道等搜索引擎

百度网友反馈提交入口。雅虎网站收录提交入口

AIOps智能运维 2011-05-11

[转]实时搜索——搜索引擎的未来

时下，以Twitter为代表的实时网络成为互联网最热门的应用领域之一，而正是基于网民对新兴资讯速度和实时性的更高要求，搜索引擎领域应需而动，“实时搜索”概念应孕而生。　　此前曾经有一个号称Google杀手的Wolfram Alpha引擎，它的目标就是直接给

冬冬阳光 2010-07-13

云栖专辑 | 阿里开发者们的第7个感悟：做一件事情，需要有道有术

2015年12月20日，云栖社区上线。2018年12月20日，云栖社区3岁。阿里巴巴常说“晴天修屋顶”。在我们看来，寒冬中，最值得投资的是学习，是增厚的知识储备。12月28日，做一件事情，需要有道有术。先后研发上万台Hadoop、ODPS集群；先后负责阿里

libinhai0 2019-06-30

必应、谷歌、百度、搜狗、有道、奇虎主流搜索对比

百度搜的什么狗屁东西，我需要你给我翻译了吗？搜狗、奇虎还行，但比不过必应和谷歌，或许我搜中文的会好点。

nutian 2012-11-22

APKBUS携手程序员们庆端午

————————————————————————————————————————————————————————————————————————————————————

齐北的小村 2013-06-11

Android巴士转发

———————————————————————————————————————————————————————————————————————————————————————————

luoj 2013-06-11

自动化测试用例编写守则

先来说下一般自动化测试的流程，今天一个朋友也问过我这个问题，就顺便说说。在这些过程中，其实关键的地方的地方在于测试设计，包括测试用例、测试脚本架构及测试组织等。首先，我们要确定一点，就是自动化的目的和作用。当测试用例不断完善之后，就可以抽取部分测试用例来进

Dataleon 2013-01-14

大数据驱动下的有道词典广告传播

目前，有道词典已拥有近4亿用户，将近2亿的手机端用户，月活跃用户数量超过7000万，成为拓展视野、探索世界的平台。而有道词典的用户集中在80后和90后“国际人”群体当中，他们有朝气，受过良好的教育，拥有坚实的消费基础和多元的消费潜力。目前有道词典正在尝试，

jiahaowanhao 2015-12-10

百度云怎么收藏网页文章和图片就像有道云笔记一样

百度云是百度推出的基于“云”端存储的新一代工具，提供了众多实用功能，如网盘、相册、通讯录、手机找回等功能，当然也包含了收藏网页文章及图片的功能，可以像有道云笔记那样一键保存网页内容。添加完成后，您就可以在插件栏看到“百度云收藏”工具了。

努力练功不自宫 2014-07-02

在AI+教育的黄金赛道，网易有道如何践行进阶之路

「未来 30 年，通过吞下一粒药丸你就可以学习一门课程，因为它可以通过血液进入大脑。」两年前，在一次 TED 演讲上，美国计算机专家尼葛洛庞帝曾对未来的教育如是预言。虽然生物科技尚未完成这种颠覆，但近年来红透天的 AI 技术对于教育的改变却已展露苗头。

bufsin 2019-04-23

扣丁学堂Python培训简述Python调用有道api接口的方法有哪些

def youdao: #c 1 翻译 2查词。#textx=text.decode.encode #将gbk编码转utf-8 编码有道api要求传入 utf-8 编码。url="接口" #这个链接自己申请哈。title='『小风翻译

zupzng 2019-03-15

网易有道andorid程序员两轮面试，这些问题你能答上几个？

近日，w3cschool app开发者头条分享了网易有道andorid实习面经。引来了不少安卓开发程序员的围观，大家认为这些面试题难度有点高。w3cschool在给小伙伴们分享网易有道andorid实习面经前，先跟大家分享一些andorid学习和进阶的方法

haishizi 2018-02-13

zhouhaihua00

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号