一网打尽成语歇后语，GitHub新华字典数据库

张亚京

2018-07-30

关注关注

大数据文摘出品

作者：蒋宝尚

今天，文摘菌给大家推荐一个非常优秀的数据库——新华字典数据库。

数据库收录了包括14032条歇后语，16142个汉字，31648个成语。下面文摘菌就简单的介绍一下这个数据库。

这个数据库放在GitHub中，所有的数据放在data/目录下，并且如果对性能没有要求的同学，可以使用作者的新华字典API访问数据库。

数据库地址：

https://github.com/pwxcoo/chinese-xinhua

项目结构

在GitHub中，整个新华字典数据库的项目结构为：

一网打尽成语歇后语，GitHub新华字典数据库

整个结构包括数据文件夹，配置文件以及脚本文件夹，在脚本文件夹下提供了成语脚本和汉字脚本以及歇后语脚本的下载。

数据库介绍及API的使用

前面提到，整个数据库包括14032条歇后语，16142个汉字，31648个成语。

在使用API查询每条成语的时候，分为两种情况：

如果直接请求成语，需要两个参数：
type=idiom 表示需要请求成语
word=兴高采烈表示请求的成语
请求拼音首字母缩写，也需要两个参数：
type=idiom 表示需要请求成语
word=xgcl 表示请求的成语拼音首字母缩写

下面文摘菌用Python简单实现了一下：

一网打尽成语歇后语，GitHub新华字典数据库

返回结果为：

一网打尽成语歇后语，GitHub新华字典数据库

上图可知，当你请求的是成语时，返回的结果包括：成语的来源、成语的解释、成语的拼音、用成语造的句子以及成语的首字母缩写。

当访问歇后语的时候则也需要两个参数：

type=xiehouyu 表示需要请求歇后语
riddle=王婆表示请求的歇后语的语面。可以模糊匹配

Python实现

一网打尽成语歇后语，GitHub新华字典数据库

由上图的Python实现可知，当你输入的关键词是模糊的时候，结果会返回带有关键词的所有歇后语。例如，你查询关键词为王婆的歇后语，返回了三条结果，每条结果包含歇后语的迷面以及歇后语的谜底。

当需要访问汉字的时候，当前接口只能直接请求汉字，不能请求拼音。如果请求了拼音，则返回的结果为空。

请求汉字需要两个参数：

type=word 表示需要请求汉字
word=“蒋” 表示请求的汉字

Python实现

一网打尽成语歇后语，GitHub新华字典数据库

如上图所示，当请求‘蒋’这个汉字的时候，返回的结果包括汉字的拼音、汉字的来源、以及汉字的繁体版等等。

注：GET、POST均可，返回数据格式为JSON。

数据库GitHub地址：

https://github.com/pwxcoo/chinese-xinhua

新华字典歇后语数据库

张亚京

0 关注 0 粉丝 0 动态

关注关注

跟老齐学Python之字典，你还记得吗？

字典，这个东西你现在还用吗？随着网络的发展，用的人越来越少了。不少人习惯于在网上搜索，不仅有web版，乃至于已经有手机版的各种字典了。我曾经用过一本小小的《新华字典》。《新华字典》是中国第一部现代汉语字典。最早的名字叫《伍记小字典》，但未能编纂完成。从19

LHpython 2019-04-16

评论：新华字典App收费是种讽刺免费开放又何妨

但是，有用户反映，在查询两个字后，App便弹出提示要求购买完整版，充值金额至少为40元。有不少网友表示，这款App比纸质版售价高了不少，价格上并不亲民。对此，商务印书馆相关负责人表示，收费和定价的参考依据是版权和软件开发的成本。近日，科技部首次针对此事公开

W3C CSS 2017-06-25

新华字典设下40元付费门槛打情怀牌的字典产品？

你有多久没用《新华字典》查生僻字词，这本立志为民族文化普及和知识传播建功的字典，离开小、初高中学校，真的就此失去用户和使用场景了吗？日前，《新华字典》推出了APP，从1953年的最初版，至2011年的第十一版，这本世界出版史上发行量最高的字典，在耳顺之年，

80652319 2017-06-17

《新华字典》App，卖的是字典还是情怀？

一天只能免费查两个字，想要多查阅需要至少花费40元，《新华字典》App一经推出就引发了热议。有记者从苹果商店看到，该App上线4天虽然吸引大批网友下载，但评分仅为两颗星。此次引发最大争议点在定价和充值方式上。相形之下，目前第11版《新华字典》双色本在网上售

网络游戏 2017-06-15

新华字典App 初探收费路

小学时代人手一本的《新华字典》出官方App了。由商务印书馆出版、中国社科院语言所修订的新华字典App日前正式登陆苹果应用商店。和纸质版一样的红底白字的经典版式，只是新华字典App的logo上硕大的“正版”二字相当显著。值得一提的是，李瑞英对每一个汉字提供的

BAT 批处理程序 2017-06-14

新华字典App被指收费价格高回应：买的是服务

近日，由商务印书馆官方出版，中国社科院语言所修订的《新华字典》App上线。据介绍，该App提供数字版纸版对照、原《新闻联播》播音员李瑞英播读、汉字规范笔顺动画等增值服务。但《新华字典》App的免费版每天只能查2个字的情况引发争议，App的开发方表示，因涉及

BAT 批处理程序 2017-06-13

安科网

一网打尽成语歇后语，GitHub新华字典数据库

张亚京

张亚京

相关推荐

跟老齐学Python之字典，你还记得吗？

评论：新华字典App收费是种讽刺免费开放又何妨

新华字典设下40元付费门槛打情怀牌的字典产品？

《新华字典》App，卖的是字典还是情怀？

新华字典App 初探收费路

新华字典App被指收费价格高回应：买的是服务

张亚京