使用百度 AI 进行智能写诗 & 智能春联
注:本博客为博主在 百度 AI 社区 上分享的一篇文章,由于本博主也是作为一个学习者,所以如果文章中存在错误或者不适合的地方还请见谅。
先来一波推荐:
如果你也喜欢开发,欢迎加入百度 AI 开发平台的核心团队,分享自己的 idea,当然也是有福利的,具体信息访问以下链接:【招募令】核心团队在找最优秀的你! 。如果不介意的话可以说是我推荐的哟,本博主百度AI社区ID:busyboxs
我为什么要做这个小项目?
要说起我为什么要做这个小项目,其实要从我的学习生涯谈起。我本来是学深度学习图像处理的,所以经常关注深度学习相关的咨询。当然也喜欢将实际的理论知识用于实践中,在两年前,使用深度学习来对对联火了一段时间,我当时也关注了这个,印象比较深刻的是 王斌给您对对联 -_-!,这个是用 tensorflow 来实现的项目,但是由于我主要是做 CV 的,对于 NLP 很多东西不是很了解,所以没有深入去理解里面的网络结构。后来一次偶然的机会接触到了百度 AI 开放平台,看到里面有提供这个接口,所以打算尝试写一个我自己的对对联项目。所以这个小项目得以诞生,虽然可能还是由很多问题,并不完善,但是在写出这个小项目后还是蛮开心的。我从中也学会了一些新知识,比如 Flask 库的使用以及 request 相关的知识。我的小项目里也借用了 王斌给您对对联 -_-! 中的一些网页元素,在此对作者的分享表示感谢,同时感谢百度 AI 开放平台提供的接口,只是遗憾的是这个接口的免费调用次数有所限制。
百度 AI 目前提供了智能写作的接口,主要包括智能写诗接口与智能春联接口。具体的使用说明可以参考文档 https://ai.baidu.com/ai-doc/NLP/Nk3ippdkc.
智能写作接口说明
智能春联接口
智能春联是指根据用户输入的命题关键词自动生成一副春联,包括上联、下联和横批。
智能春联的请求参数如下表:
参数 | 是否必选 | 类型 | 描述 |
---|---|---|---|
text | 是 | string | 字符串(限5字符数以内)即春联的主题 |
index | 否 | int | 整数 默认为数值为0,即第一幅春联。每换一次,数值加1即可,一定数量后会返回之前的春联结果。 |
上面两个字符段是接口的输入,text
字数小于 5,是春联的主题。 index
可以用来指定生成的对联,不同的 index
可能会生成不同的对联。
智能春联的返回参数如下表:
参数 | 类型 | 描述 |
---|---|---|
couplets | object | object嵌套结构,对应返回的春联 |
+first | string | 春联上联:成7-9个字的上联 |
+second | string | 春联下联:生成7-9个字的春联下联 |
+center | string | 春联横批:生成4个字的春联横批 |
其输出为 json 字符串。例如:“春节”对应的一个输出为
{ 'couplets': { 'center': '迎春接福', 'first': '春节迎春新世纪', 'second': '福音报福小康年' } }
智能写诗接口
智能写诗是指根据用户输入的命题关键词自动生成一首7言绝句。
智能写诗的请求参数如下表:
参数 | 是否必选 | 类型 | 描述 |
---|---|---|---|
text | 是 | string | 字符串(限5字符数以内,)即作诗的主题 |
index | 否 | int | 整数 默认为数值为0,即第一首诗。每换一次,数值加1即可,一定数量后会返回之前的作诗结果 |
这两个输入字段和智能春联的两个输入字段相同,只是,text
代表诗的主题
智能写诗的返回参数如下表:
参数 | 类型 | 描述 |
---|---|---|
poem | array | 数组结构,元素对应7言绝句诗 |
+title | string | 诗名,即用户输入作诗主题 |
+content | string | 作诗结果:为一首7言绝句 |
其输出也是 json 字符串,例如:“百度”对应的一个输出为
{ "poem": [ { "title": "百度" "content": "神州百度庆元功 华夏千秋唱大风 伟业宏图开盛世 红旗锦绣耀长空" } ] }
错误码说明
错误码 | 错误信息 | 描述 |
---|---|---|
52000 | 成功 | 无 |
52001 | 请求超时 | 重试 |
52002 | 系统错误 | 重试 |
52003 | 未授权用户 | 检查您的appid是否正确 |
52004 | 输入解析失败 | 检查输入编码格式,有无特殊字符,是否是json格式 |
52005 | 输入字段有误 | 是否包含text字段 |
52006 | 输入文本长度有误 | 输入不能超过5个字符 |
52007 | 输入文本包含政治&黄色内容 | 换输入文本 |
52008 | 后台服务返回错误 | 重试 |
54003 | 访问频率受限 | 请降低您的调用频率 |
54100 | 查询接口参数为空 | 检查是否少传参数 |
54102 | 无写诗结果 | 重试 |
2 | 后端连接超时 | 重试 |
代码实现
本文使用 python3 来调用智能春联和智能写诗接口,接下来一步一步进行说明。
创建应用
首先进入到控制台,然后在“总览”下找到“产品服务” -> “人工智能” -> “自然语言处理”。
然后点击创建应用,填写好“应用名称”、“应用描述”,其他默认就行,然后点击“创建”。
创建好应用之后,进入“应用列表”,就能看到应用的相关信息,我们需要的是 API Key
和 Secret Key
。
获取 access token
通过 API Key
和 Secret Key
获取的 access_token
。更多关于 access_token
的获取方法参考 https://ai.baidu.com/ai-doc/REFERENCE/Ck3dwjhhu。
下面代码是 python3 获取 access_token 的代码
# 获取 token def get_token_key(): token_key = '' # client_id 为官网获取的AK, client_secret 为官网获取的SK client_id = '【百度云应用的AK】' client_secret = '【百度云应用的SK】' host = f'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials' f'&client_id={client_id}&client_secret={client_secret}' request = Request(host) request.add_header('Content-Type', 'application/json; charset=UTF-8') response = urlopen(request) token_content = response.read() if token_content: token_info = json.loads(token_content) token_key = token_info['access_token'] return token_key
token_content 中包含很多信息,例如输出如下(为了我个人信息安全,部分内容用 * 代替):
{'access_token': '****************************************', 'expires_in': 2592000, 'refresh_token': '*******************************************', 'scope': 'brain_nlp_sentiment_classify_custom public nlp_simnet nlp_wordemb ' 'nlp_comtag nlp_dnnlm_cn brain_nlp_lexer brain_all_scope ' 'brain_nlp_comment_tag brain_nlp_dnnlm_cn brain_nlp_word_emb_vec ' 'brain_nlp_word_emb_sim brain_nlp_sentiment_classify ' 'brain_nlp_simnet brain_nlp_depparser brain_nlp_wordembedding ' 'brain_nlp_dnnlm_cn_legacy brain_nlp_simnet_legacy ' 'brain_nlp_comment_tag_legacy brain_nlp_lexer_custom ' 'brain_nlp_keyword brain_nlp_topic brain_nlp_ecnet brain_nlp_emotion ' 'brain_nlp_comment_tag_custom wise_adapt lebo_resource_base ' 'lightservice_public hetu_basic lightcms_map_poi kaidian_kaidian ' 'ApsMisTest_Test权限 vis-classify_flower lpq_开放 cop_helloScope ' 'ApsMis_fangdi_permission smartapp_snsapi_base iop_autocar ' 'oauth_tp_app smartapp_smart_game_openapi oauth_sessionkey ' 'smartapp_swanid_verify smartapp_opensource_openapi', 'session_key': '*****************************', 'session_secret': '*******************************'}
而我们需要的只是 access_token
,因此只需获取该字段就行。
调用智能春联接口
调用智能春联接口的 python3 实现代码如下:
注:由于文档和接口有更新,请求 URL 有修改
如下
请求URL:https://aip.baidubce.com/rpc/2.0/creation/v1/couplets
请求URL: https://aip.baidubce.com/rpc/2.0/nlp/v1/couplets(邀测期用户)
# 调用百度 AI 智能春联接口(用于测试) def get_couplets(text, token_key, index=0): """ 调用百度AI智能春联接口,并生成横批、上联和下联 :param text: 智能春联的主题(官方限制不超过5个字) :param token_key: 通过调用 get_token_key() 获取的 token :param index: 不同的 index 会生成不同的春联 :return: 调用智能春联生成的数据 """ request_url = 'https://aip.baidubce.com/rpc/2.0/nlp/v1/couplets' params_d = dict() params_d['text'] = text params_d['index'] = index params = json.dumps(params_d).encode('utf-8') access_token = token_key request_url = request_url + "?access_token=" + access_token request = Request(url=request_url, data=params) request.add_header('Content-Type', 'application/json') response = urlopen(request) content = response.read() if content: data = json.loads(content) return data # 解析生成的春联 def parse_couplets(data): """ 解析调用智能春联生成的数据 :param data: 调用智能春联生成的有效数据 :return: 横批(center)、上联(first)和下联(second) """ center = data['couplets']['center'] first = data['couplets']['first'] second = data['couplets']['second'] # print(f'上联:{first}') # print(f'下联:{second}') # print(f'横批:{center}') return center, first, second
get_couplets
函数调用接口得到返回的值,parse_couplets
函数解析调用智能春联生成的有效数据。这里所说的有效数据是指调用接口没有发生错误的情况。在正确调用接口时,data 输出示例如下:
{ 'couplets': { 'center': '迎春接福', 'first': '春节迎春新世纪', 'second': '福音报福小康年' } }
是一个字典型数据,直接进行解析就能得到横批、上联和下联。如果想要获取同一主题不同的对联,可以尝试不同的 index
。
当调用接口失败时,就会得到无效的 data,通过解析 data,能够获得错误信息,下面是解析错误的代码,能够返回对应错误的中文描述。
# 错误代码 ERROR_DICT = { '2': '后端连接超时请重试', '52001': '请求超时请重试', '52002': '系统错误请重试', '52003': '未授权用户', '52004': '输入解析失败', '52005': '输入字段有误', '52006': '输入文本长度不超过5', '52007': '输入文本包含政治&黄色内容', '52008': '后台服务返回错误请重试', '54003': '访问频率受限', '54100': '查询接口参数为空', '54102': '无写诗结果请重试' } # 解析是否调用接口错误,如果有返回对应的提示,没有返回None def parse_error(data): """ 解析是否调用接口错误 :param data: 调用接口生成的数据 :return: 如果出错,返回对应的错误信息,否则返回None """ if 'error_code' in data: code = data['error_code'] error = ERROR_DICT[str(code)] return error return None
调用智能写诗接口
调用智能写诗接口的 python3 实现代码如下:
注:由于文档和接口有更新,请求 URL 有修改
如下
请求URL:https://aip.baidubce.com/rpc/2.0/creation/v1/poem
请求URL: https://aip.baidubce.com/rpc/2.0/nlp/v1/poem(邀测期用户)
# 调用百度 AI 智能写诗接口(用于测试) def get_poem(text, token_key, index=0): """ 调用百度AI智能写诗接口,并生成七言诗 :param text: 智能写诗的主题(官方限制不超过5个字) :param token_key: 通过调用 get_token_key() 获取的 token :param index: 不同的 index 会生成不同的七言诗 :return: 调用智能写诗生成的数据 """ request_url = 'https://aip.baidubce.com/rpc/2.0/nlp/v1/poem' params_d = dict() params_d['text'] = text params_d['index'] = index params = json.dumps(params_d).encode('utf-8') access_token = token_key request_url = request_url + "?access_token=" + access_token request = Request(url=request_url, data=params) request.add_header('Content-Type', 'application/json') response = urlopen(request) content = response.read() if content: data = json.loads(content) return data # 解析生成的诗句 def parse_poem(data): """ 解析调用智能写诗生成的数据 :param data: 调用智能写诗生成的有效数据 :return: 诗的题目(title)和诗的内容(content) """ title = data['poem'][0]['title'] poem = data['poem'][0]['content'].replace('\t', '\n') # print(title) # print(poem) return title, poem
在正确调用接口时,data 输出如下:
{ "poem": [ { "title": "百度" "content": "神州百度庆元功 华夏千秋唱大风 伟业宏图开盛世 红旗锦绣耀长空" } ] }
是一个字典型数据,直接进行解析就能得到题目和内容。如果想要获取同一主题不同的诗,可以尝试不同的 index
。
案例应用
本文进一步通过网页的形式将上述功能进行实现,使用Flask来部署。
首先创建一个文件夹 flaskr,该文件夹下有一个名为 static 的文件夹,用于存放 css 样式和背景图片,还有一个文件夹名为 templates 用于存放 html 网页,另外还有一个 python 文件,用于执行 flask。
以下是 Flask 相关代码
from flask import Flask, render_template, request, redirect, url_for, session from flaskr.poem import nlp_result, parse_error, parse_couplets, parse_poem import random app = Flask(__name__) token_key = '【你获取的token】' @app.route("/", methods=('GET', 'POST')) def index(): if request.method == 'POST': couplets = request.form.get('couplets') if couplets is not None: return redirect(url_for('get_couplets')) poem = request.form.get('poem') if poem is not None: return redirect(url_for('get_poem')) return render_template('couplets/index.html') @app.route("/couplets", methods=('GET', 'POST')) def get_couplets(): if request.method == 'POST': center = None first = None second = None title = request.form.get('theme') back = request.form.get('back') if back == '返回': return redirect(url_for('index')) index = random.randint(0, 10) data = nlp_result(title, token_key, index, way='couplets') error = parse_error(data) if not error: center, first, second = parse_couplets(data) return render_template('couplets/show.html', center=center, first=first, second=second, title=title, error=error) return render_template('couplets/base.html') @app.route("/poem", methods=('GET', 'POST')) def get_poem(): if request.method == 'POST': title = None poem = None title = request.form.get('theme') back = request.form.get('back') if back == '返回': return redirect(url_for('index')) index = random.randint(0, 10) data = nlp_result(title, token_key, index, way='poem') error = parse_error(data) if not error: title, poem = parse_poem(data) return render_template('couplets/poem_show.html', title=title, poem=poem, error=error) return render_template('couplets/poem_index.html') if __name__ == '__main__': app.run(debug=True)
该代码中有三个函数,分别对应三个界面,如果运行地址为 http://127.0.0.1:5000/
,那么三个界面对应的网址分别为 http://127.0.0.1:5000/
、http://127.0.0.1:5000/couplets
和 http://127.0.0.1:5000/poem
。表示主页、对联页和写诗页。
其效果展示如下:
处理错误信息的效果展示如下: