Simon 是一个开源的语音识别系统,它不仅可以输入文字,而且可以代替键盘、鼠标操作电脑。Simon 基于 Qt 用 C++ 开发,因为某些支持库与 KDE 相同,所以可完美的集成到 KDE 4 中。除 KDE 之外,Simon 也可在 GNOME、Xfce、及其他 X11 环境下运行。
# TTS/语音合成和处理
FreeSWITCH团队宣布支持开源的BroadVoice语音编解码–窄带8kKZ的BV16和宽带16kHZ的BV32。BroadVoice2.1使用LGPL发布,完全免费,因而被广泛使用在许多开源的电话系统中。* 适当的比特率 - 编码效率很高Bradvoice编码是自去年以来第三个加入FreeSWITCH的高清语音编码,其它两个免费、高质量的语音编码是CELT和G.722。
至于为什么叫Vekou,我也不知道,唯一想了一分钟多的是用什么字母开头,i是苹果,z和m、w都是微软,k是相机和胶卷,d像狗,所以还是v 比较有型一点,然后随手就把后面几个可以连在一起发音的字母敲出来了。Vekou读作'vekau,项目进行了一段时间以后才突然想起需要一个比较像样的名,一开始建eclipse项目名用的还是speech synthesis。Vekou目前虽然发音质量不是相当好,但基本上还可以工作了。
OpenEars is an open-source iOS library for implementing round-trip English language speech recognition and text-to-speech on the iPhone and iPad, which uses the CMU Pocketsphinx, CMU Flite, and MITLM libraries.
# iOS/iPhone/iPad开发包 # TTS/语音合成和处理
SpeakRight 是一个 Java 框架,用于编写语音识别应用,基于 VoiceXML 技术。使用 StringTemplate 模板引擎自动生成 VoiceXML 文档。
基于字的N-gram和上下文相关的HMM模型,它可以进行几乎实时实时解码目前大多数电脑在60K字听写任务。完全纳入,如树的N-gram词汇,保,跨词的上下文依赖处理,包围梁搜索,高斯修剪,高斯的选择,除了搜索效率等各大搜索技术,它也是模块化小心从模型结构独立,如共享状态triphones的和并列混合模型与任意数量的混合物,州或手机,支持各种HMM的类型。
语音特征向量:采用MFCC系数模式匹配模型:采用GMM模型本程序为课程实验验证开发,所实现的声纹识别算法难免有错误及不妥之处!
Audible TTS可以通过发声的方式从其他应用程序,剪贴板,或从文本文件读取文本内容。它可以从应用程序如Feedme或k9-Mail,剪贴板,或者MicroSD卡上的文件获取文本。它还可以在混合文本中使用适当的语言和声音读取每个句子,而不必手动选择它。您必须已经安装了一个语音合成器和声音要使用的语言。目前支持德语、英语、西班牙语、法语、意大利语、俄罗斯、韩国、中国和日本。
Dragonfly 是一个用 Python 开发的语音识别框架。提供高级对象模型,可编写简单脚本来实现语音的识别。当前支持语音识别引擎有:Dragon NaturallySpeaking , a product of Nuance, Window Speech Recognition , as included in Microsoft Windows Vista.
基于 Google 开源的 WebRTC 的音频和视频核心引擎开发的开源语音和视频框架, 包含服务器和客户端两部分, 可用于开发类似YY, QTalk等软件.
AISEntry的目标是建立一个自然沟通方式的Android程序或ROM,目标是实现人工智能在产品上的集成。不过,目前先以服务用户,方便使用为目的,利用讯飞语音+,实现使用Android端程序本地文本朗读和朗读PC端选中文本的功能。在日常生活中,方便用户听新闻、文章。欢迎广大人工智能爱好者一起加入开发。
JuliusJS JavaScript 语音识别库
Kaldi 是一个语音识别工具。使用 C++ 开发,基于 Apache 许可证。目的是为语音识别研究者提供。Kaldi's versus other toolkitsKaldi is similar in aims and scope to HTK. The goal is to have modern and flexible code, written in C++, that is easy to modify and extend. Important features include:. We i
Voix.JS 是一个 JavaScript 库,可为你的网站、应用和游戏增加了语音命令的功能,目前只支持 Chrome 浏览器。
Pocketsphinx.js 是一个在浏览器上通过纯 JavaScript 实现语音识别的功能,支持 Chrome 和 Firefox 浏览器。提供录音的功能。
简介govpr是golang 实现的基于 GMM-UBM 说话人识别引擎,可用于语音验证,身份识别的场景. 目前暂时仅支持汉语数字的语音,语音格式为wav格式
安科网(Ancii),中国第一极客网
Copyright © 2013 - 2019 Ancii.com
京ICP备18063983号-5 京公网安备11010802014868号