今天应学弟要求,又回顾了下LDA模型,陡然发现之前弄懂弄通的一些地方竟然开始有些生疏,果然还是得记录总结。如何自动的从一批文档中,找出文档表达的n个主题思想?LDA模型的假设基础就是:关键词在文档中出现的概率 = 关键词在主题中出现的概率 * 主题在文档中
x<-rbinom #做1次试验,假设正面概率为0.5,进行5次观察,每1次试验中正面出现的次数为别为 0 0 1 1 0. z<-pbinom #累计概率 小于等于50的概率为0.5397946. summary #汇总数据包括 最小
安科网(Ancii),中国第一极客网
Copyright © 2013 - 2019 Ancii.com
京ICP备18063983号-5 京公网安备11010802014868号