让我们假设您有一堆来自用户的文本文档,并希望从中获得一些见解。例如,如果您是市场,则可以对某些商品进行数百万次评论。另一个可能的情况是,日常用户使用您的服务创建文本文档,并且您希望将这些文档分类到某些组中,然后向用户提出这些预测类型。听起来很酷,不是吗?令
对于文本分类问题,第一个挑战将是清理我们的数据并将其转换为计算机可以轻松理解的格式。考虑到我们必须根据它的内容找到一本书或一部电影的流派,我们首先要做的就是准备训练数据集。在这里我们有两种方法可以做到这一点,一种是simple bag of words 方
安科网(Ancii),中国第一极客网
Copyright © 2013 - 2019 Ancii.com
京ICP备18063983号-5 京公网安备11010802014868号