美国购物平台Stitch Fix王建强:数据驱动的决策辅助与产品智能化
王建强· Stitch Fix数据科学总监
问及经历,才知道他曾于Twitter就职,负责广告推荐算法相关工作。对于为什么放弃大企业而选择初创公司,他这样回答:大公司跟小公司其实各有优劣,一般在大公司工作待遇会好生活稳定,但同时大公司就不像小公司有那么多的挑战,在大公司可能会做比较局限于某一块的工作。但是你如果到小公司的话,个人会有更大的发展空间。
Stitch Fix的商业模式和业务流程
王建强表示,加入Stitch Fix,主要因素是欣赏Stitch Fix的商业模式。Stitch Fix商业模式和Netflix早期的商业模式很相似,约2004、2005年Netflix商业模式主要是用户可以在网上建一个队列,自己想看的电影,建这样一个队列以后,Netflix会把电影寄到用户的家来。Stitch Fix也是采用直邮的模式,只不过它是电商+直邮+推荐。
Stitch Fix是一个在线个性化服装推荐公司。用户注册后,系统会推荐一些衣服寄到家里,用户根据自己的兴趣偏好决定要不要购买这些衣服。Stitch Fix主要解决用户的购物痛点,如在我们生活中大部分人都非常忙碌,没有时间上街购物。有些用户可能想发掘新的穿着偏好,或是一些穿搭的体会,另外还有很多追随时尚潮流的人,想试用一下这样的场景。公司有三百左右的全职员工,还有近两千的兼职造型师。公司会提供造型师平台,以便于这些人随时随地工作,每周工作十小时以上即可。
Stitch Fix的业务模式
当问及Stitch Fix的业务模式,王建强表示,从用户的方面看,用户需要填写个人风格问卷,问卷会涉及购买衣服时会考虑到的常规问题,如颜色、价格、尺寸等等。Stitch Fix会搜集用户个人风格问卷,通过算法和造型师建议结合起来进行推荐。之后,用户会收到五件不同的衣服,可在方便的地方试穿及与其他衣服搭配,喜欢留下来,不喜欢退回。
从Stitch Fix角度看,需要做三件事情:其一,当用户发来需求,看哪个仓库能满足需求的同时还要考虑运费,投递时间等。其二,做用户和造型师匹配。这些会考虑到交易历史和用户给造型师打分等。其三,是做人货匹配,可以理解为是比较传统的机器学习算法。
Stitch Fix的参考特征和推荐算法
王建强表示,基于现有的业务模式,主要参考用户特征、产品特征以及历史交易数据。用户特征包括问卷特征,这里值得一提的是,Stitch Fix在收集用户信息时,会用一个相对较长的文件调查收集用户在购物时方方面面的信息且用户也很愿意分享自己的信息,区别于一些社交网络,如在微博这种社交网站上,用户对于暴露隐私这件事很介意。相反Stitch Fix这样一个购物平台,用户会觉得如告知Stitch Fix更多个人信息了,就可做更精准推荐。故某种程度上,Stitch Fix跟用户出发点是一致的,所以可得到更高质量,更多数量的用户偏好数据。产品特征就是通过深度神经网络学习得到的特征,把每一个产品的图片放到深度神经网络里,然后生产的一些进程,对每一件产品的进程可以计算产品相似度矩阵,这样一来,就可做一些接近推荐。
在算法方面,Stitch Fix主要是在开源库的基础上自研,这样的模式比较像脸书。Stitch Fix开发了关于推荐方面的很多算法,如基于逻辑回归、分类树、还有基于Factorization Machine,就是把协同过滤跟基于特征的建模结合在一起,且factorization machine可处理稀疏的特征,还有一些比较稠密的特征,所以说相当于是二合一的模型。
人机协同 1+1>2
人和货匹配时采用的是人机协同的方式,不是纯粹靠机器算法,也不是纯粹靠人工。首先用算法做一个扫描,对大量的库存数据进行筛选并排序,解决人工面对海量库存耗时筛选的难点。其次,可从试穿环节找到模式,如发现某一类衣服可能深受某个年龄段用户的钟爱。同时做数据降噪,如不同造型师挑选会有差异,导致系统质量很难保证,这就要通过算法做进一步筛选,从某种程度上保证大家最后挑选衣服的质量。