[机器学习]第六、七周记录

这篇记录的内容来自于Andrew Ng教授在coursera网站上的授课。 


1.不要浪费大量的时间在获得样本上。实际上,太多的样本数并不会使学习算法更加的优秀。要尝试调整你的系数:

1.使用更少的特征。

2.增加多项式。

3.调整$\lambda$。

2.诊断学习算法:

1.将样本打乱,并将其中一部分作为训练样本,剩下的作为测试样本,来判断是否出现了过拟合。

2.将样本划分为三类:训练集,交叉验证(cross validation,cv)集,测试集。对于线性回归,训练集来得出相应次数下的theta,交叉验证集来比较这些theta,获得最好的模型,测试集继续训练模型。


1.支持向量机(support vector machine,SVM):

相关推荐