基于SGD、ASGD算法的SVM分类器（OpenCV案例源码train_svmsgd.cpp解读）

baike

2020-03-06

此案例用于二分类问题（鼠标左键、右键点出两类点，会实时画出分界线），最终得到一条分界线（直线）：f(x)=weights*x+shift

源码不再贴出，只讲解最核心的doTrain()里的内容。参数含义翻译自ml.hpp文件。

与SVM不同，SVMSGD不需要设置核函数。

【参数】默认值见下述代码

模型类型：SGD、ASGD（推荐）。随机梯度下降、平均随机梯度下降。
边界类型：HARD_MARGIN、SOFT_MARGIN（推荐），前者用于线性可分，后者用于非线性可分
边界规范化 lambda：推荐设为0.0001（对于SGD），0.00001（对于ASGD）。越小，异类被抛弃的越少。
步长 gamma_0
步长降低力度 c：推荐设置为1（对于SGD），0.75（对于ASGD）
终止条件：TermCriteria::COUNT、TermCriteria::EPS、TermCriteria::COUNT + TermCriteria::EPS

参数设置函数：

setSvmsgdType()
setMarginType()
setMarginRegularization()
setInitialStepSize()
setStepDecreasingPower()

【使用方式】

cv::Ptr<SVMSGD> svmsgd = SVMSGD::create();//创建对象
svmsgd->train(trainData);//训练
svmsgd->save("MySvmsgd.xml");//保存模型
svmsgd->load("MySvmsgd.xml");//加载模型
svmsgd->predict(samples, responses);//预测，结果保存到responses标签中

bool doTrain(const Mat samples, const Mat responses, Mat &weights, float &shift)
{
    //*创建SVMSGD对象
    cv::Ptr<SVMSGD> svmsgd = SVMSGD::create(); //创建SVMSGD对象
    //*设置参数，以下全是默认参数
    //svmsgd->setSvmsgdType(SVMSGD::ASGD); //模型类型
    //svmsgd->setMarginType(SVMSGD::SOFT_MARGIN); //边界类型
    //svmsgd->setMarginRegularization(0.00001); //边界规范化
    //svmsgd->setInitialStepSize(0.05);//步长
    //svmsgd->setStepDecreasingPower(0.75); //步长减弱力度
    //svmsgd->setTermCriteria(TermCriteria(TermCriteria::COUNT,1000,1e-3));//终止条件，1000次迭代，0.001每次迭代的精度
    //*训练集
    cv::Ptr<TrainData> trainData = TrainData::create(samples, cv::ml::ROW_SAMPLE, responses);
    //*训练
    svmsgd->train(trainData);

    if (svmsgd->isTrained()) //获取分界线的系数，f(x)=weights*x+shift
    {
        weights = svmsgd->getWeights();//x系数
        shift = svmsgd->getShift();//常数项
        //*保存模型
        svmsgd->save("svmsgd.xml"); //保存训练好的模型
        
        return true;
    }
    return false;
}

得到的xml中，weights有两个数，shift有一个数。

基于SGD、ASGD算法的SVM分类器（OpenCV案例源码train_svmsgd.cpp解读）

f(x)=weights*x+shift，不可以理解为y=kx+b，应该理解为Ax+By+C=0。weights的两个数就是A、B，shift是C。

Mat weights(1, 2, CV_32FC1); weights是一个1*2的向量，x也是1*2的向量（xi,xj）也就是(x,y)坐标。

公式写全了就是：f(x)=weights1*xi+weights2*xj+shift，其实就是weights与x这两个向量的内积（对应相乘在求和）

f(x)如果等于0，说明点在此直线上，大于0就在线的一边，小于0在线的另一边。

sgd svm算法分类器

安科网

基于SGD、ASGD算法的SVM分类器（OpenCV案例源码train_svmsgd.cpp解读）

baike

baike

相关推荐

随机梯度下降法（Stochastic gradient descent, SGD）

使用SGD(Stochastic Gradient Descent)进行大规模机器学习

全局最优解？为什么SGD能令神经网络的损失降到零

腾讯AI Lab误差补偿式量化SGD：显著降低分布式机器学习通信成本

Python语言描述随机梯度下降法

监督学习：随机梯度下降算法（sgd）和批梯度下降算法（bgd）

baike