摩西
互联网运营
1、libsvm和liblinear
在特征维度是几万以上级别的前提下,libsvm只能训练几万条样本。而liblinear对于百万级别的样本数量,速度很快,千万级别有点吃力。liblinear对于libsvm的缺点就是,不能使用核函数,libsvm也正是这点所以耗性能。
2、Xgboost
xgboost是gbdt算法的实现,可以做回归,分类,和排序。支持各种语言调用,支持单机和分布式,支持libsvm的稀疏矩阵的数据格式,非常适合于大规模数据集。
参考文章:https://zhuanlan.zhihu.com/p/20366456
78
52
2017-05-03