注册

我们想用用户画像工具,各位专家有哪些靠谱的推荐?

1 579 2016-04-25
互联网+战略
请输入500字内的献计内容
我来献计
摩西 互联网运营
1、libsvm和liblinear
在特征维度是几万以上级别的前提下,libsvm只能训练几万条样本。而liblinear对于百万级别的样本数量,速度很快,千万级别有点吃力。liblinear对于libsvm的缺点就是,不能使用核函数,libsvm也正是这点所以耗性能。
2、Xgboost
xgboost是gbdt算法的实现,可以做回归,分类,和排序。支持各种语言调用,支持单机和分布式,支持libsvm的稀疏矩阵的数据格式,非常适合于大规模数据集。
参考文章:https://zhuanlan.zhihu.com/p/20366456
78 52 2017-05-03
图片验证码
×