4000336031 微信 li1377174255

贵阳大数据培训学校

这一年来,数据科学家都用哪些算法?

来源:贵阳大数据培训学校 发布时间:2017/2/12 10:32:04

在“数据为王”的今天,越来越多的人对数据科学产生了兴趣。数据科学家离不开算法的使用,那么,数据科学家较常用的算法,都是哪些呢?

较近,的资料探勘信息网站 KDnuggets 策划了十大算法调查,这次调查对数据科学家常用的算法进行,并发现较“产业”和较“学术”的算法,还对这些算法在过去 5 年间(2011~2016)的变化,做了一番详细的介绍。

这次调查结果,是基于 844 名受访者投票整理出来。

KDnuggets 总结出十大算法及其投票份额如下:

图1:数据科学家使用的十大算法和方法

请参阅文末的所有算法和方法的完整列表。

从调查中得知,受访者平均使用 8.1 个算法,与 2011 年的一项类似调查相比大幅提高。

与用于数据分析/数据挖掘的 2011 年投票算法相比,我们注意到流行的算法仍然是回归算法、聚类算法、决策树和可视化。相对来说较大的增长是以(pct2016/pct2011-1) 测定的以下算法:


Boosting,从 2011 年的 23.5% 至 2016 年的 32.8%,同比增长 40%

文本挖掘,从 2011 年的从 27.7% 至 2016 年的 35.9%,同比增长 30%

可视化,从 2011 年的从 38.3% 至 2016 年的 48.7%,同比增长 27%

时间序列分析,从 2011 年的从 29.6% 至 2016 年的 37.0%,同比增长 25%

异常/偏差检测,从 2011 年的从 16.4% 至 2016 年的 19.5%,同比增长 19%

集合方法,从 2011 年的从 28.3% 至 2016 年的 33.6%,同比增长 19%

支持向量机,从 2011 年的从 28.6% 至 2016 年的 33.6%,同比增长 18%

回归算法,从 2011 年的从 57.9% 至 2016 年的 67.1%,同比增长 16%

在 2016 年较受欢迎的新算法是:


K-近邻算法(K-nearest neighbors,KNN),46% 份额

主成分分析(Principal Commponent Analysis,PCA),43%

随机森林算法(Random Forests,RF),38%

较优化算法(Optimization),24%

神经网络-深度学习(Neural networks-Deep Learning),19%

奇异值矩阵分解(Singular Value Decomposition,SVD), 16%

跌幅较大的算法分别为:


关联规则(Association rules),从 2011 年的 28.6% 至 2016 年的 15.3%,同比下降 47%

增量建模(Uplift modeling),从 2011 年的 4.8% 至 2016 年的 3.1%,同比下降 36%

因子分析(Factor Analysis),从 2011 年的 18.6% 至 2016 年的 14.2%,同比下降 24%

生存分析(Survival Analysis),从 2011 年的 9.3% 至 2016 年的 7.9%,同比下降 15%

领取试听课
每天限量名额,先到先得
温馨提示:为不影响您的学业,来校区前请先电话或QQ咨询,方便我校安排相关的专业老师为您解答
  • 详情请进入 贵阳大数据培训学校

关于我们 | 招生信息 | 新闻中心 | 学校动态

版权所有:搜学搜课(www.soxsok.com)