提问时间:2021-03-10
1. 朴素贝叶斯(Naive Bayes, NB)
超级简单,就像做一些数数的工作.如果条件独立假设成立的话,NB将比鉴别模型(如Logistic回归)收敛的更快,所以你只需要少量的训练数据.即使条件独立假设不成立,NB在实际中仍然表现出惊人的好.如果你想做类似半监督学习,或者是既要模型简单又要性能好,NB值得尝试.
2. Logistic回归(Logistic Regression, LR)
LR有很多方法来对模型正则化.比起NB的条件独立性假设,LR不需要考虑样本是否是相关的.与决策树与支持向量机(SVM)不同,NB有很好的概率解释,且很容易利用新的训练数据来更新模型(使用在线梯度下降法).如果你想要一些概率信息(如,为了更容易的调整分类阈值,得到分类的不确定性,得到置信区间),或者希望将来有更多数据时能方便的更新改进模型,LR是值得使用的.
3.决策树(Decision Tree, DT)
DT容易理解与解释.DT是非参数的,所以你不需要担心野点(或离群点)和数据是否线性可分的问题(例如,DT可以轻松的处理这种情况:属于A类的样本的特征x取值往往非常小或者非常大,而属于B类的样本的特征x取值在中间范围).DT的主要缺点是容易过拟合,这也正是随机森林(Random Forest, RF)(或者Boosted树)等集成学习算法被提出来的原因.此外,RF在很多分类问题中经常表现得最好(我个人相信一般比SVM稍好),且速度快可扩展,也不像SVM那样需要调整大量的参数,所以最近RF是一个非常流行的算法.
4.支持向量机(Support Vector Machine, SVM)
很高的分类正确率,对过拟合有很好的理论保证,选取合适的核函数,面对特征线性不可分的问题也可以表现得很好.SVM在维数通常很高的文本分类中非常的流行.由于较大的内存需求和繁琐的调参,我认为RF已经开始威胁其地位了.
- 1I think that
- 2Nine and twelve is t____按句意及首字母提示填空
- 3一物体作匀加速直线运动,通过一段位移△x所用的时间为t1,紧接着通过下一段位移△x所用时间为t2.则物体运动的加速度为( ) A.2△x(t1−t2)t1t2(t1+t2) B.△x(t1−t2)t
- 4一个正方形,一边减少5厘米,另一边减少8厘米,得到一个长方形,长方形的面积比正方形的面积小259平方厘米
- 5如何配制PEG固体培养基?
- 6有关树的诗句
- 7《匆匆》这篇文章表达了作者什么的感情
- 8楚人一炬 可怜焦土 楚人是谁
- 9小学三年级数学题小明做一道除法题时,误把除数9看成6,结果算出的商是12,余数是4.正确的结果是多少?
- 10名不见经传的反义词
- 1王大伯看了儿子的电报:“船已行二日即到.”他不明白其中的意思,就拿去问人,甲乙丙三人看了后分别说出
- 2生物啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊
- 3with no time to sit around 做什么成分,to sit around又做什么成分
- 4关于圣诞节的稿件300字
- 5题如下:g(x)=log(3)1/4-x,x属于[-5,35/9]
- 6一种商品7折出售,是什么意思
- 7求乘积2008个6乘以2009个3的各位数字之和
- 8天然气的热值大约是3.8×10的7次方j/m³,完全燃烧0.84m³天然气,可以将多少kg水从20℃加热至100
- 9Whatever will be, wil be.第二个will be 是什么意思?全句可否翻译为“爱咋咋地”?
- 1039、20oC时,物质A的溶解度为20克,表示_____此饱和溶液中,溶质.溶剂.溶液的质量