基础数学课12-朴素贝叶斯

这里我们利用一个区分水果的案例,来讲解朴素贝叶斯,这里我们有着橙子,苹果,西瓜三种不同的水果

每个水果都有着不同的特征,比如形状,外皮颜色,纹理,重量,硬度,口感。

这里我们给出一个统计的表格

这里我们将一些值进行了转换,比如重量,根据范围划分为了不同的枚举,从而方便计算。

那么我们如何利用这样的一些数据来体现朴素贝叶斯呢?

我们可以使用先验概率,后验概率,条件概率和贝叶斯法则。

这里我们可以将A理解为一种水果,B认为是一种属性,那么我们Pa 或Pb就是种类或者属性在样本中出现的概率。

在具有这样的公式之后,我们需要考虑的下一件事就是我们往往具有多种属性,那么该如何分析?

这时候朴素贝叶斯中的独立假设就有作用了,我们可以假定归类时影响时相互独立的。

也就是一个对象同时具有属性f i,fj。那么对象对类别的概率如下

这样我们就可以先划分先验概率,然后根据先验概率去推测后验概率。

上述的先验概率中,我们存在着0的情况,针对这种情况,我们可以采用一个极小值来代替0概率,比如0.01

之后,如果我们有一个水果,他的形状时圆形,口感时甜的,那么我们可以推测他属于苹果,西瓜,橙子的概率分别是多少。

其中apply代表着苹果,shape-2表示着形状为2,taste-2表示口感为2,最后得到的结果是0.00198

之后分别计算香橙和西瓜的结果。得到0.26934和0.00798

最终最有可能的就是香橙。

这样我们就讲解了朴素贝叶斯的原理,基本分为得到训练样本,基于样本的计算,预测。

而其他类型的分类算法和朴素贝叶斯对比

KNN对比,需要更多的时间进行训练,但对于新数据进行预测的时候,效果更高

决策树相比,不容易让人理解,但是可以提供模糊分类

和SVM向量机对比,无法支持连续值的输入,但是我们将连续值转换为离散值,方便处理。

发表评论

邮箱地址不会被公开。 必填项已用*标注