博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
朴素贝叶斯法(二)——基本方法
阅读量:5878 次
发布时间:2019-06-19

本文共 1425 字,大约阅读时间需要 4 分钟。

朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法

 

基本方法

总论

朴素贝叶斯法是典型的生成学习方法。生成方法由训练数据学习联合概率分布P(X,Y),然后得到后验概率P(Y|X)。即:

一)利用训练数据得到P(X|Y)P(Y)的估计

二)根据公式P(X,Y)=P(Y)P(X|Y)得到P(X,Y)

三)根据公式P(Y|X)=得到 P(Y|X)

展开

假设

输入空间χ⊆Rnn维向量的集合

输出空间为类标记集合У={c1,c2,…cK}

输入为特征向量x∈χ

输出为类标记yУ

X是定义在输入空间χ上的随机变量

Y是定义在输出空间У上的随机变量

训练数据集为T={(x1,x2),(x2,y2),…(xN,yN)}

特征的总个数为n

每一个特征的可能取值为Sj

训练数据的总个数为N

类标记个数为K

推导

一)通过训练数据得到

1.  先验概率P(Y=ck), k=1,2,…K

2.  条件概率分布P(X=x|Y=ck)=P(X(1)=x(1),…X(n)=x(n)|Y=ck)

朴素贝叶斯法的基本假设为条件独立性,即用于分类的特征在类确定的条件下都是条件独立的。所以

P(X=x|Y=ck)=P(X(1)=x(1),…X(n)=x(n)|Y=ck)

           P(X(j)=x(j) |Y=ck)

对于参数P(Y=ck)P(X(j=x|Y=ck)的估计可以是几大似然估计也可以是贝叶斯估计。

极大似然估计

P(Y=ck)=

设第j个特征x(j)可能的取值为{aj1,aj2,…ajsj}个数为Sj

P(X(j)=xjl|Y=ck)=

贝叶斯估计

用几大似然估计可能会出现所要估计的概率值为0的情况,这时候影响到后验概率的计算结果,使分类产生偏差。解决这一问题的方法是采用贝叶斯估计的方法估计。此时条件概率的贝叶斯估计为

P (X(j)=xjl|Y=ck)=

等价于在随机变量的各个取值的频数上加上一个正数。当时为极大似然估计,常去,此时成为拉普拉斯平滑。显然有

P (X(j)=xjl|Y=ck)>0

P (X(j)=xjl|Y=ck) = 1

同样P(Y=ck)=

二)根据公式P(X,Y)=P(Y)P(X|Y)得到P(X,Y)

三)根据公式P(Y|X)=得到 P(Y|X)

P(X)=

    =

P(Y|X)= =P(Y=ck)P(X(j)=x(j) |Y=ck) / 

可以看出此时分母是一样的,所以,

y=arg P(Y=ck)P(X(j)=x(j) |Y=ck)

后验概率最大化的含义

y=arg P(Y=ck)P(X(j)=x(j) |Y=ck)

等价式是取得最大值,原因是:朴素贝叶斯法将实例分到后验概率最大的类中,这等价于期望风险最小化。后验概率最大等价于0-1损失函数的期望风险最小化。

假设选择0-1损失函数:

L(Y,f(X)) = f(X)是分类决策函数

此时,期望风险函数为

Rexp(f) = E[L(Y,f(X))]

=

=

=Ex)

 

可以看出是取条件期望,设

f(x)=

 0-1损失函数,相等的为0

= 

=argmaxP(y=ck|X=x)

这样一来,风险最小化准则得到后验概率最大化准则:

f(x)=argmaxP(ck|X=x)

 

本文转自jihite博客园博客,原文链接:http://www.cnblogs.com/kaituorensheng/p/3379478.html,如需转载请自行联系原作者

你可能感兴趣的文章
[原创]FineUI秘密花园(二十三) — 树控件概述
查看>>
【Java学习笔记】如何写一个简单的Web Service
查看>>
如何解决This system is not registered with RHN.
查看>>
Cocos2d-x学习笔记(两)Cocos2d-x总体框架
查看>>
拆解探索MagSafe电源接口结构和指示灯变颜色原理
查看>>
Android中EditText,Button等控件的设置
查看>>
lintcode:Remove Nth Node From End of Lis 删除链表中倒数第n个节点
查看>>
POJ 1915-Knight Moves (单向BFS && 双向BFS 比)
查看>>
java中在linux下利用jstack检测死锁
查看>>
linux编译安装LAMP
查看>>
php中的continue用法
查看>>
Android小游戏应用---撕破美女衣服游戏
查看>>
TextKit简单示例
查看>>
网格最短路径算法(Dijkstra & Fast Marching)(转)
查看>>
最短路径算法-Dijkstra算法的应用之单词转换(词梯问题)
查看>>
软链接和硬链接详解
查看>>
HTML5 video 视频标签 常用属性
查看>>
深入理解javascript对象系列第一篇——初识对象
查看>>
Redis_master-slave模式
查看>>
qemu安装
查看>>