最大熵模型简介[例子+推导+GIS求解]

原作者: [db:作者] 来自: [db:来源] 收藏邀请

这篇文章是结合论文http://www.cqvip.com/Main/Detail.aspx?id=7707219对博文：http://www.cnblogs.com/hexinuaa/p/3353479.html加入自己的理解做了简化重写，另外本文末尾附上了最大熵模型的实现。

一个例子 我们通过一个简单的例子来了解最大熵的概念。假设现在需要做一个自动将英语到法语的翻译模型，为了方便说明，我们将这个问题简化为将英文句子中的单词{in}翻译成法语词汇。那么翻译模型p就是对于给定包含单词”in”的英文句子，需要给出选择某个法语单词f 做为”in”的翻译结果的概率p(f)。为了帮助开发这个模型，需要收集大量已经翻译好的样本数据。收集好样本之后，接下来需要做两件事情：一是从样本中抽取规则（特征），二是基于这些规则建立模型。
从样本中我们能得到的第一个规则就是in可能被翻译成的法语词汇有：

{dans, en, à, au cours de, pendant}。

也就是说，我们可以给模型p施加第一个约束条件：

p(dans)+p(en)+ p(à)+p(au cours de)+p(pendant) = 1。

这个等式是翻译模型可以用到的第一个对样本的统计信息。显然，有无数可以满足上面约束的模型p可供选择，例如：

p(dans)=1，即这个模型总是预测dans

或者

p(pendant)=1/2 and p(à)=1/2，即模型要么选择预测pendant，要么预测à。

这两个模型都只是在没有足够经验数据的情况下，做的大胆假设。事实上我们只知道当前可能的选项是5个法语词汇，没法确定究竟哪个概率分布式正确。那么，一个更合理的模型假设可能是：

p(dans) = 1/5

p(en) = 1/5

p(à) = 1/5

p(au cours de) = 1/5

p(pendant) = 1/5

即该模型将概率均等地分给5个词汇。但现实情况下，肯定不会这么简单，所以我们尝试收集更多的经验知识。假设我们从语料中发现有30%的情况下，in会被翻译成dans 或者en，那么运用这个知识来更新我们的模型，得到2模型约束：

p(dans) + p(en) = 3/10

p(dans)+p(en)+ p(à)+p(au cours de)+p(pendant) = 1

同样，还是有很多概率分布满足这两个约束。在没有其他知识的情况下，最直观的模型p应该是最均匀的模型（例如，我拿出一个色子问你丢出5的概率是多少，你肯定会回答1/6），也就是在满足约束条件的情况下，将概率均等分配：

p(dans) = 3/20

p(en) = 3/20

p(à) = 7/30

p(au cours de) = 7/30

p(pendant) = 7/30

假设我们再一次观察样本数据，发现：有一半的情况，in被翻译成了dans 或 à。这样，我们有就了3个模型约束：

p(dans) + p(en) = 3/10

p(dans)+p(en)+ p(à)+p(au cours de)+p(pendant) = 1

p(dans)+ p(à)=1/2

我们可以再一次选择满足3个约束的最均匀的模型p，但这一次结果没有那么明显。由于经验知识的增加，问题的复杂度也增加了，归结起来，我们要解决两组问题：第一，均匀(uniform)究竟是什么意思?我们怎样度量一个模型的均匀度(uniformity)？第二，有了上述两个问题的答案，我们如何找到满足所有约束并且均匀的模型？

最大熵算法可以回答上面的2组问题。直观上来将，很简单，即：对已知的知识建模，对未知的知识不做任何假设。换句话说，在给定一组事实（features + output）的情况下，选择符合所有事实，且在其他方面尽可能均匀的模型。这也是我们在上面的例子中，每次选择最恰当的模型用到的原理。俗话说，不把鸡蛋放在一个篮子里，正是运用的这个原理来规避风险。

最大熵(MaxEnt)建模

我们考察一个随机过程，它的输出是y, y属于有穷集合Y。对于上面提到的例子，该过程输出”in”的翻译结果y， y∈Y = {dans, en, à, au cours de, pendant}。在输出y时，该过程会受到”in”在句子中上下文信息x的影响, x属于有穷集合X。在上文的例子中，这个x主要就是在英文句子中”in”周围的单词。

我们的任务就是构造一个统计模型，该模型的任务是：在给定上下文x的情况下，输出y的概率p(y|x)。

训练数据

为了研究上述过程，我们观察一段时间随机过程的行为，收集到大量的样本数据：（x₁, y₁), (x₂, y₂), …, (x_N, y_N)。在之前讨论的例子中，每个样本包括：在英文句子中”in”周围的单词x，”in”的翻译y。假设我们已经拿到了足够多的训练样本，我们可以用样本的经验分布_p^~来表示所有样本的分布特性：

其中N为训练样本的大小, num(x,y)是样本中某一对(x,y)同时出现的次数。

特征和约束

我们的目标是构造一个能产生训练样本这一随机过程_p^~(x,y)的统计模型。而我们能够使用的数据就是对训练样本的各种统计信息或者说特征。定义特征如下：

这个也叫指示函数(indicator function)，它表示某个特定的x和某个特定的y之间是否有一定的关系。例如，在之前的例子中，如果April这个词出现在in之后，那么in会被翻译成en，那么这个特征可以表示成：

特征f(x,y)关于训练样本经验分布_p^~(x,y)的期望如下，这个是我们可以在语料中统计到的特征经验值：

而特征关于模型分布p(y|x)的理论期望值是：

其中_p^~(x)是x在训练样本中的经验分布。我们约束这一期望值和训练样本中的经验值相等：即要求期望概率值等于经验概率值。

结合等式(1)(2)(3)我们得到等式：

我们称等式(3)为约束(constraint)。我们只关注满足约束(3)的模型p(y|x)，也就是说不再考察跟训练样本的特征经验值不一致的模型。

到这里，我们已经有办法来表示训练样本中内在的统计现象（_p^~(f)），同时也有办法来让模型拟合这一现象(p(f) = _p^~(f))。

最大熵原理

再回到之前例子中的问题：什么是均匀?

数学上，条件分布p(y|x)的均匀度就是条件熵，定义如下：

熵的最小值是0，这时模型没有任何不确定性；熵的最大值是log|Y|, 即在所有可能的y(|Y|个)上的均匀分布。

有了这个条件熵，最大熵的原理定义为：当从允许的概率分布集合C中选择一个模型时，选择模型p*∈C ，使得熵H(p)最大。即：

其中C的含义是所有满足约束的模型集合，n为特征或者说特征函数fi的数量（注意跟样本数量N区别)。

指数形式

最大熵要解决的是约束优化问题：find the p*∈C which maximizes H(p)。对于上述翻译的例子，如果只施加了前面两个约束，很容易直接求得p的分布。但是，绝大多数情况下最大熵模模型的解无法直接给出，我们需要引入像拉格朗日乘子（Lagrange Multiplier）这样的方法。
我们具体要优化的问题是：相应的约束为：为解决这个优化问题，为每一个f_i引入参数λ_i ，得到拉格朗日函数ζ(p, Λ, γ)如下：其中实值参数Λ = {λ1, λ2, …, λn}和γ对应着约束2和3的n+1个限制。保持Λ和γ不变，计算拉格朗日函数ζ(p, Λ, γ)在不受限的情况下的最大值，即可得到p(y|x)的最优解。因此对ζ(p, Λ, γ)在p(y|x)上求导得（注意为了方便计算，我们这里对数以自然对数e为底）：令上式（10）等于0，即：解上面的单变量方程(把p(y|x)当未知数)，可得p(y|x) ：根据约束2，对于任意x, Σ_yp(y|x) = 1，我们对等式(12)两边分别求和，可以得到：将等式(13)代入等式（12），可以得到：令Z(x) 为：则模型p(y|x)的最优解为，其中Z(x)称为归一化因子: 到这里，我们可以看到，满足约束C的最大熵模型具有（16）的参数化形式。由于拉格朗日函数ζ(p, Λ, γ)中的p(y|x)和γ都可以表示成Λ，所以接下来的问题就转化成了求解参数Λ = {λ1, λ2, …, λn}。为此，我们定义对偶函数ψ( Λ ) 及其优化问题：根据所谓的Kuhn-Tucker theorem(KTT)原理（这个目前还没研究，暂不展开），我们有如下结论：公式（16）中模型p*(y|x)中的参数Λ，可以通过最小化对偶函数ψ( Λ ) 求解，如(17)(18)所示。 计算参数 求解Λ = {λ1, λ2, …, λn}，解析的方法是行不通的。这种最大熵模型对应的最优化问题，一般有GIS/IIS，IIS是GIS的优化版。这里讨论最简单的GIS。GIS的一般步骤是：
1. 初始化所有λi 为任意值，一般可以设置为0，即： 其中λ的上标(t)表示第t论迭代，下标i表示第i个特征，n是特征总数。 2. 重复下面的权值更新直至收敛：收敛的判断依据可以是λi 前后两次的差价足够小。其中C一般取所有样本数据中最大的特征数量，E_p^~和Ep如下: 代码实现见：揭开机器学习的面纱：最大熵模型100行代码实现[Python版] 【转载请注明，纯净的天空出品:https://vimsky.com/2015/05/714.html】

鲜花

握手

雷人

路过

鸡蛋

专题导读

More+

10-27 六六分期app的软件客服如何联系？(六六分期

11-06 可心卡盟:win10系统火狐flash插件崩溃怎么

11-06 亲亲特价:怎么删除回收站图标

11-06 济南大学虚拟社区:鲁大师节能降温的具体办

11-06 xlueops.exe:无线网络安装向导

11-06 女斗合众国:win7系统cf与主机连接不稳定怎

11-06 0xc000022-[cf烟雾头]cf怎么调烟雾头

11-06 qizideyouhuo:应用程序无法正常启动0xc0000

11-06 ipz-185:win7系统vcf文件怎么打开

11-06 傻哥蹦迪:win10系统s4怎么打开usb调试

11-06 八神浩树gtaste:回收站清空了怎么恢复

11-06 妖尾之黑色守护:win10系统电脑没有1440x900

11-06 校园至尊魔王小说:win7系统浏览网页时字体

11-06 女斗合众国:win10系统访问共享文件夹提示请

11-06 tokyo hot n0654:恢复win7系统默认字体一招

11-06 雨酷仙境:设置win7系统转移临时文件夹腾出

11-06 阿穆纳伊之杖:win7系统开始菜单在右边还原

11-06 tunespotting:win10系统火狐flash插件总是

11-06 甘尔葛分析师：计谋网站seo关键词暴涨有什

11-06 蔡贵霖: 计谋网站seo关键词暴涨有什么秘密

11-06 博益网首页:ao3网页版进入不了解决方法

11-06 漏斗子专栏: 网站数据分析小白易懂精华篇

11-06 见证双虹怎么做:win7系统开启telnet命令的

11-06 颾狐蝶蜋:系统资源不足无法完成请求的服务

11-06 国光中学校歌:提交网站到alexa查询详细步骤

11-06 西安有情天:静态网页和动态网页的区别

11-06 红木雅尚斋:外部链接构造对网站的好处

11-06 前官礼遇：防止域名劫持–增强域安全性的10

11-06 密传二转答案: 中文分词算法有哪些

11-06 金泉家园邮编:百度快照劫持的表现及应对方

Slope One——简单而高效的协同过滤算法发布时间：2022-05-14

协同过滤之ALS-WR算法发布时间：2022-05-14

剪的笔顺,诠释剪的笔画,认识剪的部首

1 六六分期app的软件客服如何联系？(六六分期

六六分期app的软件客服如何联系？不知道吗？加qq群【895510560】即可！标题：六六分期

阅读：19128|2023-10-27

2 可心卡盟:win10系统火狐flash插件崩溃怎么

今天小编告诉大家如何处理win10系统火狐flash插件总是崩溃的问题，可能很多用户都不知

阅读：9972|2022-11-06

3 亲亲特价:怎么删除回收站图标

今天小编告诉大家如何对win10系统删除桌面回收站图标进行设置，可能很多用户都不知道

阅读：8317|2022-11-06

4 济南大学虚拟社区:鲁大师节能降温的具体办

今天小编告诉大家如何对win10系统电脑设置节能降温的设置方法，想必大家都遇到过需要

阅读：8686|2022-11-06

5 xlueops.exe:无线网络安装向导

我们在使用xp系统的过程中,经常需要对xp系统无线网络安装向导设置进行设置，可能很多

阅读：8626|2022-11-06

6 女斗合众国:win7系统cf与主机连接不稳定怎

今天小编告诉大家如何处理win7系统玩cf老是与主机连接不稳定的问题，可能很多用户都不

阅读：9643|2022-11-06

7 0xc000022-[cf烟雾头]cf怎么调烟雾头

电脑对日常生活的重要性小编就不多说了，可是一旦碰到win7系统设置cf烟雾头的问题，很

阅读：8611|2022-11-06

8 qizideyouhuo:应用程序无法正常启动0xc0000

我们在日常使用电脑的时候，有的小伙伴们可能在打开应用的时候会遇见提示应用程序无法

阅读：7991|2022-11-06

9 ipz-185:win7系统vcf文件怎么打开

今天小编告诉大家如何对win7系统打开vcf文件进行设置，可能很多用户都不知道怎么对win

阅读：8642|2022-11-06

10 傻哥蹦迪:win10系统s4怎么打开usb调试

今天小编告诉大家如何对win10系统s4开启USB调试模式进行设置，可能很多用户都不知道怎

阅读：7527|2022-11-06

客服电话

电子邮件

最大熵模型简介[例子+推导+GIS求解]

上一篇：

下一篇：

bradtraversy/iweather: Ionic 3 mobile we

joaomh/curso-de-matlab

断牙刷新位置时间（断牙属性及刷新位置介绍

Java小程序—录屏小程序(上半场)

rugk/mastodon-simplified-federation: Sim

剪的笔顺,诠释剪的笔画,认识剪的部首

六六分期app的软件客服如何联系？(六六分期

florent37/ViewAnimator: A fluent Android

florent37/Shrine-MaterialDesign2: implem

CVE-2020-36276

SimpleSoftwareIO/simple-sms: Send and re

关于我们

产品与服务

解决方案

139-2527-9053