百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

随机模拟:马尔科夫链蒙特卡洛采样MCMC与EM算法「2.3」

cac55 2024-10-03 17:49 44 浏览 0 评论

最近学习了机器学习中的马尔科夫链蒙特卡洛(Markov Chain Monte Carlo, 简称MCMC) 相关的知识。

主要内容包括:

【1】蒙特卡洛原则,及其应用于采样的必要性(已经发布在头条)

【2】用于求解最大似然、近似推断、期望问题的经典采样算法:Metropolis-Hastings,Rejection,Importan,MetropolisGibbs算法。(本文属于此部分)

【3】马尔可夫链各个性质在蒙特卡洛采样问题中的应用,包括同质性,平移不变性

—————【2】—————

上一篇【2.2】中详细讨论了EM优化算法的推导和性质,EM算法通过不断提高下界来逼近最大似然,其中E步求Q(z)=p(z|x,θ),此时的θ是上一个M步已经固定的,求得此θ对应的最大下界的Q(z),更新Q(z)。M步固定Q(z),求得此时使得下界最大的θ,更新θ,如此迭代,直到收敛到局部最优,得到最终估计值。


M步中对L最大化求新θ,等价于求使得Q(θ,θold)最大的θ值。因此,如果此后验概率p(z|x,θ)不能用分析式直接求得,可以用采样的方法近似之。Q(θ,θold)写成积分形式为 integral(p(z|x,θold)ln(p(z,x|θ)))dz

这里,p(z|x,θ)成为我们采样的目标函数,分析式未知。

【蒙特卡洛期望最大化算法Monte Carlo EM algorithm】

MCEM算法可以解决此问题,该算法从当前p(z|x,θold)中取L个样本,根据积分的定义,Q(θ,θold)可由下式的样本逼近:


使用此算法计算Q,完成EM算法的运算。

以上就是EM算法和蒙特卡洛采样的关系。在上上篇文章讨论重要性采样算法时提到,其局限性在于假设分布和目标分布的差异不能太大。而MCMC采样可以克服此问题。

【马尔科夫链蒙特卡洛采样算法Markov Chain Monte Carlo】

MCMC是使用马尔科夫链生成样本的方法,这个链设计为在最重要的区域花费最多的时间,样本x的生成模拟从目标分布p(x)中产生的过程。

对比MCMC和重要性采样(见上上篇文章【2采样算法】),MCMC采用可变的假设分布,即使用q(x'|x)而不是q(x),x'是新的要采样的状态,x是前一个样本。每产生一个样本,原假设分布都会更新为一个新的假设分布。

MCMC算法不是一个特定的算法,而是使用上述思想的一类算法。

从最简单的一个成员开始:

【Metropolis-Hasting算法】

1、初始化x0

2、循环N-1次:对i=0,1,一直到N-1

从【0,1】均匀分布中随机采样小数u;

从假设分布q(x'|xi)中随机采样x';

判断:若u< min {1, p_(x')*q(xi|x')/(p_(xi)*q(x'|xi))},x(i+1)=x'接受x'为新样本,

否则x(i+1)=x(i)

例如,令每一个假设分布为均值等于x的高斯分布,【1蒙特卡洛原则】中已经讨论过p_(x)也易得,因此可以很方便对p(x)采样。

如图所示,每次取一个样本修正一次假设分布,避免了重要性采样算法的误差。马尔科夫链性质体现在假设分布的设置。

【废弃样本Burn-In period】

在MCMC算法中,初次取样本时,可能取在上图中的长尾之中,导致经过很多次迭代才把假设分布逐渐逼近到目标分布去,因此可能需要在采样完成后将前面这些废弃样本删除,例如前1000个样本可能都是无效的。

本文讨论了EM算法中应用蒙特卡洛采样,以及一种马尔可夫链蒙特卡洛采样算法-Metropolis hasting算法,之后将继续讨论其他MCMC算法。

相关推荐

Linux :远程访问的 16 个最佳工具(一)

通过远程桌面协议(RDP)可以访问远程Linux桌面计算机,这是Microsoft开发的专有协议。它为用户提供了一个图形界面,可以通过网络连接连接到另一台/远程计算机。FreeRDP是...

Guacamole安装部署_guacamole简单搭建

Guacamole安装部署Guacamole简介Guacamole是提供连接远程桌面的解决方案的开源项目(也可以说是一个远程桌面网关),通过浏览器就能远程操作服务器,适用于Chrome、Firefox...

1-FreeRTOS入门指南_freertos+lwip

本专栏是根据官方提供的文档进行FreeRTOS的各个功能函数的说明,以及函数的使用本专栏不涉及动手操作,只是对原理进行说明,FreeRTOS基础知识篇更新完成会对如何在开发板上进行上手实战操作。这里不...

Windows暂停远程桌面,这些工具可替代

Windows暂停远程桌面,这些工具可替代近日,Windows官方宣布将于2025年5月27日起,在Windows10和Windows11应用商店中下架“Microsoft远程桌面”应用。这一消...

现在做 Web 全景合适吗?_前端全景

作者:前端藏经阁转发链接:https://www.yuque.com/xwifrr/uxqg5v/cgclx0前言Web全景在以前带宽有限的条件下常常用来作为街景和360°全景图片可查看。它可以...

网页直连,MSTSC远程控制Windows新姿势!

不用安装软件,打开浏览器就能远程办公?今天要聊的是一种颠覆传统的远程控制玩法,直接用网页连接Windows电脑,无需下载客户端,手机、平板、Mac甚至Linux都能轻松操作。这可不是吹牛,结合MSTS...

QQ出现大面积盗号,原因已查明,请抓紧改密码

你没有看错,QQ又上了微博热搜,这次比较严重了,QQ出现大面积盗号,多个QQ群出现yellow信息,其次导致多位成员被踢出,并且还被封号处理,到底怎么回事?请继续往下看。在6月26日晚上10点左...

我在淘宝花10块钱,买到了能玩“宝可梦”的Q群机器人

十一月雨|文我是个没事喜欢逛淘宝的人,虽然是个不怎么好的习惯,但总是能够发现一些奇奇怪怪的东西,这次我发现的是一种Q群机器人。Q群机器人,大多是基于腾讯SmartQQ协议实现的一种能自动回复、自定...

Metasploit最实用的攻击模块&quot;Meterpreter&quot;

Meterpreter命令详解Meterpreter是Metasploit渗透测试平台框架中功能最强大的攻击载荷模块,在最新的Metasploitv4.5.0版本中,攻击载荷模块已经达到了25...

手机QQ再更新,上线了一个想让人“无法回避”的新功能

近日,手机QQ更新了V8.2.6.700版本,苹果iOS版和安卓版手机QQ上线了一个新功能:可以实时显示对方的手机电量以及充电状态。开通电量显示也很简单,长按主页左上方的头像,在在线状态中选择我的电量...

「网络安全」常见攻击篇(20)——点击劫持

什么是点击劫持?点击劫持(Clickjacking)技术又称为界面伪装攻击(UIredressattack),是一种视觉上的欺骗手段。通常有两种方式:攻击者使用一个透明的iframe,覆盖...

曾利用驱动人生升级通道传播的木马下载器攻击方法再次升级

一、概述御见威胁情报中心1月25日再次监测到曾利用驱动人生升级通道传播的木马下载器攻击方法再升级。本次升级主要变化在于攻击模块,木马在之前的版本上,新增计划任务“DnsScan”,在其中将永恒之蓝攻击...

QQ飞车手游:点券首个功能性宠物上架,实战稳定触发还不快入手?

随着版本的逐渐更新,点券宠物在道具模式发挥逐渐越来越小,曾经探讨点券宠物在道具是不是真的没有用?直到出现了波斯猫改变了,我对点券宠物在道具模式的看法,如今又一个强势点券宠物来袭,而且特性触发简单,还是...

工单系统设计实战(上):核心配置与效能提升

流程的标准化并非终点,而是研发效能持续革命的基石。当工单系统真正成为研发团队的“神经中枢”,每一次需求的精准流转、每一行代码的受控提交、每一次版本的可靠发布,都将汇聚成驱动产品持续进化的强大动力...

6个编辑PDF文档内容的工具(软件+网站)

在日常办公、学习和生活中,PDF文件因其格式稳定、跨平台兼容性强等特点,被广泛应用。但有时我们拿到PDF文件后,却发现需要修改其中的内容,总感觉有点难搞。其实PDF文档编辑修改也很简单,这里分享6个软...

取消回复欢迎 发表评论: