stata中如何em最大期望算法进行插值

如题所述

假设男、女身高均值分别为 μ1、μ2,这两个数的初值可以赋予任意两个不同的随机数,例如我们令初值为:
μ1=190,μ2=150

  根据这个初值,我们来重新估计每个 xi 对应的 Mi 和 Fi 的期望值。这里,我们可以把 Mi 和 Fi 理解为 xi 对应男人和女人的人数,取值介于0~1之间。因为两类数据分布会产生重叠,因此,对于同一个身高数据,按照密度函数来计算分配人数比列。这里假设男人和女人的概率密度函数分别为 pm 和 pf,同一个身高数据 xi 对应的男、女人数计算如下:
  

Mi=pm(xi)pm(xi)+pf(xi)Fi=pf(xi)pm(xi)+pf(x1)

  接下来,我们要更新 μ1、μ2 的值了,计算方法就是总身高除以总人数,算式如下:

μ1=M1x1+...+M8x8M1+...+M8μ2=F1x1+...+F8x8F1+...+F8
  这里可以把 Mi 和 Fi 理解为 xi 对应男人和女人的人数,取值介于0~1之间。
  
  看到这里,我服气得简直要跪了。因为我特地准备两个170cm的身高,这个身高男女各一个数据,我想看看EM如何处理。之前我是用K均值聚类算法的思维来看这个问题,没想到EM给我来了一个“模糊数学”的处理技巧,把这个问题巧妙化解了。
  
  数据170对应男、女人数都是0.5,因为有两个170,所以,男人和女人每组仍然能分配一个,这正好恢复了男女数据没混和以前的样子。
  
  接下来没啥悬念了,重复迭代上面的过程,直到 μ1、μ2 收敛为止。如果 Mi 和 Fi 最终确定了,相当于把抽样数据区分开了,求分布的其他参数也变得毫无悬念了。
温馨提示:答案为网友推荐,仅供参考
相似回答