Probit回归:
Probit回归全称probability unit,翻译过来叫做概率单位法,蛮拗口的一个名字。这个回归主要用于研究半数效量用的。直白一点说,就是比方你拿一种药去药蟑螂,你想知道你用多少药能药死多少蟑螂,那你就可以用probit回归来估计这个数。Probit回归经常拿来和logistic回归作比较,通常对于二分类变量来说,这两个回归计算出来的概率是非常相似的。(虽然logistic回归最后判断的是是或否,但是它也需要计算一个概率来判断这个结果倒是是还是否。)而且如果有一点数学基础的话,会知道,这两个回归画出来的图也非常像,只是logistic回归画出来的Z型稍微平缓一些。
那么这两个回归到底有什么区别呢?通常来说区别不大。最重要的一个区别在于probit回归适用于呈正态分布的数据,logistic回归适用于呈logistic分布的数据。不过这个区别也蛮微妙的,因为正态分布和logistic分布还蛮像的。所以大概来讲,到底是选择哪个分布更多的还是一种个人喜好。
但是大家都知道啊,logistic分布比probit分布可有名多了。如果说十个从事大数据的人里边有五个人知道logistic回归,那么有三个知道probit回归就不错了。在我们ppv课网站的spss视频教学里边,绝大部分都会讲到logistic回归,但是probit回归就不见得有人讲了。(顺便说一句,我个人最喜欢spss从入门到精通这套课程,刚入门的时候就是听得这套课。强烈推荐大家去听一听)。
那么这是什么原因呢?这绝不是probit不好用的原因。主要原因有两个,第一,logistic回归形式比较多。二分类,有序多分类,无序多分类,这些logistic回归都可以做。这就好像我们ppv课网站提供了spss,sas,r,matlab,hadoop等等视频,你可以从零基础学到精通级别,肯定比较受欢迎哈。第二,则归功于logistic回归的易解释性。Logistic回归提供了一个很重要的参数,OR值,这个值很直接的告诉你处于某个状态比处于另一个状态时因变量发生的概率增加了多少倍。这当然是一个很重要很直观的参数啦。就好像你每学一段时间以后,我们ppv课网站告诉你你的知识积累比之前增加了多少倍多少倍,这个肯定很重要撒。