【独家】Diana从实验员到项目经理：（6）统计那点事（1）

diana_zhang · 发表于 2015-7-27 21:10

登陆有奖并可浏览互动！

您需要登录才可以下载或查看，没有账号？立即注册

×

本帖最后由 diana_zhang 于 2015-8-7 08:58 编辑

Diana从实验员到项目经理：（6）统计那点事（1）

试验过程中形成的实验数据、日常工作中形成的各种工作数据有没有什么规律可言？有没有什么让我们觉得可以眼前一亮的发现？这些常常困扰我们的问题我们都希望可以通过对数据的统计分析来解决，然而一说到统计分析真的是让人望而却步。且不说哪些看着就眼晕的繁杂的数学公式，单单是那么多的统计分析的方法到底要如何选择就已经使得我们头疼不已了。曾经有人告诉我说，他对同样的数据分别采用了A和B两种方法进行统计，结果得出了完全相反的结论，面对这样的结果，他只能是仰天长叹：“统计学想说爱你咋就这么难！”

统计学可以算得上在学校里面学习的课程中最枯燥的那种，没有什么变幻莫测的试验，没有欣喜若狂的欢呼，只有那无穷无尽的数字运算，对于有运算恐惧症的人来说统计学课程简直就是一种折磨。加上很多统计学的内容在后来工作中应用较少也就慢慢的被遗忘了。但实际上统计学或者说用统计的方式思考问题对解决工作中的问题是非常有帮助的。所以，我觉得有必要说说统计那点事。

一、建立日常工作中的统计学思维

在日常工作中，无论是实验室工作还是项目管理还是其他管理工作，养成统计学思维对工作是非常有帮助的。什么是统计学思维呢？就是每开展一项工作，优先会考虑对数据进行汇总整理。例如：在研发的过程中每一项研究工作都将实验室数据汇总整理，从中找出规律。

1、建立统计学思维是从第一个数据被关注开始的

其实我要在这里说的是这是一种工作习惯，无论在何种情况下都将自己的工作用统计的方法进行一下梳理。我做处方调整，那么针对每个变化量的结果进行统计分析，看看是否能够发现变化的趋势。我做原材料质检，那么对不同厂商的同一个原材料的不同批次检验结果进行趋势分析，看看是否能够从中发现变化。这些趋势分析依赖于长期的大量数据的积累，但如果你形成一个统计分析的思维那么永远不可能有第一次的数据纳入，这样等到你需要这样的数据趋势分析的时候是没有办法得到，因为数据趋势分析是依赖于长期工作所建立的数据积累的。所以，在日常工作中从关注第一数据开始是形成统计学思维的起点。

2、用身边的数据和方法进行统计分析

一说到统计分析很多人会想到专业的统计分析软件，然后设定各种统计条件、分析方法等等，总之在还没有开始前就设立很多很多的门槛，而面对这样高的门槛不要说一步跨过去，就是爬也要爬半天，加上没有明确的可以看到效果的指标显示，往往还没开始就放弃了。所以，统计分析从第一个点开始搜集数据，就需要清醒的认识到统计不是一天可以攀越的珠峰，分析可以从身边最实用的软件——EXE表格开始。

对于大多数日常工作中积累的数据都可以使用EXE表格中强大的统计分析功能得以实现。处方调整后的数据分析可以用散点图、折线图考察趋势；供应商评估可以用饼图、折线图来比较；批生产量核算可以用柱状图、饼图进行比较……一句话，EXE软件就是谁用谁知道。

二、几种常用的统计方法

说了这么多统计的好处，现在让我们来一起学习一下几种在体外诊断试剂临床研究、实验室研究等过程中比较适用的统计方法

1、四格表

在分类资料统计分析中我们常会遇到这样的资料，如两组大白鼠在不同致癌剂作用下的发癌率如下表，问两组发癌率有无差别？

表1 某地癌症发病情况调查

	发癌数	未发癌数	合计	发癌率%
甲组	52	19	71	73.24
乙组	39	3	42	92.86
合计	91	22	113	80.53

表格中红色数字是表中最基本的数据，因此上表资料又被称之为四格表资料。卡方检验的统计量是卡方值，它是每个格子实际频数A与理论频数T差值平方与理论频数之比的累计和。每个格子中的理论频数T是在假定两组的发癌率相等（均等于两组合计的发癌率）的情况下计算出来的，如第一行第一列的理论频数为71*(91/113)=57.18，故卡方值越大，说明实际频数与理论频数的差别越明显，两组发癌率不同的可能性越大。

在临床检验过程中我们希望了解的待评估产品或方法与对照的产品或方法是否存在一致性，根据研究结果的统计可以做出如下四格表：

表2 检验结果统计表

		对照试剂或方法		合计
		对照阳性	对照阴性	合计
待评估产品或方法	检测结果阳性	TP（真阳性）	FP（假阳性）	TP+FP
待评估产品或方法	检查结果阴性	FN（假阴性）	TN（真阴性）	FN+TN
合计		TP+FN	FP+TN	TP+FP+FN+TN

待评估产品或方法的特异度（Specificity）=TN/(FP+TN)

（或：阴性一致百分比=TN/(FP+TN)*100%）

待评估产品或方法的灵敏度（Sensitivity）=TP/(TP+FN)

（或：阳性一致百分比=TP/(TP+FN)*100%）

有价值的诊断试剂或方法应该是SE+SP＞100

在这里我们要提到另一个非常重要的概念：似然比。似然比（Likelihood ratio, LR）是反映真实性的一种指标，属于同时反映灵敏度和特异度的复合指标。即有病者中得出某一筛检试验结果的概率与无病者得出这一概率的比值。

用诊断试验检测经诊断金标准确诊的患病人群的阳性率TP/(TP+FN)与以金标准排除诊断的受试者中试验阳性即假阳性率TN/(FP+TN)之间的比值.

因真阳性率即为敏感性，假阳性率与特异性成互补关系，所以，也可表示成敏感性与(1－特异性)之比：

LR=TP/(TP+FN)÷FP/(FP+TN)=SE/(1－SP)

阳性似然比、阴性似然比结合了敏感性、特异性、阳性预测值和阴性预测值的优点，既可以根据患者有无某项报警症状来做预测，同时又不受被检人群中病变发生率的影响，可用于多种临床环境中，因此是一个相对独立的、更具临床意义的诊断性试验效果的评估指标。当阳性似然比>10 或阴性似然比<0.1时，诊断或排除某种疾病的可能性就显著的增加。

我们用四格表的统计方法是评价待评估产品或方法与对照产品或方法的一致性。但这样的一致性研究也存在一定的缺点和不足：

（1）一致并不表示“正确”

在四格表的统计研究中，我们所建立的统计参照物是对照的产品或方法，将待评估的产品或方法的分析结果与对照的分析结果进行比较，认为一致性越高越好。但对照分析结果的正确性不是本次研究的目的。所以，一致并不表示“正确”。两个分析结果可以高度一致，但这样的分析结果可能都是错误；同样，不一致也不意味着待评估的产品或方法的分析结果是错误的。

（2）我们在做上面的四格表分析时仅提到了阳性一致百分比或阴性一致百分比，但我们没有提到“总一致百分比”这样的说法，因为在统计分析计算中可能存在一种情况就是：在某些特定条件下，阳性/阴性一致百分比非常低，但整体一致性也可以很好。所以用总一致性的测量可能会引起误解，故而不鼓励仅用“总一致性”指标来判断某项分析结果的效果。

2、基于四格表的kappa检验

对两法测定结果一致部分进行检验，看一致部分是否是由偶然因素影响的结果，它叫做“一致性检验”，也称Kappa检验。说明两种方法测定结果的实际一致率与随机一致率之间的差别是否具有显著性意义。需要计算反映两法一致性程度高低的系数，叫做Kappa统计量。具体公式如下：

P0为实际一致率，Pe为理论一致率。

Kappa是一个统计量，也有抽样误差，其渐进标准误（ASE）。由于u＝Kappa/ASE近似服从标准正态分布，故可借助正态分布理论。

H0：Kappa＝0，

H1：Kappa≠0。如果拒绝H0认为两种方法具有较高的一致性。

在诊断试验的研究中，数据资料多为双向有序的列联表资料，即两个变量都是有序变量，而且属性相同。属性相同分为以下三种情况：

（1）属性、分级水平数和分级水平都完全相同

如甲医生和乙医生都把病人的检查结果分为1、2、3、4四个等级。此时可直接作Kappa检验。当这两个变量都只有2个水平时，就成为配对设计的四格表资料，可使用配对χ2检验，即McNemar检验。

（2）属性相同的分级水平数相同，但分级水平不全相同。如甲医生和乙医生都把病人的检查结果分为四个等级，但甲医生的分级为1、2、3、4，而乙医生的分级为2、3、4、5。在这种情况下，由于列联表的行数和列数仍然是一致的，即列联表仍为方表，所以也可计算出相应的Kappa统计量。

（3）属性相同，但分级水平数和分级水平不全相同。这种情况就是我们所说的列联表的行列数不一致。由于收集上来的数据不能轻易删除掉，所以我们考虑添加行或列使联表成为方表。如行数为n，例数为n-1，则我们只需要添加第n列，在第n行第n列的格点中添加权值0001，而第n行的其它格点均设为0，就可以命名其成为方表，并计算Kappa统计量了。由于权值系数很小，所以不会影响Kappa值的计算结果。

另一方面，如果两个变量中有一个变量是金标准，那么我们不但能分析出检验结果的一致性，还可以计算出敏感度、特异度、误诊率和漏诊率等指标。如果有不同的诊断分界点，还可以绘制出ROC曲线。

1960年Cohen等提出用Kappa值作为评价判断的一致性程度的指标。实践证明，它是一个描述诊断的一致性较为理想的指标，因此在临床试验中得到广泛的应用。Kappa是评价一致性的测量值。检验是否沿对角线格子中的计数（接收比率一样的零件）与那些仅是偶然的期望不同。

设Po=对角线单元中观测值的总和，Pe=对角线单元中期望值的总和。则Kappa=（Po-Pe）/（1-Pe）。Kappa是测量而不是检验。其大小用一个渐进和标准误差构成的t统计量决定。一个通用的经验法则是Kappa大于0.75表示好的一致性（Kappa最大为1）；小于0.4表示一致性差。

本系列文章独家供小桔灯网站发布，本系列文章为作者：diana_zhang原创，未经允许不得删改，转载请注明原文出处和作者。原文链接http://bbs.iivd.net/thread-22263-1-1.html