第五章 临床生化检验方法的选择和评价
临床生化检验方法的选择和评价,是临床生化检验质量控制的重要基础工作。当建立一个新的方法,或引进新的方法、都应对它们的技术性能作出评价,以便科学的选择和应用。
第一节 检验方法的正确选择
一 检验方法和标准品的分级
(一)方法的分级
临床生化检验方法根据其准确度与精密度的不同可以分为决定性方法、参考方法、常规方法等三级。
1.决定性方法(definitive method) 是指准确度最高,系统误差最小,经过详细的研究,没有发现产生误差的原因或在某些方面不够明确的方法。用于发展及评价参考方法和一级标准品。
2.参考方法(reference method) 是指准确度与精密度已经充分证实的分析方法,干扰因素少,系统误差与重复测定的随机误差相比可以忽略不计,有适当的灵敏度、特异性及较宽的分析范围。这类方法在条件许可的实验室中应经常使用。用于评价常规方法和试剂盒,鉴定二级标准品。
3.常规方法(routine method) 指性能指标符合临床或其他目的的需要,有足够的精密度、准确度、特异性和适当的分析范围,而且经济实用。这类方法经有关学术组织认可后可称为推荐方法(recommended method),推荐方法应具有足够的实验证据。
临床化学决定性方法及参考方法见表5-1。
表5-1 临床化学决定性方法及参考方法
(Tietz,clin chem. 1979, 25: 834)
项目 决定性方法 参考方法
钙 ID-MS 原子吸收分光光度法
氯 电量滴定法、中子活化法 电流滴定法
镁 ID-MS 原子吸收分光光度法
磷 ID-MS --
钾 ID-MS、中子活化法 火焰光度法
钠 重量分析法、中子活化法 火焰光度法
白蛋白 -- 免疫化学法
总蛋白 -- 双缩脲法
肌酐 ID-MS、离子交换层析法 离子交换层析法
尿素 ID-MS 尿素酶法
尿酸 ID-MS 尿酸酶法(紫外法)
胆红素 -- 重氮反应法
葡萄糖 ID-MS 己糖激酶法
胆固醇 ID-MS Abell-Kendall法,胆固醇氧化酶法
甘油三酯 ID-MS 酶法
AST(GOT) -- MDH-NADH法
ALT(GPT) -- LDH-NADH法
转***酶(r-GT) -- 连续监测产物生成法
肌酸激酶 -- NAD+偶联法
注:ID-MS:同位素稀释一质谱法 MDH:苹果酸脱氢酶 LDH:乳酸脱氢酶
(二)标准品的分级
国际标准化委员会将标准品(参考物)的定义暂定为:它的一种或几种物理或化学性质已经充分确定;被用于校正仪器或用于评价一种测定方法的物质,并将其分成三级。
1.一级标准品(原级参考物) 是一种稳定而均一的物质,它的数值已由决定性方法确定,或由高度准确的若干方法确定,所含杂质也已经定量,且有证书;用于校正决定性方法,评价及校正参考方法以及为二级标准品定值。
2.二级标准品(次级参考物) 也称校准品,包括用于常规分析的标准液。这类标准品可由实验室自已配制或为商品,它的示值必须用一级标准品和参考方法并由训练有素的,能熟练掌握参考方法的操作者确定;主要用于常规方法的评价或为控制物定值和常规测定的结果计算。
3.校准品 用二级标准品和常规方法测定得到校准品,用于常规测定中的标准。
各级测定方法及标准品之间的相互关系及准确度传递见图5-2。
二 常规方法的选择
(一)常规方法的性能指标
国际临床化学协会(IFCC)提出:常规方法应具有实用性和可靠性两方面的性能指标,至于某一项具体分析方法所应具有的性能标准,可由临床化学家根据采用这一试验的目的决定。
(1)实用性:一般应具备微量快速,便于急诊;费用低廉;应用安全。
(2)可靠性:一般具有较高的精密度和准确度,以及较大的检测范围。精密度即变异系数(CV%)一般应小于5%。准确度是指测定值与"真值"的符合程度,一般偏差系数(CB)应小于5%。特异性是指只对待测物质起化学反应,不与其他结构类似的化合物发生反应。检测能力?quot;检测限度"或"检出限"。检出限通常是指能与适当的"空白"读数相区别的待测物的最小量。
(二)常规方法的选择程序
首先根据方法选择的要求对已发表的各种检测方法进行比较与检验,确定哪些方法有充分的科学根据及真实的使用价值。经初步选定的方法称为候选方法。候选方法确定后,要熟悉该法的原理、性能指标及相应的条件等。然后进行初步试验,为了实用的目的,初试应该评价候选方法所有的性能指标。
第二节 临床生化检验方法学评价
方法学评价(evaluation of methodology)的基本内容是通过实验途径,测定并评价方法的精密度与准确度,在实验中测定的是不精密度与不准确度,无论是精密度还是准确度,强调的都是误差,评价实验的过程就是对误差的测定。
一、方法评价方案
美国国家临床实验室标准委员会(NCCLS)制订了一套评价方案(evaluation Protocols),能客观而正确地对方法的技术性能作出评价。它不仅可用来评价临床生化检验方法,而且还可用以评价试剂盒和分析仪器的性能。
(一)精密度评价
1.目的要求 评价方法给出结果的可重复程度即精密度。反映精密度好坏的指标是变异系数CV,CV越小精密度越好,反之则差,故有人称其为不精密度。用本方案评价可以计算出批内、批间、日间和总CV,其中总CV最重要,它代表整个分析体系的可重复程度。
2.评价前的准备 ①对于评价对象和评价方案均应熟悉。②实验用试剂应是同批次配制,或同一批号的商品试剂盒和参考物,仪器也应处于良好的工作状态。③实验用标本一般选择2个(亦可更多),一个在正常范围或在医学决定水平附近,另一个为异常值,被测物在疾病时增高者用高值,降低者用低值;实验标本的介质应与临床标本一致,并应妥善保存,应保证在整个实验过程中稳定。④先作一个初步的批内精密度测定,即一个标本重复测定20次,计算出均值,标准差和变异系数。
3.评价步骤 用2个标本每天测定2次(2次测定间隔不得少于2小时),每次测定均作双份,共测定20天。每次测定至少做一个质控。
(二)准确度评价
1.方法比较试验 目的是评价方法所给出的结果是否准确,采用的是方法比较试验。在实验的范围内两方法间的平均差异,并确定偏差。
(1)要求 方法比较试验理论上是两种方法间的差异均作为试验方法的偏差。因此比较方法应是参考方法或推荐方法,如该测定没有参考方法或推荐方法亦可用公认的常规方法。但须具备:①比较试验方法有更好的精密度。②干扰影响已知。③与试验方法使用相同的计算单位。
(2)比较前准备 ①实验者应熟悉所用的仪器、试验方法、比较方法和评价方案。②实验标本应收集新鲜的正常和异常的临床标本,应有足够宽的浓度范围,各浓度应有合适的比例。如不能及时测定,标本应妥善保存并应在分析物的稳定期内测定。
(3)方法比较步骤 ①样本数至少为40个标本,每个标本用2种方法分别作双份测定,因此样本应有足够的量,如临床标本的量太少可将2份含量相近的标本混合。②每天测定8个标本,双份测定时第一次按顺序1,2……7,8,第二次8,7……2,1,共测试5天。方法比较中实验质料的分配建议见表5-2。
2.回收试验 所谓回收即分析方法正确测定加入常规分析样品中的纯分析物的能力。目的是测定比例系统误差,以衡量候选方法的准确度。
(1)方法:将被分析的纯品标准液加入样品中,成为分析样品,原样品加入同量的无分析物的溶液作基础样品,然后用实验方法分析,两者测定结果的差值为回收量。
(2)回收率计算:理想的回收率为100%,如某法测血钙的回收率为95.7%,有4.3%的比例误差,表明一个含钙真值为2.5mmol/l的标本,若用该方法测定,约为2.39mmol/l(2.5×95.79% ),误差为0.11mmol/L(2.5Χ4.3%)。
(3)注意事项:① 准确吸量,因为被分析物的理论值是根据加入标准液体积及原样品的体积计算所得,吸量稍有不准,就会影响结果; ② 样品中加入标准液后,总的浓度必须在方法的分析范围内,一般须加入高、中、低不同浓度做回收试验,计算平均回收率;③ 加入标准液后,最好使实验样品的被测浓度达到医学决定浓度; ④ 加入标准液的体积一般在10%以内。若稀释过大,误差将发生改变,甚至消失。
(三)线性评价
1.目的要求 线性范围是分析方法的一个重要技术指标,它能判断对某一分析方法测得的浓度或活性值与设定的浓度或活性值之间的比例关系的范围。常规方法应具有较宽的分析范围,一般应覆盖临床可能出现的高值。
2.评价前准备 ①熟悉仪器、评价方案和试剂。②评价标本的介质应与实际测定的标本相一致,理想的标本是病人的低值或高值标本,这往往不易收集到,亦可用病人的混合标本加入分析物作为高值标本,用正常人标本作为低值标本(必要时可作处理如分析物为酶可以加热,小分子化合物可以透析,脂类可用超离心或多价阴离子沉淀)。③浓度范围应以分析项目的线性要求为准。线性评价应有5个不同浓度,可选择低值和高值标本各一个,低值标本为1号,高值标本为5号,二者3:1混匀为2号,等份混匀为3号,1:3混匀为4号,2-4号标本的浓度按下式计算:
标本浓度 = (C1V1 + C5V5)/(V1 + V5)C = 浓度,V = 体积。
(四)干扰试验
1.目的要求 判断评价方法给出的结果是否受非分析物影响及影响程度。①干扰是指在测定某分析物的浓度或活性时,受另一非分析物影响而导致测定结果增高(正干扰)或降低(负干扰)。②干扰物质可分为内源性(标本中存在的)和外源性(外界污染的)两类。内源性的干扰物有:血清中固有的代谢产物,如甘油三酯测定时血清中的甘油,肌酐酶法测定时血清中的肌酸等;病理情况下生成的:如胆红素,脂类,蛋白质,血红蛋白等;治疗药物,肠道营养等。外源性
表5-2 方法比较中实验资料分配的建议
项 目 A 组 B 组 C 组 D 组 E 组
Glu(mg/dl) <50(10%) 51~110(40%) 111-150(30%) 151-251(10%) 251-SL(10%)
BUN(mg/dl) <15(10%) 12~25(40%) 26-50(20%) 51-100(20%) 101-SL(10%)
Cr(mg/dl) <1.0(20%) 1.1~2.5(30%) 2.6-5.0(20%) 5.1-10(20%) 10-SL(10%)
Na(mmol/L) 120~130(20%) 131~140(40%) 141-150(30%) 151-160(10%)
K(mmol/L) <3.0(20%) 3~4.5(40%) 4.5-6.0(30%) >6(10%)
Cl(mmol/L) 80~95(30%) 96~105(40%) 106-120(30%)
CO2(mmol/L) <15(10%) 15~20(30%) 21-30(40%) 31-40(10%) 41-SL(10%)
Ca(mg/dl) <8(10%) 8.1~9(20%) 9.1-11(40%) 11.1-13(10%) 13.1-SL(10%)
Fe(μg/dl) <50(20%) 51~150(50%) 151-300(20%) 301-SL(10%)
iP(mg/dl) <2.5(10%) 2.6~4.5(60%) 4.6-6.5(20%) >6.5(10%)
UA(mg/dl) <3.0(20%) 3.1~5(20%) 5.1-8(20%) 8.1-10(20%) 10.1-SL(20%)
TP(g/L) <50(10%) 51~70(40%) 71-90(40%) >90(10%)
Alb(g/L) <30(10%) 31~40(40%) 41-50(40%) >50(10%)
T-Bil(mg/dl) 0~1.0(30%) 1.1~2(30%) 2.1-5(20%) >5(10%)
Cho(mg/dl) <150(10%) 151~250(40%) 251-350(30%) >350(20%)
TG(mg/dl) <75(10%) 76~125(30%) 126-200(30%) 201-300(10%) 301-SL(10%)
ALP(U/L)
ALT(U/L)
Hb(g/dl) <9.0(15%) 9.1~12(25%) 12.1-17(50%) 17.1-SL(10%)
RBC(×106) <3.0(10%) 3.1~4(30%) 4.1-6(50%) 6.1-SL(10%)
WBC(×103) <2.0(10%) 2.1~5(20%) 5.1-11(40%) 11.1-25(20%) 25.1-SL(10%)
Platlets(×103) <50(10%) 51~150(20%) 151-300(30%) 301-450(30%) 451-SL(10%)
干扰有:标本收集中的添加物如抗凝剂,防腐剂,稳定剂,容器和塞子的污染等;试剂中的杂质和杂酶等。③干扰的机理,可有物理作用、化学作用以及非特异反应等。④干扰可能是造成误差的一个重要原因,如果干扰物是恒定的将引起恒定误差,如干扰物随病理生理因素影响,将引起随机误差。因此,实验室应了解各种测定方法的干扰情况。
2.试验前准备 ①应做的主要干扰物为病人标本中常常出现的黄疸,脂血和溶血;某些药物如维生素C等;实验常用的抗凝剂,防腐剂和稳定剂。②质量保证,不存在系统误差;批内精密度在可接受范围内;应不存在前后结果的交叉污染;实验过程有质控监督。
3.干扰试验方法
(1)"配对差异"试验:即将不同浓度的干扰物加入到实验标本中,然后分别测定加与不加干扰物的标本,比较二者有无偏差,并了解干扰物浓度与偏差程度的关系。
(2) 用病人标本作偏差分析: ① 本分析用来证实某类病人标本中是否存在未知的干扰物;进一步肯定加入干扰物实验的结论。② 选择2组病人标本,一组含疑似干扰物为测定组,另一组不含疑似干扰物作为对照组,两组的分析物浓度范围应大致相同,每组标本需20~40个。③ 两组样品分别用试验方法和比较方法(参考方法)双份测定,并在2小时内完成。④ 分别比较每组样品,两种方法间的差异,如测定组有差异,对照组无差异说明存在干扰,如两组均无显著差异说明不存在干扰。单用统计学上的差异显著与否来判断干扰存在与否,有时并不确切,因实际测定中随机误差的存在,可能会作出相反的解释,必须结合临床要求的性能来综合判断。
这两种干扰试验各有优缺点,第一种方法的不足之处是实验标本的介质可能与病理标本的介质不一致,病理标本中的干扰物可能不是原来的药物而是代谢产物,加入的干扰物可能与病理标本中的干扰物不完全相同等。第二种方法的不足之处是①病人通常用多种药物,难以确定干扰物;②不是每种测定项目均有参考方法,而且有的参考方法难以在临床实验室中开展;③参考方法亦可能受某些物质的干扰。两种方法同时使用,会起互补作用。
4.试验步骤 ①实验材料应选择混合血清1份,分成2份,1 份加入干扰物,含量为临床标本中可能出现的最高含量,另一份不加,按比例混合成5个不同干扰物浓度。(见线性评价)②每份标本重复测定n次。
二、统计分析及评价
(一)精密度统计评价
1. 将精密度测定的数据整理于表5-3。
2. 离群点的检查 如每次双份测定的差值超过初步精密度测定时±标准差的5.5倍(是99.99%的上限值),这时数据为"离群点",应弃去或重做。
3. 统计分析 见表5-3、4和计算公式。本例的批内CV为2.23%,批间CV为2.46%,日间CV为3.48%,总CV为4.19%。日平均均值=0.949
S日间(B) = 0.033
CV日间 = B/日平均均值×100% = 3.48%
S批间(A)= n = 测定天数
CV批间 = A/日平均均值×100% = 2.46%
S批内(A)=
CV批内 = S批内/日平均均值×100% = 2.23%
S总 =
CV总 = S总/日平均均值×100% = 4.19%
表5-3 实验数据整理和几项计算(甘油三酯低值质控血清,mmol/L)
天数 次数I 次数II 次数I 次数II 日
结果1 结果2 结果1 结果2 平均 平均 平均
1 0.960 0.950 0.990 0.980 0.955 0.985 0.978
2 0.920 0.930 1.010 1.010 0.925 1.010 0.968
3 0.986 1.014 1.010 0.960 1.000 0.985 0.992
18 0.948 0.920 0.955 0.937 0.934 0.946 0.940
19 0.908 0.936 0.890 0.917 0.922 0.904 0.913
20 0.889 0.944 0.901 0.920 0.917 0.910 0.914
表5-4 实验数据的几项计算
天数 次数I 次数II 次数I 平均
(结果1-2)2 (结果1-2)2 次数II 平均
1 0.0001 0.0001 0.0009
2 0.0001 0.0000 0.00723
3 0.000784 0.0025 0.000225
18 0.000784 0.000324 0.000144
19 0.000784 0.000729 0.000324
20 0.003025 0.000361
C
(二)准确度统计评价
1.将方法实验测得的数据整理于表5-5中。
2.方法内双份测定的离群点检查 按表5-6中的公式计算,分别得出每一标本的DX和DY以及DX′和DY′。如分别超过DX和DY以及DX′和DY′值的4倍为离群点,应剔除,如出现一个以上离群点,应查找原因,必要时重做。
表5-5 淀粉酶测定试验方法(Y)与BM试剂(X)比较(U/L)
样品 试验方法 比较方法 试验方法 比较方法
结果1 结果2 结果1 结果2 结果1-2 结果1-2
1 1792 1795 1672 1676 3 4
2 1755 1751 1561 1562 4 1
3 1598 1595 1480 1483 3 3
38 35 36 39 40 1 1
39 72 75 79 78 3 1
40 54 52 58 55 2 3
表5-6 方法内复测结果检查
Xi1=1672 Xi2=1676 Yi1=1792 Yi2=1795
Dxi=
DYi=
Dxi′=
DYi′=
同样:
I Xi1 Xi2 Yi1 Yi2 DXi DYi DXi′ DYi′
1 1672 1676 1792 1795 4 3 0.00239 0.00167
2 1561 1562 1755 1751 1 4 0.00511 0.00228
3 1480 1483 1598 1595 3 3 0.00202 0.00202
……
38 39 40 35 36 1 1 0.0253 0.0282
39 79 78 72 75 1 3 0.0127 0.0382
40 56 55 54 52 1 2 0.0180 0.0377
控制限值=
进位制=11
控制限值=
进位制=12
控制限值=
控制限值=
本例方法内未发现离群点
表5-7 离群点检查
Xi1=1672 Xi2 =1676 Yi1=1792 Yi2=1795
Ei1= Ei2= Ei1′= Ei2′= 同样:
I Ei1 Ei2 Ei1′ Ei2′
1 120 119 0.0718 0.0710
2 185* 189* 0.1180 0.1210
3 118 112 0.0797 0.0755
38 4 4 0.1030 0.1000
39 7 3 0.0886 0.0385
40 2 3 0.0357 0.0545
E的控制限值=4×E=4×42=167.96 进位=168
E′的控制限值=4×E′=0.2416
本例二方法间出现2个离群点
表5-8 适用范围的检查(相关性计算)和回归计算
X=637U/L Y=678U/L
(r≥0.975, r2≥0.950为合适范围) a=Y-(b× )= -17.003. 试验方法与比较方法间的离群点检查可按表5-7中的公式计算,控制限为4E。本例的标本出现2个离群点。
4. 试验方法(Y)与比较方法(X)相关性 按表5-8中的公式计算, r≥0.975或r2≥0.95说明二法的相关良好。
(三)线性评价方法
1.测定结果 5个不同浓度的标本,随机排列,每个标本测定4次,因此标本应有足够的量,并且分析要求在当天完成。
2. 离群点检查 将每个标本(X1到X5)4次测定的结果排列在Y1-Y4,见表5-9。D1和D2中的数据均未超过界限值P0.05 = 0.765和P0.01 = 0.889,本组数据未发现离群点。
3. 线性评价统计 采用回归分析,将数据归纳于表5-10。
数据计算:
TY = 28441.8
TYY = 57994529.74
TXY = 57982482.6
D = 20TXX -(TX)2 =350807104
TSS = Q/20 = 17547730.38
Q = 20TYY -(TY)2 = 350954607.6
LSS = M2/20D =
M
RSS = TSS - LSS = 222.132
表5-9 离群点检查结果(以肌酐酶法测定为例)
X1 X2 X3 X4 X5
97 760 1422 2084 2746
Y1 97.5 764 1425 2090 2748
Y2 97 762 1422 2088 2748
Y3 96.8 760 1420 2085 2745
Y4 96.5 756 1418 2080 2939
D = Y1- Y4 1.0 8 7 10
a
D1 = (Y1- Y2)/D 0.5 0.25 0.43 0.20 0.31
b) Y3- Y4 0.3 4 2 5 6
D2 = (Y3- Y4)/D 0.3 0.5 0.29 0.50 0.46
界限值P0.05 = 0.765, P0.01 = 0.889
4. 线性回归分析 b = M/D = 1.0002;a = Y-bX = 0.00564;Y = 0.00564 + 1.0002X
5. 稀释变异试验 P = 最大SS/TE = 90/209.03 = 0.43;界限值P0.05 = 0.6841; P0.01 = 0.7814;现稀释变异为可接受。
6. 线性失拟检查 LOF = RSS - TE = 13.102;G = 5 LOF/TE = 0.313;界限值F0.05 = 3.29; F0.01 = 5.42;现G< F0.05说明线性良好。
表5-10 回归分析结果
X X2 Y
Y2
SS = 97.5 9506.25
97 9409
96.8 9370.24
96.5 9312.25
97 9409 387.8 37616.6 37597.74 0.53
764 583696
762 580644
760 577600
756 571536
760 577600 3042 2311920 2313476 35
1425 2030625
1422 2022084
1420 2016400
1418 2010724
1422 2022086 5685 8084070 8079833 26.75
2090 4368100
2088 4359744
2085 4347225
2080 4326400
2084 4343056 8343 17386812 17401469 56.75
2752 7523504
2748 7551504
2745 7535025
2739 7502121
2746 7540516 10984 30162064 30162154 90
(四)干扰实验统计评价
计算分析干扰 各组均值 - 未加干扰物相应组的均值 = 干扰值。对照这一浓度±1.96 s,可得出某浓度内有无干扰。
不论是方法特异性差或是受干扰,都影响到测定结果的正确度,影响的程度和分析物的浓度无关,但和非分析物的量有关,所以产生的误差都是恒定系统误差(以Bias表示),Bias即偏差,指所有测定值系统性的偏离真值,表示系统误差的大小。在干扰实验中,偏差等于干扰样品测定值与基础样品测定值之差。
如Bias<允许误差(EA)的临界值(EA为可允许误差的95%限度),表明由于干扰物引起的偏差对临床诊断和治疗不产生不良的影响,是可以被接受的。
三 方法学性能分析
(一)方法学性能标准
性能标准(performance standards, PS)也称分析目标,应根据不同的应用目的(筛选、诊断、预后、监测)而异。由允许分析误差(allowable analytical error)和医学决定水平(medical decision level)这两项内容决定。① 允许分析误差 用EA表示,它被规定为95%样品的允许误差限度;② 医学决定水平 用XC表示,是临床判断结果具有意义的被分析物浓度。
EA和XC两项内容,就是一个测定方法的性能指标。但对于每一医学决定水平都应规定相应的性能标准,即在一定XC值下的EA值。以血清葡萄糖测定为例。在XC1= 2.8mmol/L, XC2= 6.7mmol/L, XC3 = 8.9mmol/L时,其相应的EA均为0.56mmol/L,而在XC4=16.8mmol/L, 其EA为1.4mmol/L。这里EA指的是总误差。
制定的性能标准,既应反映临床应用与解释结果的要求,称为医学效用限度(medical usefulness limits),又应基本符合实验室所能达到的技能状态(state of art)。因此,需要由临床医学家和临床化学家共同研究制定。
(二)方法学性能分析
候选方法可否被接受,最后根据评价方案中的误差结果进行归纳,作出判断。任何一项指标大于可允许误差,该方法都不能接受。
如果候选方法被得出可接受性的结论,那么接着就要进行评价后实验,包括参考值的制定,制定的参考值及其范围应符合以前公认的调查报告;质控观察,应符合室内质控的要求;临床病例的观察等。最后进入方法应用阶段。不要以为一经评价合格的方法就可产生高质量的结果,还须建立质控系统,以便随时发现合格的方法在实施过程中出现的问题,要善于发现其中还存在的不足并进一步研究解决使其日臻完善。教学目标和要求
掌握临床生化检验方法的分级、标准品分级及方法选择的要求和方法评价方案。
熟悉方法评价与实验误差之间的关系,方法性能指标。
了解方法评价方案中统计分析的方法。



