分析檢測的首要任務是定性和定量,定性可以說是有和無的問題,定量是提供待測物質含量范圍的一個過程,這當中包含了任何定性定量都有不確定度的含義。而普遍采用的標準曲線已然是分析檢測中的常規工作,本篇內容以講解加問答的形式探討標準曲線使用過程中的難點和誤區,結合數據處理版面關于標準曲線的問題交流,以期答疑解惑、共同精進。
標準曲線我們通常采用的是Y=a+bX,曲線擬合完必須要做統計檢驗,且要做統計完備的線性檢驗和失擬檢驗,然后再做a與0的差別檢驗,如果a與0的統計學上無差異,你就可以考慮用Y=bX的擬合曲線,擬合出來后同樣做線性檢驗和失擬檢驗,如果線性檢驗合格(P<0.05)且失擬檢驗合格(p>0.05)此時你就可以采用Y=bX。二次曲線的采用同樣是這樣的道理,如果你Y=a+bX時擬合不合格,你就考慮用Y=a+bX+cX2,同樣做失擬檢驗,考察擬合的符合情況。如果Y=a+bX 和Y=a+bX+cX2都滿足擬合檢驗和失擬檢驗合格,則采用Y=a+bX形式,這樣符合統計學上參數最少的統計簡潔性原則。
工作中我們常要減掉空白得到樣品含量,現有國家標準方法有的推薦先算出空白含量,用樣品含量相減,也有推薦先用樣品信號減空白信號然后去標準曲線推算含量。而且這兩種算法常常差距很大。其實這種差距往往是低含量水平時才出現,在低含量水平通過標準曲線推算含量時,本身不確定度就很大。這兩種方法都可以。個人推薦先用樣品信號減空白信號然后去標準曲線推算含量,因為這樣出來的含量不確定度要小一些,而先算出空白含量再相減就增加了1次標準曲線推算含量時的不確定度,因為好的測量永遠是不確定度小的測量。
1.先從原理上講:判斷兩條或多條標準曲線的差異,須檢驗殘差,截距和斜率三項,分別有不同的統計學參數,殘差用F檢驗,截距和斜率采用較為復雜的統計量。
標準溶液體積取用的有效數字跟你采用的體積量具有直接關系。比如說量取或準確量取等字眼,10mL和10.0mL提示你要采用不同的量具。
GB5750.3-20068.2.7項有如下規定:校準曲線相關系數只舍不入,保留到小數點后出現非9的一位,如0.99989→0.9998。如果小數點后都是9時,最多保留小數點后4位。
標準系列一般都是配制不同濃度,進樣相同體積來做的(濃度法)。但實際工作中我們還用到同一濃度來進樣不同體積的方式來做(體積法),濃度法與體積法的區別在于濃度法中與待測物質存在的溶劑/待測物質的比例與體積法不同。濃度法中溶劑的環境(體積)基本是一致的,這樣的好處就是濃度法在判斷溶劑(或溶劑中干擾物質)和待測物質的指認上更加容易。體積法中干擾物質也會隨標準系列增加,不容易實現待測物質的指認。從進樣針,進小體積時不確定度比較大,帶來的直接結果時標準曲線不如濃度法容易做直。而且物理體積的限制,體積法不太容易實現較大跨度的濃度系列設置。總之,體積法和濃度法本質上是一致的,但濃度法有:容易做好標準曲線,容易實現較大濃度跨度和容易實現待測物質的指認等優點。
這種情況下我們一般選擇四種方式報告結果:未檢出,<檢出限,<定量限,<標準曲線第一點所推算的樣品濃度。
空白代表你所選擇的空白對儀器響應/信號的影響,當然可能是正方向和負方向的影響,所以理論上講必須減掉空白。至于是先減空白信號,還是減空白測定值,按國家規定或參見4.4問題。
配制一系列濃度標準,包括0濃度,從低濃度開始擬合當擬合檢驗出現P>0.05的最高的那個濃度點為止。有也經驗說當加入的高濃度點在低濃度點構建的直線方程推算的響應超出±10%范圍。關于線性范圍的最低點應該是0、檢出限或是定量限的問題,個人趨向最低點為0,因為線性范圍只是統計學上線性的表現,跟能否準確定量是兩方面的問題。
內容提要
本文內容共分為【四個部分】
1.標準曲線的本質:系列濃度待測物質與響應的關系,用以推算樣品含量。
2.標準曲線的做法:3點以上,至少重復2次,濃度均勻設置。
3.標準曲線的檢驗:擬合檢驗、失擬檢驗和斜率、截距檢驗。
4.標準曲線使用中的問題。
標準曲線的本質
分析檢測中的標準曲線是指一系列已知含量(濃度/量)的物質與儀器響應/信號之間的關系,數學處理就是曲線方程,圖形表示就是標準曲線。
標準曲線的目的是可以根據標準曲線查出待測物質的含量。當我們得到一系列已知含量的物質的響應后,就會去建立函數關系,數學上稱曲線擬合,由于直線最為簡單,所以常常用直線方程加以擬合,當然會用到多項式擬合等其他方式。
標準曲線的核心問題要解決:
1、能找到確切濃度的標準物質或標準品。
2、標準系列和待測物質一定要有相同和一致的基體,因為樣品基體可能會干擾儀器的響應,從這個意義上講,樣品的前處理實際就是提供標準和樣品同樣的基體環境,盡量祛除干擾基體。
所以最好的標準系列應該是樣品基體匹配的標準系列。
而方法建立過程中首先要考慮的當然是基體干擾的問題,推薦用標準加入曲線和Youden曲線分別考察樣品基體所帶來的乘積性干擾和加和性干擾。
標準加入曲線就是在樣品中加入一系列標準,然后考察該標準加入曲線和標準曲線斜率的統計學差異,若有差異需考慮用標準加入法定量;
而Youden曲線就是對樣品做一系列稀釋,然后用稀釋倍數如1/10,1/5,1/2,1對儀器響應做曲線,考察該Youden曲線的截距與0的差別,若有差別則提示有加和性干擾,此時測定值要減去該截距才是真實值。
只有解決了標準曲線與樣品基體的匹配問題,我們的定量才可靠。內標法和替代物的使用則是為了解決儀器和前處理的影響問題。
標準曲線的做法
按GB/T 22554-2010《基于標準樣品的線性校準》推薦:
1.標準曲線的濃度范圍應覆蓋正常操作條件下的被測量范圍;
2.標準樣品的組分盡量與被測樣品組分一致;
3.標準樣品的濃度值應等距離的分布在被測量范圍;
4.標準樣品的個數至少應有3個濃度;
5.每個標準點至少重復2次,這個重復是指從稀釋開始。
如果國家標準有相應的濃度系列推薦,盡量按國家標準,如果你要偷懶,比如我要減少標準點,至少要有理論標準支撐,比如至少要3個濃度。工作中我們經常采用線性校準,因為線性方程最為簡潔。
標準曲線的檢驗
標準曲線的檢驗是實際操作中最大的難點,也是工作中誤區和爭議最多的話題,比如GB/T 5750.3-2006 就將標準曲線的檢驗分為:精密度檢驗,截距檢驗和斜率檢驗,但并未出示具體的檢驗方法。
首先講講這三個檢驗,標準曲線的精密度檢驗,實際含義就是做出來的試驗點在我擬合的直線方程左右的分布情況,標準曲線是所有點以最小二乘算法(OLS)擬合出來的,這條曲線到所有點的垂直距離的和(殘差)是最小的。
因此這條曲線并非通過所有點而是非常接近所有點,精密度檢驗就是看這些試驗點距離擬合的直線的距離有無異常,所以也稱線性檢驗(擬合檢驗)。這時的精密度(線性檢驗)需用F檢驗,P<0.05作為線性檢驗合格的標準。
標準曲線的截距檢驗和斜率檢驗分別考察Y=a+bX中a和b與0的統計學差異,a與0有差別說明有試劑空白或系統誤差,而b若與0沒差別說明儀器的靈敏度根本達不到分析要求。日常工作中我們通常用相關系數來作為標準曲線好壞的標準,這點有一定道理,但并不全面。
決定系數是相關系數的平方,就是我們經常在儀器軟件中看到的R2或Fit,它提示的是我建立的回歸方程所解釋X對Y變化占Y變量的比值,比如決定系數是0.99也就是說我這個回歸方程可以解釋Y變化的99%,剩下的1%就是殘差。前面提到的精密度(線性檢驗)就是用這兩部分的變化做F檢驗,由于統計檢驗的臨界值比較大,通常0.90以上的相關系數都會通過這個F檢驗,當然還與實驗點數(自由度)有關。
這里要提到GB/T22554-2010《基于標準樣品的線性校準》中關于失擬檢驗的問題,這里的失擬檢驗是要看曲線擬合后剩下殘差與實驗數據本身隨機誤差(變異)之間的差別,同樣采用F檢驗,此時失擬檢驗P應該>0.05,也就是說殘差應該跟實驗測定中的隨機誤差(變異)沒有差別,你要看每次測定的隨機誤差(變異)就必須多次測定同一濃度,因此失擬檢驗要求每個濃度點至少重復2次。
除此之外,最后我們還要看看這些殘差的分布是否是正態的,因為正態才符合隨機誤差的特性。綜上所述,標準曲線的檢驗應該是線性檢驗結合失擬檢驗,以及殘差的正態性檢驗結合才是統計學上比較完備的。
通常我們采用的相關系數0.99以上的說法缺乏統計完備性。正如大家經常看到的改變擬合的參數個數,如二次方程明顯能提高相關系數,但是我們經常沒有勇氣去用二次曲線方程,因為你沒有統計學上完備的支撐。如果你發現標準曲線在低濃度和高濃度點的變異程度不同(非等方差),此時你應該考慮權重最小二乘(WLS)。
標準曲線使用中的問題
1 標準曲線需要人為的增加(0,0)點嗎?
不能。通常的標準系列多是配制0,1,2,3mg/L系列這樣的說法,沒做實驗人為添加(0,0)很不妥,因為很多時候0管進入儀器可能也有響應值,這也是我們考察試劑空白的一個重要步驟。這個0管在某些時候非常重要,比如全血鉛測定,我們采用牛血清來基體匹配標準系列,如果此時你用酸做空白或沒做實驗人為添加(0,0),那你就很難做好標準曲線。所以標準曲線的0管也是做好標準曲線的重要考慮點。
2 標準曲線需要減掉試劑空白來做嗎?
不需要。儀器測出來標準系列的響應值可以減掉試劑空白或減掉0管的響應值來做,工作中我們也常用0管來做儀器調零。其實沒有必要那么麻煩,即使空白或0管有響應值,在構建標準曲線時,我們已經認為該響應值就是0濃度,也就是扣除了這個空白的。
3 什么時候用Y=bX和二次曲線呢?
標準曲線我們通常采用的是Y=a+bX,曲線擬合完必須要做統計檢驗,且要做統計完備的線性檢驗和失擬檢驗,然后再做a與0的差別檢驗,如果a與0的統計學上無差異,你就可以考慮用Y=bX的擬合曲線,擬合出來后同樣做線性檢驗和失擬檢驗,如果線性檢驗合格(P<0.05)且失擬檢驗合格(p>0.05)此時你就可以采用Y=bX。二次曲線的采用同樣是這樣的道理,如果你Y=a+bX時擬合不合格,你就考慮用Y=a+bX+cX2,同樣做失擬檢驗,考察擬合的符合情況。如果Y=a+bX 和Y=a+bX+cX2都滿足擬合檢驗和失擬檢驗合格,則采用Y=a+bX形式,這樣符合統計學上參數最少的統計簡潔性原則。
4 標準曲線去查含量時是先減空白信號算樣品含量還是先算出空白含量相減呢?
工作中我們常要減掉空白得到樣品含量,現有國家標準方法有的推薦先算出空白含量,用樣品含量相減,也有推薦先用樣品信號減空白信號然后去標準曲線推算含量。而且這兩種算法常常差距很大。其實這種差距往往是低含量水平時才出現,在低含量水平通過標準曲線推算含量時,本身不確定度就很大。這兩種方法都可以。個人推薦先用樣品信號減空白信號然后去標準曲線推算含量,因為這樣出來的含量不確定度要小一些,而先算出空白含量再相減就增加了1次標準曲線推算含量時的不確定度,因為好的測量永遠是不確定度小的測量。
5 如何做兩條標準曲線的檢驗呢?
1.先從原理上講:判斷兩條或多條標準曲線的差異,須檢驗殘差,截距和斜率三項,分別有不同的統計學參數,殘差用F檢驗,截距和斜率采用較為復雜的統計量。
2、從實際操作講:多用協方差分析檢驗截距和斜率的差異,以SPSS為例:
①先重新整理數據,將y2數據列加到y1下面,變成一個變量y;將x2數據列加到x1下面,變成一個變量x;然后再設定一個新的分組變量group,原來第1組值為1,第2組值為2。
②進行協方差分析(第一步分析斜率是否無差異).Analyze->GeneralLinear Model->Univariate Dependent List:填入y—將y做為因變量 Fixed Factor:填入group Covaraites:填入x—將x做為協變量 Model:選Custom Model:填入 x groupx*group—注意如果變量填入順序不一樣,結果也會不一樣. Sum ofsquares下拉列表框:選TypeI 然后點擊ok,看結果里x*group這一行的Sig.P值,若大于0.05,則接受原假設,即兩條回歸直線的斜率無差異,否則拒絕。
③再來進行截距的無差異分析其實過程跟上面一樣,只是Model里去掉了x*group交叉項.Analyze->GeneralLinear Model->Univariate Dependent List:填入y—將y做為因變量 Fixed Factor:填入group Covaraites:填入x—將x做為協變量 Model:選Custom Model:填入 x group—注意如果變量填入順序不一樣,結果也會不一樣. Sum of squares下拉列表框:選TypeI 點擊ok后,看group一行的Sig.P值,若P值大于0.05說明兩條回歸直線截距也無差異,若小于0.05說明截距是有差異的。
6 標準系列的標準溶液體積取用中有效數字該如何寫呢?
標準溶液體積取用的有效數字跟你采用的體積量具有直接關系。比如說量取或準確量取等字眼,10mL和10.0mL提示你要采用不同的量具。
當我們使用某個量具完成某次體積取用后,讀數是按照量具的最小允差決定的,而最小允差是針對最小分度線而言的。
當取用10mL體積時,如果用A級10mL的分度吸管,那么10.0mL應該是確定的,因為它的分度線為0.1mL。
當取用1mL體積時,如果用A級1mL的分度吸管,那么1.00mL應該是確定的,因為它的分度線為0.01mL。
所以我個人意見,到底寫10.00還是10.0以最小分度線來確定,最小分度線以下的都為估讀。如果你認為估讀也是有效數字的話,10.00mL也可以,因為此時的容量允差為0.05mL,但1.000mL就沒有太大意義了,因為A級1mL的分度吸管的容量允差已經是0.008mL了。
7 標準曲線的相關系數的有效數字該如何保留呢?
GB5750.3-20068.2.7項有如下規定:校準曲線相關系數只舍不入,保留到小數點后出現非9的一位,如0.99989→0.9998。如果小數點后都是9時,最多保留小數點后4位。
8 標準曲線可以用同一濃度不同體積的進樣來做嗎?
標準系列一般都是配制不同濃度,進樣相同體積來做的(濃度法)。但實際工作中我們還用到同一濃度來進樣不同體積的方式來做(體積法),濃度法與體積法的區別在于濃度法中與待測物質存在的溶劑/待測物質的比例與體積法不同。濃度法中溶劑的環境(體積)基本是一致的,這樣的好處就是濃度法在判斷溶劑(或溶劑中干擾物質)和待測物質的指認上更加容易。體積法中干擾物質也會隨標準系列增加,不容易實現待測物質的指認。從進樣針,進小體積時不確定度比較大,帶來的直接結果時標準曲線不如濃度法容易做直。而且物理體積的限制,體積法不太容易實現較大跨度的濃度系列設置。總之,體積法和濃度法本質上是一致的,但濃度法有:容易做好標準曲線,容易實現較大濃度跨度和容易實現待測物質的指認等優點。
9 標準曲線查出樣品是負值,如何報告結果呢?
這種情況下我們一般選擇四種方式報告結果:未檢出,<檢出限,<定量限,<標準曲線第一點所推算的樣品濃度。
四種都有道理,實際區別是埋在四種選擇下面的結果報告人的風險。
未檢出的全部含義應該是本實驗室本儀器本方法未檢出,如果沒有這些界定,未檢出的歧義很多,而且沒有提供其它任何可用的信息。
所以建議學生一般不采用這種報告方法;
檢出限是定性檢出的標志,它是跟空白的統計比較計算出來的。
每臺儀器,每次測定都有其檢出限,檢出限計算目前有兩大類計算方法:單濃度方法和校正設計法(Anal.Chem.1997,69:3069),常規采用的單濃度方法需要額外的工作,所以現在趨向用校正設計法,既利用標準曲線直接計算檢出限,但檢出限I類和II類錯誤皆控制在0.05。
定量限是可以定量檢出的標志,其RSD定為10%,其II類錯誤比檢出限小很多。<標準曲線第一點所推算的樣品濃度,是我們儀器比較可信的測定濃度。總之,報告<檢出限,<定量限,<標準曲線第一點所推算的樣品濃度所犯I類和II類錯誤依次降低,但如果這個報告結果已經超過你要判斷的限值,那么你的檢測就一點意義都沒有了。所以現在的檢測單位甚至直接報告小于國家標準規定的限值,從概率統計的角度講,它犯錯誤的幾率最小,但又解決了客戶的檢測問題。
10 空白測出來是負值,該不該減呢?
空白代表你所選擇的空白對儀器響應/信號的影響,當然可能是正方向和負方向的影響,所以理論上講必須減掉空白。至于是先減空白信號,還是減空白測定值,按國家規定或參見4.4問題。
11 線性范圍(動態范圍)的最低點和最高點如何確定呢?
配制一系列濃度標準,包括0濃度,從低濃度開始擬合當擬合檢驗出現P>0.05的最高的那個濃度點為止。有也經驗說當加入的高濃度點在低濃度點構建的直線方程推算的響應超出±10%范圍。關于線性范圍的最低點應該是0、檢出限或是定量限的問題,個人趨向最低點為0,因為線性范圍只是統計學上線性的表現,跟能否準確定量是兩方面的問題。