大量的研究對不同的標(biāo)度法進(jìn)行了比較。因?yàn)闃?biāo)度數(shù)據(jù)通常用于識別產(chǎn)品之間的差異,所以檢測差異的能力是衡量標(biāo)度方法好壞的一個重要實(shí)踐標(biāo)準(zhǔn)。一個相關(guān)的標(biāo)準(zhǔn)是誤差方差的程度或類似的測量數(shù)據(jù),如標(biāo)準(zhǔn)偏差的大小或變異系數(shù)。顯然,個體之間差異小的標(biāo)度方法會產(chǎn)生更敏感的測試、更顯著的差異、更低的Ⅱ類錯誤風(fēng)險(忽略真實(shí)差異)。還有一個相關(guān)的問題是操作的可靠性。相似的實(shí)驗(yàn)是否能得到可重復(fù)的結(jié)果。
其他的實(shí)際的考慮也是重要的。任務(wù)應(yīng)該是用戶友好的,并且使所有參與者容易理解。在理想情況下,該方法應(yīng)該適用范圍廣泛的產(chǎn)品和問題,受試者不會被回答表或問卷調(diào)查中的反應(yīng)類型的變化所困惑。如果評價員熟悉一種標(biāo)度類型,并且正在有效地使用它,那么嘗試引入新的或不熟悉的方法可能會有一些問題。一些方法,如分類標(biāo)度、直線標(biāo)度和量值估計,可以適用于強(qiáng)度和喜好度(喜歡-不喜歡)的響應(yīng)。編碼、列表和處理信息所需大量時間可能是另一個問題,取決于計算機(jī)輔助的數(shù)據(jù)收集和其他可用資源。
不論哪種方法,有效性或準(zhǔn)確性是根本問題。有效性只能通過參考一些外部標(biāo)準(zhǔn)來判斷。對于喜好標(biāo)度,人們可能希望該方法適應(yīng)于其他選擇或消費(fèi)行為。一個相關(guān)的標(biāo)準(zhǔn)是標(biāo)度識別或揭示不同偏好的消費(fèi)群體的能力。
鑒于以上原因,我們可能會間,哪種標(biāo)度方法更好。大多數(shù)已發(fā)表的研究發(fā)現(xiàn),對于不同的標(biāo)度方法,只要方法應(yīng)用合理,就可以獲得相同的靈敏度。例如,Lawless和Malone(1986a,b)使用不同的感官連續(xù)統(tǒng),包括嗅覺、觸覺和視覺形式,在集中地點(diǎn)檢驗(yàn)法中利用消費(fèi)者可進(jìn)行一系列廣泛的研究(超過20000個判斷)。他們比較了直線標(biāo)度、量度估計和分類標(biāo)度。使用產(chǎn)品之間的統(tǒng)計差異程度作為方法效應(yīng)的標(biāo)準(zhǔn),所標(biāo)度的方法都表現(xiàn)很好。Shand 等(1985)利用感官培訓(xùn)小組也得出了類似的結(jié)論。與大學(xué)生相比,利用消費(fèi)者得出的量值估計的變異性稍微大一點(diǎn)。隨著人們開始了解被評價樣評的范圍,統(tǒng)計學(xué)差異會隨著重復(fù)而增加。Moskowitz 和 Sidel(1971),Pearce(1986),Shand(1985)等和Vickers(1983)等發(fā)現(xiàn)了類似的關(guān)于量度估值標(biāo)度和分類標(biāo)度在對樣品的區(qū)別程度上的差異性,盡管數(shù)學(xué)關(guān)系形式與潛在的物理變量常不同。換句話說,正如Stevens和Galanter(1957)所發(fā)現(xiàn)的那樣,兩種方法的數(shù)據(jù)之間經(jīng)常存在曲線關(guān)系。然而,這種觀點(diǎn)并沒有得到普遍的認(rèn)可,也有人發(fā)現(xiàn)了其具有簡單的直線關(guān)系。Mattes和Lawless(1985)發(fā)現(xiàn)了分類標(biāo)度和直線標(biāo)度的類似結(jié)果。
總而言之,關(guān)于心理學(xué)文獻(xiàn)中標(biāo)度方法有效性的論點(diǎn),實(shí)證研究發(fā)現(xiàn)方法之間的同等性比人們可能認(rèn)為的多得多。由于樣本間距合理,對預(yù)期范圍有一定的了解,受試者在可用范圍內(nèi)評價,并可適當(dāng)使用標(biāo)度來區(qū)分樣本。比較標(biāo)度方法的文獻(xiàn)的合理總結(jié)是,鑒于一些合理的預(yù)防措施,它們同樣能很好地區(qū)分產(chǎn)品。