揭秘科研“瑕疵”:如何解決質(zhì)譜成像中的批次效應(yīng)?

質(zhì)譜成像是一種用于分析生物分子分布的成像技術(shù),它通過(guò)在組織切片上掃描激光并收集質(zhì)譜數(shù)據(jù)來(lái)獲取組織中生物分子的空間分布信息。雖然許多初始技術(shù)挑戰(zhàn)現(xiàn)已得到解決,但所謂的批次效應(yīng)已經(jīng)顯著地阻礙了從特定中型研究中獲得可靠數(shù)據(jù)比較。
本次的干貨將主要解決以下問(wèn)題:
在質(zhì)譜成像數(shù)據(jù)中批次效應(yīng)可能在哪些層次(像素、切片、玻片、時(shí)間和位置)?可能對(duì)生物標(biāo)志物發(fā)現(xiàn)或多元分類(lèi)的影響?后續(xù)會(huì)有更多干貨內(nèi)容,記得關(guān)注收藏哦~
如何解決質(zhì)譜成像中的批次效應(yīng)?
在質(zhì)譜成像技術(shù)進(jìn)行實(shí)驗(yàn)時(shí),常常會(huì)出現(xiàn)批次效應(yīng),這會(huì)導(dǎo)致實(shí)驗(yàn)結(jié)果的誤差和不可重復(fù)性,從而影響研究結(jié)論的可靠性和準(zhǔn)確性。圖1展示了質(zhì)譜成像中批次效應(yīng)的類(lèi)型和影響。
圖中a顯示了技術(shù)變異可以掩蓋給定生物效應(yīng)大小的情況,這可以單獨(dú)出現(xiàn)(綠色矩形)或在累積批次效應(yīng)(紅色三角形)的情況下發(fā)生。
圖b展示了批次效應(yīng)的不同類(lèi)型和影響,包括信號(hào)強(qiáng)度偏移、信號(hào)峰的位置偏移、峰形狀和寬度的變化等。
圖 1:質(zhì)譜成像中的批次效應(yīng)
批次效應(yīng)可以在像素(pixel)、切片(section)、載玻片(slide)、時(shí)間(time)和位置(location)等不同層次上表現(xiàn)出來(lái)。
質(zhì)譜成像在不同層次上的批次效應(yīng)
在質(zhì)譜成像中,數(shù)據(jù)集是從組織切片的不同位置獲取的質(zhì)譜集合。圖 2 展示了在像素、區(qū)域、切片和玻璃片級(jí)別上的批次效應(yīng)。
圖2:質(zhì)譜成像在像素、切片和玻璃片級(jí)別上的批次效應(yīng)
在 (a) 中,基質(zhì) (左) 或每個(gè)像素固有的化學(xué)成分 (右) 導(dǎo)致的離子抑制可以導(dǎo)致組織中信號(hào)強(qiáng)度的人工差異,從而導(dǎo)致像素和區(qū)域相關(guān)的批次效應(yīng)。?
(b) 組織區(qū)域的不同化學(xué)組成也會(huì)影響組織上消化速度,從而導(dǎo)致區(qū)域相關(guān)的批次效應(yīng)。
?(c) 區(qū)域相關(guān)的批次效應(yīng)也可能是由于MS運(yùn)行期間系統(tǒng)性的技術(shù)變異而引起的。
?(d) 在由71個(gè)連續(xù)組織切片組成的數(shù)據(jù)集中觀(guān)察到了在切片、玻璃片和日期級(jí)別上的批次效應(yīng)。
和一個(gè)像素在一個(gè)區(qū)域中的位置類(lèi)似,不同位置的切片也可能因測(cè)量本身的批次效應(yīng)而暴露不同(圖2d)。
圖3展示了組織切片級(jí)別的批次效應(yīng)可能對(duì)多變量像素分類(lèi)的影響。圖(a)顯示了32個(gè)癌癥組織的像素級(jí)分類(lèi),其中紅色和黑色代表兩種不同的臨床特征。圖(b)中不同的顏色表示每個(gè)交叉驗(yàn)證階段留出用于測(cè)試的數(shù)據(jù)。
結(jié)果顯示,在十倍交叉驗(yàn)證中,分類(lèi)器的準(zhǔn)確率顯著更高(圖c)。然而,這種情況在臨床實(shí)踐中是不現(xiàn)實(shí)的,因?yàn)樾碌馁|(zhì)譜成像數(shù)據(jù)對(duì)分類(lèi)器來(lái)說(shuō)是未知的。
圖3:組織切片層次的批次效應(yīng)對(duì)多變量像素分類(lèi)的影響
玻璃載玻片可以被視為一個(gè)批次,因?yàn)樵撦d玻片上的所有像素,無(wú)論它們屬于一個(gè)或多個(gè)組織切片,都經(jīng)歷了相同的樣品制備和質(zhì)譜分析過(guò)程(圖2d)。當(dāng)分析組織微陣列(TMA)時(shí),這種情況可能會(huì)變得明顯。
圖4這張圖展示了在組織微陣列(TMA)中可能存在的批次效應(yīng)。由于不同類(lèi)別之間在TMA之間可能分布不均,因此在生物標(biāo)記物的發(fā)現(xiàn)中可能會(huì)出現(xiàn)假陽(yáng)性結(jié)果。
圖4:TMA中可能出現(xiàn)的批次效應(yīng)
批次效應(yīng)的消除方法
在質(zhì)譜成像實(shí)驗(yàn)中避免、識(shí)別和糾正批次效應(yīng)的方法中,研究設(shè)計(jì)是最有效的手段之一,可以通過(guò)隨機(jī)化、技術(shù)重復(fù)和阻斷來(lái)減少技術(shù)偏差。
在像素級(jí)別,異常值檢測(cè)、數(shù)據(jù)轉(zhuǎn)換和魯棒數(shù)據(jù)統(tǒng)計(jì)是處理批次效應(yīng)的有效方法。在質(zhì)譜成像數(shù)據(jù)中,可以使用單變量匯總統(tǒng)計(jì)量(如均值、標(biāo)準(zhǔn)差、中位數(shù)、四分位數(shù))來(lái)識(shí)別潛在的異常值。然而,考慮到質(zhì)譜成像數(shù)據(jù)的多變量特性,使用主成分分析(PCA)來(lái)識(shí)別異常值可能更為可取,例如通過(guò)在二維或三維的PCA空間中使用誤差橢圓(如圖5b,左)。對(duì)于3D數(shù)據(jù),回歸分析可以用來(lái)識(shí)別離群的切片,這些切片通常與3D堆疊中的趨勢(shì)偏離(如圖5b,右)。
圖5展示了通過(guò)實(shí)驗(yàn)設(shè)計(jì)和異常值檢測(cè)來(lái)緩解批次效應(yīng)的方法。首先,通過(guò)阻擋法(Blocking)來(lái)消除質(zhì)譜成像研究中已知的干擾因素(如玻片)。為了檢測(cè)玻片的異常值(b左),可以利用從質(zhì)量控制中獲得的分子譜的主成分分析(紅色點(diǎn)在綠色95%誤差橢圓之外)。在三維(3D)質(zhì)譜成像中,可以使用回歸分析來(lái)檢測(cè)不符合預(yù)期信號(hào)強(qiáng)度梯度的異常切片(b右)。
圖5:實(shí)驗(yàn)設(shè)計(jì)和異常值檢測(cè)來(lái)緩解批次效應(yīng)
批次效應(yīng)的挑戰(zhàn)
為了得到足夠數(shù)量的生物學(xué)重復(fù)樣本用于臨床研究,可以將不同中心的研究結(jié)果結(jié)合起來(lái),以提高發(fā)現(xiàn)真正生物學(xué)差異的機(jī)會(huì)。然而,由于實(shí)驗(yàn)設(shè)置的多參數(shù)性質(zhì),標(biāo)準(zhǔn)化方法的開(kāi)發(fā)仍然具有挑戰(zhàn)性。以下幾個(gè)解決方案:
(1) 實(shí)驗(yàn)工作流的優(yōu)化和標(biāo)準(zhǔn)化;
(2) 質(zhì)量控制的建立;
(3) 在不同層面上進(jìn)行歸一化以減少批次效應(yīng)的影響。
圖6展示了通過(guò)樣品間歸一化來(lái)調(diào)整批次效應(yīng)的方法。為確保多個(gè)樣品集之間的可比性,可以使用各種方法來(lái)估計(jì)縮放因子。
圖6:通過(guò)樣品間歸一化來(lái)調(diào)整批次效應(yīng)
現(xiàn)在,質(zhì)譜成像必須致力于研究,以指導(dǎo)下一代儀器、軟件和實(shí)驗(yàn)工作流程的開(kāi)發(fā)和驗(yàn)證,以更好地理解、避免緩解質(zhì)譜成像中發(fā)生在不同層面的批次效應(yīng)。專(zhuān)門(mén)致力于質(zhì)量保證和標(biāo)準(zhǔn)化的
質(zhì)譜成像科學(xué)社區(qū)聯(lián)盟,如MALDISTAR?或METASPACE?。
以上就是這期的干活內(nèi)容了,您有任何問(wèn)題,都可以掃描下方微信,聯(lián)系我們哦~

小鹿推薦
關(guān)注
鹿明生物提供優(yōu)質(zhì)的空間代謝組服務(wù)

空代儀器平臺(tái)
已搭建2套AFADESI-MSI質(zhì)譜成像系統(tǒng)+1套Waters DESI-MSI質(zhì)譜成像系統(tǒng)
項(xiàng)目執(zhí)行
已落地執(zhí)行項(xiàng)目百余項(xiàng)、檢測(cè)組織樣本類(lèi)型20+;
定性算法經(jīng)過(guò)多維校準(zhǔn)
定性結(jié)果同時(shí)考慮物質(zhì)表達(dá)空間情況、加和離子及同位素峰表達(dá)強(qiáng)度相似性、同位素表達(dá)空間分布相似性、非靶向質(zhì)譜數(shù)據(jù)和空代自建數(shù)據(jù)庫(kù)進(jìn)行校準(zhǔn)。
項(xiàng)目實(shí)測(cè)結(jié)果
可實(shí)現(xiàn)定性代謝物數(shù)量:1000-3000個(gè)代謝物
無(wú)偏好性檢測(cè)代謝物::70%為700Da以下的小分子物質(zhì),30%為脂質(zhì)類(lèi)物質(zhì),更加適合代謝組學(xué)研究方向;
猜你還想看
◆【生信分析干貨】多組學(xué)數(shù)據(jù)挖掘利器—云平臺(tái)趨勢(shì)分析指南
END
biotfj?撰文
歡迎轉(zhuǎn)發(fā)到朋友圈
本文系鹿明生物原創(chuàng)
轉(zhuǎn)載請(qǐng)注明本文轉(zhuǎn)自鹿明生物

我知道你在看喲


點(diǎn)“閱讀原文”了解更多
-
儀器推薦詢(xún)底價(jià) Tel:400-6699-117 轉(zhuǎn) 7540
-
儀器推薦詢(xún)底價(jià) Tel:400-6699-117 轉(zhuǎn) 7540
-
儀器推薦詢(xún)底價(jià) Tel:400-6699-117 轉(zhuǎn) 7540
-
儀器推薦詢(xún)底價(jià) Tel:400-6699-117 轉(zhuǎn) 7540