揭秘科研“瑕疵”:如何解決質(zhì)譜成像中的批次效應(yīng)?
質(zhì)譜成像是一種用于分析生物分子分布的成像技術(shù),它通過在組織切片上掃描激光并收集質(zhì)譜數(shù)據(jù)來獲取組織中生物分子的空間分布信息。雖然許多初始技術(shù)挑戰(zhàn)現(xiàn)已得到解決,但所謂的批次效應(yīng)已經(jīng)顯著地阻礙了從特定中型研究中獲得可靠數(shù)據(jù)比較。
本次的干貨將主要解決以下問題:
在質(zhì)譜成像數(shù)據(jù)中批次效應(yīng)可能在哪些層次(像素、切片、玻片、時(shí)間和位置)?可能對生物標(biāo)志物發(fā)現(xiàn)或多元分類的影響?后續(xù)會有更多干貨內(nèi)容,記得關(guān)注收藏哦~
如何解決質(zhì)譜成像中的批次效應(yīng)?
在質(zhì)譜成像技術(shù)進(jìn)行實(shí)驗(yàn)時(shí),常常會出現(xiàn)批次效應(yīng),這會導(dǎo)致實(shí)驗(yàn)結(jié)果的誤差和不可重復(fù)性,從而影響研究結(jié)論的可靠性和準(zhǔn)確性。圖1展示了質(zhì)譜成像中批次效應(yīng)的類型和影響。
圖中a顯示了技術(shù)變異可以掩蓋給定生物效應(yīng)大小的情況,這可以單獨(dú)出現(xiàn)(綠色矩形)或在累積批次效應(yīng)(紅色三角形)的情況下發(fā)生。
圖b展示了批次效應(yīng)的不同類型和影響,包括信號強(qiáng)度偏移、信號峰的位置偏移、峰形狀和寬度的變化等。
圖 1:質(zhì)譜成像中的批次效應(yīng)
批次效應(yīng)可以在像素(pixel)、切片(section)、載玻片(slide)、時(shí)間(time)和位置(location)等不同層次上表現(xiàn)出來。
質(zhì)譜成像在不同層次上的批次效應(yīng)
1、質(zhì)譜成像在像素層次上的批次效應(yīng)
在質(zhì)譜成像中,數(shù)據(jù)集是從組織切片的不同位置獲取的質(zhì)譜集合。圖 2 展示了在像素、區(qū)域、切片和玻璃片級別上的批次效應(yīng)。
圖2:質(zhì)譜成像在像素、切片和玻璃片級別上的批次效應(yīng)
在 (a) 中,基質(zhì) (左) 或每個像素固有的化學(xué)成分 (右) 導(dǎo)致的離子抑制可以導(dǎo)致組織中信號強(qiáng)度的人工差異,從而導(dǎo)致像素和區(qū)域相關(guān)的批次效應(yīng)。?
(b) 組織區(qū)域的不同化學(xué)組成也會影響組織上消化速度,從而導(dǎo)致區(qū)域相關(guān)的批次效應(yīng)。
?(c) 區(qū)域相關(guān)的批次效應(yīng)也可能是由于MS運(yùn)行期間系統(tǒng)性的技術(shù)變異而引起的。
?(d) 在由71個連續(xù)組織切片組成的數(shù)據(jù)集中觀察到了在切片、玻璃片和日期級別上的批次效應(yīng)。
2.數(shù)據(jù)準(zhǔn)備質(zhì)譜成像在切片層次上的批次效應(yīng)
和一個像素在一個區(qū)域中的位置類似,不同位置的切片也可能因測量本身的批次效應(yīng)而暴露不同(圖2d)。
圖3展示了組織切片級別的批次效應(yīng)可能對多變量像素分類的影響。圖(a)顯示了32個癌癥組織的像素級分類,其中紅色和黑色代表兩種不同的臨床特征。圖(b)中不同的顏色表示每個交叉驗(yàn)證階段留出用于測試的數(shù)據(jù)。
結(jié)果顯示,在十倍交叉驗(yàn)證中,分類器的準(zhǔn)確率顯著更高(圖c)。然而,這種情況在臨床實(shí)踐中是不現(xiàn)實(shí)的,因?yàn)樾碌馁|(zhì)譜成像數(shù)據(jù)對分類器來說是未知的。
圖3:組織切片層次的批次效應(yīng)對多變量像素分類的影響
3.質(zhì)譜成像在載玻片層次上的批次效應(yīng)
玻璃載玻片可以被視為一個批次,因?yàn)樵撦d玻片上的所有像素,無論它們屬于一個或多個組織切片,都經(jīng)歷了相同的樣品制備和質(zhì)譜分析過程(圖2d)。當(dāng)分析組織微陣列(TMA)時(shí),這種情況可能會變得明顯。
圖4這張圖展示了在組織微陣列(TMA)中可能存在的批次效應(yīng)。由于不同類別之間在TMA之間可能分布不均,因此在生物標(biāo)記物的發(fā)現(xiàn)中可能會出現(xiàn)假陽性結(jié)果。
圖4:TMA中可能出現(xiàn)的批次效應(yīng)
批次效應(yīng)的消除方法
在質(zhì)譜成像實(shí)驗(yàn)中避免、識別和糾正批次效應(yīng)的方法中,研究設(shè)計(jì)是最有效的手段之一,可以通過隨機(jī)化、技術(shù)重復(fù)和阻斷來減少技術(shù)偏差。
在像素級別,異常值檢測、數(shù)據(jù)轉(zhuǎn)換和魯棒數(shù)據(jù)統(tǒng)計(jì)是處理批次效應(yīng)的有效方法。在質(zhì)譜成像數(shù)據(jù)中,可以使用單變量匯總統(tǒng)計(jì)量(如均值、標(biāo)準(zhǔn)差、中位數(shù)、四分位數(shù))來識別潛在的異常值。然而,考慮到質(zhì)譜成像數(shù)據(jù)的多變量特性,使用主成分分析(PCA)來識別異常值可能更為可取,例如通過在二維或三維的PCA空間中使用誤差橢圓(如圖5b,左)。對于3D數(shù)據(jù),回歸分析可以用來識別離群的切片,這些切片通常與3D堆疊中的趨勢偏離(如圖5b,右)。
圖5展示了通過實(shí)驗(yàn)設(shè)計(jì)和異常值檢測來緩解批次效應(yīng)的方法。首先,通過阻擋法(Blocking)來消除質(zhì)譜成像研究中已知的干擾因素(如玻片)。為了檢測玻片的異常值(b左),可以利用從質(zhì)量控制中獲得的分子譜的主成分分析(紅色點(diǎn)在綠色95%誤差橢圓之外)。在三維(3D)質(zhì)譜成像中,可以使用回歸分析來檢測不符合預(yù)期信號強(qiáng)度梯度的異常切片(b右)。
圖5:實(shí)驗(yàn)設(shè)計(jì)和異常值檢測來緩解批次效應(yīng)
批次效應(yīng)的挑戰(zhàn)
為了得到足夠數(shù)量的生物學(xué)重復(fù)樣本用于臨床研究,可以將不同中心的研究結(jié)果結(jié)合起來,以提高發(fā)現(xiàn)真正生物學(xué)差異的機(jī)會。然而,由于實(shí)驗(yàn)設(shè)置的多參數(shù)性質(zhì),標(biāo)準(zhǔn)化方法的開發(fā)仍然具有挑戰(zhàn)性。以下幾個解決方案:
(1) 實(shí)驗(yàn)工作流的優(yōu)化和標(biāo)準(zhǔn)化;
(2) 質(zhì)量控制的建立;
(3) 在不同層面上進(jìn)行歸一化以減少批次效應(yīng)的影響。
圖6展示了通過樣品間歸一化來調(diào)整批次效應(yīng)的方法。為確保多個樣品集之間的可比性,可以使用各種方法來估計(jì)縮放因子。
圖6:通過樣品間歸一化來調(diào)整批次效應(yīng)
總結(jié)
現(xiàn)在,質(zhì)譜成像必須致力于研究,以指導(dǎo)下一代儀器、軟件和實(shí)驗(yàn)工作流程的開發(fā)和驗(yàn)證,以更好地理解、避免緩解質(zhì)譜成像中發(fā)生在不同層面的批次效應(yīng)。專門致力于質(zhì)量保證和標(biāo)準(zhǔn)化的
質(zhì)譜成像科學(xué)社區(qū)聯(lián)盟,如MALDISTAR?或METASPACE?。
以上就是這期的干活內(nèi)容了,您有任何問題,都可以掃描下方微信,聯(lián)系我們哦~
小鹿推薦
關(guān)注
鹿明生物提供優(yōu)質(zhì)的空間代謝組服務(wù)
空代儀器平臺
已搭建2套AFADESI-MSI質(zhì)譜成像系統(tǒng)+1套Waters DESI-MSI質(zhì)譜成像系統(tǒng)
項(xiàng)目執(zhí)行
已落地執(zhí)行項(xiàng)目百余項(xiàng)、檢測組織樣本類型20+;
定性算法經(jīng)過多維校準(zhǔn)
定性結(jié)果同時(shí)考慮物質(zhì)表達(dá)空間情況、加和離子及同位素峰表達(dá)強(qiáng)度相似性、同位素表達(dá)空間分布相似性、非靶向質(zhì)譜數(shù)據(jù)和空代自建數(shù)據(jù)庫進(jìn)行校準(zhǔn)。
項(xiàng)目實(shí)測結(jié)果
可實(shí)現(xiàn)定性代謝物數(shù)量:1000-3000個代謝物
無偏好性檢測代謝物::70%為700Da以下的小分子物質(zhì),30%為脂質(zhì)類物質(zhì),更加適合代謝組學(xué)研究方向;
猜你還想看
◆震撼來襲!7大生信工具助力,發(fā)文一鏡到底!
◆【生信分析干貨】多組學(xué)數(shù)據(jù)挖掘利器—云平臺趨勢分析指南
◆Wow! 收到好消息,2023年國自然初審結(jié)果公布了!
◆【R語言】火山圖作圖實(shí)操教程,讓你的文章火起來!