【生信分析干貨】多組學(xué)數(shù)據(jù)挖掘利器—云平臺(tái)趨勢(shì)分析指南
生信分析干貨強(qiáng)勢(shì)來襲
隨著蛋白質(zhì)組學(xué)、代謝組學(xué)、基因組學(xué)的研究逐漸增多,生信分析的作用也越來越大。鹿明生物作為創(chuàng)新多組學(xué)研究的先鋒,我們的生信部門專業(yè)人員將手把手教你進(jìn)行生信數(shù)據(jù)分析!
本次的干貨主題為:云平臺(tái)分析小工具之時(shí)間序列、趨勢(shì)分析,后續(xù)會(huì)有更多生信分析干貨內(nèi)容,記得關(guān)注收藏哦~
趨勢(shì)分析概念介紹
Mfuzz能夠識(shí)別表達(dá)譜的潛在時(shí)間序列模式,并將相似模式的特征聚類,以幫助我們了解特征之間的動(dòng)態(tài)模式和它們功能的聯(lián)系。
Mfuzz模糊聚類原理是將一個(gè)特征物質(zhì)(代謝物、蛋白、基因)對(duì)應(yīng)到幾個(gè)簇,通過計(jì)算各個(gè)簇下該特征物質(zhì)(代謝物、蛋白、基因)membership值,直觀感受特征物質(zhì)在某個(gè)聚類的歸屬程度,對(duì)時(shí)間序列這種逐漸變化,并且會(huì)頻繁的出現(xiàn)聚類重疊類型的數(shù)據(jù)進(jìn)行聚類分析。模糊聚類通過算法來確定每個(gè)數(shù)據(jù)隸屬于各個(gè)簇的程度,而不是將一個(gè)數(shù)據(jù)對(duì)象硬性地歸類到某一簇中。
算法流程:
(1)標(biāo)準(zhǔn)化數(shù)據(jù)矩陣;
(2)聚類簇的數(shù)量的確定;
(3)建立模糊相似矩陣,初始化隸屬矩陣;
(4)算法開始迭代,直到目標(biāo)函數(shù)收斂到極小值;?
(5)根據(jù)迭代結(jié)果,由最后的隸屬矩陣確定數(shù)據(jù)所屬的類,顯示最后的聚類結(jié)果。
趨勢(shì)分析教學(xué)
那么作為新手,我想使用時(shí)間序列、趨勢(shì)分析方法來了解生物學(xué)分子的動(dòng)態(tài)模式與功能間的聚類聯(lián)系,我該如何操作呢?
今天我們會(huì)推薦生信分析的網(wǎng)站:云平臺(tái),并對(duì)其中的操作和結(jié)果解讀進(jìn)行詳細(xì)說明,現(xiàn)在就讓我們開始這趟生信之旅吧~
云平臺(tái)使用攻略
云平臺(tái)官網(wǎng)地址:
https://cloud.oebiotech.cn/task/detail/mfuzzAnalyst/
STP 1.數(shù)據(jù)準(zhǔn)備
時(shí)間序列、趨勢(shì)分析一般采用差異特征物質(zhì)(代謝物、蛋白、基因)的并集進(jìn)行分析。將各個(gè)分組分別篩選出差異特征物質(zhì),獲得每組差異特征物質(zhì)并計(jì)算每組對(duì)應(yīng)特征物質(zhì)表達(dá)值的均值進(jìn)行分析。
將數(shù)據(jù)保存成第一列為基因、蛋白、代謝物名稱,其余各列為各樣品分組中均值表達(dá)量,表頭為樣本分組名。如果表達(dá)量矩陣文件中存在空值的情況,請(qǐng)?zhí)畛?后再上傳運(yùn)行。
STP 2.數(shù)據(jù)上傳
提示:上傳文件格式為xlsx格式,且分析適用于組別為3組及以上的數(shù)據(jù)集。
STP 3.結(jié)果說明
在時(shí)間序列、趨勢(shì)分析之前會(huì)對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,將所有的數(shù)據(jù)處于同一標(biāo)度。以下表為例,其中.Expression Abundance(Z-score)表示經(jīng)過標(biāo)準(zhǔn)化的數(shù)據(jù),標(biāo)準(zhǔn)化基于原始數(shù)據(jù)的均值和標(biāo)準(zhǔn)差對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化。.raw表示未經(jīng)處理的數(shù)據(jù)。
為了更直觀的展示組之間的關(guān)系及特征物質(zhì)在不同組之間的表達(dá)差異,對(duì)所有差異特征物質(zhì)的表達(dá)量進(jìn)行層次聚類。
如果想要了解每個(gè)Cluster匹配到的特征物質(zhì)有哪些及表達(dá)情況細(xì)節(jié)的數(shù)據(jù)時(shí),可以查看結(jié)果中對(duì)應(yīng)的Cluster的熱圖結(jié)果及折線圖結(jié)果。
?▲當(dāng)前簇的熱圖展示
顏色從藍(lán)到紅表示特征物質(zhì)的表達(dá)豐度從低到高,即越紅表示差異特征物質(zhì)的表達(dá)豐度越高。
?▲特征物質(zhì)在簇中趨勢(shì)的展示
黃色和綠色的線表示低membership值的基因,紅色和紫色的線表示高membership值。
Tips
運(yùn)行結(jié)束后,
以上就是這期的干活內(nèi)容了,快使用歐易生物云平臺(tái)工具自己動(dòng)手免費(fèi)分析吧!如果還有不清楚的,或者操作中遇到問題,可以掃描下方微信,聯(lián)系我們哦~
小鹿推薦
?2023空間代謝組技術(shù)與實(shí)踐培訓(xùn)班
鹿明生物第35期空間代謝組(線下)培訓(xùn)班報(bào)名中:包含2023空間代謝組技術(shù)與實(shí)踐培訓(xùn),為期3天;
時(shí)間:4月19日(周三)至4月21日(周五)
地點(diǎn):歐易集團(tuán)總部
還有早鳥價(jià)(4月5日前報(bào)名即可享),同時(shí)還有團(tuán)報(bào)優(yōu)惠價(jià)哦,快來參加吧~
關(guān)注
鹿明生物提供優(yōu)質(zhì)的空間代謝組服務(wù)
空代儀器平臺(tái)
已搭建2套AFADESI-MSI質(zhì)譜成像系統(tǒng)
項(xiàng)目執(zhí)行
已落地執(zhí)行項(xiàng)目百余項(xiàng)、檢測(cè)組織樣本類型20+;
定性算法經(jīng)過多維校準(zhǔn)
定性結(jié)果同時(shí)考慮物質(zhì)表達(dá)空間情況、加和離子及同位素峰表達(dá)強(qiáng)度相似性、同位素表達(dá)空間分布相似性、非靶向質(zhì)譜數(shù)據(jù)和空代自建數(shù)據(jù)庫(kù)進(jìn)行校準(zhǔn)。
項(xiàng)目實(shí)測(cè)結(jié)果
可實(shí)現(xiàn)定性代謝物數(shù)量:1000-3000個(gè)代謝物
無偏好性檢測(cè)代謝物::70%為700Da以下的小分子物質(zhì),30%為脂質(zhì)類物質(zhì),更加適合代謝組學(xué)研究方向;
猜你還想看
◆厲害了!頂刊看好,打破傳統(tǒng)維度的空間代謝組學(xué)如何「盡快去學(xué)」
◆項(xiàng)目文章 | AFADESI空間代謝組學(xué)探究小麥穎果氨基酸和有機(jī)酸對(duì)多基因響應(yīng)~
◆當(dāng)我問ChatGPT怎么學(xué)習(xí)空間代謝組時(shí),它竟然直接告訴我應(yīng)該這么做~
◆首次公開 | 鹿明空間代謝組最新分析內(nèi)容解析(數(shù)據(jù)挖掘必看)