導師給你推薦了嗎?歷隔4年,HMDB數據庫5.0版強勢來襲!
中文標題:HMDB 5.0:2022年人類代謝組數據庫
英文標題:HMDB 5.0:The Human Metabolome Database For 2022
研究對象:HMDB數據庫
發表期刊:Nucleic Acids Research
影響因子:16.971
發表時間:2022年1月
● 什么是HMDB?
代謝組學是以生物整體、器官組織或細胞的內源性代謝物質的代謝網絡為研究對象,并運用多種分析手段包括核磁共振(NMR)、質譜(MS)、高效液相色譜和氣相色譜(HPLC & GC)為核心的代謝分析技術體系,已經廣泛應用于生命科學、疾病診斷、藥物安全性評價、營養科學以及中醫藥現代化等多個領域。由于生物體內代謝物的種類、結構、性質差異極大。為了更準確檢測和定性代謝物,一個穩定、可靠的代謝數據庫必不可少。
人類代謝數據庫(HMDB)是世界上全面優質的生物體特異性代謝數據庫,包含了目前已知的所有人類代謝物的化學結構、名稱或標識、詳細描述、參考文獻、生物學作用、生理濃度、組織位置、疾病和遺傳關聯、化學和酶促反應、代謝途徑以及參考的圖譜(包括串聯質譜、GC-MS質譜和NMR)的詳細信息。被認為是人類代謝研究的標準代謝組學資源。
為了滿足代謝組學研究中不斷變化的需求,自2007年首次發布以來,HMDB一直在不斷更新,今年已更新到5.0版本。
圖1 | HMDB各版本發布時間
●?HMDB 5.0有啥不一樣?
相比于之前版本,HMDB 5.0在以下五個方面有所更新:
圖2 | HMDB 5.0的更新
1.?代謝物條目增加
(1)改善了數據庫里代謝物覆蓋率和MS光譜覆蓋率都不足或不完整的問題HMDB的團隊連續地對文獻進行檢索,并對已發表的代謝組學和暴露組學的研究進行了詳細的回顧,這使數據庫增加了1476種代謝物
(2)擴大了HMDB對氧化脂質、額外的心磷脂、暴露體或人體血液中鑒定到地環境化合物、酰基肉堿及相應的輔酶A和酰基酰胺的覆蓋范圍
(3)增加了新的膽汁酸 - 氨基酸偶聯物、食物來源的化合物、硫酸化代謝物、其他新鑒定的人代謝物、新批準的藥物和一些微生物或腸道來源的代謝物
(4)HMDB 5.0共添加了113568種新的化合物(從114100種增加到217920種)。此外還刪除了9548種BioTransformer預測的化合物以及323種錯誤的化合物以及一些重復的條目
(5)保留了1581537種衍生化合物的未注釋集合
2.?更新代謝物深度描述
對于每個化合物的描述、作用以及位置的詳細注釋是HMDB在代謝界受歡迎的主要原因之一HMDB 5.0在以下幾個方面做了改進:
(1)手動修復了八百多種已知和疾病相關的化合物描述信息
(2) ChemoSummarizer程序(自2017年以來一直用于自動描述HMDB中化合物)被修改和升級,大大提高了數據庫整體的實用性和可靠性
(3)除了“人可讀信息”的更新外,HMDB 5.0還更新了機器可讀信息
(4)更新化合物的實驗測量信息,總共有超過一萬九千種化合物的濃度被添加、校正或注釋
3.?新的可視化工具
JavaScript技術的持續改進使得數據庫上進行更復雜,更具交互性的視覺顯示(如圖3所示):
(1)用戶可以查看分子3D結構、可以看到有手性中心(R / S注釋)的分子結構
(2)也可以在HMDB 5.0中看到新的譜圖信息,包括MS/MS譜、GC–MS譜和NMR光譜。對于 NMR 光譜數據,數據庫支持一維和二維的顯示結果
(3)HMDB 5.0中,HMDB的代謝通路徑可視化工具也有所改進。用來創建通路圖像的PathWhiz已經變得更加標準化,注釋也更加充分。PathWhiz插圖中更多種類的圖標允許對復雜的生理過程和藥物進行說明(圖4是尿毒癥毒素通路的示意圖)
(4)新版HMDB目前含有132335種代謝途徑,覆蓋了136878種代謝物或外源性物質和2153種蛋白質
圖3 | HMDB 5.0中一些新的可視化功能
圖4 | HMDB的代謝途徑示例圖(硫酸吲哚氧基的尿毒癥毒素的作用模式和形成機制)
4.?增加離子淌度等新信息
代謝組學科研者鑒定和注釋代謝物的關鍵是將獲得的數據和有參考物的數據庫進行比較,因此HMDB團隊在這方面投入了大量資源,包括:
(1)用于分析離子淌度光譜(IMS)數據的碰撞截面(CCS)數據庫,包括由MetCCS和DeepCCS生成的871680個HMDB代謝物的CCS值
(2)更準確的MS/MS譜數據庫(準確性提升約30%),可預測HMDB 5.0中所有217920種代謝物在三種不同碰撞能量(10,20和40 eV)下的正離子和負離子模式圖譜
(3)更精確的一維1H和13C核磁共振光譜數據庫,包括用于鑒定化合物的312980個1H和13C NMR譜
(4)用于GC-MS分析準確預測的保留指數(RI)數據庫,包含474461個特定保留指數
5.?搜索功能重大升級
由于新增了許多新的可預測的光譜可觀測物(例如CCS、RI、NMR化學位移等),所以對光譜搜索功能進行了重大升級:
(1)光譜可視化程序(JSV)的改進使得數據庫能夠改進光譜匹配輸出的圖形顯示
(2)"LC-MS 搜索"和"LC-MS/MS 搜索"功能現在支持IMS數據作為附加搜索限制
(3)"GC-MS 搜索"修改成支持RI數據作為附加搜索限制
(4)對于“NMR搜索”已被簡化,現在允許用戶輸入以下信息:1H或13C化學位移搜索與實驗NMR光譜,預測的NMR光譜或兩者的光譜匹配
●?HMDB數據庫未來還有哪些改進?
在過去的15年中,HMDB在規模和范圍上都取得了顯著地發展,代謝物覆蓋范圍是最初的100倍以上,包含的數據的大小也是最初的1000倍以上。現在已經包括了廣泛的光譜數據、通路數據、生理和疾病數據,并且能夠提供不同類型的高級可視化工具,搜索工具和下載或數據可訪問性選擇。由于代謝組學研究地爆發式發展,越來越多地HMDB數據庫的更新過程將依賴于計算機地數據收集和自然語言處理技術,HMDB團隊已經通過ChemFOnt項目來開發和試用。從2022年開始,HMDB還會推出一個新的姊妹數據庫,稱為"HypoMet",該數據庫包含數百萬個假設的生物學上可行的代謝物。在未來兩到三年內,另一項重要的任務是更新或補充HMDB條目,使得每個條目至少有一個機器可讀的路徑圖。
小鹿推薦
HMDB數據庫是代謝組學中常用的數據庫之一。為了滿足代謝組學界不斷變化的需求,從2007年創立至今,數據庫經歷了廣泛地開發和改進,現已來到5.0版本。這些升級和改進會大大提高HMDB的易用性及其潛在應用,不僅在人類代謝組學中,還在暴露組學、脂質組學、營養科學、生物化學和臨床化學中。鹿明生物代謝組學服務項目中也采用了HMDB數據庫,隨著數據庫的不斷更新,將為大家帶來更優質的服務!
代謝組學數據如何輕松上傳到公共數據庫?(文末看點 | lumingbio
長按掃碼咨詢鹿明生物
技術工程師
項目咨詢|樣本咨詢
猜你還想看
◆蛋白組學發文必看,iProX又添新功能啦~(附帶上傳操作可收藏)
◆速看!2022年國家自然科學基金項目指南大變化~
◆預警!2022年經典分析繪圖軟件,總有一款適合你
◆喜報 | 鹿明生物榮獲2021年上海市和諧勞動關系達標企業