質(zhì)體是負(fù)責(zé)真核生物(如植物、藻類和原生生物)光合作用的關(guān)鍵細(xì)胞器,它也被當(dāng)作遺傳轉(zhuǎn)化和操作的重要材料。質(zhì)體的結(jié)構(gòu)和數(shù)目不同于包括線粒體在內(nèi)的其它細(xì)胞器,其表型同時受到遺傳學(xué)和環(huán)境因子的影響。質(zhì)體基因組產(chǎn)生數(shù)量可觀的參與多種生物學(xué)過程(如光合作用、呼吸作用和翻譯等)的核心蛋白質(zhì)。不同物種的質(zhì)體基因組的基因數(shù)目和種類是有差異的,而且,它們還具有不同程度的序列保守性和功能保守性。
我們已經(jīng)知道存在一些類似操縱子的結(jié)構(gòu)(基因成簇),它們傾向于共同表達(dá),從而提高轉(zhuǎn)錄和翻譯的效率,最終在進(jìn)化上由于選擇壓力的作用而不容易被拆開。目前存在的質(zhì)體或者葉綠體相關(guān)的數(shù)據(jù)庫主要集中在單個基因組的數(shù)據(jù)注釋方面,而同時考慮多物種間的比較基因組學(xué)和進(jìn)化生物學(xué)方面的研究較為缺乏。中國科學(xué)院北京基因組研究所于軍研究員和英國倫敦大學(xué)學(xué)院腫瘤研究所王大鵬博士構(gòu)建了以質(zhì)體基因組結(jié)構(gòu)變異和成對基因保守性為主要內(nèi)容的數(shù)據(jù)庫Plastid-LCGbase,該研究成果發(fā)表于近期出版的Nucleic Acids Research 雜志。
該數(shù)據(jù)庫共收集470個質(zhì)體(主要是葉綠體)基因組,將物種按照界、門、綱、目、科、屬進(jìn)行分類整理。顯示基因組水平的宏觀基因分布情況以及不同基因組間DNA和編碼序列的同源程度。展示不同進(jìn)化尺度和分類下成對基因的保守模式以及周圍基因的插入或刪除、重排和易位等基因變異模式。此外,按照轉(zhuǎn)錄方向參數(shù)和物理距離參數(shù)的原則,將成對基因分成了三種類別“頭對頭”、“頭對尾”和“尾對尾”以及三種模式“分離”、“重疊”和“包含”,同時考察成對基因轉(zhuǎn)錄起始位點(diǎn)間距離的可變性。數(shù)據(jù)庫還通過連接高度保守的基因?qū),為每個物種鑒定了潛在的操縱子結(jié)構(gòu)。
該數(shù)據(jù)庫囊括了來自廣泛代表性物種的數(shù)據(jù),實(shí)現(xiàn)了比較基因組數(shù)據(jù)的可視化,將在探索質(zhì)體或葉綠體基因組保守和變異的動態(tài)規(guī)律方面為廣大用戶提供一個有力的平臺。
數(shù)據(jù)庫頁面
