中科院北京生科院團隊發(fā)表不編碼蛋白質(zhì)識別新技術

作者: 2017年03月06日 來源:化工儀器在線 瀏覽量:
字號:T | T
非編碼RNA(Non-codingRNA)是指不編碼蛋白質(zhì)的RNA。其中包括rRNA,tRNA,snRNA,snoRNA和microRNA等多種已知功能的RNA,還包括未知功能的RNA。這些RNA的共同特點是都能從基因組上轉(zhuǎn)錄而來,但是不翻譯成蛋白,在RNA

  非編碼RNA(Non-coding RNA)是指不編碼蛋白質(zhì)的RNA。其中包括rRNA,tRNA,snRNA,snoRNA和microRNA等多種已知功能的RNA,還包括未知功能的RNA。這些RNA的共同特點是都能從基因組上轉(zhuǎn)錄而來,但是不翻譯成蛋白,在RNA水平上就能行使各自的生物學功能了。
  2017年2月28日,國際學術期刊Briefings in Bioinformatics發(fā)表了中國科學院北京生命科學研究院趙方慶團隊題為“Circular RNA identification based on multiple seed matching”的最新研究成果。目前環(huán)形RNA的識別存在著假陽性率高、敏感度不夠等問題,該研究提出了全新的多重種子匹配算法及最大似然估計模型,可以精確識別環(huán)形RNA接頭序列,顯著提升環(huán)形RNA識別效率。

  目前已有的環(huán)形識別算法均基于對環(huán)形RNA接頭序列的查找,可分為基于注釋的算法以及從頭預測的算法。然而,由于真核生物轉(zhuǎn)錄的復雜性及環(huán)形RNA分子的特殊性,兩類識別算法均面臨著靈敏度低、可靠性差、運算時間長或內(nèi)存使用高等問題,其應用也因此受到限制。此外,對上述識別算法的評價體系卻仍主要依賴模擬數(shù)據(jù),難以對相關算法在真實轉(zhuǎn)錄數(shù)據(jù)中的表現(xiàn)進行客觀衡量。

  針對此現(xiàn)狀,趙方慶團隊提出基于多重種子匹配策略的算法,針對比對質(zhì)量較低的基因組區(qū)域,按長度降序進行種子序列提取,并將之與前后側翼基因組區(qū)域進行快速匹配。同時,建立了最大似然估計模型,判斷該種子序列的真實來源,并排除來自線性轉(zhuǎn)錄本或剪接副產(chǎn)物的干擾,從而極大提高了環(huán)形RNA分子識別的精度。該研究摒棄了偏差較大的模擬數(shù)據(jù)評測方法,采用 RNase R降解前后真實轉(zhuǎn)錄數(shù)據(jù)的比對體系,對10種已有算法進行全面的評測比較。結果顯示本研究建立的方法在包含靈敏度與可靠性在內(nèi)的綜合表現(xiàn)(F1得分)上具有明顯的優(yōu)勢,其并行模式還可進一步提升運算速度及內(nèi)存使用效率。該算法與此團隊開發(fā)的CIRI, CIRI-AS等分析工具(Genome Biology, 2015; Nature Communications, 2016)實現(xiàn)無縫銜接,將進一步促進環(huán)形RNA組成及功能等方面的研究。

 該工作由趙方慶課題組的研究生高遠和張金陽完成,得到了國家自然科學基金委和中國科學院的經(jīng)費支持。

    

全球化工設備網(wǎng)(http://m.bhmbl.cn )友情提醒,轉(zhuǎn)載請務必注明來源:全球化工設備網(wǎng)!違者必究.

標簽:

分享到:
免責聲明:1、本文系本網(wǎng)編輯轉(zhuǎn)載或者作者自行發(fā)布,本網(wǎng)發(fā)布文章的目的在于傳遞更多信息給訪問者,并不代表本網(wǎng)贊同其觀點,同時本網(wǎng)亦不對文章內(nèi)容的真實性負責。
2、如涉及作品內(nèi)容、版權和其它問題,請在30日內(nèi)與本網(wǎng)聯(lián)系,我們將在第一時間作出適當處理!有關作品版權事宜請聯(lián)系:+86-571-88970062