Cell:中國博後一作,開發CRISPR-Cas13篩選技術,發現778個人類必需lncRNA

撰文丨王聰

編輯丨王多魚

排版丨水成文

衆所周知,基因包含着製造蛋白質的指令,根據“中心法則”,遺傳信息從DNA流向RNA,再流向蛋白質。但人類基因組只有2%編碼蛋白質,其餘98%屬於非編碼序列,它們的功能在很大程度上是未知的。

人類遺傳學的一個緊迫問題是瞭解這些非編碼的基因組區域的作用,實際上,這些區域雖然不編碼蛋白質,但它們廣泛轉錄爲RNA,其中包括成千上萬的長鏈非編碼RNA(lncRNA),這些lncRNA通常被剪接和多聚腺苷酸化,但通常不能翻譯成蛋白質。在已註釋的lncRNA中,只有極少數 (<1%) 具有明確的功能作用,在這些罕見的情況下,lncRNA被發現可以隔離miRNA、阻斷翻譯、形成生物分子凝集物、編碼微肽,以及調控蛋白質或RNA。

lncRNA的低序列保守性、低丰度和細胞類型特異性表達,使其難以與不穩定的轉錄噪聲區分開來。儘管全基因組生物信息學分析和比較測序研究已經發現了保守的lncRNA,提示了它們可能的功能作用,但後續的實驗驗證僅限於低通量研究,每次只關注一個lncRNA。

2024年11月7日,紐約大學Neville E. Sanjana團隊(博士後樑雯薇爲第一作者) 在國際頂尖學術期刊Cell上發表了題爲: Transcriptome-scale RNA-targeting CRISPR screens reveal essential lncRNAs in human cells 的研究論文。

該研究開發了一種基於CRISPR-Cas13的靶向RNA的轉錄組規模的CRISPR篩選技術,並使用該技術在來自不同組織的5種人類細胞中篩選鑑定了778個必需的lncRNA,表明了許多lncRNA並非垃圾,而且在人類癌症和發育中發揮着必不可少的重要作用。

該研究建立了一種強大的篩選工具,可用於系統性研究非編碼轉錄本的功能貢獻,併爲識別在任何表型或疾病中具有功能的lncRNA鋪平了道路。此外,該篩選工具具有廣泛適用性,並不侷限於lncRNA,還可以直接應用於其他非編碼RNA的篩選,包括增強子RNA和環狀RNA。

CRISPR基因編輯技術的出現,給生物醫學研究帶來了革命性變化,大多數 CRISPR基因編輯使用Cas9酶在DNA水平上編輯基因。近年來,基於Cas9的CRISPR干擾(CRISPRi)和CRISPR激活(CRISPRa)被用於篩選和鑑定功能性lncRNA,雖然這些技術很有價值,但也往往遇到意料之外的上靶活性,也就是在預期的基因組位點結合,但會干擾附近的其他基因,此外,在DNA水平上擾動lncRNA位點,也可能抑制與lncRNA轉錄本無關的功能性DNA元件,導致篩選結果失真。

相比Cas9酶,Cas13酶靶向編輯RNA,而不會破壞附近的蛋白編碼基因和其他DNA調控元件。

爲了克服當前CRISPR篩選功能性lncRNA的侷限性,研究團隊開發了基於CRISPR-Cas13的RNA靶向的CRISPR篩選方法,可在轉錄組水平上以轉錄本和鏈特異性的系統性干擾lncRNA,確保位點內不會發生非預期的對附近基因或功能性DNA元件的調控。

研究團隊使用大量平行CRISPR-Cas13正向轉錄組篩選了五個不同的人類細胞系(HAP1、HEK293T、K562、MDA-MB-231、THP1)中的6199個lncRNA,從中確定了一組共享的核心必需lncRNA(影響細胞的生存、增殖或分化),比較了它們與附近的蛋白質編碼基因的必需性,分析了它們在單細胞中擾動後的轉錄組變化,並描述了它們在發育和癌症進展中的關鍵作用。

研究團隊使用RNA靶向的CRISPR-Cas13核酸酶,系統地鑑定了必需lncRNA,並且通過靶向這些lncRNA附近的蛋白編碼基因,還識別了這些蛋白編碼基因是否同樣必需。 利用7個器官和26個發育階段 (從受孕後4周到老年) 的lncRNA表達圖譜,研究團隊設計了CRISPR-Cas13文庫,目標是靶向在所有階段至少一個器官或供體中表達水平在5RPKM及以上的所有lncRNA。 研究團隊還靶向了另外2500個lncRNA,這些lncRNA來自最近使用DNA靶向的CRISPR進行的篩選,以及存在於lncRNA數據庫 (lncRNAdb) 中的lncRNA。 研究團隊設計的CRISPR-Cas13文庫包含了75000個gRNA,用於靶向6199個lncRNA和附近的4390個蛋白編碼基因。

對五個不同的人類細胞系(HAP1、HEK293T、K562、MDA-MB-231、THP1)的篩選結果顯示,共有778個必需lncRNA,它們在至少一個細胞系中是必需的。

進一步分析顯示,在這778個必需lncRNA中,61%(477個)是細胞類型特異性的(也就是隻在一種細胞系中是必需的),33%(255個)是部分共享的(在2-4種細胞系中是必需的),只有6%(46個)是在所有5種細胞系中都是必需的。

對於蛋白編碼基因而言,如果其在一種細胞中是必需的,那麼它在其他細胞中往往也是必需的,相比之下,必需lncRNA則具有更強的細胞類型特異性,在不同細胞系之間的重疊較少。共享的必需lncRNA (在所有5種細胞系中都是必需的) 與細胞類型特異性的必需lncRNA相比,前者具有更高的轉錄丰度。

接下來,研究團隊進一步詳細研究了這46個共享的必需lncRNA,其中包括MALAT1和MIR17HG,前者是一種廣泛存在的lncRNA,之前已被證明可調節細胞運動和癌症轉移;後者是一種miRNA宿主基因,可促進癌症進展。這46個必需lncRNA中只有6個是在之前的必需lncRNA研究中被發現的,而且通常只在一個細胞系中發現。

研究團隊進一步分析了這些必需lncRNA是否會調控其附近的蛋白編碼基因,這是一個從未在非編碼RNA中研究過的機制問題。而該研究發現,絕大多數必需lncRNA獨立於其最近的蛋白編碼基因運作。

利用單細胞的轉錄組分析,研究團隊還發現,這些必需lncRNA的缺失會損害細胞週期進程並驅動細胞凋亡。許多必需lncRNA在發育過程中表現出跨組織的動態表達,在人類發育早期的組織中高表達,而在後期低表達,這表明有些lncRNA在人類發育過程中發揮着重要作用。

研究團隊還對大約9000個原發腫瘤進行了分析,發現在特定類型的腫瘤中lncRNA的表達發生了改變,並進一步確定了那些在腫瘤中表達與較好或較差癌症生存率相關的的lncRNA,從而提供了新的生物標誌物和潛在的治療靶點。

必需lncRNA在腫瘤中差異表達,並與生存相關

總的來說,這項轉錄組規模的功能性lncRNA篩選,促進了我們對非編碼轉錄本的理解,並展示了利用CRISPR-Cas13進行轉錄組規模的非編碼篩選的潛力。該研究提供了一種強大的工具,可用於系統性研究非編碼轉錄本的功能貢獻,併爲識別在任何表型或疾病中具有功能的lncRNA鋪平了道路。

此外,該研究建立的轉錄組規模的RNA靶向的CRISPR篩選框架具有廣泛適用性,並不侷限於lncRNA,還可以直接應用於其他非編碼RNA的篩選,包括增強子RNA和環狀RNA,以研究非編碼轉錄本的功能。

論文鏈接:

www.cell.com/cell/fulltext/S0092-8674(24)01203-0