2020年8月31日,山西農(nóng)業(yè)大學(xué)雜糧分子育種團隊與中國農(nóng)業(yè)科學(xué)院作物科學(xué)研究所等單位合作研究論文“A mini-foxtail millet with an Arabidopsis-like life cycle as a C4 model system”在線發(fā)表于國際期刊Nature Plants(IF:13.256),報道了C4禾谷類研究的理想模式植物“小米”的研究成果。山西農(nóng)業(yè)大學(xué)的楊致榮教授、中國農(nóng)業(yè)科學(xué)院作物科學(xué)研究所的張皓珊博士和山西農(nóng)業(yè)大學(xué)的李旭凱副教授為論文的共同第一作者;山西農(nóng)業(yè)大學(xué)的王興春教授、韓淵懷教授和中國農(nóng)業(yè)科學(xué)院作物科學(xué)研究所的隋毅副研究員為論文的共同通訊作者。美國普渡大學(xué)和英國諾丁漢大學(xué)等單位參與了部分研究。百邁客有幸參與了其中基因組、轉(zhuǎn)錄組及數(shù)據(jù)庫構(gòu)建工作。目前,數(shù)據(jù)庫由百邁客負(fù)責(zé)維護和運行,暫時托管在公司服務(wù)器(http://foxtail-millet.biocloud.net/home)。
研究背景
眾所周知,與C3植物相比,C4植物具有較高的光合效率和水肥利用率。因此,若能將C4光合途徑整合到水稻等C3作物,將有望大幅提高水稻產(chǎn)量,解決由于人口增長帶來的溫飽問題。然而,目前常用的模式植物擬南芥和水稻都是C3植物,作為C4作物的模式植物時有很大的局限性,無法解決諸如C4光合代謝以及許多黍亞科特殊的基礎(chǔ)問題。
谷子(Setaria italica)起源于中國,是我國幾千年來的主栽作物和中華民族的哺育作物。此外,具有抗旱、耐瘠薄和高光效等突出優(yōu)勢,恰恰彌補了擬南芥和水稻作為模式植物的不足,是極具發(fā)展?jié)摿Φ暮坦阮惸J街参?。但谷子生育期較長、株高較高、遺傳轉(zhuǎn)化困難,極大地限制了其作為模式植物在功能基因組學(xué)研究中的應(yīng)用。本次研究篩選到一個超早熟谷子突變體“小米”,其生命周期短,植株小,與擬南芥相似?!靶∶住蹦J街参矬w系的建立將極大促進C4高光效、氮素高效吸收利用機制、抗旱機制、遺傳馴化和優(yōu)異品質(zhì)形成的分子基礎(chǔ)等研究,使“小米”成為C4植物功能研究的理想模式系統(tǒng)。
研究材料與方法
每株系約50株T1轉(zhuǎn)基因幼苗進行重測序,每株系約12 Gb的數(shù)據(jù)(~28×)。晉谷21、“小米”、“小米”2進行重測序比較分析。
11個不同的組織:3日齡種子(種子)、2周齡整株苗(苗)、根、莖、2周齡苗的第一片全展葉(葉1),30日齡植株頂?shù)诙~(葉2)、旗葉(葉3)、第四葉(葉4)、未成熟的圓錐花序(圓錐花序1)、授粉期圓錐花序(圓錐花序2)、灌漿期圓錐花序(圓錐花序3);葉2有5個生物學(xué)重復(fù),其他有3個生物學(xué)重復(fù)。
主要研究內(nèi)容
1.?“小米”的創(chuàng)造與表型表征
2.?“小米”的特性由PHYC基因突變引起
3.?“小米”基因組組裝注釋
4.?谷子品種間基因組序列比較
5.?“小米”動態(tài)基因表達圖譜的構(gòu)建
6.?農(nóng)桿菌介導(dǎo)高效遺傳轉(zhuǎn)化體系的建立
研究結(jié)果
1.?“小米”的創(chuàng)造與表型表征
利用EMS誘變技術(shù)對山西省名優(yōu)谷子晉谷21進行了誘變,從中篩選到一個超早熟突變體“小米”。
“小米”主要有以下特征:(1)表現(xiàn)出極早的開花表型:抽穗期39天(播種后天數(shù),DAS)左右,約70天內(nèi)完成了生命周期。而野生型(晉谷21,WT)的平均抽穗期約為82 天(DAS),成熟期為130 DAS(圖1b、c);(2)“小米”比野生型矮(圖1b),但結(jié)實率高12.83%,且種子大小沒有顯著差異(圖1d);(3)“小米”在短日(SD,10h光照/14h暗)條件下比長日(LD,16h光/8h暗)條件下的抽穗晚了約一個月,表明“小米”的早期抽穗依賴于LD條件(圖1e)。通過延長日長和優(yōu)化其他條件,可以將“小米”的生命周期縮短到65天,株高約為29厘米(圖1f),每年可以在成長室里完成5到6代。(4)僅需較小的種植面積,類似于種植等量的擬南芥植株。
圖1 “小米”的表型特征
2.?“小米”的特性由PHYC基因突變引起
為了找出導(dǎo)致“小米”早熟的突變,研究者將其與抽穗期為75 DAS的G1雜交。所有9株F1植株均表現(xiàn)出類似G1的晚抽穗表型,由268株組成的F2群體表現(xiàn)出G1型晚抽穗期與“小米”型早抽穗期的分離比為3:1(?χ2=0.318<χ2?0.05(1)=3.841),說明“小米”早熟抽穗期是由單基因座隱性突變引起的。利用106個早花F2個體,將該位點定位到9號染色體上的212kb區(qū)域,根據(jù)“小米”參考基因組的注釋,該區(qū)域含有27個基因(圖2a)。
將“小米”基因組序列與經(jīng)基因組重測序生成的晉谷21基因組序列進行比較,發(fā)現(xiàn)在定位區(qū)域只存在一個突變——“小米”基因Si9g09200的編碼區(qū)從“G”到“T”的突變,該基因編碼一種假定的PHYC蛋白(圖2a)。在所檢測的77個早期抽穗F2個體中,均為T/T純合突變體。相比之下,在256個晚抽穗個體中,92個是G/G WT純合子,另外164個是G/T雜合子,反映了基因型和表型之間的完美關(guān)聯(lián)。這種突變產(chǎn)生了一個終止密碼子,形成一個截短的蛋白質(zhì),占該基因約71%的轉(zhuǎn)錄本(轉(zhuǎn)錄本1)(圖2a-d)。這一突變還導(dǎo)致了113 bp的移碼缺失的剪接,形成了占該基因約29%轉(zhuǎn)錄本(轉(zhuǎn)錄本2)的截短蛋白(圖2a-d)。根據(jù)預(yù)測,被截斷的蛋白質(zhì)缺少第二個PAS結(jié)構(gòu)域的三分之二(肽1)或三分之一(肽2),以及整個HK和HD域(圖2d)。
圖2 “小米”的分子特征
研究者對另一個來源于晉谷21的突變株——“小米”2號進行了測序?!靶∶住?號突變體表現(xiàn)出與“小米”相似的早期抽穗表型。PHYC基因座序列比較顯示“小米”2號PHYC第一外顯子發(fā)生單點突變(T674A),導(dǎo)致從保守的亮氨酸變?yōu)榻M蛋白(圖3)。這種SNP與M2雜合子突變體的82株早抽穗(A/A基因型)和84株晚抽穗(49 T/A基因型和35 T/T基因型)M3植株的表型分離密切相關(guān)。綜上所述,這些觀察結(jié)果證實了早期抽穗表型是由PHYC位點突變引起的。
圖3 “小米”2號突變體的表型和分子生物學(xué)特性
為了了解PHYC位點突變對LD條件下開花時間的影響,研究者利用30-DAS(“小米”抽穗前10天)植株的第二片葉片進行了RNA-seq,并以30-DAS采集的WT葉片為對照。發(fā)現(xiàn)與擬南芥振蕩器基因、偽應(yīng)答調(diào)節(jié)蛋白(PRRs)、PHYTOCLOCK 1?(PCL1) 和GIGANTEA?(GI)同源的幾個基因在“小米”中的表達受到顯著影響(圖4)。
與Ghd7同源的下游光周期基因的表達水平下降了約95倍(長日照條件下,增強Ghd7的表達可延遲抽穗期),而與HEADING DATE 1 (Ehd1), HEADING DATE?3a (Hd3a),APETALA1?(AP1)/FRUITFULL?(FUL)-like?MADS box基因同源的開花基因在“小米”中的表達水平顯著增加。Ehd1是水稻光周期開花途徑中的一個關(guān)鍵轉(zhuǎn)錄調(diào)控因子,可以激活葉片中成花素Hd3a的轉(zhuǎn)錄。在葉片中產(chǎn)生的Hd3a蛋白被轉(zhuǎn)運到莖尖分生組織,在那里誘導(dǎo)AP1/FUL-like?MADS box基因的表達。這些觀察結(jié)果表明,“小米”早熟的表型是由于光周期通路的中斷引起的。
圖4?光周期途徑RNA-seq結(jié)果的qRT-PCR驗證
(注:這些蛋白質(zhì)編碼基因命名:Si(代表“小米”),其次是染色體數(shù)目和染色體上的基因數(shù),例如,1號染色體上的第一個和第二個基因分別命名為Si1G00010和Si1G00020)
3.?“小米”基因組組裝注釋
為了便于“小米”作為模型植物的使用,使用PacBio平臺組裝出429.94 Mb基因組 v1.0(k-mer預(yù)估438.26 Mb),contig N50高達18.8?Mb,Scaffold N50為42.41 Mb,并且僅包含48個Gap。其中399.4 Mb通過Hi-C錨定在9條染色體上(掛載率~93%;圖5)。根據(jù)Illumina DNA比對,組裝的錯誤率約為0.001%(每100kb有一個錯誤)。BUSCO評估結(jié)果為97.78%。這些結(jié)果表明“小米”基因組v1.0可以作為研究界的金標(biāo)準(zhǔn)參考。
圖5 “小米”基因組Hi-C熱圖
“小米”基因組序列中有237.28 Mb(55.19%)為重復(fù)序列?;趶念^預(yù)測、同源基因預(yù)測并結(jié)合Iso-seq和RNA-seq,對34436個蛋白質(zhì)編碼基因進行了注釋,其中32743個(95.08%)位于9個假染色體上。在GO、KEGG、KOG、TrEMBL、NR數(shù)據(jù)庫中檢索這些基因,并與擬南芥和水稻的注釋進行比較,檢索出具有已知功能的同源基因,共注釋33789個基因(98.12%)。此外還注釋了919個rRNA基因、3516個tRNA基因、2631個假基因、340個miRNA前體、28260個lncRNA前體和1318個circRNA前體(表1)。
所有的基因組和轉(zhuǎn)錄組數(shù)據(jù)可在數(shù)據(jù)庫(http://sky.sxau.edu.cn/MDSi.htm)公開訪問。在這個數(shù)據(jù)庫中,研究人員可以通過染色體坐標(biāo)、基因或轉(zhuǎn)錄符號,或者通過BLAST搜索“小米”基因組、CDS或肽序列來尋找基因組位置。
表1 “小米”基因組組裝與注釋統(tǒng)計?
4.?谷子品種間基因組序列比較
與 豫谷1、張谷和 TT8的3個基因組序列相比,“小米”基因組在基因組覆蓋率、contig N50、contig和gap數(shù)方面表現(xiàn)出*高的質(zhì)量?!靶∶住毙蛄兄?14.58 Mb(96.44%)對應(yīng)于豫谷1號 383.52 Mb(95.67%),共有1577935個SNPs。相應(yīng)區(qū)域的大小差異主要由259731個InDel,2804個(總計15.32 Mb)存在變異(>1000bp)和2722個(總計17.38 Mb)缺失變異(>1000bp)引起(圖6)。
在“小米”基因組34436個蛋白編碼基因中,有32112個基因(93.25%)與豫谷1號基因組(v2.2)共有。2280個“小米”預(yù)測基因在張谷基因組中未被發(fā)現(xiàn)。在豫谷1號和張谷中均未發(fā)現(xiàn)的1030個基因,為“小米”特有基因。
圖6?“小米”與豫谷1號基因組比較圈圖
5.?“小米”動態(tài)基因表達圖譜的構(gòu)建
為了建立一個參考的基因表達圖譜,研究者測量了“小米”不同發(fā)育階段的11種不同組織的轉(zhuǎn)錄水平??偣伯a(chǎn)生并分析了1054.51 M reads(每個樣本約30 M reads)。從頂部第二葉(葉2)到授粉期圓錐花序(圓錐花序2)檢測到的基因表達比例為74.26%~82.95%。11個“小米”組織共表達22202個基因。這些基因中,85個(0.25%)在所有被測組織中都有組成性表達,包括一個轉(zhuǎn)錄起始因子(Si3G07600)和兩個泛素結(jié)合酶編碼基因(Si1G37980和Si2G05250)。此外,還鑒定了1218個器官/組織特異基因和1226個器官/組織優(yōu)先表達基因。
圖7?Si9g04830基因表達模式圖
6.?農(nóng)桿菌介導(dǎo)高效遺傳轉(zhuǎn)化體系的建立
研究者對各種因素進行了測試,以開發(fā)出適合“小米”的農(nóng)桿菌介導(dǎo)的轉(zhuǎn)化方案。并挑戰(zhàn)使用成熟種子作為愈傷組織誘導(dǎo)的起始材料,以避免在使用新鮮組織(如幼花序或未成熟胚)誘導(dǎo)愈傷組織時的昂貴需求。在改良的愈傷組織誘導(dǎo)培養(yǎng)基(CIM)上進行三輪繼代培養(yǎng)后,獲得了致密的胚性愈傷組織(圖8a)。通過使用綠色熒光蛋白(GFP)報告基因來監(jiān)測農(nóng)桿菌感染效率,如圖8b、c所示,以及篩選轉(zhuǎn)基因愈傷組織的有效性。“小米”的再生能力在CIM培養(yǎng)基上保持良好(圖8f)。表達GFP的轉(zhuǎn)基因植株在生根培養(yǎng)基上容易誘導(dǎo)生根,移栽到土壤后成活良好(圖8g-i)。
研究者比較了兩個常用的選擇標(biāo)記NPTII(新霉素磷酸轉(zhuǎn)移酶II)和HPT(潮霉素磷酸轉(zhuǎn)移酶),NPTII的轉(zhuǎn)化效率為8.05%-38.75%,平均轉(zhuǎn)化效率為23.28%;HPT的轉(zhuǎn)化效率為3.08%-16.67%,平均為8.72%。使用分別擴增GFP基因、UBI啟動子、HPT或NPTII選擇標(biāo)記基因的引物,通過PCR來確認(rèn)轉(zhuǎn)基因原植物(T0)中是否存在轉(zhuǎn)基因(圖8j)。觀察到綠色熒光蛋白在干種子和發(fā)芽種子中的表達,表明轉(zhuǎn)基因已傳遞給后代(圖8k,l)。
圖8?農(nóng)桿菌介導(dǎo)的“小米”轉(zhuǎn)化研究
用HPT或NPTII標(biāo)記的13個獨立轉(zhuǎn)基因系的基因組測序證實了轉(zhuǎn)基因插入“小米”基因組的正確性,并通過PCR進一步確定了3個檢測系的T-DNA插入位點。在盆栽中培育了代表8個轉(zhuǎn)基因事件的T1植株,觀察到與未轉(zhuǎn)化的“小米”植株沒有明顯的表型差異。因此,研究者建立了一個有效的方案,允許在2-3個月內(nèi)(從農(nóng)桿菌感染算起)或4-5個月內(nèi)(從成熟種子開始愈傷組織算起),完成生產(chǎn)準(zhǔn)備移植到土壤中的轉(zhuǎn)基因植物(圖9)。
圖9?農(nóng)桿菌介導(dǎo)“小米”轉(zhuǎn)化工藝流程圖
小結(jié)
本次研究利用EMS誘變技術(shù)對山西省名優(yōu)谷子晉谷21進行了誘變,從中篩選到一個超早熟突變體“小米”。該突變體生育期僅僅兩個月左右,株高僅30 cm左右?!靶∶住钡纳诤椭旮吲c模式植物擬南芥相當(dāng),從而解決了谷子作為C4禾谷類模式植物無法在室內(nèi)大規(guī)模培養(yǎng)的難題。在此基礎(chǔ)上,研究團隊組裝了高質(zhì)量參考基因組,構(gòu)建了全生育期基因表達圖譜和谷子多組學(xué)數(shù)據(jù)庫(http://sky.sxau.edu.cn/MDSi.htm),極大地方便了“小米”功能基因組學(xué)研究。經(jīng)過大量摸索和嘗試,建立了一套方便快捷、高效穩(wěn)定的農(nóng)桿菌介導(dǎo)的“小米”遺傳轉(zhuǎn)化體系(圖7)。該體系遺傳轉(zhuǎn)化效率高達23.28%,已經(jīng)接近模式植物擬南芥和水稻的遺傳轉(zhuǎn)化水平,解決了“小米”作為模式植物遺傳轉(zhuǎn)化效率低下的難題。