利用异源表达挖掘纤维堆囊菌So0157-2的新型天然产物
Genome mining for novel natural products in Sorangium cellulosum So0157-2 by heterologous expression
收稿日期: 2021-02-20 修回日期: 2021-04-06
| 基金资助: |
|
Received: 2021-02-20 Revised: 2021-04-06
作者简介 About authors
黏细菌是天然产物的重要来源。纤维堆囊菌So0157-2是抗癌药物埃博霉素的产生菌,并且是已知基因组最大的原核生物。生物信息学分析发现该菌一共含有35个次级代谢产物生物合成基因簇,除了已知的埃博霉素基因簇和其他两个萜类化合物生物合成基因簇与已知基因簇的相似度为100%之外,其他基因簇与已知化合物基因簇相似度均较低,其中包括17个聚酮合酶(polyketide synthase,PKS)、非核糖体肽合成酶(nonribosomal peptide synthetase,NRPS)及其杂合的基因簇。由于纤维堆囊菌So0157-2生长缓慢、培养困难且难以在本源菌中进行遗传改造。因此,将其生物合成基因簇转移到简单宿主中,利用异源表达策略是挖掘该菌中新颖天然产物的一个有效途径。本文利用直接克隆技术从纤维堆囊菌So0157-2基因组DNA中克隆了1个包含NRPS和PKS结构域的基因簇BGC18,将其转移至伯克氏菌DSM 7029中进行异源表达。通过液质联用分析,色谱柱靶向分离纯化,进而通过NMR结构鉴定和Marfey反应确定了3个化合物分别为Cyclo(N-Me-L-Leu-L-Val)(1)、Cyclo(N-Me-L-Leu-L-Leu)(2)、Cyclo(N-Me-L-Leu-L-Ile)(3)。化合物结构的多样性来源于第1个腺苷化结构域对底物识别的宽泛性(Val/Leu/Ile)。生物合成途径分析推测由于缺少硫醇化结构域导致PKS模块被跳过,从而只获得了NRPS指导合成的环二肽产物1~3,这可能是细菌中一种实现化合物多样性的方式。本论文以基因簇直接克隆与异源表达相结合的策略,成功实现了一个来源于纤维堆囊菌So0157-2中的NRPS-PKS杂合基因簇的异源表达,分离并鉴定了3个该基因簇对应的表达产物。本研究为后续从该菌株中挖掘更多活性天然产物奠定了技术基础,也为其他难培养菌株的次级代谢产物的挖掘提供了思路。
关键词:
Myxobacteria are an important source for natural products. Sorangium cellulosum So0157-2 produces anticancer epothilone, and its genome of 14.78 Mb is the largest prokaryotic genome sequenced to date. Bioinformatic analysis indicated that the genome harbors 35 biosynthetic gene clusters (BGCs). In addition to the known epothilone BGC and another two terpene BGCs with 100% similarity to their predicted BGCs, there are 17 BGCs for polyketide synthases (PKSs), nonribosomal peptide synthetases (NRPSs), and PKS-NRPS hybrids, which mean this strain has great potential to produce novel natural products. However, limits on slow growth, difficult culture, and the absence of efficient genetic manipulation tools for So0157-2 impede the deep mining of its metabolic potential. Therefore, transferring its BGCs to a simple heterologous host and using heterologous expression strategy to achieve genome mining would be an effective way for discovering novel natural products produced by this strain. In this work, a PKS-NRPS hybrid BGC (BGC18) was directly cloned into an Escherichia coli expression vector and transferred into the heterologous host Schlegelella brevitalea DSM 7029. Fractionation was conducted by using repeated column chromatography (HPLC-MS) over a RP-C18 column packing with silica gel, and three pure products were obtained, which were identified by extensive NMR analysis and the Marfey's method as new compounds: (1) cyclo(N-Me-L-Leu-L-Val), (2) cyclo(N-Me-L-Leu-L-Leu), and (3) cyclo(N-Me-L-Leu-L-Ile). Analysis of BGC18 reveals that the lack of thiolation domain in the PKS module might lead to the skipping of this PKS module, and only three cyclodipeptides were synthesized by the two NRPS modules, which might be a strategy for structural diversity in the bacterial NRPS-PKS BGCs. A NRPS-PKS hybrid BGC in S. cellulosum So0157-2 was successfully cloned, and expressed by using direct cloning and heterologous expression strategy with three corresponding products isolated and identified. This study lays a solid foundation for subsequent discovery of more active natural products in S. cellulosum So0157-2, and also provides theoretical guidance for mining secondary metabolites from other microbes which are difficult for culture.
Keywords:
本文引用格式
周海波, 申琪瑶, 陈汉娜, 王宗杰, 李越中, 张友明, 卞小莹.
ZHOU Haibo, SHEN Qiyao, CHEN Hanna, WANG Zongjie, LI Yuezhong, ZHANG Youming, BIAN Xiaoying.
随着基因组测序技术的发展,越来越多的基因组信息分析表明黏细菌基因组所蕴藏的生物合成基因簇(biosynthetic gene cluster,BGC)合成新颖次级代谢产物的潜力远远超出了目前已分离获得的化合物的数目。例如,抗肿瘤药物埃博霉素(epothilone)的产生菌纤维堆囊菌So0157-2(Sorangium cellulosum So0157-2)的基因组测序结果表明,该菌株拥有14.78 Mb的环状染色体,是目前已知基因组最大的原核生物[7-9]。除了已知的埃博霉素系列衍生物[10-15]之外仍未见其他化合物从该菌株中分离报道,这预示着该菌株仍具有较大的代谢潜能。对隐性基因簇进行有效的激活和改造,能够为药物先导结构的发现提供更多的化合物资源。由于纤维堆囊菌So0157-2生长相对较慢、培养困难,本源菌也缺乏合适的遗传操作体系,对其天然产物的开发存在着诸多挑战。
异源表达的难点之一在于大部分天然产物生物合成基因簇都相当大(>10 kb),PCR扩增很难得到如此长的DNA序列。通过构建和筛选基因文库虽然能够获得目的基因簇,但是工作量非常大,且不一定能获得完整的基因簇。随着基因编辑技术的发展和进步,可以利用直接克隆技术(direct cloning)从基因组中克隆大型基因簇,比如LLHR(linear-linear homologous recombination)、TAR(transformation-associated recombination)、CATCH(Cas9 assisted targeting of chromosome segments)等[20]。其中LLHR是由本团队于2012年开发的基于Red/ET重组工程技术(recombineering)的直接克隆技术[21],并与异源表达相结合,广泛应用于天然产物基因簇的挖掘。2018年将Red/ET重组工程技术与核酸外切酶体外处理技术相结合,开发了ExoCET(exonuclease combined with RecET recombination)克隆技术,进一步提高了BGCs直接克隆的效率[22]。此外,Red/ET重组工程技术还可以用于基因簇的无痕定点突变,结构域替换等等,极大促进了大型基因簇的遗传操作[22-28]。
异源表达的另一个难点在于异源宿主的选择。大肠杆菌和酿酒酵母都是表征良好、易于遗传操作的模式菌株,为细菌和真菌中天然产物的表达提供了良好的异源宿主[29-31]。研究者也发现,当宿主菌与包含目标基因簇的菌株在进化上相近时,异源表达就更易成功。所以,很多链霉菌被开发为异源宿主菌,用于放线菌中基因簇的异源表达[32-33]。可用于黏细菌异源表达的异源宿主菌相对缺乏,目前常用的有黄色黏球菌(Myxococcus xanthus)、恶臭假单胞菌(Pseudomonas putida)以及Schlegelella brevitalea DSM 7029(曾用名:Burkholderiales Strain DSM 7029,[Polyangium]brachysporum DSM 7029)等[16-18]。除了黄色黏球菌和S. brevitalea DSM 7029之外,其他异源宿主产量普遍较低。黄色黏球菌也属于黏细菌属,自身生长周期慢、难于进行遗传操作等劣势也限制了其应用。S. brevitalea DSM 7029是一株能够产生多种非核糖体肽、聚酮-非核糖体肽杂合化合物的革兰氏阴性细菌,相较于黄色黏球菌具有生长快、易操作、代谢背景清晰等诸多优点,特别是在表达纤维堆囊菌来源埃博霉素中显示了作为通用底盘菌的潜力[34-37]。因此,该菌株可作为本研究的异源宿主候选菌。
基于纤维堆囊菌So0157-2基因组信息预测分析所显示出的代谢潜能,本论文利用ExoCET直接克隆技术从该菌基因组DNA中克隆了1个未知功能的NRPS-PKS杂合的基因簇BGC18。通过启动子插入,并以S. brevitalea DSM 7029为异源宿主进行异源表达,经过液质联用(HPLC-MS)分析,正相与反相色谱柱靶向分离纯化,获得了3个该基因簇对应的表达产物。最后,通过核磁共振(NMR)结构鉴定和Marfey反应确定了3个化合物分别为新天然产物Cyclo(N-Me-L-Leu-L-Val)(1)和Cyclo(N-Me-L-Leu-L-Leu)(2),新化合物Cyclo(N-Me-L-Leu-L-Ile)(3)。将化合物结构与生物合成基因簇对比分析发现化合物结构的多样性来源于第1个腺苷化结构域(A domain)对底物识别的宽泛性。此外,推测由于缺少硫醇化结构域(T domain)导致PKS模块被跳过,从而只获得了两个NRPS模块指导合成的环二肽产物。该研究成功构建了基于Red/ET重组工程技术的纤维堆囊菌So0157-2基因簇的直接克隆、遗传修饰和异源表达体系,不仅丰富了纤维堆囊菌So0157-2的代谢产物库,也为挖掘该菌株中其他新颖的天然产物用于药物筛选评价奠定了基础。
1 材料和方法
1.1 材料
1.1.1 菌株、质粒和引物
表1 本研究所用的菌株和质粒
Tab. 1
| Strains/Plasmids | Description | Sources |
|---|---|---|
| Strains | [21] | |
| Escherichia coli GB05-dir | GB2005, araC-PBAD-ETgA; recE, recT, redγ, and recA regulated by arabinose-induced promoter are inserted at ybcC locus | |
| E. coli GB05-red | GB2005, araC-PBAD-αβγA; redα, redβ, redγ, and recA regulated by arabinose-induced promoter are integrated at ybcC locus | [38] |
| S. cellulosum So0157-2 | wild type harboring BGC18 | [7-8] |
| S. brevitalea DSM 7029 | Burkholderiales strain DSM 7029, [Polyangium] brachysporum DSM 7029 (K481-B101; ATCC 53080) | [35-36,39] |
| DSM7029:Pkm-BGC18 | Pkm-BGC18 was inserted into genome of Schlegelella brevitalea DSM 7029, kmR | This work |
| Plasmids | ||
| p15A-cm-tetR-tetO-hyg-ccdB | direct cloning vector, p15A replicon, containing a tetracycline inducible promoter PtetO, cmR/hygR | [24] |
| pR6K-oriT-TnpA-IR-km | R6K replicon, containing MycoMar transposase gene (tnpA) and conjugation element oriT, kmR | [24] |
| p15A-cm-BGC18 | BGC18 was cloned into cloning vector, cmR | This work |
| p15A-oriT-IR-Pkm-BGC18 | Expression vector of BGC18 with Pkm was inserted into upstream of the first core gene of BGC18, containing transposon elements oriT-tnpA-IR, kmR | This work |
表2 本研究所用的引物
Tab. 2
| Primers | Sequences (5′-3′) |
|---|---|
| BGC18-HAF | cagtatggccgatcggggtgtcagcggtcaacacgcgagctcgctcgctctgtggcggcgctctcatggtgcAACGCTCTCTACTAGAGTCA |
| BGC18-HAR | gacgtgaccgggtatcgctaggtccacccaccaggagtccggccagggatccggagagtgagagttcaacgcGGGTCTTAAGACGTCGATATCT |
| IR-Pkm-C18-HAF1 | gcctgcgatcgtaccattacgtatttttgcgcgagcggaacggtatgcagGCTGATCTTCAGATCCTCTAC |
| IR-Pkm-C18-HAR1 | tcgagccgcaaggcgcattcttgctccagagagagcggcatagtacccaacctcctTCAGAAGAACTCGTCAAGAAG |
| detect-C18 in 7029-F1 | GATGGGTTATCAGGACTACGC |
| detect-C18 in 7029-R1 | CGAGGAGCCTGTAGAACGCGT |
| detect-C18 in 7029-F2 | TCGACGATCAGGTGAAGATCCA |
| detect-C18 in 7029-R2 | AGCTCTCCATAGGTGAGCGAA |
| detect-C18 in 7029-F3 | TGAAGATCCGCGGCTATCGCA |
| detect-C18 in 7029-R3 | CGGGAACTGGAACAGGTCCAT |
| detect-C18 in 7029-F4 | TTCTTCGTCAACGCCGCGCC |
| detect-C18 in 7029-R4 | GCGATAGGCGTGCACCGTGC |
| detect-C18 in 7029-F5 | TCACGCTGCCGCAAGCACTC |
| detect-C18 in 7029-R5 | GCTCTGCGAAGGACGTCCTC |
1.1.2 培养基
LB培养基:酵母粉0.5%,蛋白胨1%,NaCl 0.1%,pH 7.0。
CYMG培养基:胰蛋白胨0.8%,酵母粉0.4%,MgCl2·2H2O 0.4%,甘油5 mL/L。
M26培养基:土豆淀粉0.8%,葡萄糖0.2%,蛋白胨0.2%,酵母提取物0.2%,CaCl2·2H2O 0.1%,微量元素液1 mL/L; pH 7.0。
VY/2培养基:鲜酵母 0.5%,MgSO4·7H2O 0.4%,维生素B12 0.005%,CaCl2·2H2O 0.1%。
以上固体培养基均添加1.5%的琼脂。
1.1.3 主要试剂和仪器
限制性DNA内切酶、T4 DNA聚合酶购自New England BioLabs公司;PrimeSTAR Max DNA聚合酶、DNA Marker购自Takara公司;卡那霉素(kanamycin,km)、氯霉素(chloramphenicol,cm)购自上海生工生物工程有限公司;培养基组分购自北京索莱宝生物科技有限公司;分析纯甲醇、无水乙醇、异丙醇购自国药集团化学试剂有限公司;色谱级甲醇、乙腈购自Thermo Fisher科技有限公司。
液质联用仪型号为Thermo Fisher UltiMate3000与Bruker Amazon SL联用;高效液相色谱仪型号为Agilent 1260;电转仪型号为Eppendorf AG 4309;核磁共振波普仪型号为Agilent 500 MHz DD2;HPLC制备所用色谱柱型号为Agilent ZORBAX SB-C18,9.4 mm×250 mm,5 μm;液质分析所用色谱柱为Thermo Scientific Acclaim RSLC 120 C18,2.1 mm×100 mm,2.2 μm。
1.2 BGC18基因簇的直接克隆与异源表达
1.2.1 S. cellulosum So0157-2基因组提取
将-80 ℃保藏的S. cellulosum So0157-2接种到VY/2平板上,30 ℃恒温培养,待长出菌膜,转接到表面湿润的M26平板上。刮取M26平板培养5~7 d的菌落置于50 mL离心管中,水洗两次,然后根据菌量加入适量的无菌水,涡旋混匀。吸取1.8 mL 菌液分装到2 mL EP管中,12 000 r/min离心1 min,弃上清。加入450 μL Tris-HCl(10 mmol/L,pH 8.0),吹打混匀。加入30 μL 20 mg/mL蛋白酶K,颠倒混匀。加入40 μL 10% SDS(sodium laurylsulfonate)后,轻轻混匀。50 ℃水浴1~2 h,中间间断颠倒直至溶液变澄清。加入500 μL苯酚-氯仿-异戊醇(25∶24∶1),快速混匀,至溶液呈乳浊状,13 800 r/min离心15 min。用去尖的移液吸头吸取300 μL上清置于新的2 mL EP管中。加入35 μL 3 mol/L NaAc(pH 7.5),混匀后,加入1.2 mL无水乙醇,混匀。准备新的2 mL EP管并加入1 mL 70%乙醇,用黄色吸头将悬浮的DNA挑至该EP管中。10 000 r/min离心1 min。弃上清,倒置于吸水纸上并用吸水纸将管壁上的水吸掉。室温干燥15~20 min。加入200 μL双蒸水(double-distilled H2O,ddH2O),放置4 °C冰箱备用。
1.2.2 S. cellulosum So0157-2基因组酶切产物制备
将基因组DNA利用限制性内切酶DraⅠ和HindⅢ酶切,释放目标基因簇片段。取上述制备的基因组DNA 200 μL,加入40 μL 10×Cutsmart buffer、12 μL限制性内切酶DraⅠ和HindⅢ、1.5 μL RNase A,用ddH2O补齐至400 μL,37 ℃反应3 h。取10 μL酶切产物跑琼脂糖凝胶电泳进行检测。检测之后用等体积的苯酚-氯仿-异戊醇(25∶24∶1)抽提酶切产物除去蛋白,然后进行乙醇沉淀。
1.2.3 直接克隆载体的制备
以BGC18-HAF和BGC18-HAR为PCR引物,以质粒p15A-cm-tetR-tetO-hyg-ccdB为PCR模板,进行PCR扩增。取2 μL PCR产物进行电泳检测,确认正确后将剩余PCR产物切胶回收目的片段。
1.2.4 目的基因簇BGC18的直接克隆
直接克隆载体和酶切基因组产物在体外用T4 DNA Polymerase退火:取200 ng克隆载体、2 μL 10×NEB Buffer 2.1、0.13 μL T4 DNA Polymerase混匀后,轻轻加入12 μL基因组酶切产物,再用ddH2O将酶切体系补足到20 μL。PCR反应程序为:25 ℃,60 min;75 ℃,20 min;50 ℃,30 min;4 ℃保温。反应完成之后将产物室温除盐40 min。将上述除盐后的产物电转化到经L-Ara诱导的感受态细胞E. coli GB05-dir/pSC101-BAD-ETgA中。从LB转化平板上挑取单菌落,小量提取质粒,进行酶切分析。
1.2.5 目的基因簇BGC18的遗传修饰
分别对质粒p15A-cm-BGC18进行转座元件和启动子的插入。利用带有同源臂的引物对IR-Pkm-C18-IR-HAF1/HAR1对质粒pR6K-oriT-TnpA-IR-km进行扩增,得到oriT-IR-Pkm PCR产物,PCR产物通过切胶回收纯化;随后将回收的产物与质粒p15A-cm-BGC18共同转入E. coli GB05-red感受态细胞中,使用合适的抗生素(km/cm)筛选重组子;重组质粒通过限制性内切酶ApaL Ⅰ进行酶切鉴定及测序鉴定。
1.2.6 目的基因簇BGC18异源表达
S. brevitalea DSM 7029已作为异源宿主表达了多个黏细菌来源的基因簇,所以本研究中选择野生型的S. brevitalea DSM 7029作为首选异源宿主。首先将质粒p15A-oriT-TnpA-IR-Pkm-BGC18(约1 μg)电转入野生型S. brevitalea DSM 7029中[24],通过含卡那霉素的CYMG平板筛选重组子。分别利用detect-C18 in 7029-F1/R1,detect-C18 in 7029-F2/R2,detect-C18 in 7029-F3/R3,detect-C18 in 7029-F4/R4,detect-C18 in 7029-F5/R5五对引物对重组子进行菌落PCR鉴定。
1.2.7 菌株的发酵提取分离与LC-MS检测
将正确的重组子接种于含有50 mL CYMG培养基(km 3μg/mL)的300 mL锥形瓶中,30 °C,180 r/min培养过夜制备种子液。转接50 μL种子液于相同的培养基相同培养条件下培养2 d,然后每瓶加入1 mL经前处理的XAD16大孔树脂,继续恒温摇床培养2 d。
将菌体和大孔树脂通过100目筛进行分离,并用双蒸水将树脂洗涤3次(尽量去除菌体)。将树脂倒入新的干燥的锥形瓶中,加入50 mL的甲醇,30 °C,180 r/min浸泡1 h。通过滤纸过滤将树脂和甲醇分离,并将甲醇组分减压浓缩蒸干得到粗提物。加入1 mL色谱甲醇或乙腈溶解粗提物,然后12 000 r/min,离心10 min,取上清过0.22 μm微孔滤膜并转移至HPLC进样管中,待HPLC-MS进行质谱检测。
液质检测条件如下:液质分析色谱柱;流动相,A相为水+0.1%甲酸,B相为乙腈+0.1%甲酸;流速0.3 mL/min;进样 3 μL;检测波长190~400 nm;洗脱程序0~3 min,5% B;3~18 min,5%~95% B;18~22 min,95% B;22~25 min,5% B。质谱检测条件:电喷雾离子源,正离子模式,二级质谱AutoMS2,检测范围m/z 70~2200。
1.2.8 氨基酸绝对构型的确定
采用Marfey法将化合物1~3分别进行酸水解,水解产物分别与L-FDAA(1-fluoro-2-4-dinitrophenyl-5-L-alanine amide)或D-FDAA反应[35]。采用同样的方法制备标准品N-Me-L-Leu与L/D-FDAA的衍生产物,L/D-Val、L/D-Leu、L/D-Ile、L/D-allo-Ile与L-FDAA的衍生物,随后进行LC-MS分析。N-Me-L-Leu、L/D-Val与L/D-FDAA的衍生产物的分析条件与1.2.7液质检测条件一致,检测波长330 nm。L/D-Leu、L/D-Ile、L/D-allo-Ile的衍生产物洗脱程序为0~45 min,5%~50% B。对应衍生物的参照分子量为[M+H]+m/z 398(N-Me-L-Leu)、370(L/D-Val)、384(L/D-Leu,L/D-Ile,L/D-allo-Ile)。
2 结果和分析
2.1 S. cellulosum So0157-2生物信息学分析
通过antiSMASH分析,S. cellulosum So0157-2基因组(NCBI数据库登录号:CP003969.1)共包含35个BGCs(表3),编码聚酮(PKS)、非核糖体肽(NRPS)、PKS-NRPS杂合以及萜类(terpene)等多种结构类型化合物。除了已知的epothilone[8]及另外两个萜类生物合成基因簇geosmin[40]和eremophilene[41]之外,其余基因簇与目前已知的生物合成基因簇都存在着较大的不同,相似度较低,这预示着该菌株仍具有较大的代谢潜能。PKS-NRPS杂合的化合物通常具有新颖的结构以及广泛的生物活性[42],因此优先选取该类型基因簇进行激活。BGC18预测为PKS-NRPS杂合基因簇,长度约为26.7 kb(图1)。核心基因(SCE1572_24725)包含3个模块共有10个结构域(C1-A1-T1,C2-A2-MT-T2,KS-AT-TE)(图1)。其中A1(adenylation)被预测可能识别缬氨酸/丙氨酸/甘氨酸/亮氨酸/异亮氨酸(Val/Ala/Gly/Leu/Ile),A2被预测可能识别亮氨酸,然后被N-甲基化形成N-甲基亮氨酸(N-Me-Leu),AT(acyltransferase)则可能识别丙二酰辅酶A(Malonyl-CoA),但是缺少PKS所必需的硫醇化(thiolation,T)结构域,这些底物能否通过NRPS和PKS的延伸单元被依次加载、缩合,形成的终产物最后被硫酯酶(TE)结构域释放是一个值得研究的问题。
表3 antiSMASH 预测So0157-2基因组编码的生物合成基因簇
Tab. 3
| Gene Clusters | Type | Similar known cluster | Similarity |
|---|---|---|---|
BGC1 BGC2 BGC3 BGC4 BGC5 BGC6 BGC7 BGC8 BGC9 BGC10 BGC11 BGC12 BGC13 BGC14 BGC15 BGC16 BGC17 BGC18 BGC19 BGC20 BGC21 BGC22 BGC23 BGC24 BGC25 BGC26 BGC27 BGC28 BGC29 BGC30 BGC31 BGC32 BGC33 BGC34 BGC35 | RiPP-like NRPS Thioamitides NRPS-PKS NRPS-PKS hglE-KS RiPP-like RiPP-like Indole T3PKS NRPS-T1PKS Terpene T1PKS NRPS RiPP-like thioamitides NRPS NRPS-T1PKS NRPS-T1PKS hglE-KS NRPS-T1PKS NRPS-T1PKS arylpolyene LAP, RRE-containing RiPP-like RiPP-like T1PKS T1PKS microbiridin phosphonate NRPS RiPP-like NRPS-T1PKS terpene NRPS | — — — pyxipyrrolone A/B kirromycin — — — — alkylpyrone-407/393 disorazol A geosmin pallasoren — — — myxochelin A/B — Epothilone — — Hapalosin N-tetradecanoyl tyrosine — — — — — microviridin J — coelibactin — crochelin A eremophikene — | — — — 11% 5% — — — — 6% 23% 100% 50% — — — 50% — 100% — — 40% 6% — — — — — 66% — 45% — 26% 100% — |
图1
2.2 BGC18的直接克隆、改造、异源表达
利用DraⅠ和HindⅢ酶切基因组,释放出27 kb的完整BGC18,将酶切后的基因组回收备用。然后PCR扩增1.79 kb的直接克隆载体p15A-cm,得到的片段两端各带有72 bp的同源臂。参照ExoCET的方法[22],对基因簇进行克隆(图2)。复苏后的菌体涂布含氯霉素的LB筛选平板,过夜培养后挑取24个转化子,用MscⅠ酶切鉴定(图3),将其中4个所有酶切条带均正确的质粒,对它们的同源臂部分进行测序,测序正确的命名为p15A-cm-BGC18。为了让质粒p15A-cm-BGC18能在异源宿主中成功表达,需要插入转座元件oriT-tnpA-IR将基因簇通过转座的方式整合至异源宿主的基因组上。此外,来源于黏细菌的启动子在DSM 7029中可能无法正常工作,所以将BGC18的结构基因的启动子替换成异源宿主中可以工作的组成型启动子Tn5-kan(Pkm)。用带有50 bp同源臂的引物对pR6K-oriT-TnpA-IR-km进行扩增,得到oriT-TnpA-IR-km片段,将这个片段与p15A-cm-BGC18发生线环重组(LCHR),挑选7个转化子进行酶切分析和同源臂部分测序,成功获得重组质粒p15A-oriT-IR-Pkm-BGC18(图3)。
图2
图3
图3
重组质粒p15A-cm-BGC18(a)和p15A-OriT-IR-Pkm-BGC18(b)分别以MscⅠ和ApaLⅠ酶切鉴定
(红色方框代表酶切条带正确)
Fig. 3
a: Restriction analysis of the recombinant plasmids p15A-cm-BGC18 by MscⅠ(a) and p15A-OriT-IR-Pkm-BGC18 by ApaLⅠ(b)
(Red box indicates right recombinant plasmids)
将质粒p15A-oriT-IR-Pkm-BGC18电转入野生型的S. brevitalea DSM 7029中,从含卡那霉素的CYMG平板上挑取重组子进行菌落PCR鉴定,挑选3个正确的重组子(DSM7029:Pkm-BGC18)进行发酵检测,并以野生型DSM 7029作为阴性对照。利用HPLC-MS对发酵结果进行分析。HPLC-MS结果显示,所有带有BGC18的突变体均产生了两个显著的化合物峰m/z 227[M+H]+、241[M+H]+,且这些峰在阴性对照中未发现,推测是BGC18在DSM 7029中表达的产物(图4)。
图4
图4
BGC18在S. brevitalea DSM 7029中的异源表达产物LC-MS分析(BPC+:m/z 200~300)
Fig. 4
LC-MS analysis for the heterologous products of BGC18 expressed in S. brevitalea DSM 7029
2.3 产物的分离纯化
将突变菌株DSM7029:Pkm-BGC18采用CYMG培养基批量发酵10 L,大孔树脂XAD-16吸附目标化合物,然后用甲醇提取发酵粗提物。发酵粗提物首先经过正相硅胶柱色谱分离,干法上样,以CH2Cl2-MeOH为流动相,梯度洗脱(100∶1、50∶1、30∶1、20∶1、10∶1),得到5个分组分Fr1~Fr5。液质检测将含有目标化合物的组分Fr3继续通过反相中压液相色谱制备,水和甲醇为流动相,梯度洗脱。最终通过HPLC制备,30%乙腈水溶液恒梯度洗脱得到化合物1(33 mg),40%乙腈水溶液恒梯度洗脱得到化合物2(7 mg)和化合物3(4 mg)。
2.4 化合物1-3结构鉴定
化合物1为白色固体,阳离子质谱ESIMS 在m/z 227.0处给出[M+H]+分子离子峰,结合化合物的一维1H谱、13C谱(表4)可以得到化合物分子式为C12H12O2N2。分析13C NMR,DEPT谱发现,化合物1具有2个酰胺羰基(δC 167.6,165.1);4个次甲基(δC 60.1,59.2,32.6,25.1);1个亚甲基(δC 42.7);5个甲基(δC 32.1,23.1,21.8,19.2,18.0)其中1个与氮相连;进一步通过HMBC二维核磁数据确定化合物1的结构与已知有机合成中间体Cyclo(N-Me-L-Leu-L-Val)相同[43-44](图5),但是其核磁数据未见报道,因此对其核磁数据H和C谱进行了解析与指认(表4)。
表4 化合物1~3的NMR核磁数据
Tab. 4
| No | 1 | 2 | 3 | ||
|---|---|---|---|---|---|
| δC | δH (J in Hz) | δH (J in Hz) | δH (J in Hz) | ||
| N-Me-Leu | 1 2 3 4 5 6 N-Me | 167.6, C 59.2, CH 42.7, CH2 25.1, CH 23.1, CH3 21.8, CH3 32.1, CH3 | 3.78, dd (4.5, 8.2) 1.58, m 1.87, m 0.89, d (6.7) 0.93, d (6.7) 2.82, s | 3.79, t (6.7) 1.59, t (7.0) 1.79, m 0.90, d (6.5) 0.93, d (6.5) 2.82, s | 3.78, dd (4.5, 8.1) 1.58, m 1.87, m 0.89, d (6.5) 0.93, d (6.5) 2.82, s |
| Val/Leu/Ile | 1 2 3 4 5 6 NH | 165.1, C 60.1, CH 32.6, CH 19.2, CH3 18.1, CH3 | 3.55, dd (3.6, 5.2) 2.01, m 0.92, d (6.8) 0.84, d (6.8) 8.24, d (2.4) | 3.73, dt (3.9, 8.7) 1.52, m 1.45, m 1.79, m 0.86, d (6.5) 0.90, d (6.5) 8.39, d (2.6) | 3.61, dd (3.8, 4.8) 1.73, m 1.43, m 1.11, m 0.84, t (6.5) 0.89, d (6.5) 8.23, d (1.6) |
图5
图5
化合物1~3的结构式及化合物1的HMBC相关信号
Fig. 5
Structures of 1~3 and HMBC correlations of 1
化合物2和3均为白色固体,阳离子质谱ESIMS 在m/z 241.0处给出[M+H]+分子离子峰,提示化合物分子式为C13H24O2N2比1多一个CH2。与化合物1的氢谱数据比较发现(表4),化合物2中的两个氨基酸均为亮氨酸(Leu)。进一步查阅文献发现化合物2为已知有机合成中间体Cyclo(N-Me-L-Leu-L-Leu)(图5)[45]。化合物3与化合物2的氢谱数据非常类似,除了一个二重峰(d)的甲基变成了三重峰(t)的甲基(δH 0.84)以及一个与氮相连的CH信号由dt峰变为dd峰(δH 3.61),这就表明化合物3中的氨基酸为Ile,为新化合物(图5)。采用Marfey法对氨基酸的绝对构型进行了确定,4种氨基酸(N-Me-Leu、Val、Leu、Ile)均为L构型(表5)。
表5 化合物1~3氨基酸与marfey试剂衍生产物的保留时间
Tab. 5
| Amino acid | Configuration | Retention time | |||
|---|---|---|---|---|---|
| Standard | 1 | 2 | 3 | ||
| N-Me-L-Leu | L | 12.9 | 12.9 | 12.9 | 12.9 |
| D | 13.2 | ||||
| Val | L | 11.6 | 11.6 | ||
| D | 12.5 | ||||
| Leu | L | 29.7 | 29.7 | ||
| D | 33.1 | ||||
| Ile | L | 29.1 | 29.1 | ||
| D | 32.5 | ||||
| allo-Ile | L | 29.2 | |||
| D | 32.6 | ||||
2.5 化合物1~3的生物合成途径分析
根据化合物的结构及其生物合成基因簇的生信分析,对化合物1~3的生物合成途径进行了推测(图6)。A1结构域可识别L型的Val/Leu/Ile。A2结构域可识别的L-Leu,然后经过N-甲基转移酶甲基化修饰后形成N-Me-Leu。两部分经过缩合与TE介导的环化,最终形成化合物1~3的完整结构。尽管该基因簇含有PKS模块,推测可能因为缺少PKS所必需的T结构域导致PKS模块被跳过,从而只获得了NRPS指导合成的环二肽产物1~3。
图6
2.6 化合物1~3的抗菌活性测试
本研究采用96孔板二倍稀释法[35]测定了化合物1~3对下列指示菌株(E. coli ATCC 35218、P. aeruginosa ATCC 27853、Staphylococcus aureus ATCC 29213、Bacillus subtilis ATCC 6633、Helicobacter pylori G27、H. pylori 159、Enterococcus faecalis ATCC 19434、Mycobacterium smegmatis ATCC 607、Candida albicans SC5314)的抗菌活性,结果显示化合物1~3对所测菌株均无抑制作用(MIC>32 μg/mL)。
3 结论
基因组信息分析表明,纤维堆囊菌So0157-2基因组中含有丰富的未知功能的基因簇,特别是含有大量通常具有良好生物活性的PKS、NRPS或两者杂合的基因簇,预示着该菌株仍具有产生新颖天然产物的潜力。BGC18即为该菌基因组中预测的一个NRPS-PKS杂合的基因簇,大小约为26.7 kb。该基因簇中NRPS模块的核心基因预测含有两个A结构域,其中A2结构域被预测具有底物的专一性,而A1结构域对底物的识别具有宽泛性,因此该基因簇可能合成结构多样的二酮哌嗪类化合物。此外,该基因簇PKS模块缺少T结构域,这些底物能否通过NRPS和PKS的延伸单元被依次加载、缩合,形成的终产物最后被TE结构域释放值得深入研究。然而,由于该菌株较难培养且自身未建立遗传操作体系,因此将该生物合成基因簇转移到合适的异源宿主中,利用异源表达策略是激活该生物合成基因簇挖掘其次级代谢产物的一个有效途径。异源表达成功的关键主要涉及基因簇的克隆与遗传修饰以及异源宿主的合理选择。本课题组已经建立了以Red/ET DNA同源重组技术为核心的生物合成基因簇直接克隆与遗传修饰技术平台,为天然产物的挖掘提供了技术支撑[21-28]。基因簇在异源表达时,存在着密码子偏好性的影响。选择异源宿主时,首先考虑与原始生产菌在进化地位上亲缘关系相近的菌。本文中所选用的异源宿主S. brevitalea DSM 7029与纤维对囊菌So0157-2均为变形菌门,GC含量相似,分别为68%和72%[8,39]。前期,本课题组将纤维堆囊菌来源的埃博霉素成功地在该异源宿主S. brevitalea DSM 7029中进行了表达,说明两株菌的密码子有一定的兼容性[36]。此外,通过启动子工程改造以及额外补充稀有密码子的tRNA或者进行密码子优化等也可以提高异源表达的概率[36-37]。
因此,本研究成功构建了纤维堆囊菌So0157-2中基因簇的直接克隆与遗传修饰体系,并将一个NRPS-PKS杂合的基因簇BGC18转入异源宿主S. brevitalea DSM 7029中实现了该基因簇的功能性表达,成功获得了3个对应的代谢产物。通过正相硅胶柱色谱和HPLC分离纯化,以及MS、NMR解析了化合物的结构。SciFinder数据库检索证实化合物1和2仅作为有机合成中间体被报道,为新天然产物,而化合物3为新化合物。BGC18为NRPS-PKS杂合基因簇,从结构上看,化合物1~3为二酮哌嗪类化合物,其所含氨基酸与生物信息学预测一致,但是并未见PKS单元。仔细分析PKS相关基因发现该基因簇缺少硫醇化结构域,推测导致PKS不能有效组装。化合物1~3结构上差别主要为第1个氨基酸的不同(1 Val, 2 Leu, 3 Ile),这是由于第1个腺苷化结构域(A domain)对底物识别的非特异性所导致的。由A结构域对底物识别的宽泛性导致的结构多样性也在我们前期分离获得的多个脂肽类化合物得到证实[46-47]。基于Red/ET重组工程技术的纤维堆囊菌So0157-2隐性基因簇的直接克隆、修饰和异源表达体系的建立,不仅有助于进一步了解该菌的生物合成潜力,而且能够发现新颖的天然产物用于药物筛选评价。
参考文献
Natural products from myxobacteria: novel metabolites and bioactivities
[J].
Myxobacterial secondary metabolites: bioactivities and modes-of-action
[J].
Myxobacteria—'microbial factories' for the production of bioactive secondary metabolites
[J].
Antibiotics from myxobacteria
[J].
黏细菌生物活性物质的研究
[J].
Study of myxobacterial bioactive substances
[J].
黏细菌: 天然的制药厂
[J].
Myxobacteria: natural pharmaceutical factories
[J].
Extraordinary expansion of a Sorangium cellulosum genome from an alkaline milieu
[J].
Isolation and characterisation of the epothilone gene cluster with flanks from high alkalotolerant strain Sorangium cellulosum (So0157-2)
[J].
黏细菌纤维堆囊菌的基因组学研究现状
[J].
Research status of genomics of myxobacteria Sorangium cellulosum
[J].
Glycosylation and production characteristics of epothilones in alkali-tolerant Sorangium cellulosum strain So0157-2
[J].
Five new epothilone metabolites from Sorangium cellulosum strain So0157-2
[J].
Two epothilones from Sorangium cellulosum strain So0157-2
[J].
New epothilone congeners from Sorangium cellulosum strain So0157-2
[J].
Four natural epothilone derivatives isolated from Sorangium cellulosum strain So0157-2
[J].
Epothilone O, a new member of this family from Sorangium cellulosum strain So0157-2
[J].
Heterologous expression of bacterial natural product biosynthetic pathways
[J].
Recent advances in the heterologous expression of microbial natural product biosynthetic pathways
[J].
Genetic platforms for heterologous expression of microbial natural products
[J].
New tools for reconstruction and heterologous expression of natural product biosynthetic gene clusters
[J].
Engineered biosynthesis of natural products in heterologous hosts
[J].
Full-length RecE enhances linear-linear homologous recombination and facilitates direct cloning for bioprospecting
[J].
ExoCET: exonuclease in vitro assembly combined with RecET recombination for highly efficient direct DNA cloning from complex genomes
[J].
Red/ET同源重组技术及其在微生物基因组挖掘中的应用进展
[J].
Advances in Red/ET recombineering and its application for microbial genome mining
[J].
Improved seamless mutagenesis by recombineering using ccdB for counterselection
[J].
Rational and efficient site-directed mutagenesis of adenylation domain alters relative yields of luminmide derivatives in vivo
[J].
RecET direct cloning and Redαβ recombineering of biosynthetic gene clusters, large operons or single genes for heterologous expression
[J].
Recombineering for genetic engineering of natural product biosynthetic pathways
[J].
Engineering and elucidation of the lipoinitiation process in nonribosomal peptide biosynthesis
[J].
Robust platform for de novo production of heterologous polyketides and nonribosomal peptides in Escherichia coli
[J].
真菌天然产物异源生产研究进展
[J].
Progress in heterologous expression of fungal natural products-a review
[J].
Yeast-based genome mining, production and mechanistic studies of the biosynthesis of fungal polyketide and peptide natural products
[J].
Heterologous production of small molecules in the optimized Streptomyces hosts
[J].
放线菌次级代谢产物合成基因簇异源表达体系的研究进展
[J].
Advances in heterologous expression system of secondary metabolite synthesis gene clusters of actinomycetes
[J].
Reassembly of the biosynthetic gene cluster enables high epothilone yield in engineered Schlegelella brevitalea
[J].
Discovery of recombinases enables genome mining of cryptic biosynthetic gene clusters in Burkholderiales species
[J].
Heterologous production and yield improvement of epothilones in Burkholderiales strain DSM 7029
[J].
Promoter screening facilitates heterologous production of complex secondary metabolites in Burkholderiales strains
[J].
Chapter eight-a recombineering pipeline to make conditional targeting constructs
[J].
Reclassification of 'Polyangium brachysporum' DSM 7029 as Schlegelella brevitalea sp. nov
[J].
Isolation and characterization of the gene associated with Geosmin production in cyanobacteria
[J].
Characterization of the gene cluster CYP264B1-geoA from Sorangium cellulosum So ce56: Biosynthesis of (+)-eremophilene and its hydroxylation
[J].
Protein-protein interactions in polyketide synthase-nonribosomal peptide synthetase hybrid assembly lines
[J].
Macrocyclization studies and total synthesis of cyclomarin C, an anti-inflammatory marine cyclopeptide
[J].
Synthesis and stereochemistry of JBIR-81, a peptide enamide derived from aspergilli
[J].
Structural and biochemical characterization of the cytochrome P450 CypX (CYP134A1) from Bacillus subtilis: A cyclo-L-leucyl-L-leucyl dipeptide oxidase
[J].
Identification of holrhizins E-Q reveals the diversity of nonribosomal lipopeptides in Paraburkholderia rhizoxinica
[J].
Genomics-driven activation of silent biosynthetic gene clusters in Burkholderia gladioli by screening recombineering system
[J].
/
| 〈 |
|
〉 |