天然产物一直是潜在的先导药物的重要来源,天然产物及其结构类似物在历史上对疾病治疗做出了重大贡献,特别是对癌症和传染病的治疗。在过去两百年的时间里,天然产物的发现和研究经历了巨大的变化,由传统的分离鉴定为主的经典研究方法转为了基因组时代的多学科组合研究。虽然近二十年发现和挖掘了丰富的活性天然产物,但与自然界中巨大的天然产物合成潜力相比仍有不足,庞大的陆地和海洋天然产物资源尚待开发。同时,与传统的化学合成分子相比,天然产物具有丰富的骨架多样性和结构复杂性,在新药发现中展现了巨大的优势。虽然在天然产物的新药创新方面仍面临着种种挑战,但新的分析技术和挖掘策略的出现有望迎来天然产物发现的新阶段。本文总结了近十年(2014年1月—2023年10月)美国食品药品监督管理局批准成药的天然产物及源自天然产物的半合成药物,并对其中纯天然产物来源分子、重要的半合成天然产物前体的生物合成研究进展进行了详细总结。此外还简要总结了一些FDA批准的老药在过去十年中取得的重要生物合成研究进展。期望通过对成药天然产物生物合成途径及机制的深入理解,为更多天然产物创新药物的发现和研究提供借鉴。
自然界中存在的酶拥有多种多样的功能,它们已经被应用在工业生产和学术研究中,但其中许多酶的性质和功能还不能完全满足应用需要,通过改造来提升这类酶的某些特性是酶工程的重要任务。本文介绍了酶工程的主要发展历程,并重点梳理了人工智能(AI)助力酶工程领域的研究进展。酶工程主要包括理性设计、定向进化、半理性设计和人工智能辅助设计等策略。理性设计方法根据酶的催化机理、结构等先验知识进行改造。定向进化技术通过构建随机突变文库和高通量筛选提升目标酶的稳定性和活性等性质。半理性设计方法借助一系列计算方法构建相比于定向进化更小也更合理的突变文库以降低筛选工作量。人工智能技术在大量数据驱动下可以学习有关蛋白质构成和进化的特征信息。通过直接学习自然界中存在的蛋白质序列、共进化信息和结构,深度神经网络已经可以解决许多类型的酶工程问题,如预测具有有益影响的突变、优化蛋白质的稳定性、提高催化活性等。通过对酶工程现状进行分析,本文旨在进一步推动酶的开发和优化以实现更广泛的应用,为研究者和相关从业人员提供更多有价值的见解。
酶催化具有绿色温和、高效高选择性的优势,在工业生产和技术研发等领域发挥着重要作用。然而,酶能催化的反应类型相对有限,难以满足未来绿色生物合成的需要。光催化已成为在温和反应条件下生成活性反应中间体的有效策略,但是光化学反应的选择性调控一直是个挑战性难题。结合光催化与酶催化的光酶催化合成,能够突破天然酶催化功能的局限,并为光化学领域的选择性调控难题提供新的解决方案,成为合成科学领域的研究热点之一。本文综述了光酶催化合成的最新研究进展,根据光酶的结合模式分成四部分讨论:光氧化还原实现辅因子再生、光催化剂-酶的协同或串联反应、光激发已知酶实现新转化、人工光酶。本文归纳了近年来光酶催化合成的代表性工作,重点分析光酶催化反应的化学机制和实现新生物转化的策略。与此同时,通过分析该领域当下面临的瓶颈,本文展望了光酶催化未来的发展方向,希望能够为光酶催化新转化的开发和更多高附加值化学品的绿色不对称合成提供参考。
生物合成基因簇(biosynthetic gene cluster, BGC)是一类非常重要的基因集合(gene set)类型。BGC普遍存在于各类生物基因组中,并且发挥着重要的代谢和调控作用。从线性结构上来说,一个BGC中的基因通常在基因组中处于相邻的位置;从基因功能上来说,一个BGC中的基因通常共同负责一类通路,生成特定的化合物小分子。因此,BGC作为极具潜力的元件来源,在合成生物学研究中极为重要。然而从序列模式上来说,一个BGC中的基因数量众多且序列差异度大,很难通过序列同源性发掘新类型的BGC。因此,建立生物合成基因簇的智能发掘策略,系统性地发掘BGC并进行验证和转化研究,不论在理论方面还是实际应用方面,都具有非常重要的价值。本文主要基于微生物组大数据,较全面地介绍了BGC挖掘的意义和瓶颈问题,系统性地总结了当前BGC发掘中的数据资源和挖掘方法,尤其是人工智能方法,指出了干湿结合方法对于验证新发掘BGC的重要价值,同时展示了新发掘BGC的多样性和广泛应用领域。最后,展望了结合现有BGC挖掘方法和合成生物学转化,将如何在广度和宽度方面扩展目前的合成生物学研究。
合成生物学是按照一定的规律综合已有的信息设计和构建全新的生物元件、装置和系统,或者重新设计已有的天然生物系统。合成生物学的核心在于设计、改造、重建或制造生物元件、生物反应系统、代谢途径与过程,乃至创造具有生命活动能力的细胞和生物个体,为解决人类发展在环境、资源、能源等方面面临的若干重大挑战提供新技术方案。毫无疑问,从DNA重组到基因电路设计,合成生物学的发展为众多领域带来全新的解决方案,优良的催化与调控元件是设计高效、鲁棒的系统的基础。然而,合成生物学的元件通常是天然的生物大分子,其固有的复杂性限制了对其工程化改造,导致合成生物技术的潜力未能得到充分发掘。随着人工智能(artificial intelligence,AI)与计算生物学的兴起和发展,有望助力该技术更好地发挥其价值。本文主要介绍了基于AI与计算生物学的不同类型的元件设计,聚焦催化元件、调控元件、传感元件三类元件的设计和前沿进展以及生物元件改造在合成生物学研究领域中的应用方面的研究进展。
天然蛋白质具有临界稳定性的特征,这种较低的稳定性使蛋白质结构具有足够的灵活性,从而支持其发挥生物学功能。然而,临界稳定性使得蛋白质遭受胁迫压力后极易发生错误折叠并失去功能,导致天然蛋白质往往无法满足科学研究与工业应用的需求。此外,体内蛋白质在错误折叠后产生的聚集沉淀被认为是多种疾病发生发展的原因,包括阿尔兹海默病、帕金森综合征等。因此,优化蛋白质的稳定性是科学研究与工程应用领域亟待解决的关键问题。本文从蛋白质的折叠与稳定性机制出发,聚焦于序列优化与折叠环境优化两种改善蛋白质稳定性的手段,综述了基于理性设计、计算机辅助设计改善蛋白质稳定性的研究方法,介绍了用于高通量筛选蛋白质稳定化突变体或折叠相关因子的定向进化技术。通过多项蛋白质序列改良、折叠环境优化的案例介绍,展示了蛋白质稳定化技术在蛋白质工程与生物医药领域的广阔应用,包括酶的稳定化设计、疫苗蛋白质的构象控制、分子伴侣与蛋白质聚集抑制剂的筛选、蛋白质稳态药物的开发等。最后,展望了蛋白质稳定化技术未来的研究方向与前景,定制化的蛋白质稳定性检测技术将会迎来蓬勃发展。
木质素是木质纤维素的主要成分之一,按干重计约占15%~30%,全球年产量约200亿吨。木质素是由苯丙烷单元通过多种不同的碳碳键和碳氧键构成的一类芳香族高聚化合物,是高等陆生植物次生细胞壁的主要成分,赋予了植物刚性并保护植物体免受微生物的入侵。由于木质素产量巨大、可再生,近些年全球对木质素利用的兴趣持续升高。但是木质素的成分复杂,无论是其降解还是后续的利用都充满了挑战,因此目前多用作燃料。在众多木质素降解利用的方法中,生物法反应条件温和、绿色环保,近些年在绿色可持续发展的大背景下受到广泛关注。本文介绍了自然界中催化木质素降解的关键酶:漆酶、锰过氧化物酶、木质素过氧化物酶、染料脱色过氧化物酶、多功能过氧化物酶等,同时简要介绍了其催化机制。并总结了生物利用木质素类芳香族化合物过程中涉及的四个主要反应:O-脱甲基、脱羧、羟基化和双加氧酶介导的开环反应,以及相关的酶和催化机制。最后,简要介绍了利用合成生物学手段构建细胞工厂实现木质素高值利用的案例。木质素的生物降解和利用是一个极具潜力的领域,同时也存在诸多的挑战,例如转化效率低、反应时间长等。但相信随着合成生物学的迅猛发展,利用高效基因编辑和代谢工程改造提高关键酶的反应速率和代谢通路的效率、提高底盘细胞对有毒芳香族化合物的抵抗能力、维持还原力的平衡等,将有效提高木质素生物降解利用的效率,其工业应用也许在不久的将来就会实现。
胶原蛋白是哺乳动物中含量最多的蛋白质,至今已发现28种类型,主要分为纤维性胶原蛋白、网状胶原蛋白、珠状丝状胶原蛋白、锚定纤维蛋白、膜蛋白以及multiplexins胶原蛋白,其中纤维性胶原蛋白中Ⅰ型、Ⅱ型、Ⅲ型胶原蛋白占人体胶原蛋白的80%~90%。目前,根据来源,胶原蛋白大致分为动物源胶原蛋白和重组胶原蛋白。动物源胶原蛋白主要来源于陆生动物以及海洋动物,而重组胶原蛋白是指将人胶原蛋白基因克隆到选定的表达载体并转化到表达细胞内,最后通过纯化技术所获得的蛋白质。本文简述了胶原蛋白的结构、类别和生物合成机制,重点阐述了重组胶原蛋白表达体系及特点,包括原核生物、酵母、植物、杆状病毒以及哺乳动物细胞等表达体系及其优势与局限性,介绍了重组胶原蛋白市场前景及在眼科、软骨工程、皮肤治疗等生物医药方面的实际应用,并对重组胶原蛋白的研究和产业发展进行了展望。
紫杉醇是目前已发现的最具抗癌活性的天然广谱抗癌药物之一,其生产方式主要依赖于从珍稀植物红豆杉中进行分离提取以及化学半合成,因其含量稀少,生产能力受到严重的限制。随着红豆杉基因组的全解析和合成生物学的迅速发展,通过合成生物技术,构建重组工程细胞合成紫杉醇及其关键前体成为解决当前供需不平衡和资源有限的有效方法。本文针对紫杉醇生物合成途径解析、红豆杉组学分析、底盘细胞构建、关键前体合成、紫杉醇合成途径关键酶的改造及催化机理解析等相关研究进展开展系统性的综述,尤其对近期发表的关于氧杂环丁烷环形成的相关突破性研究进行了详细介绍,并基于相关进展探讨当前紫杉醇合成生物学研究面临的关键酶催化效率低下、产物杂泛性严重、具体反应顺序未知等技术挑战及生物合成紫杉醇关键中间体的未来前景。助力加强对紫杉醇合成通路和催化过程的理解,进一步实现紫杉醇的绿色、高效生物合成。
萜类化合物是自然界中广泛存在的一类具有重要生理功能和显著生物活性的天然产物,在食品、医疗及日化行业有着广泛的应用。在萜类化合物的生物合成途径中,萜类合酶往往决定了萜类碳骨架的种类和结构新颖性,细胞色素P450酶等后修饰酶则可对碳骨架进行多种修饰,最终形成结构和功能都具有丰富多样性的萜类化合物。近年来,随着基因测序技术与合成生物学的发展,大量植物和微生物来源的萜类生物合成酶被表征,令人兴奋的是,其中包含一些与经典萜类合酶不同的非常规萜类合酶,它们亦可催化生成独特的环化萜类骨架。与此同时,利用组合生物合成等策略,人们创造了许多新颖的非天然萜类化合物,进一步丰富了萜类资源库。本文综述了近5年在非常规萜类环化酶与组合生物合成途径等方面取得的最新研究进展,以期为未来新型萜类化合物的发现和生物合成提供启示。本文首先综述了新发现的具有萜类环化功能的新酶,包含Ⅰ型萜类合酶新亚族、非角鲨烯来源三萜合酶、UbiA型萜类环化酶、细胞色素P450氧化酶、甲基转移酶、钒依赖卤素过氧化物酶、卤代酸脱卤酶等,同时还对其序列、功能和可能的环化机制进行了介绍,有助于理解自然界中萜类生物合成酶的进化起源和发现新颖萜类化合物。然后,本文介绍了非常规萜类衍生物的组合生物合成,通过将萜类合酶与甲基转移酶、天然或人工细胞色素P450氧化酶进行组合,产生了一系列包含非常规C11、C16骨架以及具有不同氧化形式的非天然萜类化合物,可为往后萜类化合物的结构创新研究带来启发。这些新颖酶元件的挖掘与新型组合生物合成途径的构建,将进一步拓宽萜类化合物的结构多样性和化学空间,有望为临床萜类药物研发提供更多的潜在小分子。
微生物工程菌株是生物制造的重要基础,但大多数的工程菌株需要进化改造才能适用于生物制造。在菌种选育过程中,如何高效地筛选获得具有目标性状的微生物工程菌株是进行生物制造应用的关键影响因素之一。液滴微流控技术作为近年来发展起来的一种基于微芯片的高通量检测筛选技术,可以生成大小均一、相互独立的微体积液滴小室,并应用于单细胞的培养、检测和分离,在微生物菌株改造尤其是分泌型菌株的改造中得到广泛应用。本文首先概述液滴微流控技术的组成部分,对关键性的技术进行简要介绍;其次根据液滴检测信号的来源、液滴筛选流程的难易程度和液滴分选仪器的适用范围,对液滴微流控技术在工程菌株选育中的应用进行总结分析;最后对液滴微流控技术在应用中存在的问题和研究方向进行展望,为深化其在微生物合成生物学中的应用提供指导。
虾青素是一种高附加值的抗氧化萜类物质,具有很强的抗氧化活性,同时还具有抗癌、预防炎症、护眼等诸多功效。随着合成生物学技术的不断发展,利用微生物发酵法合成虾青素是实现虾青素工业化生产最有效的途径之一,也更能满足消费者对天然化合物的需求。目前,生产虾青素的微生物包括细菌、真菌、藻类等。本文系统介绍了虾青素的结构性质和生产方法,重点讲述了虾青素天然合成以及外源构建的合成路径,总结了不同微生物如雨生红球藻、酵母和大肠杆菌生产虾青素的最新进展,分析了利用基因工程和发酵过程调控手段提高虾青素产量的方法。未来,通过代谢工程等手段(如虾青素合成基因过表达、使用高强度启动子、代谢途径优化等)可提高虾青素产量,以进一步增加虾青素在食品、医疗、化妆品和饲料等产业的应用。
蛋白质是各类生命活动不可缺少的承担者,其序列决定了折叠后的三维结构和功能。这些具有特定功能的蛋白质在生物医学等多个领域具有重要的应用价值。计算蛋白质设计可以根据所需的蛋白功能和结构设计氨基酸序列,生成自然界中不存在的蛋白质。传统计算蛋白质设计通常采用能量函数和特定的搜索优化算法获得设计的序列。近年来,随着先进算法的发展、大数据的积累和计算机硬件算力的增长,人工智能技术得到了蓬勃发展,并逐渐应用于蛋白质设计领域。本文综述了近年人工智能在蛋白质结构设计中的进展,侧重于各类算法的介绍,从固定骨架设计、可变骨架设计和序列结构生成三个方面回顾了最新的蛋白质结构设计算法,并阐明了其相对于传统计算方法的新颖性和创新性。在人工智能技术的赋能下,蛋白质设计的成功率和合理性获得大幅提高,按需功能蛋白设计的时代即将到来。
CRISPR/Cas9是近年来发展起来的新兴技术,其在多种生物和组织的基因组上具有快速、高效、精准的基因编辑与调控能力,这使得该技术在基础科学和合成生物学等应用科学领域均得到了极大的发展与应用。本文首先对CRISPR的历史沿革、分类及CRISPR/Cas9技术的作用机制进行简述,并结合其原理和在基因组工程中面临的脱靶率高、PAM依赖性强等限制因素总结了近年来针对Cas9蛋白和向导RNA(gRNA)进行的一系列优化与改造。接下来详细叙述了CRISPR/Cas9系统结合效应蛋白实现的多种功能,包括基因表达调控、表观基因组编辑、单碱基编辑等。基于gRNA多表达策略和Cas9多路复用策略,本文还对CRISPR/Cas9技术主要的多重应用成果进行了梳理汇总。最后探讨了CRISPR/Cas9作为高精度基因组编辑工具使用的应用前景,以及作为疗法使用时的安全性和风险控制问题。
规律成簇间隔短回文重复序列及其相关蛋白(CRISPR/Cas)是一种微生物获得性免疫系统,自从证实其可用于基因编辑之后,迅速增强了我们编辑、操纵、注释、检测甚至成像生物体DNA和RNA的能力,为基础生命科学、医学和生物工程等领域的创新发展注入了强劲动力,快速推动了合成生物学等学科的兴盛发展。然而,CRISPR/Cas系统也有一些固有的问题,例如脱靶效应、原间隔序列邻近基序(PAM)对靶目标的约束性以及基因编辑活性的可控性等,严重制约了该系统在基因精准可控编辑等方面的长足发展,阻碍了其新功能和新应用的拓展。为了突破这些限制,“蛋白质工程修饰Cas蛋白”与“基于生物信息学的新型CRISPR/Cas系统的挖掘”就成为完善发展CRISPR/Cas系统以及扩充CRISPR工具箱的两种重要策略。本文主要针对当前应用最为广泛的Ⅱ类CRISPR/Cas系统,重点介绍了CRISPR/Cas9、CRISPR/Cas12a和CRISPR/Cas13a这三种代表性系统的基本结构和作用机制,及其在结构改造和功能拓展等方面的新进展,同时也对一些新近发掘的具有重要特色和潜在应用价值的CRISPR/Cas系统进行了综述,例如CRISPR/CasФ 和 CRISPR/Cas12k。这些改造和发掘工作显著改善了CRISPR/Cas系统的固有问题,有力地拓展了其功能和适用性,势必会进一步快速推动CRISPR/Cas系统在诸多领域的创新发展。
基因组测序、编辑与合成技术日新月异,推动了基因型“设计”和“合成”能力的突飞猛进,同时也使人工细胞的表型检测成为合成生物学发展的瓶颈之一。对于细胞功能的快速测试与评价,单细胞分析技术具有重要意义与前景,但理想的解决方案需要具备活体无损、非标记式、提供全景式表型、能分辨复杂功能、快速高通量且低成本、能与组学分析联动等特征。拉曼光谱技术具备上述所有特征,能够提供单细胞的化学成分组成及分子结构等信息,是一种高效的单细胞表型识别技术。本文首先概述了拉曼组概念和基于拉曼组的细胞功能表型识别,包括代谢产物定性和定量、底物代谢和互作表征、细胞种类和状态鉴定以及环境应激检测等;其次,根据拉曼信号的分类、拉曼信号检测模式和目标细胞分选策略,对现有的拉曼分选平台及其在细胞表型分选中的应用进行分析总结;最后,对单细胞拉曼光谱技术在合成细胞表型检测与分选面临的问题、潜在解决策略进行了探讨和展望。单细胞拉曼光谱技术不仅为细胞工厂的高通量、全景式表型检测与筛选提供了全新的解决方案,还将推动“单细胞精度的表型组-功能基因组”作为一种新的生物大数据类型,服务于“数据科学”驱动下的合成生物技术。
蛋白质复合物是不同蛋白质链通过相互作用形成的,自然界中很多蛋白质通过形成复合物而执行功能,因此准确地预测复合物的结构对于理解和掌握功能至关重要。近两年来,单条蛋白质链的结构预测有了突破性的进展,从氨基酸序列出发预测蛋白质结构的水平大幅提高。但相较于单体蛋白质,蛋白质复合物结构预测的准确性仍然较低。本文旨在总结蛋白质复合物结构预测的相关算法以及介绍最新进展。首先简要介绍蛋白质结构预测领域的相关人工智能算法,主要包括共进化分析与蛋白质接触预测、深度学习方法与蛋白质结构预测、预训练模型与蛋白质表征学习几个方面;其次系统总结了蛋白质复合物链间相互作用预测的基本方法,从复合物的多重序列比对构建到对于同源或异源复合物的链间残基接触预测;最后从相互作用位点指导复合物结构预测、蛋白质分子对接算法、端到端的复合物结构预测方法等方面阐述了蛋白质复合物结构预测的基本方法和思路。总体来说,目前蛋白质复合物结构预测精度不够高,有效地解决多重序列比对的配对和多聚体复合物模板搜索等问题,或者在大量的序列或结构数据上结合预训练模型的新范式,是一个合理而有效的方案。提升蛋白质复合物结构预测水平在合成生物学领域如抗体设计、药物发现等方面有很好的应用前景。
香精香料是个人护理产品中的重要成分,其中,萜类化合物及其衍生物在天然香料市场中有着重要的地位。近年来,合成生物学的蓬勃发展为解决萜类香料产能瓶颈及开发更多元化的新型香料化合物带来了新机遇。本文探讨了合成生物学在萜类香料可持续生产中的应用和发展,介绍了数据驱动的合成生物学和生物技术创新如何赋能萜类香料生产,讨论比较了萜类合成的经典合成途径和替代合成途径,并探讨了萜类合酶挖掘与改造进展。在此基础上,着重介绍了单萜类、倍半萜类和降异戊二烯类香料的细胞工厂合成现状,包括元件改造、途径优化和萜类解毒等关键技术策略。最后,对当前专利布局和产业化竞争格局进行了总结分析,并对未来发展的挑战和机遇进行了展望,包括生物合成技术的挑战、新产物的发掘与设计,以及市场监管与安全性问题。
近年来,光遗传学技术因具有非侵入性、可逆性、时空特异性等优点被广泛应用于生物医学研究领域,为疾病治疗提供了新思路和新理念。光作为一种理想的基因表达诱导物,以前所未有的时空精度操控基因表达和细胞行为。随着光遗传学技术的深入研究,基于光遗传学的个性化精准治疗和临床转化成为可能。本文主要介绍了响应不同波长的光遗传学工具及其用于神经系统疾病、肿瘤、心血管疾病、糖尿病、肠道疾病等精准治疗和用于控制基因转录表达、基因编辑、基因重组以及细胞器运动等应用。同时也介绍了光遗传学技术与智能电子设备的有机结合及其在便携式生物电子药物、人工智能诊疗方面的最新研究进展。光遗传学的迅速发展极大地拓展了传统生物电子医学领域。光控系统的远程可控性、可逆性和无毒性为光遗传学在生物医学中的应用提供了坚实的基础。这些方法的成功将对未来实践中的精准医疗产生持久的影响。最后探讨了光遗传学工具存在的问题和在未来临床应用面临的挑战,并对其未来发展前景进行了展望。
蛋白质功能预测是生物信息学中的一项重要任务,在疾病机制的阐明和药物靶点发现等领域有着重要作用。因为传统的测定蛋白质功能的生化实验通常成本高、耗时长、通量低,所以开发出高效且准确的蛋白质功能预测计算方法十分重要。蛋白质功能预测可以分为残基水平的结合位点预测和蛋白水平的基因本体论(gene ontology, GO)预测。本文首先介绍该领域常用的数据库及蛋白质特征信息,接着对当下最新的蛋白质功能预测方法进行总结。在结合位点预测方面,根据配体类型分别介绍了最新的蛋白质-蛋白质、蛋白质-多肽、蛋白质-核酸和蛋白质-小分子或离子配体的结合位点预测方法;在GO预测方面,按照预测方法的类别分别介绍了最近的基于序列、基于结构和基于蛋白相互作用网络的方法。最后,对目前的蛋白质功能预测方法进行总结、分析优劣,并展望该领域未来的发展方向。