[go: up one dir, main page]

CN113838526B - 一种病毒突变体的生成方法、系统、计算机设备及介质 - Google Patents

一种病毒突变体的生成方法、系统、计算机设备及介质 Download PDF

Info

Publication number
CN113838526B
CN113838526B CN202111085705.4A CN202111085705A CN113838526B CN 113838526 B CN113838526 B CN 113838526B CN 202111085705 A CN202111085705 A CN 202111085705A CN 113838526 B CN113838526 B CN 113838526B
Authority
CN
China
Prior art keywords
mutant
population
mutants
prediction
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111085705.4A
Other languages
English (en)
Other versions
CN113838526A (zh
Inventor
刘华清
周顺
高翠
韩蓝青
涂嘉琦
张启星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CYAGEN BIOSCIENCES (GUANGZHOU) Inc
Guangzhou Decode Gene Technology Co ltd
Original Assignee
CYAGEN BIOSCIENCES (GUANGZHOU) Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CYAGEN BIOSCIENCES (GUANGZHOU) Inc filed Critical CYAGEN BIOSCIENCES (GUANGZHOU) Inc
Priority to CN202111085705.4A priority Critical patent/CN113838526B/zh
Publication of CN113838526A publication Critical patent/CN113838526A/zh
Application granted granted Critical
Publication of CN113838526B publication Critical patent/CN113838526B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/50Mutagenesis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Molecular Biology (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Physiology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供的一种病毒突变体的生成方法、系统、计算机设备以及介质,其方法获取若干初始突变体,根据所述初始突变体构建得到模型预测种群;对所述模型预测种群中的第二突变体进行特性预测,根据特性预测结果确定所述第二突变体的特性分数;根据所述特性分数对所述模型预测种群中的第二突变体进行非支配排序,计算所述模型预测种群的拥挤度;根据非支配排序结果和所述拥挤度确定第三突变体,根据所述第三突变体构建得到目标种群,对所述目标种群进行筛选得到目标突变体;方案实现高通量、高有效率并且快速地筛选出具备特定应用所需特性的多种多样的病毒突变体,可广泛应用于生物信息技术领域。

Description

一种病毒突变体的生成方法、系统、计算机设备及介质
技术领域
本发明属于生物信息技术领域,尤其是一种病毒突变体的生成方法、系统、计算机设备以及存储介质。
背景技术
传统的腺病毒相关病毒(adeno-associated virus,AAV)改进设计方法主要有定向进化和理性设计等方法。其中,定向进化方法无需较多的先验知识,通过高通量的随机突变结合人工施加的进化压力,筛选出满足要求的突变体,但缺点是有效率不高,大量的随机突变中只能选出少数几个或者无法筛选出满足要求的突变体。理性设计是基于先验的专家知识来改进设计AAV衣壳蛋白,虽然有效率远远高于定向进化,但是无法实现高通量。且这两者均有周期长和研发成本高的缺点,制约了基因治疗中目的基因递送载体AAV衣壳蛋白的改进设计和临床应用。
发明内容
有鉴于此,为至少部分解决上述技术问题之一,本发明实施例目的在于提供一种兼具高通量和高效率,能够快速地筛选出具备特定应用场景所需特性的AAV衣壳突变体的病毒突变体的生成方法,以及能够对应实现该方法的系统、计算机设备以及存储介质。
第一方面,本申请的技术方案提供了一种病毒突变体的生成方法,其步骤包括:
获取若干初始突变体,根据所述初始突变体构建得到模型预测种群;
对所述模型预测种群中的第二突变体进行特性预测,根据特性预测结果确定所述第二突变体的特性分数;
根据所述特性分数对所述模型预测种群中的第二突变体进行非支配排序,计算所述模型预测种群的拥挤度;
根据非支配排序结果和所述拥挤度确定第三突变体,根据所述第三突变体构建得到目标种群,对所述目标种群进行筛选得到目标突变体。
在本申请方案的一种可行的实施例中,所述获取若干初始突变体,根据所述初始突变体构建得到模型预测种群这一步骤,包括:
在序列空间中搜索得到若干所述初始突变体;
通过训练得到的预测模型得到所述初始突变体的生存能力分数,根据所述生存能力分数筛选所述初始突变体得到初始母代种群;
选择所述初始母代种群中的部分突变体进行繁衍构建得到子代种群,将所述子代种群和所述初始母代种群进行合并得到模型预测种群。
在本申请方案的一种可行的实施例中,所述对所述模型预测种群中的第二突变体进行特性预测这一步骤,包括:
制备突变文库,所述突变文库包括生存能力数据集和靶向性数据集;
根据所述生存能力数据集训练得到生存能力预测模型,根据所述靶向性数据集训练得到靶向性预测模型;
根据所述生存能力预测模型预测得到所述第二突变体的生存能力分数;根据所述靶向性预测模型预测得到所述第二突变体的靶向性分数。
在本申请方案的一种可行的实施例中,所述根据非支配排序结果和所述拥挤度确定第三突变体,根据所述第三突变体构建得到目标种群,对所述目标种群进行筛选得到目标突变体这一步骤,包括:
重复获取若干所述非支配排序结果以及所述拥挤度,根据所述非支配排序结果以及所述拥挤度构建得到若干个所述目标种群;
根据所述特性分数,对所述目标种群中的第三突变体进行排序,对排序后的第三突变体进行贪婪过滤,得到所述目标突变体。
在本申请方案的一种可行的实施例中,在所述对所述目标种群进行筛选得到目标突变体这一步骤之后,所述方法还包括:
通过湿实验对所述目标突变体的属性特征进行验证;所述湿实验包括以下步骤:
根据所述目标突变体的衣壳的碱基序列,合成序列并构建质粒;
根据所述质粒转染细胞得到病毒突变体颗粒并进行动物体内实验,确定所述病毒突变体的生存能力、免疫原性以及组织或器官的特异靶向性。
在本申请方案的一种可行的实施例中,所述根据所述特性分数对所述模型预测种群中的第二突变体进行非支配排序这一步骤,包括:
根据所述特性分数确定所述第二突变体的支配关系或非支配关系;
根据所述支配关系或所述非支配关系确定若干非支配个体,将所述非支配个体进行整合得到若干非支配层,通过所述非支配层对所述第二突变体进行分层排序。
在本申请方案的一种可行的实施例中,所述计算所述模型预测种群的拥挤度这一步骤,包括:
在所述非支配层中,根据所述特性分数对所述第二突变体进行排序,计算排序后所述第二突变体与相邻突变体之间特性分数的差值,将所述差值求和得到所述拥挤度。
第二方面,本发明的技术方案还提供一种病毒突变体的生成系统,该系统包括:
初始种群构建模块,用于获取若干初始突变体,根据所述初始突变体构建得到模型预测种群;
个体特性预测模块,用于对所述模型预测种群中的第二突变体进行特性预测,根据特性预测结果确定所述第二突变体的特性分数;
个体特性筛查模块,用于根据所述特性分数对所述模型预测种群中的第二突变体进行非支配排序,计算所述模型预测种群的拥挤度;
目标个体筛选模块,用于根据非支配排序结果和所述拥挤度确定第三突变体,根据所述第三突变体构建得到目标种群,对所述目标种群进行筛选得到目标突变体;
特性预测模型模块,用于训练得到生存能力预测模型和靶向性预测模型。
第三方面,本发明的技术方案还提供一种病毒突变体的生成计算机设备,其包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当至少一个程序被至少一个处理器执行,使得至少一个处理器运行第一方面中所述方法。
第四方面,本发明的技术方案还提供一种存储介质,其中存储有处理器可执行的程序,所述处理器可执行的程序在由处理器执行时用于运行如第一方面所述一种病毒突变体的生成方法。
本发明的优点和有益效果将在下面的描述中部分给出,其他部分可以通过本发明的具体实施方式了解得到:
本申请技术方案本发明通过在高通量测序技术和合成生物学技术基础上,基于深度学习算法和启发式算法,提供了一种智能算法驱动的病毒突变体生成方法,通过对种群中的个体进行特性预测,对突变体的特性进行了初步筛选,再通过非支配排序和拥挤度的二次筛选最后得到满足需求的目标突变体,实现高通量、高有效率并且快速地筛选出具备特定应用所需特性的多种多样的病毒突变体。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种病毒突变体的生成方法的步骤流程图;
图2为本发明实施例提供的另一种病毒突变体的生成方法的步骤流程图;
图3为本发明实施例中生存能力预测模型的皮尔森相关性系数的散点图;
图4为本发明实施例中靶向性预测模型的皮尔森相关性系数的散点图
图5为本发明实施例中高分突变体的数量增长曲线图;
图6为本发明实施例中实施例实验过程中实验组和控制组的滴度柱状图;
图7本发明实施例测定的病毒在细胞沉淀中的滴度的散点图。
具体实施方式
下面详细描述本发明的实施例,实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。对于以下实施例中的步骤编号,其仅为了便于阐述说明而设置,对步骤之间的顺序不做任何限定,实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。
腺病毒相关病毒(adeno-associated virus,AAV)是一类单链线状DNA缺陷型病毒。其基因组DNA小于5kb,无包膜,外形为裸露的20面体颗粒。AAV不能独立复制,只有在辅助病毒(如腺病毒、单纯疱疹病毒、痘苗病毒)存在时,才能进行复制和溶细胞性感染,否则只能建立溶源性潜伏感染。
根据前述背景技术的描述,定向进化和理性设计两者均有周期长、研发成本高的缺点,制约了基因治疗中目的基因递送载体AAV衣壳蛋白的改进设计和临床应用;其主要的原因是传统方法无法高效利用实验数据内部隐藏的基因型和表型之间的固有关联信息。而伴随近年来发展起来的第二代测序技术、高通量合成生物学技术,结合启发式算法、强化学习、深度学习和机器学习等多种人工智能技术,使得AI驱动的AAV衣壳改进设计成为可能。人工智能技术可以从大量的湿实验数据中充分挖掘隐藏在AAV衣壳基因型和各表型之间丰富的关联信息,以精准快速引导科研人员搜寻具备高组织特异性、低免疫原性、高侵染性、高基因装载量、高产量的AAV衣壳突变体。基于该思想,可以建立基因治疗载体AAV衣壳蛋白的高效筛选平台,针对治疗不同类型基因病需求的AAV载体的特性,高效优化递送目的基因的AAV载体,赋能基因治疗。
本申请的技术方案通过在高通量测序技术和合成生物学技术基础上,采用深度学习算法和启发式算法,建立一种智能算法驱动的AAV衣壳改进设计方法,实现高通量、高有效率、快速地筛选出具备特定应用所需特性的AAV衣壳突变体,在第一方面,如图1所示,本申请的技术方案提供了一种病毒突变体的生成方法,其主要步骤可以包括S100-S400:
S100、获取若干初始突变体,根据初始突变体构建得到模型预测种群;
具体地,实施例是在NSGA-II基础上改进的启发式算法用以在整个AAV序列空间中搜索各项特性指标满足要求的且具备多样性的AAV突变体,以构建得到模型预测种群。可以理解的是,在实施例中还可以通过锦标赛选择机制进行子代个体的繁衍,以得到样本容量更大,个体突变概率更高的种群。需要进一步说明的是,区别于由初始突变体所组成的种群,实施例中的模型预测种群是通过至少一代个体进行繁衍得到的种群。
S200、对模型预测种群中的第二突变体进行特性预测,根据特性预测结果确定第二突变体的特性分数;
其中,实施例的模型预测种群可以由繁衍得到子代种群和母代种群合并得到,而第二突变体是指进行选择、交叉、变异产生的子代种群或者母代种群中的个体;而实施例中的特性预测可以包括但不限于生存能力预测、靶向性预测、免疫原性预测以及载体容量大小的预测。
具体地,实施例以生存能力预测和靶向性预测为例,通过训练好的预测模型预测步骤S100得到的种群内每一个个体的特性分数;在实施例中,种群内个体的特性分数主要是通过生存能力预测得到个体的生存能力分数和靶向性预测得到的个体的靶向性分数所构成;实施例中特性指标可以用于表征不同组织或器官的特异靶向性、免疫原性、衣壳容量、稳定性、生存能力以及多样性;而其中种群中个体i的多样性可以用个体i和种群中其它个体之间的最短编辑距离来量化,该最短编辑距离越大,则个体i的多样性越高。
S300、根据特性分数对模型预测种群中的第二突变体进行非支配排序,计算模型预测种群的拥挤度;
具体地,实施例根据步骤S200所预测得到的特性分数,对种群内的所有个体进行非支配排序;然后根据排序结果和特性分数,计算种群内每个个体的拥挤度。
S400、根据非支配排序结果和拥挤度确定第三突变体,根据第三突变体构建得到目标种群,对目标种群进行筛选得到目标突变体;
具体地,实施例中根据步骤S300中得到的排序结果和拥挤度,挑选出最优的N个突变个体,形成新的种群;其中,第三突变体则是指新的种群的突变个体;通过重复筛选构建模型预测种群,并通过非支配排序以及拥挤度计算筛选得到若干个个体构建得到若干个种群,然后将得到的若干个种群进行合并,并根据特性分数进行非支配排序,然后对排序后所有个体进行贪婪过滤,得到最终的,即能够满足目标需求的突变体。
在一些可选择的实施例中,为得到更优的模型预测种群,方法中获取若干初始突变体,根据初始突变体构建得到模型预测种群这一过程,其可以包括步骤S110-S130:
S110、在序列空间中搜索得到若干初始突变体;
其中,序列空间是指病毒衣壳蛋白的氨基酸序列的独热编码,也可以是病毒衣壳蛋白的DNA碱基序列的独热编码。若取氨基酸序列的独热编码,则该序列空间是一个2维矩阵,其中矩阵长度等于病毒衣壳的可变区域的长度(例如,长度记为L,长度基本单位为氨基酸),矩阵宽度为20(对应20种氨基酸),此时整个序列空间的大小为20的L次幂。若取碱基序列的独热编码,则该序列空间是一个2维矩阵,其中矩阵长度为病毒衣壳可变区与的长度(长度记为L,长度基本单位为碱基),矩阵的宽度为4(对应4种碱基),此时整个序列空间的大小为4的L次幂。由于序列空间的大小是可变区域长度的幂函数,因此,实施例中可以通过预设搜索条件,根据搜索条件从序列空间中搜索得到大量的初始突变体,例如,从序列中间中搜索得到1亿9千万个的不同突变体。
S120、通过训练得到的预测模型得到初始突变体的特性分数,根据特性分数筛选初始突变体得到初始母代种群;
具体地,实施例选取生存能力分数作为特性分数,首先,通过预先训练完成的生存能力预测模型预测步骤S110中筛选得到的每一个突变体的可行性生存能力分数;并根据生存能力分数的降序排序,筛选得到生存能力分数较高的若干个体,形成新的种群记作初始母代种群。
S130、选择初始母代种群中的部分突变体进行繁衍构建得到子代种群,将子代种群和初始母代种群进行合并得到模型预测种群;
具体地,实施例中通过锦标赛选择机制,选择步骤S120中得到的初始母代种群中的一半个体,并进行任意的两两配对交换遗传信息以繁衍子代个体,并允许子代个体发生一定概率的突变,个体突变的方式包括但不限于选择、交叉以及变异;将繁衍后的子代种群与初始母代种群进行组合,以得到模型预测种群。
需要说明的是,步骤S130中的锦标赛选择是本实施例所采用的遗传算法中的一项基本选择策略。在锦标赛选择策略中,每次从种群中取出一定数量个体(放回抽样),然后选择其中最好的一个进入子代种群,具体如下。
例如,实施例中种群规模为n,该锦标赛选择的过程为:
A)从该种群的n个个体中随机选择k(k<n)个个体,k的取值小,效率就高(节省运行时间),实施例中取值为n/2(取整);
B)从这k个个体中选择最大的一个个体(可以通过排序的方式得到),作为下一代n个个体中的一个个体;
C)重复A)—B)步,直至得到新的n个个体。
D)进行这新的n个个体之间的交叉操作,以得到子代个体并进一步得到子代种群。
在一些可选择的实施例中,方法对模型预测种群中的第二突变体进行特性预测这一过程,可以包括步骤S210-S230:
S210、制备突变文库,突变文库包括生存能力数据集和靶向性数据集;
S220、根据生存能力数据集训练得到生存能力预测模型,根据靶向性数据集训练得到靶向性预测模型;
S230、根据生存能力预测模型预测得到第二突变体的生存能力分数;根据靶向性预测模型预测得到第二突变体的靶向性分数。
具体地,如图2所示,实施例根据已有的样本数据,构建了两个突变文库,其中,第一个文库作为突变体的生存能力文库,示例性地,第一文库可以包含7万条用于训练生存能力预测模型的样本数据;第二个文库可以为突变体的小鼠肝脏靶向性文库,示例性地,第二个文库可以包含9000条样本数据。
更为具体地,实施例将第一个文库按照4:1的比例随机划分为文库1训练集和文库1测试集;用文库1训练集训练一个卷积神经网络回归器,即生存能力预测模型,该卷积神经网络回归器的输入是突变体的编码,输出该突变体的生存能力数值,在文库1测试集上,测试模型1预测值和真实值的皮尔森相关性系数为0.852,表明生存能力预测模型的预测值和真实值之间具有很强的正相关性。
相对应地,将第二个文库按照4:1的比例随机划分为文库2训练集和文库2测试集;用文库2训练集训练一个卷积神经网络回归器,即靶向性预测模型,该卷积神经网络回归器的输入是突变体的编码,输出该突变体的小鼠肝脏靶向性数值。在文库2测试集上,测试模型2预测值和真实值的皮尔森相关性系数为0.799,表明靶向性预测模型的预测值和真实值具有很强的正相关性。
实施例通过前述的方法分别训练得到生存能力预测模型和靶向性预测模型,将待预测的突变个体的编码作为模型输入,输入至两个模型之中,得到该突变个体生存能力分数以及靶向性分数。
在一些可选择的实施例中,方法中根据特性分数对模型预测种群中的第二突变体进行非支配排序这一过程,可以包括步骤S310-S320:
S310、根据特性分数确定第二突变体的支配关系或非支配关系;
S320、根据支配关系或非支配关系确定若干非支配个体,将非支配个体进行整合得到若干非支配层,通过非支配层对第二突变体进行分层排序;
具体地,实施例中进行非支配排序的过程是多目标优化问题求解的经典算法——非支配排序遗传算法中的一项排序算法。其目的是对种群的所有个体进行帕累托分层;示例性地,非支配排序算法的具体操作步骤如下:
首先,设i=1;对于所有的j=1,2.......n,且j≠i,按照以上定义,比较个体i和个体j之间的支配与非支配关系;实施例中支配关系是指,个体i具有N个特性,记为同样地,个体j也具有n个特性,记为/>若个体j的每一项特性均优于或等于(至少有一项特性优于)个体i的特性,即满足/>优于或等于/>优于或等于优于或等于/>且至少有1项特性1<<k<<n满足/>优于/>则称个体j支配个体i。
如果不存在任何一个个体优于个体i,则个体i标记为非支配个体,然后,令i=i+1,再比较个体之间的支配与非支配关系,直到找到所有的非支配个体;通过得到的非支配个体集是种群的第一级非支配层,忽略这些已经标记的非支配个体(即这些个体不再进行下一轮比较),再得到第二批非支配个体,进而得到第二级非支配层。依此类推,直到整个种群被分层。
在一些可选择的实施例中,方法计算模型预测种群的拥挤度这一过程,可以包括步骤S330:在非支配层中,根据特性分数对第二突变体进行排序,计算排序后第二突变体与相邻突变体之间特性分数的差值,将差值求和得到拥挤度;
其中,拥挤度是指种群中给定个体的周围个体的密度;实施例中通过对拥挤度控制,可以实现种群的多样性。具体地,实施例用拥挤距离来量化拥挤度,拥挤距离越大,则越不拥挤;示例性地,实施例中拥挤距离的计算过程为:
A)对种群中所有个体进行非支配排序;
B)对于同一非支配层的个体,按照特性的取值大小,进一步排序;
C)排序后处于边界上的个体,令拥挤距离为无穷;
D)排序后处于非边界上的个体i,其拥挤距离等于与个体i相邻的个体i-1和个体i+1的各项特性取值之差的和。
在一些可选择的实施例中,方法根据非支配排序结果和拥挤度确定第三突变体,根据第三突变体构建得到目标种群,对目标种群进行筛选得到目标突变体这一步骤,可以包括步骤S400,其可以包括步骤S410-S420:
S410、重复获取若干非支配排序结果以及拥挤度,根据非支配排序结果以及拥挤度构建得到若干个目标种群;
S420、根据特性分数,对目标种群中的第三突变体进行排序,对排序后的第三突变体进行贪婪过滤,得到目标突变体;
具体地,实施例可以根据步骤S300中得到的结果和拥挤度,挑选出最优的N个个体,形成新的种群;并且通过重复步骤S100-S300若干轮,得到每一轮产生的种群,将各轮循环生成的种群的并集,根据特性分数进行非支配排序,然后对排序后所有个体进行贪婪过滤,得到最终算法设计的突变体。
其中,贪婪过滤的过程,是通过计算非支配排序后集合中的每一个体和该集合内其它个体的最小编辑距离,排除编辑距离过小的个体,以降低算法筛选出来的病毒衣壳的相似性,即提高多样性。示例性地,贪婪过滤算法步骤如下:
A)对于前一环节筛选处理出来的种群,进行非支配排序;
B)记种群中个体数量为n,令i初始取值为1,从个体i开始,计算个体i和种群内个体i+1~个体n的编辑距离;
C)删除i+1~n个体中编辑距离小于d的个体,剩余的个体构成新的种群;
D)重复步骤B)—C),直至遍历种群内所有个体。剩余的个体即为贪婪过滤之后保留下来的,相比贪婪过滤前,该种群具有更高的多样性。
此外,根据非支配排序结果和拥挤度确定第三突变体其过程具体为:经过步骤S300中的快速非支配排序和拥挤度计算之后,种群中的每个个体i都拥有两个属性:非支配排序决定的非支配序nrank和nd。依据这两个属性,可以定义拥挤度比较算子:个体i与另一个个体j进行比较,只要下面任意一个条件成立,则个体i获胜:
条件1:
条件2:且/>
在一些可选择的实施例中,在对目标种群进行筛选得到目标突变体这一步骤S400之后,实施例还可以包括步骤S500:
S500、通过湿实验对目标突变体的属性特征进行验证;其中,湿实验包括步骤S510-S520:
S510、根据目标突变体的衣壳的碱基序列,合成序列并构建质粒;
S520、根据质粒转染细胞得到病毒突变体颗粒并进行动物体内实验,确定病毒突变体的生存能力、免疫原性以及组织或器官的特异靶向性;
具体地,实施例中,湿实验的目的是通过生物学实验以验证方法得到的病毒衣壳是否具备目标特性。首先,实施例根据得到的目标病毒突变体的衣壳的碱基序列,合成序列并构建对应质粒;然后进行体外实验,采用质粒转染细胞,以包装病毒;并验证病毒突变体的生存能力;最后,进行体内实验,将包装出来的病毒突变体,注射到实验动物体内,以验证病毒突变体的免疫原性、组织/器官的特异靶向性等。
结合附图3至附图7,以一个完整的实施过程,对本申请技术方案进行详细描述:
选取AAV2衣壳蛋白VP1序列的561~588号氨基酸位点作为可变区域。允许的突变形式包括:1)氨基酸替换;2)氨基酸插入,但要求任意两个位点之间最多可以插入一个新的氨基酸。对于该区域采用氨基酸的独热编码。编码后的矩阵为三维矩阵(以下简称编码矩阵),其中第1维度长28,分别表示28个氨基酸位点;第二维度长20,分别表示20种氨基酸(对于任意突变体的任意一个氨基酸位点,只可能是其中一种氨基酸,所以该维度的20个元素最多只能存在一个取值为1的元素);第3维度长为2,分别表示原位点的氨基酸和插入的氨基酸。如此,编码矩阵是一个28*20*2的三维矩阵,该序列空间的大小为(20的28次幂)×(21的28次幂)。采用现有的部分数据,具体包含两个突变文库。文库1,AAV2突变体的生存能力文库,该文库包含7万条样本;文库2,AAV2突变体的小鼠肝脏靶向性文库,该文库包含9000条样本。
步骤1、构建AAV2变体的生存能力和小鼠肝脏靶向性的AI预测模型:
将文库1按照4:1的比例随机划分为文库1训练集和文库1测试集;用文库1训练集训练一个卷积神经网络回归器(以下简称为模型1),该卷积神经网络回归器的输入是突变体的编码,输出该突变体的生存能力数值。如图3所示,其横坐标表示实际的生存能力数值,其纵坐标表示预测得到的生存能力数值,在文库1测试集上,测试模型1预测值和真实值的皮尔森相关性系数为0.852,表明模型1预测值和真实值具有很强的正相关性。
将文库2按照4:1的比例随机划分为文库2训练集和文库2测试集;用文库2训练集训练一个卷积神经网络回归器(以下简称为模型2),该卷积神经网络回归器的输入是突变体的编码,输出该突变体的小鼠肝脏靶向性数值。如图4所示,其横坐标表示实际的靶向性数值,其纵坐标表示预测得到的靶向性数值,在文库2测试集上,测试模型2预测值和真实值的皮尔森相关性系数为0.799,表明模型2预测值和真实值具有很强的正相关性。
步骤2、在可变序列空间内,随机产生大量(如1e9)的不同突变体(即随机产生大量的编码矩阵)。用模型1预测每一个突变体的生存能力分数,用模型2预测每一个突变体的小鼠肝脏靶向性分数。挑选两项分数最高的N个突变体,作为初始母代种群。
步骤3、通过锦锦标赛选择机制,选择母代种群中的一半个体,并进行任意的两两配对交换遗传信息以繁衍子代个体,并允许子代个体发生一定概率的突变。
步骤4:合并母代种群和子代种群,用模块一中训练好的模型预测种群内每一个个体的生存能力分数、小鼠肝脏靶向性分数。
步骤4:根据预测的分数,对种群内的所有个体进行非支配排序。
步骤5:根据排序结果和特性分数,计算种群内每个个体的拥挤度。
步骤6:根据排序结果和拥挤度,挑选出最优的1000个个体,形成新的种群。
步骤7:循环步骤2~5共若40轮,记录下每一轮产生的种群。如图5所示,其横坐标表示循环轮次,纵坐标表示为高分突变体的数量;40轮循环中,高分突变体的数量增长曲线。
步骤8:取前面各轮循环生成的种群的并集,共40000个突变体。根据并集内每个个体的生存能力分数、小鼠肝脏靶向性分数进行非支配排序。
步骤9:然后对排序后所有个体进行贪婪过滤(其中编辑距离阈值取为3个氨基酸),得到最终算法设计的突变体,共8119条。
步骤10:通过湿实验,从上一步骤所得的突变体中,选择12条突变体作为阳性组(记为H组),同时选择野生型AAV2作为控制组(记为Control组)、在步骤2中筛除的低分序列中选取6条作为阴性对照组(记L组),开展湿实验,测定上述各组突变体的生存能力指标和小鼠肝脏靶向性指标,以验证是否满足需求。湿实验主要包括:
1.合成上述各组的质粒;
2.体外实验,将质粒转染293T细胞,一定时间后测定病毒在细胞沉淀中的滴度。
实验结果如图6所示,图6表示在第1、2、3板块中细胞沉淀的滴度,H组的滴度显著高于Control组,L组滴度显著低于Control组。如图7所示,实验测定的病毒在细胞沉淀中的滴度,与模型1预测的生存能力分数具有中等的正相关性,Pearson相关系数为0.452,Pvalue值为0.046,表明在实验误差范围内。
第二方面,本发明的技术方案还提供一种病毒突变体的生成系统,该系统包括:
初始种群构建模块,用于获取若干初始突变体,根据初始突变体构建得到模型预测种群;
个体特性预测模块,用于对模型预测种群中的第二突变体进行特性预测,根据特性预测结果确定第二突变体的特性分数;
个体特性筛查模块,用于根据特性分数对模型预测种群中的第二突变体进行非支配排序,计算模型预测种群的拥挤度;
目标个体筛选模块,用于根据非支配排序结果和拥挤度确定第三突变体,根据第三突变体构建得到目标种群,对目标种群进行筛选得到目标突变体;
特性预测模型模块,用于训练得到生存能力预测模型和靶向性预测模型。
第三方面,本申请的实施例提供了一种病毒突变体的生成计算机设备,其包括:至少一个处理器;至少一个存储器,用于存储至少一个程序;当至少一个程序被至少一个处理器执行,使得至少一个处理器运行第一方面中方法。
从上述具体的实施过程,可以总结出,本发明所提供的技术方案相较于现有技术存在以下优点或优势:
本申请技术方案通过在高通量测序技术和合成生物学技术基础上,采用深度学习算法和启发式算法,建立一种智能算法驱动的AAV衣壳改进设计方法,实现高通量、高有效率、快速地筛选出具备特定应用所需特性的多种多样的AAV衣壳突变体。
在一些可选择的实施例中,在方框图中提到的功能/操作可以不按照操作示图提到的顺序发生。例如,取决于所涉及的功能/操作,连续示出的两个方框实际上可以被大体上同时地执行或所述方框有时能以相反顺序被执行。此外,在本发明的流程图中所呈现和描述的实施例以示例的方式被提供,目的在于提供对技术更全面的理解。所公开的方法不限于本文所呈现的操作和逻辑流程。可选择的实施例是可预期的,其中各种操作的顺序被改变以及其中被描述为较大操作的一部分的子操作被独立地执行。
此外,虽然在功能性模块的背景下描述了本发明,但应当理解的是,除非另有相反说明,功能和/或特征中的一个或多个可以被集成在单个物理装置和/或软件模块中,或者一个或多个功能和/或特征可以在单独的物理装置或软件模块中被实现。还可以理解的是,有关每个模块的实际实现的详细讨论对于理解本发明是不必要的。更确切地说,考虑到在本文中公开的装置中各种功能模块的属性、功能和内部关系的情况下,在工程师的常规技术内将会了解该模块的实际实现。因此,本领域技术人员运用普通技术就能够在无需过度试验的情况下实现在权利要求书中所阐明的本发明。还可以理解的是,所公开的特定概念仅仅是说明性的,并不意在限制本发明的范围,本发明的范围由所附权利要求书及其等同方案的全部范围来决定。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
以上是对本发明的较佳实施进行了具体说明,但本发明并不限于上述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

Claims (9)

1.一种病毒突变体的生成方法,其特征在于,包括以下步骤:
制备突变文库,所述突变文库包括生存能力数据集和靶向性数据集;
根据所述生存能力数据集训练得到生存能力预测模型,根据所述靶向性数据集训练得到靶向性预测模型;
获取若干初始突变体,根据所述初始突变体构建得到模型预测种群;
对所述模型预测种群中的第二突变体进行特性分数预测,得到特性分数;其中,所述特性分数预测包括根据所述生存能力预测模型预测得到所述第二突变体的生存能力分数、以及根据所述靶向性预测模型预测得到所述第二突变体的靶向性分数;
根据所述特性分数对所述模型预测种群中的第二突变体进行非支配排序,计算所述模型预测种群的拥挤度;
根据非支配排序结果和所述拥挤度确定第三突变体,根据所述第三突变体构建得到目标种群,对所述目标种群进行筛选得到目标突变体。
2.根据权利要求1所述的一种病毒突变体的生成方法,其特征在于,所述获取若干初始突变体,根据所述初始突变体构建得到模型预测种群这一步骤,包括:
在序列空间中搜索得到若干所述初始突变体;
通过训练得到的预测模型得到所述初始突变体的特性分数,根据所述特性分数筛选所述初始突变体得到初始母代种群;
选择所述初始母代种群中的部分突变体进行繁衍构建得到子代种群,将所述子代种群和所述初始母代种群进行合并得到模型预测种群。
3.根据权利要求1所述的一种病毒突变体的生成方法,其特征在于,所述根据非支配排序结果和所述拥挤度确定第三突变体,根据所述第三突变体构建得到目标种群,对所述目标种群进行筛选得到目标突变体这一步骤,包括:
重复获取若干所述非支配排序结果以及所述拥挤度,根据所述非支配排序结果以及所述拥挤度构建得到若干个所述目标种群;
根据所述特性分数,对所述目标种群中的第三突变体进行排序,对排序后的第三突变体进行贪婪过滤,得到所述目标突变体。
4.根据权利要求1所述的一种病毒突变体的生成方法,其特征在于,在所述对所述目标种群进行筛选得到目标突变体这一步骤之后,所述方法还包括:
通过生物湿实验对所述目标突变体的特性进行验证;所述湿实验包括以下步骤:
根据所述目标突变体的衣壳的碱基序列,合成序列并构建质粒;
根据所述质粒转染细胞得到病毒突变体,确定所述病毒突变体的生存能力、免疫原性以及组织或器官的特异靶向性。
5.根据权利要求1所述的一种病毒突变体的生成方法,其特征在于,所述根据所述特性分数对所述模型预测种群中的第二突变体进行非支配排序这一步骤,包括:
根据所述特性分数确定所述第二突变体的支配关系或非支配关系;
根据所述支配关系或所述非支配关系确定若干非支配个体,将所述非支配个体进行整合得到若干非支配层,通过所述非支配层对所述第二突变体进行分层排序。
6.根据权利要求5所述的一种病毒突变体的生成方法,其特征在于,所述计算所述模型预测种群的拥挤度这一步骤,包括:
在所述非支配层中,根据所述特性分数对所述第二突变体进行排序,计算排序后所述第二突变体与相邻突变体之间特性分数的差值,将所述差值求和得到所述拥挤度。
7.一种病毒突变体的生成系统,其特征在于,包括:
初始种群构建模块,用于获取若干初始突变体,根据所述初始突变体构建得到模型预测种群;
个体特性预测模块,用于制备突变文库,所述突变文库包括生存能力数据集和靶向性数据集;根据所述生存能力数据集训练得到生存能力预测模型,根据所述靶向性数据集训练得到靶向性预测模型;对所述模型预测种群中的第二突变体进行特性分数预测,得到特性分数;其中,所述特性分数预测包括根据所述生存能力预测模型预测得到所述第二突变体的生存能力分数、以及根据所述靶向性预测模型预测得到所述第二突变体的靶向性分数;
个体特性筛查模块,用于根据所述特性分数对所述模型预测种群中的第二突变体进行非支配排序,计算所述模型预测种群的拥挤度;
目标个体筛选模块,用于根据非支配排序结果和所述拥挤度确定第三突变体,根据所述第三突变体构建得到目标种群,对所述目标种群进行筛选得到目标突变体;
特性预测模型模块,用于训练得到生存能力预测模型和靶向性预测模型。
8.一种病毒突变体的生成计算机设备,其特征在于,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器运行如权利要求1-6任一项所述方法。
9.一种存储介质,其中存储有处理器可执行的程序,其特征在于,所述处理器可执行的程序在由处理器执行时用于运行如权利要求1-6中任一项所述一种病毒突变体的生成方法。
CN202111085705.4A 2021-09-16 2021-09-16 一种病毒突变体的生成方法、系统、计算机设备及介质 Active CN113838526B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111085705.4A CN113838526B (zh) 2021-09-16 2021-09-16 一种病毒突变体的生成方法、系统、计算机设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111085705.4A CN113838526B (zh) 2021-09-16 2021-09-16 一种病毒突变体的生成方法、系统、计算机设备及介质

Publications (2)

Publication Number Publication Date
CN113838526A CN113838526A (zh) 2021-12-24
CN113838526B true CN113838526B (zh) 2023-08-25

Family

ID=78959487

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111085705.4A Active CN113838526B (zh) 2021-09-16 2021-09-16 一种病毒突变体的生成方法、系统、计算机设备及介质

Country Status (1)

Country Link
CN (1) CN113838526B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105139037A (zh) * 2015-09-06 2015-12-09 西安电子科技大学 基于最小生成树的集成多目标进化自动聚类方法
CN107201401A (zh) * 2017-05-23 2017-09-26 深圳市第二人民医院 一种用于乳腺癌发病风险预测的多因素模型及其建立方法
GB201717125D0 (en) * 2016-11-28 2017-11-29 National Univ Of Defense Technology Differential evolution method oriented to agile satellite multi-target task planning
CN108596339A (zh) * 2018-03-15 2018-09-28 中山大学 一种构建子种群和子问题的多目标优化遗传算法
CN109934344A (zh) * 2018-12-20 2019-06-25 西安理工大学 一种改进的基于规则模型的多目标分布估计算法
US10438687B1 (en) * 2018-07-12 2019-10-08 Helix OpCo, LLC Dynamic evaluation of polygenic models based on genetic loci for which input is received
CN111582552A (zh) * 2020-04-16 2020-08-25 浙江大学城市学院 一种基于多目标遗传算法的共享单车停放点分配方法
CN112029861A (zh) * 2020-09-07 2020-12-04 臻悦生物科技江苏有限公司 基于捕获测序技术的肿瘤突变负荷检测装置及方法
CN112462803A (zh) * 2020-11-27 2021-03-09 北京工商大学 一种基于改进nsga-ii的无人机路径规划方法
WO2021088436A1 (zh) * 2019-11-07 2021-05-14 苏宁云计算有限公司 一种用于多语言协同开发的项目调度方法及装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AUPR842501A0 (en) * 2001-10-23 2001-11-15 Epipop Pty Ltd A method for identification and development of therapeutic agents
EP1818862A1 (en) * 2006-01-24 2007-08-15 Honda Research Institute Europe GmbH Combining model-based and genetics-based offspring generation for multi-objective optimization using a convergence criterion

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105139037A (zh) * 2015-09-06 2015-12-09 西安电子科技大学 基于最小生成树的集成多目标进化自动聚类方法
GB201717125D0 (en) * 2016-11-28 2017-11-29 National Univ Of Defense Technology Differential evolution method oriented to agile satellite multi-target task planning
CN107201401A (zh) * 2017-05-23 2017-09-26 深圳市第二人民医院 一种用于乳腺癌发病风险预测的多因素模型及其建立方法
CN108596339A (zh) * 2018-03-15 2018-09-28 中山大学 一种构建子种群和子问题的多目标优化遗传算法
US10438687B1 (en) * 2018-07-12 2019-10-08 Helix OpCo, LLC Dynamic evaluation of polygenic models based on genetic loci for which input is received
CN109934344A (zh) * 2018-12-20 2019-06-25 西安理工大学 一种改进的基于规则模型的多目标分布估计算法
WO2021088436A1 (zh) * 2019-11-07 2021-05-14 苏宁云计算有限公司 一种用于多语言协同开发的项目调度方法及装置
CN111582552A (zh) * 2020-04-16 2020-08-25 浙江大学城市学院 一种基于多目标遗传算法的共享单车停放点分配方法
CN112029861A (zh) * 2020-09-07 2020-12-04 臻悦生物科技江苏有限公司 基于捕获测序技术的肿瘤突变负荷检测装置及方法
CN112462803A (zh) * 2020-11-27 2021-03-09 北京工商大学 一种基于改进nsga-ii的无人机路径规划方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
A Fast and Elitist Multiobjective Genetic Algorithm: NSGA-II;Kalyanmoy Deb等;《IEEE TRANSACTIONS ON EVOLUTIONARY COMPUTATION》;第第6卷卷(第第2期期);第182-197页 *

Also Published As

Publication number Publication date
CN113838526A (zh) 2021-12-24

Similar Documents

Publication Publication Date Title
CN111582428B (zh) 一种基于灰色预测演化算法的多模态多目标优化方法
CN109448794B (zh) 一种基于遗传禁忌和贝叶斯网络的上位性位点挖掘方法
CN115203631B (zh) 一种基于改进遗传算法的多模态数据分析方法、系统
CN108615555A (zh) 基于标记基因和混合核函数svm的结直肠癌预测方法和装置
Neethling et al. Determining RNA secondary structure using set-based particle swarm optimization
CN118522345B (zh) 一种基于基因池在gwas数据上检测snp组合的方法
Wong Evolutionary algorithms: Concepts, designs, and applications in bioinformatics
CN115248781A (zh) 一种组合测试用例生成方法、装置、设备及可读存储介质
CN115908909A (zh) 基于贝叶斯卷积神经网络的进化神经架构搜索方法及系统
CN117611974B (zh) 基于多种群交替进化神经结构搜索的图像识别方法及系统
CN116994645B (zh) 基于交互式推理网络的piRNA与mRNA靶标对的预测方法
Han et al. An integrative network-based approach for drug target indication expansion
CN115148286A (zh) 基于单细胞数据的癌症协同驱动模块识别系统
CN116307213A (zh) 一种基于nsga-iii算法的自动配棉方法及装置
CN113838526B (zh) 一种病毒突变体的生成方法、系统、计算机设备及介质
Xiang et al. Neural network hyperparameter tuning based on improved genetic algorithm
CN104598657B (zh) 一种基于memetic算法的基因模体重构方法
JP2004355174A (ja) データ解析方法及びそのシステム
Topa et al. Modelling ecology and evolution of Foraminifera in the agent-oriented distributed platform
CN110020725A (zh) 一种服务于武器装备体系作战仿真的试验设计方法
CN116933835A (zh) 一种多角色自适应变维度驱动的人工蜂群算法
CN117649876B (zh) 基于gwo算法在gwas数据上检测与复杂疾病相关snp组合的方法
Stranieri et al. Forest-based Evolutionary Algorithm for Reconstructing Boolean Gene Regulatory Networks
Srikamdee et al. Collaborative Learning of Estimation of Distribution Algorithm for RNA secondary structure prediction
Flynn et al. Growth and evolution of deep neural networks from gene regulatory networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: A Method, System, Computer Equipment, and Medium for Generating a Virus Mutant

Effective date of registration: 20230911

Granted publication date: 20230825

Pledgee: Industrial and Commercial Bank of China Limited Guangzhou tianpingjia sub branch

Pledgor: CYAGEN BIOSCIENCES (GUANGZHOU) Inc.

Registration number: Y2023980056083

PE01 Entry into force of the registration of the contract for pledge of patent right
PC01 Cancellation of the registration of the contract for pledge of patent right

Granted publication date: 20230825

Pledgee: Industrial and Commercial Bank of China Limited Guangzhou tianpingjia sub branch

Pledgor: CYAGEN BIOSCIENCES (GUANGZHOU) Inc.

Registration number: Y2023980056083

PC01 Cancellation of the registration of the contract for pledge of patent right
TR01 Transfer of patent right

Effective date of registration: 20250102

Address after: 510663 No. d314, D315, d316 and D317, incubation building (Zone D) of international business incubator, Guangzhou Science City, high tech Industrial Development Zone, Guangzhou, Guangdong Province

Patentee after: CYAGEN BIOSCIENCES (GUANGZHOU) Inc.

Country or region after: China

Patentee after: Guangzhou Decode Gene Technology Co.,Ltd.

Address before: 510663 No. d314, D315, d316 and D317, incubation building (Zone D) of international business incubator, Guangzhou Science City, high tech Industrial Development Zone, Guangzhou, Guangdong Province

Patentee before: CYAGEN BIOSCIENCES (GUANGZHOU) Inc.

Country or region before: China

TR01 Transfer of patent right