[go: up one dir, main page]

CN110423769A - 一种提高目的基因在宿主体内表达水平的密码子优化方法 - Google Patents

一种提高目的基因在宿主体内表达水平的密码子优化方法 Download PDF

Info

Publication number
CN110423769A
CN110423769A CN201810030102.6A CN201810030102A CN110423769A CN 110423769 A CN110423769 A CN 110423769A CN 201810030102 A CN201810030102 A CN 201810030102A CN 110423769 A CN110423769 A CN 110423769A
Authority
CN
China
Prior art keywords
codon
target gene
host
optimization method
expression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810030102.6A
Other languages
English (en)
Inventor
左永春
贾雪琦
赵小庆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inner Mongolia University
Original Assignee
Inner Mongolia University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inner Mongolia University filed Critical Inner Mongolia University
Priority to CN201810030102.6A priority Critical patent/CN110423769A/zh
Publication of CN110423769A publication Critical patent/CN110423769A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/67General methods for enhancing the expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/22Vectors comprising a coding region that has been codon optimised for expression in a respective host

Landscapes

  • Genetics & Genomics (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明公开了一种提高目的基因在宿主体内表达水平的密码子优化方法,包括以下步骤:第一步,对目的基因和宿主基因组的密码子进行密码子偏爱性分析;第二步,比较并总结密码子使用差异,找出可能的限速密码子;第三步,将目的基因编码序列中的限速密码子进行替换优化;第四步,编码序列前后分别连接宿主管家基因的5’UTR和3’UTR;第五步,对起始密码子上游30bp附近的碱基进行优化;第六步,对DNA甲基化寡片段进行优化;第七步,排除优化后目的基因中的常见限制性内切酶位点;第八步,对优化结果表达水平进行预测。本发明的优化方法能提高目的基因在宿主内的表达水平。

Description

一种提高目的基因在宿主体内表达水平的密码子优化方法
技术领域
本发明涉及于生物技术领域,具体是一种提高目的基因在宿主体内表达水平的密码子优化方法。
背景技术
由于生物体中编码同一种氨基酸的密码子有不只一种,所以存在着同义密码子。对于同义密码子之间的选择,不同物种之间会出现一定的差异,甚至在同一物种的不同器官,不同发育阶段都可能不一致,这种现象被称作密码子偏爱性。同一物种在编码各自蛋白的时候会偏向于选择某一种或几种密码子作为其主要的密码子,而其余的密码子的出现频率会极其低,甚至为零。这是由于在不同物种的生物体中存在不同的tRNA池,及每种tRNA的含量分布不同,密码子的使用正是与该分布相互对应的,如果出现差异,在表达过程中出现大量稀有密码子,则对应的稀少tRNA会被大量使用而匮乏,结果不能及时供应翻译的需求,阻滞核糖体合成,导致蛋白的产量就会大大减少。所以当转入外源基因的时候,可能会含有大量宿主的稀有密码子,为了避免表达水平的降低,则应考虑与宿主的表达体系尽量相适应,使用宿主的偏爱密码子替换限速密码子。因此,本发明提供一种提高目的基因在宿主体内表达水平的密码子优化方法。
发明内容
本发明的目的在于提供一种提高目的基因在宿主体内表达水平的密码子优化方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种提高目的基因在宿主体内表达水平的密码子优化方法,包括以下步骤:
第一步,对目的基因和宿主基因组的密码子进行密码子偏爱性分析;
第二步,比较并总结密码子使用差异,找出可能的限速密码子;
第三步,将目的基因编码序列中的限速密码子进行替换优化;
第四步,编码序列前后分别连接宿主管家基因的5’UTR和3’UTR;
第五步,对起始密码子上游30bp附近的碱基进行优化;
第六步,对DNA甲基化寡片段进行优化;
第七步,排除优化后目的基因中的常见限制性内切酶位点;
第八步,对优化结果表达水平进行预测。
作为本发明进一步的方案:步骤八、根据CAI、CBI、GC%、Nc值以及RNA二级结构预测对优化结果表达水平进行预测。
与现有技术相比,本发明的有益效果是:
本发明为一种融合多维度信息的莱茵衣藻ω-3脂肪酸脱氢酶基因以及大豆ω-3和ω-6脂肪酸脱氢酶基因及其基因近端调控序列优化方法,所述的基因分别为SEQ ID:EF110555、EF632325和L43920的核苷酸编码序列;本发明的优化方法可以为跨物种转基因提供一种优化方法,通过该方法的优化,能提高目的基因在宿主内的表达水平。
附图说明
图1为提高目的基因在宿主体内表达水平的密码子优化方法的流程图。
具体实施方式
下面结合具体实施方式对本专利的技术方案作进一步详细地说明。
实施例1
请参阅图1,一种提高目的基因在宿主体内表达水平的密码子优化方法,包括以下步骤:
第一步,对目的基因和宿主基因组的密码子进行密码子偏爱性分析;
第二步,比较并总结密码子使用差异,找出可能的限速密码子;
第三步,将目的基因编码序列中的限速密码子进行替换优化;
第四步,编码序列前后分别连接宿主管家基因的5’UTR和3’UTR;
第五步,对起始密码子上游30bp附近的碱基进行优化;
第六步,对DNA甲基化寡片段进行优化;
第七步,排除优化后目的基因中的常见限制性内切酶位点;
第八步,根据CAI、CBI、GC%、Nc值以及RNA二级结构预测对优化结果表达水平进行预测。
实施例2
本发明利用以上方法对莱茵衣藻ω-3脂肪酸脱氢酶基因以及大豆ω-3和ω-6脂肪酸脱氢酶基因进行了人源化优化,具体操作如下:
第一步:对目的基因和宿主基因组的密码子进行密码子偏爱性分析;人类基因组密码子使用情况的统计可由在线软件Codon Usage Database得到;对于莱茵衣藻ω-3脂肪酸脱氢酶基因以及大豆ω-3和ω-6脂肪酸脱氢酶基因编码序列RNA,可以使用CodonW软件分析得到其密码子的使用情况;
第二步:比较并总结密码子使用差异,找出可能的限速密码子;将上述的三条目的基因的编码序列的密码子使用情况与人类的密码子偏好性进行统计比较,列表并整理出最优密码子、次优密码子以及稀有密码子;如果目的基因序列中的最优密码子和次优密码子是相应人类基因组中的稀有密码子,则将其归为可能的限速密码子;
第三步:将目的基因中的限速密码子进行替换优化;用人类基因组中相应的最优密码子代替可能的限速密码子;这一步可通过结合UltraEdit和Office Word的查找替换功能实现,同时也可以利用网上在线软件Codon Optimization更简易的操作,打开密码子优化页面,粘贴待优化序列并选择目标宿主物种的拉丁名,在页面下方选择尽构建密码子地图,就可以在地图上找到相应位置的限速密码子并进行对应同义密码子的更替;
第四步,编码序列前后分别连接宿主管家基因的5’UTR和3’UTR;根据实验设计中的宿主,选取其管家基因的5’UTR和3’UTR分别连接在优化后的目的基因的前后两端;管家基因的选取可以考虑ACTB或GAPDH;
第五步,对起始密码子上游30bp附近的碱基进行优化;
第六步,对DNA甲基化寡片段进行优化;
第七步:排除优化后目的基因中的常见限制性内切酶位点;将优化后的序列用BioEdit软件翻译并进行序列对比,比较优化前后蛋白质序列;在确认了氨基酸序列没有改变的前提下,用BioEdit软件识别其中的常见酶切位点,并通过替换相应使用频率较高的同义密码子,在不改变氨基酸序列的前提下排除一些常见的酶切位点;
第八步,根据CAI、CBI、GC%、Nc值以及RNA二级结构预测对优化结果表达水平进行预测;应用软件CodonW分别计算优化前后的基因序列CDS的CBI值、CG%、GC3s、Nc值和CAI值;并使用在线软件ViennaRNA Services(http://rna.tbi.univie.ac.at/)中的RNAfoldWebServer获得优化前后基因序列的RNA二级结构及最小自由能;列表比较预测其表达水平是否有提高。
通过以上的操作,预测结果显示本发明涉及的优化方法可以适当的提高目的基因的表达水平。
本发明为一种融合多维度信息的莱茵衣藻ω-3脂肪酸脱氢酶基因以及大豆ω-3和ω-6脂肪酸脱氢酶基因及其基因近端调控序列优化方法,所述的基因分别为SEQ ID:EF110555、EF632325和L43920的核苷酸编码序列;本发明的优化方法可以为跨物种转基因提供一种优化方法,通过该方法的优化,能提高目的基因在宿主内的表达水平。
上面对本专利的较佳实施方式作了详细说明,但是本专利并不限于上述实施方式,在本领域的普通技术人员所具备的知识范围内,还可以在不脱离本专利宗旨的前提下作出各种变化。
序列表
<110> 内蒙古大学
<120> 一种提高目的基因在宿主体内表达水平的密码子优化方法
<160> 1
<170> SIPOSequenceListing 1.0
<210> 1
<211> 3564
<212> DNA
<213> 脱氧核糖核酸(2 Ambystoma laterale x Ambystoma jeffersonianum)
<400> 1
atgcagtgcc tgagcagatc cagcctgcgg gctcccaccc tcagcaccag agctagagca 60
gcacctgtcc tccggagatc cgtggtgaag gtcgccaacg tcgctgctat ccctgaggca 120
ccccagcagg acagattcaa gagaaacgca gatggcacct acgacctgtc cgcacctcct 180
ccattcactc tgcaagacct gagaaacgcc atccctgctc actgctggga gaagaacacc 240
ttcagaagca tggctcacct ggcactggac gtcggcatcg tgttcggcct ggctgccgtg 300
gcattcaccg tgaaccagtg gtggatgtgg cccctgtact gggttgctca ggggaccatg 360
ttctgggctc tgtttgtggt cggccacgac tgcggccacc agtctttctc aaacaacaag 420
gcactgaacg acttcatcgg ccacctgacc cacagctcca tcctggtgcc ctaccacggc 480
tggagaatca gccacagaac tcaccacgcc aaccacggcc acgttgagaa cgacgagagc 540
tggcaccccg tgaccaagaa gctgtacgac cacctggagc ctatggccag agtcggcaga 600
ctgtccatgc cctgggcact gttcgccttc cccttctacc tgtggaagag aagccccggc 660
aaggagggca gccactacga ccccgagtgc gacctgttca ccgccgctga gagaaaccag 720
gtgctgacca ccaacgccta catgctgggc atggtggcag tgctggccgc cagaaccatc 780
aagctgggac ccctggccat gttcaacctg tacctgatcc cctactggat caacgtggtg 840
tggctggaca ttgtgaacta cctgcaccat cacggcagcc acgaccagaa cgagaagatg 900
ccctggtaca gaggcgagga gtggagctac ctgagagggg gcctgaccac catcgacagg 960
gactacggca tcttcaacaa gatccaccac gacatcggca cccatgtcgt ccaccacctg 1020
ttcccccaga ttccccacta caaccttgag gaggctaccg aggccgtcaa gccagtgatg 1080
ggaccctact acagagagcc catgaagagc cccggccccc tgcccaccca cctggtggag 1140
cccctgatca gatccttcac caacgaccac tacgtggccg acagtggcga catcgtctac 1200
taccagaagg accccaactt ccccagcgtg ggcaaggcag ttgccggcaa ggcctgaatg 1260
gtgaaggaca ccaagcctct ggcctacgcc gccaacaacg gctaccagca gaagggcagc 1320
agcttcgact tcgaccctag cgcccctccc cccttcaaga tcgccgagat cagagccagc 1380
atccccaagc actgctgggt gaagaacccc tggagatccc tgagctacgt gctgagggat 1440
gtgctggtga tcgccgccct ggtggccgcc gccatccact tcgacaactg gctgctgtgg 1500
ctgatctact gccccatcca gggcaccatg ttctgggctc tgtttgtgct gggccacgat 1560
tgcggccacg gcagctttag cgacagccct ctgctgaata gcctggtggg ccacatcctg 1620
cactccagca tcctggtgcc ataccacggc tggagaatca gccacagaac ccaccaccag 1680
aaccacggcc acatcgagaa ggatgagagc tgggtgccac tgacagagaa gatttacaag 1740
aatctggaca gcatgacaag actgattaga ttcaccgtgc cattcccact gttcgtgtac 1800
ccaatctacc tgttcagcag aagccccggc aaggacggca gccacttcaa tccctacagc 1860
aatctgtttc cacccagcga gagaaagggc atcgccatca gcaccctgtg ttgggccacc 1920
atgttttctc tgctgatcta tctgagcttc atcaccagcc cactgctggt gctgaagctg 1980
tacggcatcc cctactggat cttcgtgatg tggctggact ttgtgacata cctgcaccac 2040
cacggccacc accagaagct gccttggtac agaggcaagg agtggagcta cctgagaggc 2100
ggcctgacca ccgtggatag agactacggc tggatcaata acatccacca cgacatcggc 2160
acccatgtga tccaccacct gttcccccag atccctcact accacctggt ggaggccaca 2220
caggccgcca agccagtgct gggcgattac tacagagagc cagagagaag cgccccactg 2280
ccatttcacc tgattaagta tctgatccag agcatgagac aggaccactt cgtgagcgac 2340
accggagatg tggtgtatta tcagaccgat tctctgctgc tgcacagcca gagagactga 2400
atgggcctgg ctaaggagac aacaatggga ggcagaggca gagtggctaa ggtggaggtg 2460
cagggcaaga agcctctgag cagggtgcca aacacaaagc caccattcac cgtgggccag 2520
ctcaagaagg ccatcccacc acactgcttt cagagatccc tgctgaccag cttctcctac 2580
gtggtgtacg acctgtcatt tgccttcatc ttctacatcg ccaccaccta cttccacctg 2640
ctgcctcagc ccttttccct gatcgcctgg cccatctact gggtgctcca gggctgcctg 2700
ctgaccggcg tgtgggtgat cgcccacgag tgcggccacc acgccttcag caagtaccag 2760
tgggtggatg atgtggtggg cctgaccctg cacagcacac tgctggtgcc ttacttctcc 2820
tggaagatca gccaccgccg ccaccactcc aacaccggct ccctggacag agatgaggtg 2880
tttgtgccaa agccaaagtc caaggtggcc tggttttcca agtacctgaa caaccctctg 2940
ggcagggccg tgtctctgct ggtgacactg acaatcgggt ggcctatgta cctggccttc 3000
aatgtgtctg gcagacccta cgatagcttt gccagccact accaccctta cgcccccatc 3060
tactctaaca gagagaggct gctgatctac gtgtctgatg tggccctgtt ttctgtgacc 3120
tactctctgt atagagtggc taccctgaag ggcctggtgt ggctgctgtg tgtgtacggg 3180
gtgcctctgc tgatcgtgaa cggctttctg gtgaccatca cctacctcca gcacacccac 3240
tttgccctgc ctcactacga tagcagcgag tgggactggc tgaagggagc cctggctaca 3300
atggacagag attacggcat cctgaacaag gtgtttcacc acatcaccga tacccatgtg 3360
gcccaccacc tgttctctac aatgccacac taccacgcta tggaggccac caatgccatc 3420
aagccaatcc tgggcgagta ttaccagttt gatgacacac cattttacaa ggccctgtgg 3480
agagaggcca gagagtgcct gtacgtggag ccagatgagg gcacatccga gaagggcgtg 3540
tactggtaca ggaacaagta ttga 3564

Claims (2)

1.一种提高目的基因在宿主体内表达水平的密码子优化方法,其特征在于,包括以下步骤:
第一步,对目的基因和宿主基因组的密码子进行密码子偏爱性分析;
第二步,比较并总结密码子使用差异,找出可能的限速密码子;
第三步,将目的基因编码序列中的限速密码子进行替换优化;
第四步,编码序列前后分别连接宿主管家基因的5’UTR和3’UTR;
第五步,对起始密码子上游30bp附近的碱基进行优化;
第六步,对DNA甲基化寡片段进行优化;
第七步,排除优化后目的基因中的常见限制性内切酶位点;
第八步,对优化结果表达水平进行预测。
2.根据权利要求1所述的提高目的基因在宿主体内表达水平的密码子优化方法,其特征在于,步骤八、根据CAI、CBI、GC%、Nc值以及RNA二级结构预测对优化结果表达水平进行预测。
CN201810030102.6A 2018-01-12 2018-01-12 一种提高目的基因在宿主体内表达水平的密码子优化方法 Pending CN110423769A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810030102.6A CN110423769A (zh) 2018-01-12 2018-01-12 一种提高目的基因在宿主体内表达水平的密码子优化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810030102.6A CN110423769A (zh) 2018-01-12 2018-01-12 一种提高目的基因在宿主体内表达水平的密码子优化方法

Publications (1)

Publication Number Publication Date
CN110423769A true CN110423769A (zh) 2019-11-08

Family

ID=68408240

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810030102.6A Pending CN110423769A (zh) 2018-01-12 2018-01-12 一种提高目的基因在宿主体内表达水平的密码子优化方法

Country Status (1)

Country Link
CN (1) CN110423769A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030186291A1 (en) * 2002-02-06 2003-10-02 Nicole Faust Genetically engineered phiC31-integrase genes
CN102250928A (zh) * 2011-04-07 2011-11-23 中国农业科学院北京畜牧兽医研究所 Δ-6脂肪酸脱氢酶突变基因及其表达载体和应用
CN102533807A (zh) * 2012-01-10 2012-07-04 青岛农业大学 一种经过密码子优化的脂肪酸脱氢酶基因序列及其应用
CA2815847A1 (en) * 2012-09-18 2014-03-18 University Of Guelph Vectors and methods for enhancing recombinant protein expression in plants

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030186291A1 (en) * 2002-02-06 2003-10-02 Nicole Faust Genetically engineered phiC31-integrase genes
CN102250928A (zh) * 2011-04-07 2011-11-23 中国农业科学院北京畜牧兽医研究所 Δ-6脂肪酸脱氢酶突变基因及其表达载体和应用
CN102533807A (zh) * 2012-01-10 2012-07-04 青岛农业大学 一种经过密码子优化的脂肪酸脱氢酶基因序列及其应用
CA2815847A1 (en) * 2012-09-18 2014-03-18 University Of Guelph Vectors and methods for enhancing recombinant protein expression in plants

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
ZHIPENG ZHOU等: "Codon usage is an important determinant of gene expression levels largely through its effects on transcription", 《PROCEEDINGS OF THE NATIONAL ACADEMY OF SCIENCES OF THE UNITED STATES OF AMERICA》, vol. 113, no. 41, pages 6 - 7 *
刘博洋: "优化fat1基因真核表达载体的构建及转基因细胞系的建立", 《中国优秀硕士学位论文全文数据库》 *
孙晗笑等: "《转基因技术理论与应用》", 河南医科大学出版社, pages: 252 *

Similar Documents

Publication Publication Date Title
Hossain et al. Automated design of thousands of nonrepetitive parts for engineering stable genetic systems
Sanz et al. High-resolution, strand-specific R-loop mapping via S9. 6-based DNA–RNA immunoprecipitation and high-throughput sequencing
Dutreux et al. De novo assembly and annotation of three Leptosphaeria genomes using Oxford Nanopore MinION sequencing
Thomson et al. Sparse supermatrices for phylogenetic inference: taxonomy, alignment, rogue taxa, and the phylogeny of living turtles
Liu et al. A Cas-embedding strategy for minimizing off-target effects of DNA base editors
Liu et al. COStar: a D-star Lite-based dynamic search algorithm for codon optimization
Kleinkauf et al. antaRNA–Multi-objective inverse folding of pseudoknot RNA using ant-colony optimization
CN113631720B (zh) 设计用于消耗丰富转录物的探针
Ren et al. CodonBERT: a BERT-based architecture tailored for codon optimization using the cross-attention mechanism
Zhao et al. Bioinformatics analysis of alternative polyadenylation in green alga Chlamydomonas reinhardtii using transcriptome sequences from three different sequencing platforms
Sun et al. CRISPR-M: Predicting sgRNA off-target effect using a multi-view deep learning network
CN112430586B (zh) 一种VI-B型CRISPR/Cas13基因编辑系统及其应用
CN117757774A (zh) 一种Cas9蛋白、II型CRISPR/Cas9基因编辑系统及应用
CN118762752A (zh) 一种靶向病原微生物测序引物的设计方法和系统
CN109255484A (zh) 数据驱动的离散制造资源协同优化方法及系统
CN108595914B (zh) 一种烟草线粒体rna编辑位点高精度预测方法
CN110423769A (zh) 一种提高目的基因在宿主体内表达水平的密码子优化方法
Yang et al. Monodopsis and Vischeria genomes shed new light on the biology of eustigmatophyte algae
Liu et al. Prediction of cancer-associated piRNA–mRNA and piRNA–lncRNA interactions by integrated analysis of expression and sequence data
CN108388772A (zh) 一种利用文本比对分析高通量测序基因表达水平的方法
CN105590038A (zh) 一种推断寡核苷酸在基因组上结合位点的方法和系统
Gupta et al. Genetic algorithm based approach for obtaining alignment of multiple sequences
CN118098349A (zh) 一种基于dna链特异性的长链非编码rna的综合鉴定方法
CN116343908A (zh) 融合dna形状特征的蛋白质编码区域预测方法、介质和装置
CN115954063A (zh) 基于机器学习预测工具的功效多肽筛选方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination