CN101910406A - 减少氧化还原活性金属离子对纤维素材料酶水解抑制作用的方法 - Google Patents
减少氧化还原活性金属离子对纤维素材料酶水解抑制作用的方法 Download PDFInfo
- Publication number
- CN101910406A CN101910406A CN2008801237159A CN200880123715A CN101910406A CN 101910406 A CN101910406 A CN 101910406A CN 2008801237159 A CN2008801237159 A CN 2008801237159A CN 200880123715 A CN200880123715 A CN 200880123715A CN 101910406 A CN101910406 A CN 101910406A
- Authority
- CN
- China
- Prior art keywords
- acid
- cellulose materials
- sequestrant
- described method
- redox active
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000000463 material Substances 0.000 title claims abstract description 192
- 238000000034 method Methods 0.000 title claims abstract description 182
- 230000002401 inhibitory effect Effects 0.000 title abstract description 5
- 230000007071 enzymatic hydrolysis Effects 0.000 title description 4
- 238000006047 enzymatic hydrolysis reaction Methods 0.000 title description 4
- 229910021645 metal ion Inorganic materials 0.000 title description 2
- 238000000855 fermentation Methods 0.000 claims abstract description 95
- 230000004151 fermentation Effects 0.000 claims abstract description 94
- 239000007800 oxidant agent Substances 0.000 claims abstract description 15
- 230000000593 degrading effect Effects 0.000 claims abstract 3
- 229920002678 cellulose Polymers 0.000 claims description 218
- 239000001913 cellulose Substances 0.000 claims description 218
- GQPLMRYTRLFLPF-UHFFFAOYSA-N Nitrous Oxide Chemical compound [O-][N+]#N GQPLMRYTRLFLPF-UHFFFAOYSA-N 0.000 claims description 147
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 137
- 229920001184 polypeptide Polymers 0.000 claims description 134
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 133
- 102000004190 Enzymes Human genes 0.000 claims description 124
- 108090000790 Enzymes Proteins 0.000 claims description 124
- 229940088598 enzyme Drugs 0.000 claims description 124
- 108010047754 beta-Glucosidase Proteins 0.000 claims description 108
- 102000006995 beta-Glucosidase Human genes 0.000 claims description 108
- 239000003352 sequestering agent Substances 0.000 claims description 97
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 claims description 95
- 230000001461 cytolytic effect Effects 0.000 claims description 88
- 239000002253 acid Substances 0.000 claims description 69
- 238000002203 pretreatment Methods 0.000 claims description 64
- 239000000203 mixture Substances 0.000 claims description 63
- 150000001457 metallic cations Chemical class 0.000 claims description 62
- 230000000694 effects Effects 0.000 claims description 60
- 230000008569 process Effects 0.000 claims description 58
- 108010059892 Cellulase Proteins 0.000 claims description 54
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 claims description 51
- 108010008885 Cellulose 1,4-beta-Cellobiosidase Proteins 0.000 claims description 49
- 235000000346 sugar Nutrition 0.000 claims description 37
- 150000001413 amino acids Chemical class 0.000 claims description 31
- 230000002708 enhancing effect Effects 0.000 claims description 26
- 150000007524 organic acids Chemical class 0.000 claims description 26
- MUBZPKHOEPUJKR-UHFFFAOYSA-N Oxalic acid Chemical compound OC(=O)C(O)=O MUBZPKHOEPUJKR-UHFFFAOYSA-N 0.000 claims description 24
- 239000000835 fiber Substances 0.000 claims description 23
- -1 alkyl phosphinic acid Chemical compound 0.000 claims description 22
- 238000011282 treatment Methods 0.000 claims description 19
- 238000012545 processing Methods 0.000 claims description 17
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 claims description 12
- 239000000460 chlorine Substances 0.000 claims description 12
- 230000000452 restraining effect Effects 0.000 claims description 12
- SUKJFIGYRHOWBL-UHFFFAOYSA-N sodium hypochlorite Chemical compound [Na+].Cl[O-] SUKJFIGYRHOWBL-UHFFFAOYSA-N 0.000 claims description 12
- 108010002430 hemicellulase Proteins 0.000 claims description 11
- 229940059442 hemicellulase Drugs 0.000 claims description 11
- 239000011734 sodium Substances 0.000 claims description 11
- RGHNJXZEOKUKBD-SQOUGZDYSA-N D-gluconic acid Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C(O)=O RGHNJXZEOKUKBD-SQOUGZDYSA-N 0.000 claims description 9
- VTLYFUHAOXGGBS-UHFFFAOYSA-N Fe3+ Chemical compound [Fe+3] VTLYFUHAOXGGBS-UHFFFAOYSA-N 0.000 claims description 9
- MHAJPDPJQMAIIY-UHFFFAOYSA-N Hydrogen peroxide Chemical compound OO MHAJPDPJQMAIIY-UHFFFAOYSA-N 0.000 claims description 9
- 239000007789 gas Substances 0.000 claims description 9
- 229950006191 gluconic acid Drugs 0.000 claims description 9
- 150000002978 peroxides Chemical class 0.000 claims description 9
- 108091005804 Peptidases Proteins 0.000 claims description 8
- 102000035195 Peptidases Human genes 0.000 claims description 8
- 235000006408 oxalic acid Nutrition 0.000 claims description 8
- 229910052708 sodium Inorganic materials 0.000 claims description 8
- RGHNJXZEOKUKBD-UHFFFAOYSA-N D-gluconic acid Natural products OCC(O)C(O)C(O)C(O)C(O)=O RGHNJXZEOKUKBD-UHFFFAOYSA-N 0.000 claims description 7
- 108010076986 Phytochelatins Proteins 0.000 claims description 7
- 229910019093 NaOCl Inorganic materials 0.000 claims description 6
- NHNBFGGVMKEFGY-UHFFFAOYSA-N Nitrate Chemical compound [O-][N+]([O-])=O NHNBFGGVMKEFGY-UHFFFAOYSA-N 0.000 claims description 6
- 230000034659 glycolysis Effects 0.000 claims description 6
- 150000002576 ketones Chemical class 0.000 claims description 6
- MGFYIUFZLHCRTH-UHFFFAOYSA-N nitrilotriacetic acid Chemical compound OC(=O)CN(CC(O)=O)CC(O)=O MGFYIUFZLHCRTH-UHFFFAOYSA-N 0.000 claims description 6
- IOVCWXUNBOPUCH-UHFFFAOYSA-M Nitrite anion Chemical compound [O-]N=O IOVCWXUNBOPUCH-UHFFFAOYSA-M 0.000 claims description 5
- CBENFWSGALASAD-UHFFFAOYSA-N Ozone Chemical compound [O-][O+]=O CBENFWSGALASAD-UHFFFAOYSA-N 0.000 claims description 5
- 230000001131 transforming effect Effects 0.000 claims description 5
- WKBOTKDWSSQWDR-UHFFFAOYSA-N Bromine atom Chemical compound [Br] WKBOTKDWSSQWDR-UHFFFAOYSA-N 0.000 claims description 4
- ZAMOUSCENKQFHK-UHFFFAOYSA-N Chlorine atom Chemical compound [Cl] ZAMOUSCENKQFHK-UHFFFAOYSA-N 0.000 claims description 4
- 108090000371 Esterases Proteins 0.000 claims description 4
- 108010029541 Laccase Proteins 0.000 claims description 4
- 102000003992 Peroxidases Human genes 0.000 claims description 4
- 239000000589 Siderophore Substances 0.000 claims description 4
- 229910021536 Zeolite Inorganic materials 0.000 claims description 4
- GDTBXPJZTBHREO-UHFFFAOYSA-N bromine Substances BrBr GDTBXPJZTBHREO-UHFFFAOYSA-N 0.000 claims description 4
- 229910052794 bromium Inorganic materials 0.000 claims description 4
- 229910052801 chlorine Inorganic materials 0.000 claims description 4
- HNPSIPDUKPIQMN-UHFFFAOYSA-N dioxosilane;oxo(oxoalumanyloxy)alumane Chemical compound O=[Si]=O.O=[Al]O[Al]=O HNPSIPDUKPIQMN-UHFFFAOYSA-N 0.000 claims description 4
- 108040007629 peroxidase activity proteins Proteins 0.000 claims description 4
- 150000004965 peroxy acids Chemical class 0.000 claims description 4
- 239000012286 potassium permanganate Substances 0.000 claims description 4
- 239000010457 zeolite Substances 0.000 claims description 4
- 230000002478 diastatic effect Effects 0.000 claims description 3
- 229910052751 metal Inorganic materials 0.000 abstract description 17
- 239000002184 metal Substances 0.000 abstract description 17
- 150000001768 cations Chemical class 0.000 abstract description 13
- 239000002738 chelating agent Substances 0.000 abstract description 10
- 239000013522 chelant Substances 0.000 abstract description 3
- 230000002829 reductive effect Effects 0.000 abstract description 3
- 230000001590 oxidative effect Effects 0.000 abstract 1
- 235000010980 cellulose Nutrition 0.000 description 174
- 210000004027 cell Anatomy 0.000 description 144
- 239000013615 primer Substances 0.000 description 117
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 107
- 241000499912 Trichoderma reesei Species 0.000 description 101
- 108090000623 proteins and genes Proteins 0.000 description 95
- 210000004215 spore Anatomy 0.000 description 90
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 88
- 238000006460 hydrolysis reaction Methods 0.000 description 85
- 230000007062 hydrolysis Effects 0.000 description 83
- 239000012634 fragment Substances 0.000 description 80
- 240000006439 Aspergillus oryzae Species 0.000 description 76
- 235000002247 Aspergillus oryzae Nutrition 0.000 description 76
- 241000223258 Thermomyces lanuginosus Species 0.000 description 62
- 239000013612 plasmid Substances 0.000 description 60
- 239000000499 gel Substances 0.000 description 59
- 238000006243 chemical reaction Methods 0.000 description 58
- 102000004169 proteins and genes Human genes 0.000 description 49
- 235000018102 proteins Nutrition 0.000 description 48
- 241000894006 Bacteria Species 0.000 description 46
- 239000000047 product Substances 0.000 description 45
- 239000000243 solution Substances 0.000 description 45
- 235000019441 ethanol Nutrition 0.000 description 44
- 238000011534 incubation Methods 0.000 description 44
- 230000001580 bacterial effect Effects 0.000 description 41
- 108020004414 DNA Proteins 0.000 description 40
- 108091033319 polynucleotide Proteins 0.000 description 39
- 102000040430 polynucleotide Human genes 0.000 description 39
- 239000002157 polynucleotide Substances 0.000 description 39
- 108091026890 Coding region Proteins 0.000 description 35
- 238000000605 extraction Methods 0.000 description 34
- 238000004519 manufacturing process Methods 0.000 description 32
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 30
- XEEYBQQBJWHFJM-UHFFFAOYSA-N iron Substances [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 29
- 239000000126 substance Substances 0.000 description 29
- 108010076504 Protein Sorting Signals Proteins 0.000 description 28
- 238000013016 damping Methods 0.000 description 28
- 239000012530 fluid Substances 0.000 description 28
- 239000013604 expression vector Substances 0.000 description 26
- 229920002684 Sepharose Polymers 0.000 description 25
- 239000000523 sample Substances 0.000 description 25
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 24
- 230000029087 digestion Effects 0.000 description 24
- 230000014509 gene expression Effects 0.000 description 24
- 241000233866 Fungi Species 0.000 description 23
- 238000000354 decomposition reaction Methods 0.000 description 22
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 21
- 229920002488 Hemicellulose Polymers 0.000 description 21
- 230000002538 fungal effect Effects 0.000 description 21
- 239000008103 glucose Substances 0.000 description 21
- 241000193830 Bacillus <bacterium> Species 0.000 description 20
- 230000004927 fusion Effects 0.000 description 20
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 19
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 19
- 101150052795 cbh-1 gene Proteins 0.000 description 19
- 102000039446 nucleic acids Human genes 0.000 description 19
- 108020004707 nucleic acids Proteins 0.000 description 19
- 150000007523 nucleic acids Chemical class 0.000 description 19
- 239000002773 nucleotide Substances 0.000 description 19
- 125000003729 nucleotide group Chemical group 0.000 description 19
- 239000000376 reactant Substances 0.000 description 19
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 19
- 239000002028 Biomass Substances 0.000 description 18
- 239000002609 medium Substances 0.000 description 18
- 229940024606 amino acid Drugs 0.000 description 17
- 235000001014 amino acid Nutrition 0.000 description 17
- 230000003321 amplification Effects 0.000 description 17
- 239000007795 chemical reaction product Substances 0.000 description 17
- 238000003199 nucleic acid amplification method Methods 0.000 description 17
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 16
- 239000006228 supernatant Substances 0.000 description 16
- 229910021529 ammonia Inorganic materials 0.000 description 15
- 230000000692 anti-sense effect Effects 0.000 description 15
- 229940106157 cellulase Drugs 0.000 description 15
- 244000005700 microbiome Species 0.000 description 15
- 235000015097 nutrients Nutrition 0.000 description 15
- 230000008521 reorganization Effects 0.000 description 15
- 229910021654 trace metal Inorganic materials 0.000 description 15
- 241000235349 Ascomycota Species 0.000 description 14
- 230000008859 change Effects 0.000 description 14
- 230000004087 circulation Effects 0.000 description 14
- 238000005516 engineering process Methods 0.000 description 14
- 238000001914 filtration Methods 0.000 description 14
- 238000002360 preparation method Methods 0.000 description 14
- 239000007787 solid Substances 0.000 description 14
- 239000002585 base Substances 0.000 description 13
- 239000000872 buffer Substances 0.000 description 13
- 239000000758 substrate Substances 0.000 description 13
- 241000351920 Aspergillus nidulans Species 0.000 description 12
- 229920002134 Carboxymethyl cellulose Polymers 0.000 description 12
- VMHLLURERBWHNL-UHFFFAOYSA-M Sodium acetate Chemical compound [Na+].CC([O-])=O VMHLLURERBWHNL-UHFFFAOYSA-M 0.000 description 12
- 240000008042 Zea mays Species 0.000 description 12
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 12
- 230000000968 intestinal effect Effects 0.000 description 12
- 239000007788 liquid Substances 0.000 description 12
- 239000011535 reaction buffer Substances 0.000 description 12
- 239000001632 sodium acetate Substances 0.000 description 12
- 235000017281 sodium acetate Nutrition 0.000 description 12
- 238000005406 washing Methods 0.000 description 12
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 12
- 241000228245 Aspergillus niger Species 0.000 description 11
- 241000223218 Fusarium Species 0.000 description 11
- 241000235648 Pichia Species 0.000 description 11
- 108010048241 acetamidase Proteins 0.000 description 11
- 230000010076 replication Effects 0.000 description 11
- MEIRRNXMZYDVDW-MQQKCMAXSA-N (2E,4E)-2,4-hexadien-1-ol Chemical compound C\C=C\C=C\CO MEIRRNXMZYDVDW-MQQKCMAXSA-N 0.000 description 10
- 241000228212 Aspergillus Species 0.000 description 10
- 241000588724 Escherichia coli Species 0.000 description 10
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 10
- 238000012408 PCR amplification Methods 0.000 description 10
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 10
- 241000187747 Streptomyces Species 0.000 description 10
- QAOWNCQODCNURD-UHFFFAOYSA-N Sulfuric acid Chemical compound OS(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-N 0.000 description 10
- 241000223259 Trichoderma Species 0.000 description 10
- 238000007254 oxidation reaction Methods 0.000 description 10
- 238000012360 testing method Methods 0.000 description 10
- UHPMCKVQTMMPCG-UHFFFAOYSA-N 5,8-dihydroxy-2-methoxy-6-methyl-7-(2-oxopropyl)naphthalene-1,4-dione Chemical compound CC1=C(CC(C)=O)C(O)=C2C(=O)C(OC)=CC(=O)C2=C1O UHPMCKVQTMMPCG-UHFFFAOYSA-N 0.000 description 9
- CSCPPACGZOOCGX-UHFFFAOYSA-N Acetone Chemical compound CC(C)=O CSCPPACGZOOCGX-UHFFFAOYSA-N 0.000 description 9
- 241000589516 Pseudomonas Species 0.000 description 9
- 241001494489 Thielavia Species 0.000 description 9
- 150000001720 carbohydrates Chemical class 0.000 description 9
- 238000010367 cloning Methods 0.000 description 9
- 230000003301 hydrolyzing effect Effects 0.000 description 9
- 230000003647 oxidation Effects 0.000 description 9
- 238000012807 shake-flask culturing Methods 0.000 description 9
- 239000010902 straw Substances 0.000 description 9
- 229960003487 xylose Drugs 0.000 description 9
- 241000194108 Bacillus licheniformis Species 0.000 description 8
- UGFAIRIUMAVXCW-UHFFFAOYSA-N Carbon monoxide Chemical compound [O+]#[C-] UGFAIRIUMAVXCW-UHFFFAOYSA-N 0.000 description 8
- SRBFZHDQGSBBOR-IOVATXLUSA-N D-xylopyranose Chemical compound O[C@@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-IOVATXLUSA-N 0.000 description 8
- 244000285963 Kluyveromyces fragilis Species 0.000 description 8
- 235000014663 Kluyveromyces fragilis Nutrition 0.000 description 8
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 8
- 229910002091 carbon monoxide Inorganic materials 0.000 description 8
- 239000001768 carboxy methyl cellulose Substances 0.000 description 8
- 235000010948 carboxy methyl cellulose Nutrition 0.000 description 8
- 239000008112 carboxymethyl-cellulose Substances 0.000 description 8
- 238000004880 explosion Methods 0.000 description 8
- 230000013595 glycosylation Effects 0.000 description 8
- 238000006206 glycosylation reaction Methods 0.000 description 8
- 238000011081 inoculation Methods 0.000 description 8
- JVTAAEKCZFNVCJ-UHFFFAOYSA-N lactic acid Chemical compound CC(O)C(O)=O JVTAAEKCZFNVCJ-UHFFFAOYSA-N 0.000 description 8
- 239000003550 marker Substances 0.000 description 8
- 239000011780 sodium chloride Substances 0.000 description 8
- 230000009466 transformation Effects 0.000 description 8
- 229920001817 Agar Polymers 0.000 description 7
- GUBGYTABKSRVRQ-CUHNMECISA-N D-Cellobiose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-CUHNMECISA-N 0.000 description 7
- 102000004157 Hydrolases Human genes 0.000 description 7
- 108090000604 Hydrolases Proteins 0.000 description 7
- 241000235649 Kluyveromyces Species 0.000 description 7
- 108091036333 Rapid DNA Proteins 0.000 description 7
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 7
- 241000588902 Zymomonas mobilis Species 0.000 description 7
- 239000008272 agar Substances 0.000 description 7
- 235000014633 carbohydrates Nutrition 0.000 description 7
- 230000003197 catalytic effect Effects 0.000 description 7
- 210000002421 cell wall Anatomy 0.000 description 7
- 150000001875 compounds Chemical class 0.000 description 7
- 230000001276 controlling effect Effects 0.000 description 7
- 230000002255 enzymatic effect Effects 0.000 description 7
- 235000009973 maize Nutrition 0.000 description 7
- 230000001105 regulatory effect Effects 0.000 description 7
- 108091008146 restriction endonucleases Proteins 0.000 description 7
- 238000000926 separation method Methods 0.000 description 7
- 238000003756 stirring Methods 0.000 description 7
- 238000000108 ultra-filtration Methods 0.000 description 7
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 6
- DLFVBJFMPXGRIB-UHFFFAOYSA-N Acetamide Chemical compound CC(N)=O DLFVBJFMPXGRIB-UHFFFAOYSA-N 0.000 description 6
- 241000228215 Aspergillus aculeatus Species 0.000 description 6
- ROFVEXUMMXZLPA-UHFFFAOYSA-N Bipyridyl Chemical group N1=CC=CC=C1C1=CC=CC=N1 ROFVEXUMMXZLPA-UHFFFAOYSA-N 0.000 description 6
- 241000196324 Embryophyta Species 0.000 description 6
- 241000605909 Fusobacterium Species 0.000 description 6
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 6
- 108091028043 Nucleic acid sequence Proteins 0.000 description 6
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 6
- 108091081024 Start codon Proteins 0.000 description 6
- 241000194017 Streptococcus Species 0.000 description 6
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 6
- 229940041514 candida albicans extract Drugs 0.000 description 6
- 238000004043 dyeing Methods 0.000 description 6
- 238000004520 electroporation Methods 0.000 description 6
- 108010091371 endoglucanase 1 Proteins 0.000 description 6
- 230000001965 increasing effect Effects 0.000 description 6
- 108020004999 messenger RNA Proteins 0.000 description 6
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 6
- 229930182817 methionine Natural products 0.000 description 6
- 230000008488 polyadenylation Effects 0.000 description 6
- 239000001965 potato dextrose agar Substances 0.000 description 6
- 238000002731 protein assay Methods 0.000 description 6
- 230000001360 synchronised effect Effects 0.000 description 6
- 230000014616 translation Effects 0.000 description 6
- 239000012138 yeast extract Substances 0.000 description 6
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 5
- 239000004382 Amylase Substances 0.000 description 5
- 108010065511 Amylases Proteins 0.000 description 5
- 102000013142 Amylases Human genes 0.000 description 5
- 241001225321 Aspergillus fumigatus Species 0.000 description 5
- 101000757144 Aspergillus niger Glucoamylase Proteins 0.000 description 5
- 241000193744 Bacillus amyloliquefaciens Species 0.000 description 5
- 102000005575 Cellulases Human genes 0.000 description 5
- 108010084185 Cellulases Proteins 0.000 description 5
- 238000001712 DNA sequencing Methods 0.000 description 5
- CWYNVVGOOAEACU-UHFFFAOYSA-N Fe2+ Chemical compound [Fe+2] CWYNVVGOOAEACU-UHFFFAOYSA-N 0.000 description 5
- 239000004471 Glycine Substances 0.000 description 5
- 241000223198 Humicola Species 0.000 description 5
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 5
- 241000235395 Mucor Species 0.000 description 5
- UBQYURCVBFRUQT-UHFFFAOYSA-N N-benzoyl-Ferrioxamine B Chemical compound CC(=O)N(O)CCCCCNC(=O)CCC(=O)N(O)CCCCCNC(=O)CCC(=O)N(O)CCCCCN UBQYURCVBFRUQT-UHFFFAOYSA-N 0.000 description 5
- 241000235403 Rhizomucor miehei Species 0.000 description 5
- 241000235346 Schizosaccharomyces Species 0.000 description 5
- 241000187432 Streptomyces coelicolor Species 0.000 description 5
- 241001655322 Streptomycetales Species 0.000 description 5
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 5
- SRBFZHDQGSBBOR-LECHCGJUSA-N alpha-D-xylose Chemical compound O[C@@H]1CO[C@H](O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-LECHCGJUSA-N 0.000 description 5
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 5
- 235000019418 amylase Nutrition 0.000 description 5
- 229940091771 aspergillus fumigatus Drugs 0.000 description 5
- GUBGYTABKSRVRQ-QUYVBRFLSA-N beta-maltose Chemical compound OC[C@H]1O[C@H](O[C@H]2[C@H](O)[C@@H](O)[C@H](O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@@H]1O GUBGYTABKSRVRQ-QUYVBRFLSA-N 0.000 description 5
- 238000010364 biochemical engineering Methods 0.000 description 5
- 229910052799 carbon Inorganic materials 0.000 description 5
- 239000002299 complementary DNA Substances 0.000 description 5
- 235000005822 corn Nutrition 0.000 description 5
- 238000012258 culturing Methods 0.000 description 5
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 5
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 description 5
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 description 5
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 5
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 description 5
- 229960000958 deferoxamine Drugs 0.000 description 5
- 238000001962 electrophoresis Methods 0.000 description 5
- 238000007710 freezing Methods 0.000 description 5
- 230000008014 freezing Effects 0.000 description 5
- 125000003147 glycosyl group Chemical group 0.000 description 5
- 230000012010 growth Effects 0.000 description 5
- 239000001257 hydrogen Substances 0.000 description 5
- 229910052739 hydrogen Inorganic materials 0.000 description 5
- 230000000813 microbial effect Effects 0.000 description 5
- 238000002156 mixing Methods 0.000 description 5
- 235000016709 nutrition Nutrition 0.000 description 5
- 239000003960 organic solvent Substances 0.000 description 5
- 150000002972 pentoses Chemical class 0.000 description 5
- 238000007781 pre-processing Methods 0.000 description 5
- 210000001938 protoplast Anatomy 0.000 description 5
- 230000002441 reversible effect Effects 0.000 description 5
- 238000012552 review Methods 0.000 description 5
- 238000013519 translation Methods 0.000 description 5
- 238000009279 wet oxidation reaction Methods 0.000 description 5
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 5
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 4
- ALRHLSYJTWAHJZ-UHFFFAOYSA-N 3-hydroxypropionic acid Chemical compound OCCC(O)=O ALRHLSYJTWAHJZ-UHFFFAOYSA-N 0.000 description 4
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 4
- 244000063299 Bacillus subtilis Species 0.000 description 4
- 235000014469 Bacillus subtilis Nutrition 0.000 description 4
- 241000221198 Basidiomycota Species 0.000 description 4
- IZFQZZZGGIUQIW-UHFFFAOYSA-N C(=O)NN.OC1=CC=CC=C1 Chemical compound C(=O)NN.OC1=CC=CC=C1 IZFQZZZGGIUQIW-UHFFFAOYSA-N 0.000 description 4
- ODINCKMPIJJUCX-UHFFFAOYSA-N Calcium oxide Chemical compound [Ca]=O ODINCKMPIJJUCX-UHFFFAOYSA-N 0.000 description 4
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 4
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 4
- 241000193403 Clostridium Species 0.000 description 4
- 101100373011 Drosophila melanogaster wapl gene Proteins 0.000 description 4
- 102000010911 Enzyme Precursors Human genes 0.000 description 4
- 108010062466 Enzyme Precursors Proteins 0.000 description 4
- VZCYOOQTPOCHFL-OWOJBTEDSA-N Fumaric acid Chemical compound OC(=O)\C=C\C(O)=O VZCYOOQTPOCHFL-OWOJBTEDSA-N 0.000 description 4
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 4
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 4
- 101100394006 Humicola insolens CEL7B gene Proteins 0.000 description 4
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 4
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 4
- 101100166798 Magnaporthe oryzae (strain 70-15 / ATCC MYA-4617 / FGSC 8958) cel3A gene Proteins 0.000 description 4
- LRHPLDYGYMQRHN-UHFFFAOYSA-N N-Butanol Chemical class CCCCO LRHPLDYGYMQRHN-UHFFFAOYSA-N 0.000 description 4
- XUYPXLNMDZIRQH-LURJTMIESA-N N-acetyl-L-methionine Chemical compound CSCC[C@@H](C(O)=O)NC(C)=O XUYPXLNMDZIRQH-LURJTMIESA-N 0.000 description 4
- 241000233654 Oomycetes Species 0.000 description 4
- 235000001006 Saccharomyces cerevisiae var diastaticus Nutrition 0.000 description 4
- 244000206963 Saccharomyces cerevisiae var. diastaticus Species 0.000 description 4
- 241000264435 Streptococcus dysgalactiae subsp. equisimilis Species 0.000 description 4
- 241000193996 Streptococcus pyogenes Species 0.000 description 4
- 241000194054 Streptococcus uberis Species 0.000 description 4
- 241000187392 Streptomyces griseus Species 0.000 description 4
- 229930006000 Sucrose Natural products 0.000 description 4
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 4
- 239000005864 Sulphur Substances 0.000 description 4
- 239000007983 Tris buffer Substances 0.000 description 4
- 229930003756 Vitamin B7 Natural products 0.000 description 4
- 238000010306 acid treatment Methods 0.000 description 4
- 239000003513 alkali Substances 0.000 description 4
- SRBFZHDQGSBBOR-QMKXCQHVSA-N alpha-L-arabinopyranose Chemical compound O[C@H]1CO[C@@H](O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-QMKXCQHVSA-N 0.000 description 4
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 4
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 4
- 235000003704 aspartic acid Nutrition 0.000 description 4
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 4
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 4
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 4
- 235000013339 cereals Nutrition 0.000 description 4
- 239000003153 chemical reaction reagent Substances 0.000 description 4
- 239000008367 deionised water Substances 0.000 description 4
- 229910021641 deionized water Inorganic materials 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- XBDQKXXYIPTUBI-UHFFFAOYSA-N dimethylselenoniopropionate Natural products CCC(O)=O XBDQKXXYIPTUBI-UHFFFAOYSA-N 0.000 description 4
- 239000000975 dye Substances 0.000 description 4
- 239000000446 fuel Substances 0.000 description 4
- 235000003869 genetically modified organism Nutrition 0.000 description 4
- 239000011521 glass Substances 0.000 description 4
- JFCQEDHGNNZCLN-UHFFFAOYSA-N glutaric acid Chemical compound OC(=O)CCCC(O)=O JFCQEDHGNNZCLN-UHFFFAOYSA-N 0.000 description 4
- 230000008676 import Effects 0.000 description 4
- 229910017053 inorganic salt Inorganic materials 0.000 description 4
- 150000002500 ions Chemical class 0.000 description 4
- 229910052742 iron Inorganic materials 0.000 description 4
- LVHBHZANLOWSRM-UHFFFAOYSA-N itaconic acid Chemical compound OC(=O)CC(=C)C(O)=O LVHBHZANLOWSRM-UHFFFAOYSA-N 0.000 description 4
- 239000004310 lactic acid Substances 0.000 description 4
- 235000014655 lactic acid Nutrition 0.000 description 4
- 229920005610 lignin Polymers 0.000 description 4
- 239000002029 lignocellulosic biomass Substances 0.000 description 4
- 208000012396 long COVID-19 Diseases 0.000 description 4
- 238000009996 mechanical pre-treatment Methods 0.000 description 4
- HEBKCHPVOIAQTA-UHFFFAOYSA-N meso ribitol Natural products OCC(O)C(O)C(O)CO HEBKCHPVOIAQTA-UHFFFAOYSA-N 0.000 description 4
- BDAGIHXWWSANSR-UHFFFAOYSA-N methanoic acid Natural products OC=O BDAGIHXWWSANSR-UHFFFAOYSA-N 0.000 description 4
- 238000003801 milling Methods 0.000 description 4
- 239000010813 municipal solid waste Substances 0.000 description 4
- 230000007935 neutral effect Effects 0.000 description 4
- 229920001542 oligosaccharide Polymers 0.000 description 4
- 239000010893 paper waste Substances 0.000 description 4
- 239000002245 particle Substances 0.000 description 4
- 210000004483 pasc Anatomy 0.000 description 4
- 230000005855 radiation Effects 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 230000001954 sterilising effect Effects 0.000 description 4
- 238000004659 sterilization and disinfection Methods 0.000 description 4
- 229940115922 streptococcus uberis Drugs 0.000 description 4
- 239000005720 sucrose Substances 0.000 description 4
- 239000000725 suspension Substances 0.000 description 4
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 4
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 4
- 229940045145 uridine Drugs 0.000 description 4
- 235000011912 vitamin B7 Nutrition 0.000 description 4
- 239000011735 vitamin B7 Substances 0.000 description 4
- 239000002023 wood Substances 0.000 description 4
- AXAVXPMQTGXXJZ-UHFFFAOYSA-N 2-aminoacetic acid;2-amino-2-(hydroxymethyl)propane-1,3-diol Chemical compound NCC(O)=O.OCC(N)(CO)CO AXAVXPMQTGXXJZ-UHFFFAOYSA-N 0.000 description 3
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 3
- 240000000073 Achillea millefolium Species 0.000 description 3
- 235000007754 Achillea millefolium Nutrition 0.000 description 3
- 102100034044 All-trans-retinol dehydrogenase [NAD(+)] ADH1B Human genes 0.000 description 3
- 101710193111 All-trans-retinol dehydrogenase [NAD(+)] ADH4 Proteins 0.000 description 3
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Natural products OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 description 3
- 241001513093 Aspergillus awamori Species 0.000 description 3
- 241001480052 Aspergillus japonicus Species 0.000 description 3
- 241000223651 Aureobasidium Species 0.000 description 3
- 241000193752 Bacillus circulans Species 0.000 description 3
- 241000193749 Bacillus coagulans Species 0.000 description 3
- 241000193747 Bacillus firmus Species 0.000 description 3
- 241000194107 Bacillus megaterium Species 0.000 description 3
- 241000194103 Bacillus pumilus Species 0.000 description 3
- 241000193388 Bacillus thuringiensis Species 0.000 description 3
- 241000193764 Brevibacillus brevis Species 0.000 description 3
- 229920000018 Callose Polymers 0.000 description 3
- 241000589876 Campylobacter Species 0.000 description 3
- 101000898643 Candida albicans Vacuolar aspartic protease Proteins 0.000 description 3
- 101000898783 Candida tropicalis Candidapepsin Proteins 0.000 description 3
- 241000146399 Ceriporiopsis Species 0.000 description 3
- 241001248634 Chaetomium thermophilum Species 0.000 description 3
- 241000123346 Chrysosporium Species 0.000 description 3
- 229920000742 Cotton Polymers 0.000 description 3
- 241001362614 Crassa Species 0.000 description 3
- 101000898784 Cryphonectria parasitica Endothiapepsin Proteins 0.000 description 3
- 241001337994 Cryptococcus <scale insect> Species 0.000 description 3
- 241000235646 Cyberlindnera jadinii Species 0.000 description 3
- 102000012410 DNA Ligases Human genes 0.000 description 3
- 108010061982 DNA Ligases Proteins 0.000 description 3
- 229920002307 Dextran Polymers 0.000 description 3
- 241000194033 Enterococcus Species 0.000 description 3
- 241000589565 Flavobacterium Species 0.000 description 3
- 241000223195 Fusarium graminearum Species 0.000 description 3
- 241000221779 Fusarium sambucinum Species 0.000 description 3
- IAJILQKETJEXLJ-UHFFFAOYSA-N Galacturonsaeure Natural products O=CC(O)C(O)C(O)C(O)C(O)=O IAJILQKETJEXLJ-UHFFFAOYSA-N 0.000 description 3
- 244000286779 Hansenula anomala Species 0.000 description 3
- 235000014683 Hansenula anomala Nutrition 0.000 description 3
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 3
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 3
- 241000186660 Lactobacillus Species 0.000 description 3
- 241000194036 Lactococcus Species 0.000 description 3
- 241000226677 Myceliophthora Species 0.000 description 3
- 241000588653 Neisseria Species 0.000 description 3
- 241000221960 Neurospora Species 0.000 description 3
- 108700026244 Open Reading Frames Proteins 0.000 description 3
- 240000007594 Oryza sativa Species 0.000 description 3
- 235000007164 Oryza sativa Nutrition 0.000 description 3
- 241001236817 Paecilomyces <Clavicipitaceae> Species 0.000 description 3
- 241000194109 Paenibacillus lautus Species 0.000 description 3
- 241000228143 Penicillium Species 0.000 description 3
- 229920001131 Pulp (paper) Polymers 0.000 description 3
- 101000933133 Rhizopus niveus Rhizopuspepsin-1 Proteins 0.000 description 3
- 101000910082 Rhizopus niveus Rhizopuspepsin-2 Proteins 0.000 description 3
- 101000910079 Rhizopus niveus Rhizopuspepsin-3 Proteins 0.000 description 3
- 101000910086 Rhizopus niveus Rhizopuspepsin-4 Proteins 0.000 description 3
- 101000910088 Rhizopus niveus Rhizopuspepsin-5 Proteins 0.000 description 3
- 241000190932 Rhodopseudomonas Species 0.000 description 3
- 241000235070 Saccharomyces Species 0.000 description 3
- 235000003534 Saccharomyces carlsbergensis Nutrition 0.000 description 3
- 101000898773 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) Saccharopepsin Proteins 0.000 description 3
- 241001123227 Saccharomyces pastorianus Species 0.000 description 3
- 241000607142 Salmonella Species 0.000 description 3
- 241000222480 Schizophyllum Species 0.000 description 3
- 241000191940 Staphylococcus Species 0.000 description 3
- 241000194048 Streptococcus equi Species 0.000 description 3
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 3
- 241000228341 Talaromyces Species 0.000 description 3
- 241001540751 Talaromyces ruber Species 0.000 description 3
- 108020005038 Terminator Codon Proteins 0.000 description 3
- IXKSXJFAGXLQOQ-XISFHERQSA-N WHWLQLKPGQPMY Chemical compound C([C@@H](C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CNC=N1 IXKSXJFAGXLQOQ-XISFHERQSA-N 0.000 description 3
- 241000607479 Yersinia pestis Species 0.000 description 3
- 241000588901 Zymomonas Species 0.000 description 3
- 241000222124 [Candida] boidinii Species 0.000 description 3
- 230000001476 alcoholic effect Effects 0.000 description 3
- IAJILQKETJEXLJ-QTBDOELSSA-N aldehydo-D-glucuronic acid Chemical compound O=C[C@H](O)[C@@H](O)[C@H](O)[C@H](O)C(O)=O IAJILQKETJEXLJ-QTBDOELSSA-N 0.000 description 3
- 229940054340 bacillus coagulans Drugs 0.000 description 3
- 229940005348 bacillus firmus Drugs 0.000 description 3
- 229940097012 bacillus thuringiensis Drugs 0.000 description 3
- 239000004202 carbamide Substances 0.000 description 3
- 239000003054 catalyst Substances 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 3
- 238000004587 chromatography analysis Methods 0.000 description 3
- 238000010612 desalination reaction Methods 0.000 description 3
- 238000011033 desalting Methods 0.000 description 3
- 238000011026 diafiltration Methods 0.000 description 3
- 238000010790 dilution Methods 0.000 description 3
- 239000012895 dilution Substances 0.000 description 3
- 230000005672 electromagnetic field Effects 0.000 description 3
- 108010091384 endoglucanase 2 Proteins 0.000 description 3
- 229910001448 ferrous ion Inorganic materials 0.000 description 3
- 238000013467 fragmentation Methods 0.000 description 3
- 238000006062 fragmentation reaction Methods 0.000 description 3
- 238000001502 gel electrophoresis Methods 0.000 description 3
- 229940097043 glucuronic acid Drugs 0.000 description 3
- 102000006602 glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 3
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 3
- 238000010438 heat treatment Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000007373 indentation Methods 0.000 description 3
- 230000001939 inductive effect Effects 0.000 description 3
- 229910052500 inorganic mineral Inorganic materials 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 229940039696 lactobacillus Drugs 0.000 description 3
- 239000012160 loading buffer Substances 0.000 description 3
- 238000012269 metabolic engineering Methods 0.000 description 3
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 3
- 235000010755 mineral Nutrition 0.000 description 3
- 239000011707 mineral Substances 0.000 description 3
- 150000002482 oligosaccharides Chemical class 0.000 description 3
- 229910052760 oxygen Inorganic materials 0.000 description 3
- 229930029653 phosphoenolpyruvate Natural products 0.000 description 3
- DTBNBXWJWCWCIK-UHFFFAOYSA-N phosphoenolpyruvic acid Chemical compound OC(=O)C(=C)OP(O)(O)=O DTBNBXWJWCWCIK-UHFFFAOYSA-N 0.000 description 3
- 229920001282 polysaccharide Polymers 0.000 description 3
- 239000005017 polysaccharide Substances 0.000 description 3
- 150000004804 polysaccharides Chemical class 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 238000003259 recombinant expression Methods 0.000 description 3
- 238000006722 reduction reaction Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 235000009566 rice Nutrition 0.000 description 3
- 239000012146 running buffer Substances 0.000 description 3
- 150000003839 salts Chemical class 0.000 description 3
- 239000012723 sample buffer Substances 0.000 description 3
- 230000003248 secreting effect Effects 0.000 description 3
- 230000028327 secretion Effects 0.000 description 3
- 239000002002 slurry Substances 0.000 description 3
- XOWYRPMCSXELDS-UHFFFAOYSA-N sodium;4-[(4-anilino-5-sulfonaphthalen-1-yl)diazenyl]-5-hydroxynaphthalene-2,7-disulfonic acid Chemical compound [Na+].C=12C(O)=CC(S(O)(=O)=O)=CC2=CC(S(O)(=O)=O)=CC=1N=NC(C1=CC=CC(=C11)S(O)(=O)=O)=CC=C1NC1=CC=CC=C1 XOWYRPMCSXELDS-UHFFFAOYSA-N 0.000 description 3
- 230000006641 stabilisation Effects 0.000 description 3
- 238000011105 stabilization Methods 0.000 description 3
- 230000004936 stimulating effect Effects 0.000 description 3
- 239000006188 syrup Substances 0.000 description 3
- 235000020357 syrup Nutrition 0.000 description 3
- 238000010361 transduction Methods 0.000 description 3
- 230000026683 transduction Effects 0.000 description 3
- 230000001810 trypsinlike Effects 0.000 description 3
- 108010046845 tryptones Proteins 0.000 description 3
- 229930003231 vitamin Natural products 0.000 description 3
- 235000013343 vitamin Nutrition 0.000 description 3
- 239000011782 vitamin Substances 0.000 description 3
- 229940088594 vitamin Drugs 0.000 description 3
- 150000003722 vitamin derivatives Chemical class 0.000 description 3
- 239000003643 water by type Substances 0.000 description 3
- 210000005253 yeast cell Anatomy 0.000 description 3
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 2
- GHOKWGTUZJEAQD-ZETCQYMHSA-N (D)-(+)-Pantothenic acid Chemical compound OCC(C)(C)[C@@H](O)C(=O)NCCC(O)=O GHOKWGTUZJEAQD-ZETCQYMHSA-N 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 2
- IFBHRQDFSNCLOZ-UHFFFAOYSA-N 2-(hydroxymethyl)-6-(4-nitrophenoxy)oxane-3,4,5-triol Chemical compound OC1C(O)C(O)C(CO)OC1OC1=CC=C([N+]([O-])=O)C=C1 IFBHRQDFSNCLOZ-UHFFFAOYSA-N 0.000 description 2
- UXFQFBNBSPQBJW-UHFFFAOYSA-N 2-amino-2-methylpropane-1,3-diol Chemical compound OCC(N)(C)CO UXFQFBNBSPQBJW-UHFFFAOYSA-N 0.000 description 2
- BWLBGMIXKSTLSX-UHFFFAOYSA-N 2-hydroxyisobutyric acid Chemical compound CC(C)(O)C(O)=O BWLBGMIXKSTLSX-UHFFFAOYSA-N 0.000 description 2
- QJZYHAIUNVAGQP-UHFFFAOYSA-N 3-nitrobicyclo[2.2.1]hept-5-ene-2,3-dicarboxylic acid Chemical compound C1C2C=CC1C(C(=O)O)C2(C(O)=O)[N+]([O-])=O QJZYHAIUNVAGQP-UHFFFAOYSA-N 0.000 description 2
- OSWFIVFLDKOXQC-UHFFFAOYSA-N 4-(3-methoxyphenyl)aniline Chemical compound COC1=CC=CC(C=2C=CC(N)=CC=2)=C1 OSWFIVFLDKOXQC-UHFFFAOYSA-N 0.000 description 2
- ALYNCZNDIQEVRV-UHFFFAOYSA-N 4-aminobenzoic acid Chemical compound NC1=CC=C(C(O)=O)C=C1 ALYNCZNDIQEVRV-UHFFFAOYSA-N 0.000 description 2
- ZMZGIVVRBMFZSG-UHFFFAOYSA-N 4-hydroxybenzohydrazide Chemical compound NNC(=O)C1=CC=C(O)C=C1 ZMZGIVVRBMFZSG-UHFFFAOYSA-N 0.000 description 2
- 241000222518 Agaricus Species 0.000 description 2
- 241000220433 Albizia Species 0.000 description 2
- 102000007698 Alcohol dehydrogenase Human genes 0.000 description 2
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 2
- 241000223600 Alternaria Species 0.000 description 2
- 244000144725 Amygdalus communis Species 0.000 description 2
- 101100163849 Arabidopsis thaliana ARS1 gene Proteins 0.000 description 2
- 101710152845 Arabinogalactan endo-beta-1,4-galactanase Proteins 0.000 description 2
- 101000690713 Aspergillus niger Alpha-glucosidase Proteins 0.000 description 2
- 101900318521 Aspergillus oryzae Triosephosphate isomerase Proteins 0.000 description 2
- 241001112741 Bacillaceae Species 0.000 description 2
- 108090000145 Bacillolysin Proteins 0.000 description 2
- 241000722885 Brettanomyces Species 0.000 description 2
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 2
- 108010022172 Chitinases Proteins 0.000 description 2
- 102000012286 Chitinases Human genes 0.000 description 2
- 241000985909 Chrysosporium keratinophilum Species 0.000 description 2
- 241001674001 Chrysosporium tropicum Species 0.000 description 2
- 241000233652 Chytridiomycota Species 0.000 description 2
- 241000235457 Chytridium Species 0.000 description 2
- 241000221760 Claviceps Species 0.000 description 2
- 241001508811 Clavispora Species 0.000 description 2
- 241000228437 Cochliobolus Species 0.000 description 2
- 241000222511 Coprinus Species 0.000 description 2
- 244000251987 Coprinus macrorhizus Species 0.000 description 2
- 235000001673 Coprinus macrorhizus Nutrition 0.000 description 2
- 241000222356 Coriolus Species 0.000 description 2
- HEBKCHPVOIAQTA-QWWZWVQMSA-N D-arabinitol Chemical compound OC[C@@H](O)C(O)[C@H](O)CO HEBKCHPVOIAQTA-QWWZWVQMSA-N 0.000 description 2
- DSLZVSRJTYRBFB-LLEIAEIESA-N D-glucaric acid Chemical compound OC(=O)[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C(O)=O DSLZVSRJTYRBFB-LLEIAEIESA-N 0.000 description 2
- PHOQVHQSTUBQQK-SQOUGZDYSA-N D-glucono-1,5-lactone Chemical compound OC[C@H]1OC(=O)[C@H](O)[C@@H](O)[C@@H]1O PHOQVHQSTUBQQK-SQOUGZDYSA-N 0.000 description 2
- QXKAIJAYHKCRRA-UHFFFAOYSA-N D-lyxonic acid Natural products OCC(O)C(O)C(O)C(O)=O QXKAIJAYHKCRRA-UHFFFAOYSA-N 0.000 description 2
- QXKAIJAYHKCRRA-FLRLBIABSA-N D-xylonic acid Chemical compound OC[C@@H](O)[C@H](O)[C@@H](O)C(O)=O QXKAIJAYHKCRRA-FLRLBIABSA-N 0.000 description 2
- ZAQJHHRNXZUBTE-WUJLRWPWSA-N D-xylulose Chemical compound OC[C@@H](O)[C@H](O)C(=O)CO ZAQJHHRNXZUBTE-WUJLRWPWSA-N 0.000 description 2
- 108010054576 Deoxyribonuclease EcoRI Proteins 0.000 description 2
- 241000935926 Diplodia Species 0.000 description 2
- 101150015836 ENO1 gene Proteins 0.000 description 2
- 241001063191 Elops affinis Species 0.000 description 2
- 101710132690 Endo-1,4-beta-xylanase A Proteins 0.000 description 2
- 101710147028 Endo-beta-1,4-galactanase Proteins 0.000 description 2
- 241000588698 Erwinia Species 0.000 description 2
- 235000002756 Erythrina berteroana Nutrition 0.000 description 2
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical compound OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 2
- 241000206602 Eukaryota Species 0.000 description 2
- 241000221433 Exidia Species 0.000 description 2
- 241000567163 Fusarium cerealis Species 0.000 description 2
- 241000146406 Fusarium heterosporum Species 0.000 description 2
- 102000048120 Galactokinases Human genes 0.000 description 2
- 108700023157 Galactokinases Proteins 0.000 description 2
- 101100369308 Geobacillus stearothermophilus nprS gene Proteins 0.000 description 2
- 101100080316 Geobacillus stearothermophilus nprT gene Proteins 0.000 description 2
- 102000005744 Glycoside Hydrolases Human genes 0.000 description 2
- 108010031186 Glycoside Hydrolases Proteins 0.000 description 2
- VEXZGXHMUGYJMC-UHFFFAOYSA-N Hydrochloric acid Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 description 2
- 101150062179 II gene Proteins 0.000 description 2
- 241000006384 Jeotgalibacillus marinus Species 0.000 description 2
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 2
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 2
- 239000012741 Laemmli sample buffer Substances 0.000 description 2
- 108090001060 Lipase Proteins 0.000 description 2
- 102000004882 Lipase Human genes 0.000 description 2
- 239000004367 Lipase Substances 0.000 description 2
- 241001344131 Magnaporthe grisea Species 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- 241001184659 Melanocarpus albomyces Species 0.000 description 2
- 108090000157 Metallothionein Proteins 0.000 description 2
- 229920000168 Microcrystalline cellulose Polymers 0.000 description 2
- 241000204031 Mycoplasma Species 0.000 description 2
- 102000035092 Neutral proteases Human genes 0.000 description 2
- 108091005507 Neutral proteases Proteins 0.000 description 2
- PVNIIMVLHYAWGP-UHFFFAOYSA-N Niacin Chemical compound OC(=O)C1=CC=CN=C1 PVNIIMVLHYAWGP-UHFFFAOYSA-N 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- 241000235647 Pachysolen tannophilus Species 0.000 description 2
- 241001520808 Panicum virgatum Species 0.000 description 2
- 108091000080 Phosphotransferase Proteins 0.000 description 2
- 241000222350 Pleurotus Species 0.000 description 2
- 229920001030 Polyethylene Glycol 4000 Polymers 0.000 description 2
- 241000222640 Polyporus Species 0.000 description 2
- OFOBLEOULBTSOW-UHFFFAOYSA-N Propanedioic acid Natural products OC(=O)CC(O)=O OFOBLEOULBTSOW-UHFFFAOYSA-N 0.000 description 2
- 241000235402 Rhizomucor Species 0.000 description 2
- AUNGANRZJHBGPY-SCRDCRAPSA-N Riboflavin Chemical compound OC[C@@H](O)[C@@H](O)[C@@H](O)CN1C=2C=C(C)C(C)=CC=2N=C2C1=NC(=O)NC2=O AUNGANRZJHBGPY-SCRDCRAPSA-N 0.000 description 2
- 235000018368 Saccharomyces fragilis Nutrition 0.000 description 2
- 241000582914 Saccharomyces uvarum Species 0.000 description 2
- 241000235343 Saccharomycetales Species 0.000 description 2
- 241000235060 Scheffersomyces stipitis Species 0.000 description 2
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 2
- 101100097319 Schizosaccharomyces pombe (strain 972 / ATCC 24843) ala1 gene Proteins 0.000 description 2
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 2
- 201000004283 Shwachman-Diamond syndrome Diseases 0.000 description 2
- CDBYLPFSWZWCQE-UHFFFAOYSA-L Sodium Carbonate Chemical compound [Na+].[Na+].[O-]C([O-])=O CDBYLPFSWZWCQE-UHFFFAOYSA-L 0.000 description 2
- 241000187391 Streptomyces hygroscopicus Species 0.000 description 2
- 108090000787 Subtilisin Proteins 0.000 description 2
- 241001136494 Talaromyces funiculosus Species 0.000 description 2
- 241000228178 Thermoascus Species 0.000 description 2
- 241000203780 Thermobifida fusca Species 0.000 description 2
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 2
- 239000004473 Threonine Substances 0.000 description 2
- 241000222354 Trametes Species 0.000 description 2
- 102000005924 Triose-Phosphate Isomerase Human genes 0.000 description 2
- 108700015934 Triose-phosphate isomerases Proteins 0.000 description 2
- 101150050575 URA3 gene Proteins 0.000 description 2
- 241000082085 Verticillium <Phyllachorales> Species 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 235000009754 Vitis X bourquina Nutrition 0.000 description 2
- 235000012333 Vitis X labruscana Nutrition 0.000 description 2
- 240000006365 Vitis vinifera Species 0.000 description 2
- 235000014787 Vitis vinifera Nutrition 0.000 description 2
- 241001507667 Volvariella Species 0.000 description 2
- 241001523965 Xylaria Species 0.000 description 2
- TVXBFESIOXBWNM-UHFFFAOYSA-N Xylitol Natural products OCCC(O)C(O)C(O)CCO TVXBFESIOXBWNM-UHFFFAOYSA-N 0.000 description 2
- 229920002000 Xyloglucan Polymers 0.000 description 2
- 241000758405 Zoopagomycotina Species 0.000 description 2
- DPDMMXDBJGCCQC-UHFFFAOYSA-N [Na].[Cl] Chemical compound [Na].[Cl] DPDMMXDBJGCCQC-UHFFFAOYSA-N 0.000 description 2
- 150000007513 acids Chemical class 0.000 description 2
- 239000000654 additive Substances 0.000 description 2
- 230000000996 additive effect Effects 0.000 description 2
- 238000000246 agarose gel electrophoresis Methods 0.000 description 2
- WQZGKKKJIJFFOK-PQMKYFCFSA-N alpha-D-mannose Chemical compound OC[C@H]1O[C@H](O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-PQMKYFCFSA-N 0.000 description 2
- JYIBXUUINYLWLR-UHFFFAOYSA-N aluminum;calcium;potassium;silicon;sodium;trihydrate Chemical compound O.O.O.[Na].[Al].[Si].[K].[Ca] JYIBXUUINYLWLR-UHFFFAOYSA-N 0.000 description 2
- 101150078331 ama-1 gene Proteins 0.000 description 2
- 101150069003 amdS gene Proteins 0.000 description 2
- 238000012870 ammonium sulfate precipitation Methods 0.000 description 2
- 239000003242 anti bacterial agent Substances 0.000 description 2
- 229940088710 antibiotic agent Drugs 0.000 description 2
- 210000001367 artery Anatomy 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 2
- 238000005844 autocatalytic reaction Methods 0.000 description 2
- 230000004071 biological effect Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 101150037655 blaA gene Proteins 0.000 description 2
- HKPHPIREJKHECO-UHFFFAOYSA-N butachlor Chemical compound CCCCOCN(C(=O)CCl)C1=C(CC)C=CC=C1CC HKPHPIREJKHECO-UHFFFAOYSA-N 0.000 description 2
- AIYUHDOJVYHVIT-UHFFFAOYSA-M caesium chloride Chemical compound [Cl-].[Cs+] AIYUHDOJVYHVIT-UHFFFAOYSA-M 0.000 description 2
- DKVNPHBNOWQYFE-UHFFFAOYSA-N carbamodithioic acid Chemical compound NC(S)=S DKVNPHBNOWQYFE-UHFFFAOYSA-N 0.000 description 2
- 235000011089 carbon dioxide Nutrition 0.000 description 2
- 150000001732 carboxylic acid derivatives Chemical class 0.000 description 2
- 238000011098 chromatofocusing Methods 0.000 description 2
- 229910001603 clinoptilolite Inorganic materials 0.000 description 2
- 230000003750 conditioning effect Effects 0.000 description 2
- 150000003983 crown ethers Chemical class 0.000 description 2
- 239000012228 culture supernatant Substances 0.000 description 2
- 230000009849 deactivation Effects 0.000 description 2
- 239000013530 defoamer Substances 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 150000002016 disaccharides Chemical class 0.000 description 2
- 108010092413 endoglucanase V Proteins 0.000 description 2
- ZMMJGEGLRURXTF-UHFFFAOYSA-N ethidium bromide Chemical compound [Br-].C12=CC(N)=CC=C2C2=CC=C(N)C=C2[N+](CC)=C1C1=CC=CC=C1 ZMMJGEGLRURXTF-UHFFFAOYSA-N 0.000 description 2
- 229960005542 ethidium bromide Drugs 0.000 description 2
- HCPOCMMGKBZWSJ-UHFFFAOYSA-N ethyl 3-hydrazinyl-3-oxopropanoate Chemical compound CCOC(=O)CC(=O)NN HCPOCMMGKBZWSJ-UHFFFAOYSA-N 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000007717 exclusion Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- OVBPIULPVIDEAO-LBPRGKRZSA-N folic acid Chemical compound C=1N=C2NC(N)=NC(=O)C2=NC=1CNC1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 OVBPIULPVIDEAO-LBPRGKRZSA-N 0.000 description 2
- 235000019253 formic acid Nutrition 0.000 description 2
- 239000001530 fumaric acid Substances 0.000 description 2
- 108010061330 glucan 1,4-alpha-maltohydrolase Proteins 0.000 description 2
- 239000000174 gluconic acid Substances 0.000 description 2
- 235000012208 gluconic acid Nutrition 0.000 description 2
- 235000012209 glucono delta-lactone Nutrition 0.000 description 2
- 229960003681 gluconolactone Drugs 0.000 description 2
- 229960002989 glutamic acid Drugs 0.000 description 2
- 235000011187 glycerol Nutrition 0.000 description 2
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 2
- 229910052737 gold Inorganic materials 0.000 description 2
- 239000010931 gold Substances 0.000 description 2
- 238000000227 grinding Methods 0.000 description 2
- 229910001385 heavy metal Inorganic materials 0.000 description 2
- 150000002402 hexoses Chemical class 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- 238000002744 homologous recombination Methods 0.000 description 2
- 230000006801 homologous recombination Effects 0.000 description 2
- 239000004021 humic acid Substances 0.000 description 2
- 230000002209 hydrophobic effect Effects 0.000 description 2
- 150000002460 imidazoles Chemical class 0.000 description 2
- 238000009655 industrial fermentation Methods 0.000 description 2
- 230000005764 inhibitory process Effects 0.000 description 2
- 238000005342 ion exchange Methods 0.000 description 2
- 229940031154 kluyveromyces marxianus Drugs 0.000 description 2
- 239000012978 lignocellulosic material Substances 0.000 description 2
- 235000019421 lipase Nutrition 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000037353 metabolic pathway Effects 0.000 description 2
- 235000019813 microcrystalline cellulose Nutrition 0.000 description 2
- 239000008108 microcrystalline cellulose Substances 0.000 description 2
- 229940016286 microcrystalline cellulose Drugs 0.000 description 2
- 239000012452 mother liquor Substances 0.000 description 2
- 231100000219 mutagenic Toxicity 0.000 description 2
- 230000003505 mutagenic effect Effects 0.000 description 2
- 229910052757 nitrogen Inorganic materials 0.000 description 2
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 2
- 239000001301 oxygen Substances 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 150000002989 phenols Chemical class 0.000 description 2
- RGCLLPNLLBQHPF-HJWRWDBZSA-N phosphamidon Chemical compound CCN(CC)C(=O)C(\Cl)=C(/C)OP(=O)(OC)OC RGCLLPNLLBQHPF-HJWRWDBZSA-N 0.000 description 2
- 102000020233 phosphotransferase Human genes 0.000 description 2
- IEQIEDJGQAUEQZ-UHFFFAOYSA-N phthalocyanine Chemical compound N1C(N=C2C3=CC=CC=C3C(N=C3C4=CC=CC=C4C(=N4)N3)=N2)=C(C=CC=C2)C2=C1N=C1C2=CC=CC=C2C4=N1 IEQIEDJGQAUEQZ-UHFFFAOYSA-N 0.000 description 2
- 229920002401 polyacrylamide Polymers 0.000 description 2
- 229920001223 polyethylene glycol Polymers 0.000 description 2
- 150000004032 porphyrins Chemical class 0.000 description 2
- 235000019260 propionic acid Nutrition 0.000 description 2
- 101150054232 pyrG gene Proteins 0.000 description 2
- IUVKMZGDUIUOCP-BTNSXGMBSA-N quinbolone Chemical compound O([C@H]1CC[C@H]2[C@H]3[C@@H]([C@]4(C=CC(=O)C=C4CC3)C)CC[C@@]21C)C1=CCCC1 IUVKMZGDUIUOCP-BTNSXGMBSA-N 0.000 description 2
- 239000011541 reaction mixture Substances 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000004062 sedimentation Methods 0.000 description 2
- 238000002741 site-directed mutagenesis Methods 0.000 description 2
- 239000000779 smoke Substances 0.000 description 2
- 235000019832 sodium triphosphate Nutrition 0.000 description 2
- 238000010563 solid-state fermentation Methods 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 230000028070 sporulation Effects 0.000 description 2
- 239000011550 stock solution Substances 0.000 description 2
- 239000013595 supernatant sample Substances 0.000 description 2
- VZCYOOQTPOCHFL-UHFFFAOYSA-N trans-butenedioic acid Natural products OC(=O)C=CC(O)=O VZCYOOQTPOCHFL-UHFFFAOYSA-N 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 238000001890 transfection Methods 0.000 description 2
- UNXRWKVEANCORM-UHFFFAOYSA-I triphosphate(5-) Chemical compound [O-]P([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O UNXRWKVEANCORM-UHFFFAOYSA-I 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 210000002700 urine Anatomy 0.000 description 2
- 235000013311 vegetables Nutrition 0.000 description 2
- 210000003462 vein Anatomy 0.000 description 2
- 238000009736 wetting Methods 0.000 description 2
- 239000000811 xylitol Substances 0.000 description 2
- 235000010447 xylitol Nutrition 0.000 description 2
- HEBKCHPVOIAQTA-SCDXWVJYSA-N xylitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)CO HEBKCHPVOIAQTA-SCDXWVJYSA-N 0.000 description 2
- 229960002675 xylitol Drugs 0.000 description 2
- DIGQNXIGRZPYDK-WKSCXVIASA-N (2R)-6-amino-2-[[2-[[(2S)-2-[[2-[[(2R)-2-[[(2S)-2-[[(2R,3S)-2-[[2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S,3S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2R)-2-[[2-[[2-[[2-[(2-amino-1-hydroxyethylidene)amino]-3-carboxy-1-hydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1,5-dihydroxy-5-iminopentylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]hexanoic acid Chemical compound C[C@@H]([C@@H](C(=N[C@@H](CS)C(=N[C@@H](C)C(=N[C@@H](CO)C(=NCC(=N[C@@H](CCC(=N)O)C(=NC(CS)C(=N[C@H]([C@H](C)O)C(=N[C@H](CS)C(=N[C@H](CO)C(=NCC(=N[C@H](CS)C(=NCC(=N[C@H](CCCCN)C(=O)O)O)O)O)O)O)O)O)O)O)O)O)O)O)N=C([C@H](CS)N=C([C@H](CO)N=C([C@H](CO)N=C([C@H](C)N=C(CN=C([C@H](CO)N=C([C@H](CS)N=C(CN=C(C(CS)N=C(C(CC(=O)O)N=C(CN)O)O)O)O)O)O)O)O)O)O)O)O DIGQNXIGRZPYDK-WKSCXVIASA-N 0.000 description 1
- FQVLRGLGWNWPSS-BXBUPLCLSA-N (4r,7s,10s,13s,16r)-16-acetamido-13-(1h-imidazol-5-ylmethyl)-10-methyl-6,9,12,15-tetraoxo-7-propan-2-yl-1,2-dithia-5,8,11,14-tetrazacycloheptadecane-4-carboxamide Chemical compound N1C(=O)[C@@H](NC(C)=O)CSSC[C@@H](C(N)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)NC(=O)[C@@H]1CC1=CN=CN1 FQVLRGLGWNWPSS-BXBUPLCLSA-N 0.000 description 1
- 101150084750 1 gene Proteins 0.000 description 1
- NWUYHJFMYQTDRP-UHFFFAOYSA-N 1,2-bis(ethenyl)benzene;1-ethenyl-2-ethylbenzene;styrene Chemical compound C=CC1=CC=CC=C1.CCC1=CC=CC=C1C=C.C=CC1=CC=CC=C1C=C NWUYHJFMYQTDRP-UHFFFAOYSA-N 0.000 description 1
- QBPPRVHXOZRESW-UHFFFAOYSA-N 1,4,7,10-tetraazacyclododecane Chemical compound C1CNCCNCCNCCN1 QBPPRVHXOZRESW-UHFFFAOYSA-N 0.000 description 1
- FPIPGXGPPPQFEQ-UHFFFAOYSA-N 13-cis retinol Natural products OCC=C(C)C=CC=C(C)C=CC1=C(C)CCCC1(C)C FPIPGXGPPPQFEQ-UHFFFAOYSA-N 0.000 description 1
- 101710163881 5,6-dihydroxyindole-2-carboxylic acid oxidase Proteins 0.000 description 1
- LXAHHHIGZXPRKQ-UHFFFAOYSA-N 5-fluoro-2-methylpyridine Chemical compound CC1=CC=C(F)C=N1 LXAHHHIGZXPRKQ-UHFFFAOYSA-N 0.000 description 1
- FRXSZNDVFUDTIR-UHFFFAOYSA-N 6-methoxy-1,2,3,4-tetrahydroquinoline Chemical compound N1CCCC2=CC(OC)=CC=C21 FRXSZNDVFUDTIR-UHFFFAOYSA-N 0.000 description 1
- 101150104118 ANS1 gene Proteins 0.000 description 1
- RZVAJINKPMORJF-UHFFFAOYSA-N Acetaminophen Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 1
- 241001134630 Acidothermus cellulolyticus Species 0.000 description 1
- 241001019659 Acremonium <Plectosphaerellaceae> Species 0.000 description 1
- 101100510736 Actinidia chinensis var. chinensis LDOX gene Proteins 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- 102100034035 Alcohol dehydrogenase 1A Human genes 0.000 description 1
- 108010053754 Aldehyde reductase Proteins 0.000 description 1
- KHOITXIGCFIULA-UHFFFAOYSA-N Alophen Chemical compound C1=CC(OC(=O)C)=CC=C1C(C=1N=CC=CC=1)C1=CC=C(OC(C)=O)C=C1 KHOITXIGCFIULA-UHFFFAOYSA-N 0.000 description 1
- 241000609240 Ambelania acida Species 0.000 description 1
- 241000534414 Anotopterus nikparini Species 0.000 description 1
- 101001065065 Aspergillus awamori Feruloyl esterase A Proteins 0.000 description 1
- 101000961203 Aspergillus awamori Glucoamylase Proteins 0.000 description 1
- 241000892910 Aspergillus foetidus Species 0.000 description 1
- 241000122821 Aspergillus kawachii Species 0.000 description 1
- 101900127796 Aspergillus oryzae Glucoamylase Proteins 0.000 description 1
- 101000775727 Bacillus amyloliquefaciens Alpha-amylase Proteins 0.000 description 1
- 241001328122 Bacillus clausii Species 0.000 description 1
- 241000193422 Bacillus lentus Species 0.000 description 1
- 101000695691 Bacillus licheniformis Beta-lactamase Proteins 0.000 description 1
- 108010029675 Bacillus licheniformis alpha-amylase Proteins 0.000 description 1
- 102100030981 Beta-alanine-activating enzyme Human genes 0.000 description 1
- 102100032487 Beta-mannosidase Human genes 0.000 description 1
- 241000222490 Bjerkandera Species 0.000 description 1
- 241000222478 Bjerkandera adusta Species 0.000 description 1
- 101150020139 CEL6B gene Proteins 0.000 description 1
- 101100327917 Caenorhabditis elegans chup-1 gene Proteins 0.000 description 1
- 101100176947 Cellvibrio japonicus (strain Ueda107) celB gene Proteins 0.000 description 1
- 101100016206 Cellvibrio japonicus (strain Ueda107) celC gene Proteins 0.000 description 1
- 102100037633 Centrin-3 Human genes 0.000 description 1
- 241001466517 Ceriporiopsis aneirina Species 0.000 description 1
- 241001646018 Ceriporiopsis gilvescens Species 0.000 description 1
- 241001277875 Ceriporiopsis rivulosa Species 0.000 description 1
- 241000524302 Ceriporiopsis subrufa Species 0.000 description 1
- 241000259840 Chaetomidium Species 0.000 description 1
- 241000221955 Chaetomium Species 0.000 description 1
- 241001057137 Chaetomium fimeti Species 0.000 description 1
- GHOKWGTUZJEAQD-UHFFFAOYSA-N Chick antidermatitis factor Natural products OCC(C)(C)C(O)C(=O)NCCC(O)=O GHOKWGTUZJEAQD-UHFFFAOYSA-N 0.000 description 1
- 229920002101 Chitin Polymers 0.000 description 1
- 229920001661 Chitosan Polymers 0.000 description 1
- 208000036086 Chromosome Duplication Diseases 0.000 description 1
- 241001674013 Chrysosporium lucknowense Species 0.000 description 1
- 241001556045 Chrysosporium merdarium Species 0.000 description 1
- 241000080524 Chrysosporium queenslandicum Species 0.000 description 1
- 241000355696 Chrysosporium zonatum Species 0.000 description 1
- KRKNYBCHXYNGOX-UHFFFAOYSA-K Citrate Chemical compound [O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O KRKNYBCHXYNGOX-UHFFFAOYSA-K 0.000 description 1
- 241000259811 Cladorrhinum foecundissimum Species 0.000 description 1
- 241001508813 Clavispora lusitaniae Species 0.000 description 1
- 241001508812 Clavispora opuntiae Species 0.000 description 1
- 241000193454 Clostridium beijerinckii Species 0.000 description 1
- 241001085790 Coprinopsis Species 0.000 description 1
- 241001509964 Coptotermes Species 0.000 description 1
- 241001252397 Corynascus Species 0.000 description 1
- 241000221755 Cryphonectria Species 0.000 description 1
- 241000221756 Cryphonectria parasitica Species 0.000 description 1
- 241001559589 Cullen Species 0.000 description 1
- 240000005729 Cylindropuntia imbricata Species 0.000 description 1
- 235000001427 Cylindropuntia imbricata Nutrition 0.000 description 1
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 1
- AUNGANRZJHBGPY-UHFFFAOYSA-N D-Lyxoflavin Natural products OCC(O)C(O)C(O)CN1C=2C=C(C)C(C)=CC=2N=C2C1=NC(=O)NC2=O AUNGANRZJHBGPY-UHFFFAOYSA-N 0.000 description 1
- ZZZCUOFIHGPKAK-UHFFFAOYSA-N D-erythro-ascorbic acid Natural products OCC1OC(=O)C(O)=C1O ZZZCUOFIHGPKAK-UHFFFAOYSA-N 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 102000004594 DNA Polymerase I Human genes 0.000 description 1
- 108010017826 DNA Polymerase I Proteins 0.000 description 1
- 230000004544 DNA amplification Effects 0.000 description 1
- 239000003155 DNA primer Substances 0.000 description 1
- 239000004375 Dextrin Substances 0.000 description 1
- 229920001353 Dextrin Polymers 0.000 description 1
- FEWJPZIEWOKRBE-JCYAYHJZSA-N Dextrotartaric acid Chemical compound OC(=O)[C@H](O)[C@@H](O)C(O)=O FEWJPZIEWOKRBE-JCYAYHJZSA-N 0.000 description 1
- 101100342470 Dictyostelium discoideum pkbA gene Proteins 0.000 description 1
- 101100268551 Drosophila melanogaster Appl gene Proteins 0.000 description 1
- 241000223924 Eimeria Species 0.000 description 1
- 101000925662 Enterobacteria phage PRD1 Endolysin Proteins 0.000 description 1
- 235000007810 Eryngium campestre Nutrition 0.000 description 1
- 240000005980 Eryngium maritimum Species 0.000 description 1
- 235000003933 Eryngium maritimum Nutrition 0.000 description 1
- 101100385973 Escherichia coli (strain K12) cycA gene Proteins 0.000 description 1
- 101710098247 Exoglucanase 1 Proteins 0.000 description 1
- 101710098246 Exoglucanase 2 Proteins 0.000 description 1
- 241000145614 Fusarium bactridioides Species 0.000 description 1
- 241000223194 Fusarium culmorum Species 0.000 description 1
- 241000223221 Fusarium oxysporum Species 0.000 description 1
- 241001112697 Fusarium reticulatum Species 0.000 description 1
- 241001014439 Fusarium sarcochroum Species 0.000 description 1
- 241000223192 Fusarium sporotrichioides Species 0.000 description 1
- 241001465753 Fusarium torulosum Species 0.000 description 1
- 241000567178 Fusarium venenatum Species 0.000 description 1
- 101150108358 GLAA gene Proteins 0.000 description 1
- 241000146398 Gelatoporia subvermispora Species 0.000 description 1
- 241000726221 Gemma Species 0.000 description 1
- 241000626621 Geobacillus Species 0.000 description 1
- 241000193385 Geobacillus stearothermophilus Species 0.000 description 1
- 101100001650 Geobacillus stearothermophilus amyM gene Proteins 0.000 description 1
- 101000892220 Geobacillus thermodenitrificans (strain NG80-2) Long-chain-alcohol dehydrogenase 1 Proteins 0.000 description 1
- 229920001503 Glucan Polymers 0.000 description 1
- 108010073178 Glucan 1,4-alpha-Glucosidase Proteins 0.000 description 1
- ZRALSGWEFCBTJO-UHFFFAOYSA-N Guanidine Chemical compound NC(N)=N ZRALSGWEFCBTJO-UHFFFAOYSA-N 0.000 description 1
- 101150009006 HIS3 gene Proteins 0.000 description 1
- 101100295959 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) arcB gene Proteins 0.000 description 1
- 101100246753 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) pyrF gene Proteins 0.000 description 1
- 241000589989 Helicobacter Species 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 241001497663 Holomastigotoides Species 0.000 description 1
- 101000780443 Homo sapiens Alcohol dehydrogenase 1A Proteins 0.000 description 1
- 101000773364 Homo sapiens Beta-alanine-activating enzyme Proteins 0.000 description 1
- 101000880522 Homo sapiens Centrin-3 Proteins 0.000 description 1
- 101000891113 Homo sapiens T-cell acute lymphocytic leukemia protein 1 Proteins 0.000 description 1
- 241000223199 Humicola grisea Species 0.000 description 1
- 241000223200 Humicola grisea var. thermoidea Species 0.000 description 1
- 241001480714 Humicola insolens Species 0.000 description 1
- 241000411968 Ilyobacter Species 0.000 description 1
- 108020005350 Initiator Codon Proteins 0.000 description 1
- 241000222342 Irpex Species 0.000 description 1
- 241000222344 Irpex lacteus Species 0.000 description 1
- 241000588748 Klebsiella Species 0.000 description 1
- 241000588749 Klebsiella oxytoca Species 0.000 description 1
- 241001138401 Kluyveromyces lactis Species 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 1
- 241000235087 Lachancea kluyveri Species 0.000 description 1
- 241000222435 Lentinula Species 0.000 description 1
- 241000222418 Lentinus Species 0.000 description 1
- 241000228456 Leptosphaeria Species 0.000 description 1
- 229920002097 Lichenin Polymers 0.000 description 1
- 101150068888 MET3 gene Proteins 0.000 description 1
- 241001344133 Magnaporthe Species 0.000 description 1
- 241000183011 Melanocarpus Species 0.000 description 1
- 241000123315 Meripilus Species 0.000 description 1
- 102000003792 Metallothionein Human genes 0.000 description 1
- 229920001340 Microbial cellulose Polymers 0.000 description 1
- 240000003433 Miscanthus floridulus Species 0.000 description 1
- 241000878006 Miscanthus sinensis Species 0.000 description 1
- OVBPIULPVIDEAO-UHFFFAOYSA-N N-Pteroyl-L-glutaminsaeure Natural products C=1N=C2NC(N)=NC(=O)C2=NC=1CNC1=CC=C(C(=O)NC(CCC(O)=O)C(O)=O)C=C1 OVBPIULPVIDEAO-UHFFFAOYSA-N 0.000 description 1
- 229920002274 Nalgene Polymers 0.000 description 1
- 241000233892 Neocallimastix Species 0.000 description 1
- 241000221961 Neurospora crassa Species 0.000 description 1
- 101100022915 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) cys-11 gene Proteins 0.000 description 1
- 244000061176 Nicotiana tabacum Species 0.000 description 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 1
- 108090000913 Nitrate Reductases Proteins 0.000 description 1
- GRYLNZFGIOXLOG-UHFFFAOYSA-N Nitric acid Chemical compound O[N+]([O-])=O GRYLNZFGIOXLOG-UHFFFAOYSA-N 0.000 description 1
- 241001072230 Oceanobacillus Species 0.000 description 1
- 102000007981 Ornithine carbamoyltransferase Human genes 0.000 description 1
- 101710198224 Ornithine carbamoyltransferase, mitochondrial Proteins 0.000 description 1
- 102100037214 Orotidine 5'-phosphate decarboxylase Human genes 0.000 description 1
- 108010055012 Orotidine-5'-phosphate decarboxylase Proteins 0.000 description 1
- 241000235652 Pachysolen Species 0.000 description 1
- 241001496963 Penicillium brasilianum Species 0.000 description 1
- 241000123526 Peziza Species 0.000 description 1
- 241000222385 Phanerochaete Species 0.000 description 1
- 241000222393 Phanerochaete chrysosporium Species 0.000 description 1
- 101100172078 Phanerodontia chrysosporium Eg5A gene Proteins 0.000 description 1
- 241000222395 Phlebia Species 0.000 description 1
- 241000222397 Phlebia radiata Species 0.000 description 1
- IAJOBQBIJHVGMQ-UHFFFAOYSA-N Phosphinothricin Natural products CP(O)(=O)CCC(N)C(O)=O IAJOBQBIJHVGMQ-UHFFFAOYSA-N 0.000 description 1
- 241000235379 Piromyces Species 0.000 description 1
- 244000252132 Pleurotus eryngii Species 0.000 description 1
- 235000001681 Pleurotus eryngii Nutrition 0.000 description 1
- 101100112955 Podospora anserina (strain S / ATCC MYA-4624 / DSM 980 / FGSC 10383) CEL6C gene Proteins 0.000 description 1
- 241001451060 Poitrasia Species 0.000 description 1
- 241000276498 Pollachius virens Species 0.000 description 1
- 229920003171 Poly (ethylene oxide) Polymers 0.000 description 1
- 102000001253 Protein Kinase Human genes 0.000 description 1
- 240000004350 Prunus spinosa Species 0.000 description 1
- 235000010829 Prunus spinosa Nutrition 0.000 description 1
- 241000383860 Pseudoplectania Species 0.000 description 1
- 241001497658 Pseudotrichonympha Species 0.000 description 1
- 108091034057 RNA (poly(A)) Proteins 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 101100394989 Rhodopseudomonas palustris (strain ATCC BAA-98 / CGA009) hisI gene Proteins 0.000 description 1
- 241000193448 Ruminiclostridium thermocellum Species 0.000 description 1
- 101900354623 Saccharomyces cerevisiae Galactokinase Proteins 0.000 description 1
- 101001076706 Saccharomyces cerevisiae Invertase 1 Proteins 0.000 description 1
- 101001053411 Saccharomyces cerevisiae Invertase 3 Proteins 0.000 description 1
- 101001053412 Saccharomyces cerevisiae Invertase 4 Proteins 0.000 description 1
- 101001053409 Saccharomyces cerevisiae Invertase 5 Proteins 0.000 description 1
- 101001053400 Saccharomyces cerevisiae Invertase 7 Proteins 0.000 description 1
- 101900084120 Saccharomyces cerevisiae Triosephosphate isomerase Proteins 0.000 description 1
- 241000204893 Saccharomyces douglasii Species 0.000 description 1
- 241001407717 Saccharomyces norbensis Species 0.000 description 1
- 101100284150 Salipaludibacillus agaradhaerens cel5A gene Proteins 0.000 description 1
- 241000192263 Scheffersomyces shehatae Species 0.000 description 1
- 101000702553 Schistosoma mansoni Antigen Sm21.7 Proteins 0.000 description 1
- 101000714192 Schistosoma mansoni Tegument antigen Proteins 0.000 description 1
- 101100022918 Schizosaccharomyces pombe (strain 972 / ATCC 24843) sua1 gene Proteins 0.000 description 1
- 241000223255 Scytalidium Species 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 241000120569 Streptococcus equi subsp. zooepidemicus Species 0.000 description 1
- 101100309436 Streptococcus mutans serotype c (strain ATCC 700610 / UA159) ftf gene Proteins 0.000 description 1
- 241000958303 Streptomyces achromogenes Species 0.000 description 1
- 241001468227 Streptomyces avermitilis Species 0.000 description 1
- 101100370749 Streptomyces coelicolor (strain ATCC BAA-471 / A3(2) / M145) trpC1 gene Proteins 0.000 description 1
- 241000187398 Streptomyces lividans Species 0.000 description 1
- 101150052008 TKL-1 gene Proteins 0.000 description 1
- 241001215623 Talaromyces cellulolyticus Species 0.000 description 1
- 241000228182 Thermoascus aurantiacus Species 0.000 description 1
- 241001313536 Thermothelomyces thermophila Species 0.000 description 1
- 241000183057 Thielavia microspora Species 0.000 description 1
- 241000182980 Thielavia ovispora Species 0.000 description 1
- 241000183053 Thielavia subthermophila Species 0.000 description 1
- 108010022394 Threonine synthase Proteins 0.000 description 1
- 241001149964 Tolypocladium Species 0.000 description 1
- 241000222357 Trametes hirsuta Species 0.000 description 1
- 241000222355 Trametes versicolor Species 0.000 description 1
- 241000217816 Trametes villosa Species 0.000 description 1
- 102100028601 Transaldolase Human genes 0.000 description 1
- 108020004530 Transaldolase Proteins 0.000 description 1
- 102000004357 Transferases Human genes 0.000 description 1
- 108090000992 Transferases Proteins 0.000 description 1
- 102000014701 Transketolase Human genes 0.000 description 1
- 108010043652 Transketolase Proteins 0.000 description 1
- 241000223260 Trichoderma harzianum Species 0.000 description 1
- 241000378866 Trichoderma koningii Species 0.000 description 1
- 241000223262 Trichoderma longibrachiatum Species 0.000 description 1
- 241000223261 Trichoderma viride Species 0.000 description 1
- 241000215642 Trichophaea Species 0.000 description 1
- 241000259813 Trichophaea saccata Species 0.000 description 1
- 241000202898 Ureaplasma Species 0.000 description 1
- FPIPGXGPPPQFEQ-BOOMUCAASA-N Vitamin A Natural products OC/C=C(/C)\C=C\C=C(\C)/C=C/C1=C(C)CCCC1(C)C FPIPGXGPPPQFEQ-BOOMUCAASA-N 0.000 description 1
- 229930003270 Vitamin B Natural products 0.000 description 1
- 229930003268 Vitamin C Natural products 0.000 description 1
- 229930003316 Vitamin D Natural products 0.000 description 1
- QYSXJUFSXHHAJI-XFEUOLMDSA-N Vitamin D3 Natural products C1(/[C@@H]2CC[C@@H]([C@]2(CCC1)C)[C@H](C)CCCC(C)C)=C/C=C1\C[C@@H](O)CCC1=C QYSXJUFSXHHAJI-XFEUOLMDSA-N 0.000 description 1
- 229930003427 Vitamin E Natural products 0.000 description 1
- GLLRIXZGBQOFLM-UHFFFAOYSA-N Xanthorin Natural products C1=C(C)C=C2C(=O)C3=C(O)C(OC)=CC(O)=C3C(=O)C2=C1O GLLRIXZGBQOFLM-UHFFFAOYSA-N 0.000 description 1
- 241000409279 Xerochrysium dermatitidis Species 0.000 description 1
- 241000235013 Yarrowia Species 0.000 description 1
- 241000235015 Yarrowia lipolytica Species 0.000 description 1
- 229920002494 Zein Polymers 0.000 description 1
- DGEZNRSVGBDHLK-UHFFFAOYSA-N [1,10]phenanthroline Chemical compound C1=CN=C2C3=NC=CC=C3C=CC2=C1 DGEZNRSVGBDHLK-UHFFFAOYSA-N 0.000 description 1
- YVNQAIFQFWTPLQ-UHFFFAOYSA-O [4-[[4-(4-ethoxyanilino)phenyl]-[4-[ethyl-[(3-sulfophenyl)methyl]amino]-2-methylphenyl]methylidene]-3-methylcyclohexa-2,5-dien-1-ylidene]-ethyl-[(3-sulfophenyl)methyl]azanium Chemical compound C1=CC(OCC)=CC=C1NC1=CC=C(C(=C2C(=CC(C=C2)=[N+](CC)CC=2C=C(C=CC=2)S(O)(=O)=O)C)C=2C(=CC(=CC=2)N(CC)CC=2C=C(C=CC=2)S(O)(=O)=O)C)C=C1 YVNQAIFQFWTPLQ-UHFFFAOYSA-O 0.000 description 1
- 241000192381 [Candida] diddensiae Species 0.000 description 1
- LICUQAFOHXHWQC-UHFFFAOYSA-N [S].OP(O)(O)=O Chemical compound [S].OP(O)(O)=O LICUQAFOHXHWQC-UHFFFAOYSA-N 0.000 description 1
- 238000005299 abrasion Methods 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- LPQOADBMXVRBNX-UHFFFAOYSA-N ac1ldcw0 Chemical compound Cl.C1CN(C)CCN1C1=C(F)C=C2C(=O)C(C(O)=O)=CN3CCSC1=C32 LPQOADBMXVRBNX-UHFFFAOYSA-N 0.000 description 1
- 125000002777 acetyl group Chemical group [H]C([H])([H])C(*)=O 0.000 description 1
- 108010093941 acetylxylan esterase Proteins 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 235000013334 alcoholic beverage Nutrition 0.000 description 1
- 150000001298 alcohols Chemical class 0.000 description 1
- FPIPGXGPPPQFEQ-OVSJKPMPSA-N all-trans-retinol Chemical compound OC\C=C(/C)\C=C\C=C(/C)\C=C\C1=C(C)CCCC1(C)C FPIPGXGPPPQFEQ-OVSJKPMPSA-N 0.000 description 1
- 108090000637 alpha-Amylases Proteins 0.000 description 1
- 101150073130 ampR gene Proteins 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- 229960003311 ampicillin trihydrate Drugs 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 101150009206 aprE gene Proteins 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 101150008194 argB gene Proteins 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 239000010905 bagasse Substances 0.000 description 1
- 238000000498 ball milling Methods 0.000 description 1
- 101150103518 bar gene Proteins 0.000 description 1
- 238000010923 batch production Methods 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 235000013405 beer Nutrition 0.000 description 1
- WPYMKLBDIGXBTP-UHFFFAOYSA-N benzoic acid Chemical compound OC(=O)C1=CC=CC=C1 WPYMKLBDIGXBTP-UHFFFAOYSA-N 0.000 description 1
- 108010051210 beta-Fructofuranosidase Proteins 0.000 description 1
- 108010055059 beta-Mannosidase Proteins 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 239000003139 biocide Substances 0.000 description 1
- 238000006065 biodegradation reaction Methods 0.000 description 1
- 229920001222 biopolymer Polymers 0.000 description 1
- 238000013452 biotechnological production Methods 0.000 description 1
- OVYQSRKFHNKIBM-UHFFFAOYSA-N butanedioic acid Chemical compound OC(=O)CCC(O)=O.OC(=O)CCC(O)=O OVYQSRKFHNKIBM-UHFFFAOYSA-N 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- 238000011088 calibration curve Methods 0.000 description 1
- VTJUKNSKBAOEHE-UHFFFAOYSA-N calixarene Chemical compound COC(=O)COC1=C(CC=2C(=C(CC=3C(=C(C4)C=C(C=3)C(C)(C)C)OCC(=O)OC)C=C(C=2)C(C)(C)C)OCC(=O)OC)C=C(C(C)(C)C)C=C1CC1=C(OCC(=O)OC)C4=CC(C(C)(C)C)=C1 VTJUKNSKBAOEHE-UHFFFAOYSA-N 0.000 description 1
- 239000002775 capsule Substances 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 230000034303 cell budding Effects 0.000 description 1
- 230000006037 cell lysis Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 108010080434 cephalosporin-C deacetylase Proteins 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 229920001429 chelating resin Polymers 0.000 description 1
- 238000001311 chemical methods and process Methods 0.000 description 1
- 239000013626 chemical specie Substances 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 239000013599 cloning vector Substances 0.000 description 1
- 238000002485 combustion reaction Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 235000008504 concentrate Nutrition 0.000 description 1
- IQFVPQOLBLOTPF-HKXUKFGYSA-L congo red Chemical compound [Na+].[Na+].C1=CC=CC2=C(N)C(/N=N/C3=CC=C(C=C3)C3=CC=C(C=C3)/N=N/C3=C(C4=CC=CC=C4C(=C3)S([O-])(=O)=O)N)=CC(S([O-])(=O)=O)=C21 IQFVPQOLBLOTPF-HKXUKFGYSA-L 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 235000019628 coolness Nutrition 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 238000004132 cross linking Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- GVJHHUAWPYXKBD-UHFFFAOYSA-N d-alpha-tocopherol Natural products OC1=C(C)C(C)=C2OC(CCCC(C)CCCC(C)CCCC(C)C)(C)CCC2=C1C GVJHHUAWPYXKBD-UHFFFAOYSA-N 0.000 description 1
- 101150005799 dagA gene Proteins 0.000 description 1
- 235000013365 dairy product Nutrition 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 235000019425 dextrin Nutrition 0.000 description 1
- 238000007865 diluting Methods 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000004821 distillation Methods 0.000 description 1
- 230000035620 dolor Effects 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 230000005518 electrochemistry Effects 0.000 description 1
- 108010092450 endoglucanase Z Proteins 0.000 description 1
- 238000001976 enzyme digestion Methods 0.000 description 1
- 238000001704 evaporation Methods 0.000 description 1
- 230000008020 evaporation Effects 0.000 description 1
- 239000002360 explosive Substances 0.000 description 1
- 238000012262 fermentative production Methods 0.000 description 1
- 239000011790 ferrous sulphate Substances 0.000 description 1
- 235000003891 ferrous sulphate Nutrition 0.000 description 1
- 210000003495 flagella Anatomy 0.000 description 1
- 229960000304 folic acid Drugs 0.000 description 1
- 235000019152 folic acid Nutrition 0.000 description 1
- 239000011724 folic acid Substances 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- WIGCFUFOHFEKBI-UHFFFAOYSA-N gamma-tocopherol Natural products CC(C)CCCC(C)CCCC(C)CCCC1CCC2C(C)C(O)C(C)C(C)C2O1 WIGCFUFOHFEKBI-UHFFFAOYSA-N 0.000 description 1
- 238000002309 gasification Methods 0.000 description 1
- 239000010437 gem Substances 0.000 description 1
- 238000010359 gene isolation Methods 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 229930182478 glucoside Natural products 0.000 description 1
- 150000008131 glucosides Chemical class 0.000 description 1
- 229930182470 glycoside Natural products 0.000 description 1
- 150000002338 glycosides Chemical class 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 210000004209 hair Anatomy 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 1
- 229920001519 homopolymer Polymers 0.000 description 1
- 239000010903 husk Substances 0.000 description 1
- 230000000887 hydrating effect Effects 0.000 description 1
- 230000036571 hydration Effects 0.000 description 1
- 238000006703 hydration reaction Methods 0.000 description 1
- 150000002431 hydrogen Chemical class 0.000 description 1
- WGCNASOHLSPBMP-UHFFFAOYSA-N hydroxyacetaldehyde Natural products OCC=O WGCNASOHLSPBMP-UHFFFAOYSA-N 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 229960000367 inositol Drugs 0.000 description 1
- CDAISMWEOUEBRE-GPIVLXJGSA-N inositol Chemical compound O[C@H]1[C@H](O)[C@@H](O)[C@H](O)[C@H](O)[C@@H]1O CDAISMWEOUEBRE-GPIVLXJGSA-N 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 239000003456 ion exchange resin Substances 0.000 description 1
- 229920003303 ion-exchange polymer Polymers 0.000 description 1
- NMCUIPGRVMDVDB-UHFFFAOYSA-L iron dichloride Chemical compound Cl[Fe]Cl NMCUIPGRVMDVDB-UHFFFAOYSA-L 0.000 description 1
- UQSXHKLRYXJYBZ-UHFFFAOYSA-N iron oxide Inorganic materials [Fe]=O UQSXHKLRYXJYBZ-UHFFFAOYSA-N 0.000 description 1
- BAUYGSIQEAFULO-UHFFFAOYSA-L iron(2+) sulfate (anhydrous) Chemical compound [Fe+2].[O-]S([O-])(=O)=O BAUYGSIQEAFULO-UHFFFAOYSA-L 0.000 description 1
- 229910000359 iron(II) sulfate Inorganic materials 0.000 description 1
- 238000010829 isocratic elution Methods 0.000 description 1
- 239000010985 leather Substances 0.000 description 1
- 235000012204 lemonade/lime carbonate Nutrition 0.000 description 1
- 238000009630 liquid culture Methods 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 101150039489 lysZ gene Proteins 0.000 description 1
- 229910052749 magnesium Inorganic materials 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 229910052748 manganese Inorganic materials 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 229960000485 methotrexate Drugs 0.000 description 1
- 230000002906 microbiologic effect Effects 0.000 description 1
- 238000005497 microtitration Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 108091005573 modified proteins Proteins 0.000 description 1
- 102000035118 modified proteins Human genes 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 238000006386 neutralization reaction Methods 0.000 description 1
- 101150095344 niaD gene Proteins 0.000 description 1
- 229960003512 nicotinic acid Drugs 0.000 description 1
- 235000001968 nicotinic acid Nutrition 0.000 description 1
- 239000011664 nicotinic acid Substances 0.000 description 1
- 229910017604 nitric acid Inorganic materials 0.000 description 1
- 101150105920 npr gene Proteins 0.000 description 1
- 101150017837 nprM gene Proteins 0.000 description 1
- 239000012038 nucleophile Substances 0.000 description 1
- 230000035764 nutrition Effects 0.000 description 1
- 238000000643 oven drying Methods 0.000 description 1
- NDLPOXTZKUMGOV-UHFFFAOYSA-N oxo(oxoferriooxy)iron hydrate Chemical compound O.O=[Fe]O[Fe]=O NDLPOXTZKUMGOV-UHFFFAOYSA-N 0.000 description 1
- 125000004430 oxygen atom Chemical group O* 0.000 description 1
- 125000000636 p-nitrophenyl group Chemical group [H]C1=C([H])C(=C([H])C([H])=C1*)[N+]([O-])=O 0.000 description 1
- 229940055726 pantothenic acid Drugs 0.000 description 1
- 235000019161 pantothenic acid Nutrition 0.000 description 1
- 239000011713 pantothenic acid Substances 0.000 description 1
- 229940049547 paraxin Drugs 0.000 description 1
- 239000001814 pectin Substances 0.000 description 1
- 229920001277 pectin Polymers 0.000 description 1
- 235000010987 pectin Nutrition 0.000 description 1
- 101150019841 penP gene Proteins 0.000 description 1
- 230000004108 pentose phosphate pathway Effects 0.000 description 1
- 235000020030 perry Nutrition 0.000 description 1
- JTJMJGYZQZDUJJ-UHFFFAOYSA-N phencyclidine Chemical compound C1CCCCN1C1(C=2C=CC=CC=2)CCCCC1 JTJMJGYZQZDUJJ-UHFFFAOYSA-N 0.000 description 1
- 150000003016 phosphoric acids Chemical class 0.000 description 1
- 229910052698 phosphorus Inorganic materials 0.000 description 1
- 239000010908 plant waste Substances 0.000 description 1
- 229920002643 polyglutamic acid Polymers 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- 229910052700 potassium Inorganic materials 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 235000019833 protease Nutrition 0.000 description 1
- 108060006633 protein kinase Proteins 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 101150108007 prs gene Proteins 0.000 description 1
- 101150086435 prs1 gene Proteins 0.000 description 1
- 101150070305 prsA gene Proteins 0.000 description 1
- 238000010298 pulverizing process Methods 0.000 description 1
- 101150116440 pyrF gene Proteins 0.000 description 1
- LXNHXLLTXMVWPM-UHFFFAOYSA-N pyridoxine Chemical compound CC1=NC=C(CO)C(CO)=C1O LXNHXLLTXMVWPM-UHFFFAOYSA-N 0.000 description 1
- 235000008160 pyridoxine Nutrition 0.000 description 1
- 239000011677 pyridoxine Substances 0.000 description 1
- 230000035484 reaction time Effects 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000033458 reproduction Effects 0.000 description 1
- 230000027272 reproductive process Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 229920005989 resin Polymers 0.000 description 1
- 239000011347 resin Substances 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 235000019192 riboflavin Nutrition 0.000 description 1
- 239000002151 riboflavin Substances 0.000 description 1
- 229960002477 riboflavin Drugs 0.000 description 1
- 101150025220 sacB gene Proteins 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- CDAISMWEOUEBRE-UHFFFAOYSA-N scyllo-inosotol Natural products OC1C(O)C(O)C(O)C(O)C1O CDAISMWEOUEBRE-UHFFFAOYSA-N 0.000 description 1
- 239000000565 sealant Substances 0.000 description 1
- 238000012882 sequential analysis Methods 0.000 description 1
- 238000010008 shearing Methods 0.000 description 1
- AWUCVROLDVIAJX-GSVOUGTGSA-N sn-glycerol 3-phosphate Chemical compound OC[C@@H](O)COP(O)(O)=O AWUCVROLDVIAJX-GSVOUGTGSA-N 0.000 description 1
- 238000002791 soaking Methods 0.000 description 1
- 235000017550 sodium carbonate Nutrition 0.000 description 1
- 229910000029 sodium carbonate Inorganic materials 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- 239000000600 sorbitol Substances 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 238000005507 spraying Methods 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 238000010025 steaming Methods 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 239000010907 stover Substances 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- KDYFGRWQOYBRFD-UHFFFAOYSA-L succinate(2-) Chemical compound [O-]C(=O)CCC([O-])=O KDYFGRWQOYBRFD-UHFFFAOYSA-L 0.000 description 1
- 150000005846 sugar alcohols Chemical class 0.000 description 1
- 235000021092 sugar substitutes Nutrition 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 125000004434 sulfur atom Chemical group 0.000 description 1
- 239000001117 sulphuric acid Substances 0.000 description 1
- 235000011149 sulphuric acid Nutrition 0.000 description 1
- 239000003765 sweetening agent Substances 0.000 description 1
- 229940095064 tartrate Drugs 0.000 description 1
- OFVLGDICTFRJMM-WESIUVDSSA-N tetracycline Chemical compound C1=CC=C2[C@](O)(C)[C@H]3C[C@H]4[C@H](N(C)C)C(O)=C(C(N)=O)C(=O)[C@@]4(O)C(O)=C3C(=O)C2=C1O OFVLGDICTFRJMM-WESIUVDSSA-N 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- RMLPZKRPSQVRAB-UHFFFAOYSA-N tris(3-methylphenyl) phosphate Chemical compound CC1=CC=CC(OP(=O)(OC=2C=C(C)C=CC=2)OC=2C=C(C)C=CC=2)=C1 RMLPZKRPSQVRAB-UHFFFAOYSA-N 0.000 description 1
- HRXKRNGNAMMEHJ-UHFFFAOYSA-K trisodium citrate Chemical compound [Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O HRXKRNGNAMMEHJ-UHFFFAOYSA-K 0.000 description 1
- 229940038773 trisodium citrate Drugs 0.000 description 1
- 101150016309 trpC gene Proteins 0.000 description 1
- 239000012137 tryptone Substances 0.000 description 1
- 241001148471 unidentified anaerobic bacterium Species 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
- 239000005418 vegetable material Substances 0.000 description 1
- 230000035899 viability Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 235000019155 vitamin A Nutrition 0.000 description 1
- 239000011719 vitamin A Substances 0.000 description 1
- 235000019156 vitamin B Nutrition 0.000 description 1
- 239000011720 vitamin B Substances 0.000 description 1
- 235000019154 vitamin C Nutrition 0.000 description 1
- 239000011718 vitamin C Substances 0.000 description 1
- 235000019166 vitamin D Nutrition 0.000 description 1
- 239000011710 vitamin D Substances 0.000 description 1
- 235000019165 vitamin E Nutrition 0.000 description 1
- 239000011709 vitamin E Substances 0.000 description 1
- 229940045997 vitamin a Drugs 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
- 238000001238 wet grinding Methods 0.000 description 1
- 210000002268 wool Anatomy 0.000 description 1
- 101150052264 xylA gene Proteins 0.000 description 1
- 101150110790 xylB gene Proteins 0.000 description 1
- 229920001221 xylan Polymers 0.000 description 1
- 150000004823 xylans Chemical class 0.000 description 1
- 239000005019 zein Substances 0.000 description 1
- 229940093612 zein Drugs 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
- 150000008498 β-D-glucosides Chemical class 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/02—Preparation of oxygen-containing organic compounds containing a hydroxy group
- C12P7/04—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
- C12P7/06—Ethanol, i.e. non-beverage
- C12P7/08—Ethanol, i.e. non-beverage produced as by-product or from waste or cellulosic material substrate
- C12P7/10—Ethanol, i.e. non-beverage produced as by-product or from waste or cellulosic material substrate substrate containing cellulosic material
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/02—Monosaccharides
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E50/00—Technologies for the production of fuel of non-fossil origin
- Y02E50/10—Biofuels, e.g. bio-diesel
Landscapes
- Organic Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Wood Science & Technology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Microbiology (AREA)
- General Chemical & Material Sciences (AREA)
- Biotechnology (AREA)
- Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Polysaccharides And Polysaccharide Derivatives (AREA)
Abstract
本发明涉及产生下述纤维素材料的方法,即其具有还原态的氧化还原活性金属阳离子,其氧化还原电势(Eo)范围为约-0.4到约1.2伏,该方法包括用有效量的螯合剂处理所述纤维素材料以减少所述氧化还原活性金属阳离子对所述纤维素材料的酶降解或转化的抑制作用,并且可选地还在当所述氧化还原活性金属阳离子具有低价状态时用有效量的氧化剂处理所述纤维素材料以将所述氧化还原活性金属阳离子转化为高价状态,以优先螯合所述氧化还原活性金属阳离子。本发明亦涉及供降解或转化纤维素材料的方法以及产生发酵产物的方法。
Description
对序列表的援引
本申请包含计算机可读形式的序列表。本申请通过援引并入该序列表。
发明背景
技术领域
本发明涉及减少由氧化还原活性金属阳离子对纤维素分解酶组合物的抑制作用以改善纤维素材料水解为可发酵的糖类。
背景技术
供乙醇及其它化学物质产生的生物质原料在组成上为复杂的,包括纤维素,半纤维素,木质素与其它组分。在所述其它组分中包括金属阳离子。尽管碳水化合物为开发生物提炼酶(biorefinery enzyme)的主要目标,其它次要的生物质组分亦映入人眼帘,这是因为它们可能对纤维素材料的水解起不利作用。
在玉米秸秆,一种主要的生物质原料中,氧化铁可构成灰组分的0.5%(Morey等,2006,Characterization of feed streams and emissions from biomass gasification/combustion at fuel ethanol plants.American Society of Agricultural and Biological Engineers Annual International Meeting(Portland,Oregon USA,2006),Paper#064180)。已有Fe(II)化合物对多种纤维素酶的抑制作用的报道Ferchak and Pye 1983,Biotechnol.Bioengineer.25:2865-2872;Okada 1988,Methods in Enzymology 160:259-264;Ohmiya等,1995,Plant Cell.Physiol.36,607-614;Li等,2003,Enzyme Microb.Technol.33:932-937;Li等,2006,Appl.Microbiol.Biotechnol.70:430-436)。
美国专利Nos.5677154与5932456描述了自生物质产生乙醇与其它发酵产物,其中亚铁金属通过磁性方法移除。
本发明涉及减少氧化还原活性金属阳离子对纤维素材料酶水解的抑制作用的方法。
发明综述
本发明涉及产生氧化还原活性金属阳离子减少的纤维素材料的方法,所述金属阳离子具有范围为约-0.4到约1.2伏的氧化还原电势(Eo)(a cellulosic material reduced in a redox active metal cation having a redox potential(Eo)in the range ofabout-0.4to about 1.2volts),该方法包括用有效量的螯合剂处理所述纤维素材料以减少所述氧化还原活性金属阳离子对酶降解或转化所述纤维素材料的抑制作用,并且可选地还(and alternatively also)在当所述氧化还原活性金属阳离子具有低价状态时用有效量的氧化剂处理所述纤维素材料以将所述氧化还原活性金属阳离子转化为高价状态,以优先螯合所述氧化还原活性金属阳离子。
本发明亦涉及降解或转化纤维素材料的方法,包括:用有效量的纤维素分解酶组合物处理所述纤维素材料,其中将所述纤维素材料用有效量的螯合剂处理以减少具有氧化还原电势(Eo)范围为约-0.4到约1.2伏的氧化还原活性金属阳离子对用所述纤维素分解酶组合物酶降解或转化所述纤维素材料的抑制作用,并且可选地还在当所述氧化还原活性金属阳离子具有低价状态时用有效量的氧化剂处理所述纤维素材料以将所述氧化还原活性金属阳离子转化为高价状态,以优先螯合所述氧化还原活性金属阳离子。
本发明亦涉及产生发酵产物的方法,包括:(a)用有效量的纤维素分解酶组合物糖化纤维素材料;(b)用一种或多种发酵微生物发酵步骤(a)的经糖化的纤维素材料以产生发酵产物;以及(c)回收发酵产物,其中用有效量的螯合剂处理所述纤维素材料以减少具有氧化还原电势(Eo)范围为约-0.4到约1.2伏的氧化还原活性金属阳离子对酶糖化所述纤维素材料的抑制作用,并且可选地还在当所述氧化还原活性金属阳离子具有低价状态时用有效量的氧化剂处理所述纤维素材料以将所述氧化还原活性金属阳离子转化为高价状态,以优先螯合所述氧化还原活性金属阳离子。
附图简述
图1显示pAlLo27的限制性酶切图。
图2显示pMJ04的限制性酶切图。
图3显示pCaHj527的限制性酶切图。
图4显示pMT2188的限制性酶切图。
图5显示pCaHj568的限制性酶切图。
图6显示pMJ05的限制性酶切图。
图7显示pSMai130的限制性酶切图。
图8显示米曲霉(Aspergillus oryzae)β-葡糖苷酶天然信号序列的DNA序列和氨基酸序列(SEQ ID NO:95和96)。
图9显示特异腐质霉(Humicola insolens)内切葡聚糖酶V信号序列的DNA序列和氨基酸序列(SEQ ID NO:99和100)。
图10显示pSMai135的限制性酶切图。
图11显示pSMai140的限制性酶切图。
图12显示pSaMe-F1的限制性酶切图。
图13显示pSaMe-FX的限制性酶切图。
图14显示pAlLo47的限制性酶切图。
图15显示pSaMe-FH的限制性酶切图。
图16显示Fe(II)(10mM)对PCS水解的作用。所述水解使用每升50mM乙酸钠pH 5中43g PCS和0.25g纤维素分解酶组合物#2在50℃下进行。
图17A与17B显示了10mM FeSO4对由纤维素分解酶组合物#1(A)纤维素分解酶组合物#2(B)进行的PCS水解的作用。所述水解使用每升50mM乙酸钠pH 5中43g PCS和0.25g纤维素分解酶组合物#1或#2在50℃下进行。
图18显示选定的氧化性金属阳离子和络合物的氧化还原电势与纤维素水解抑制作用之间的关联。关于Eo与纤维素分解酶组合物#1催化的水解的起始速率来自表3与4以及正文。关联线:相关率=-46Eo+56,r2=0.264。
图19A,19B,19C与19D显示Fe(II)对由纤维素分解酶组合物#1进行的水解(A与B)以及对由纤维素分解酶组合物#1进行的PASC水解(C与D)的有效抑制浓度范围。所述水解使用每升50mM乙酸钠pH 5中23g与0.25g纤维素分解酶组合物#1在50℃下进行。FeSO4(mM):(○)0,(+)1,(△)3,(◇)5,(□)10。Dixon曲线线性回归线:1/速率=(0.035±0.003)[Fe(II)]+(0.043±0.015),r2=0.978。速率自在24与6小时处的水解差异(%)进行估算。所述PASC水解使用每升50mM乙酸钠pH 5中2gPASC与50mg纤维素分解酶组合物#1在50℃下进行。Dixon曲线线性回归线:1/速率=(0.0042±0.0003)[Fe(II)]+(0.059±0.002),r2=0.994。速率自在7小时处的水解差异(%)进行估算。
图20A,20B,20C与20D显示了10mM FeSO4对里氏木霉(Trichoderma reesei)CEL7A CBHI(A),CEL6A CBHII(B),CEL7B EGI(C)与CEL5A EG-II(D)的作用。所述水解使用每升乙酸钠pH 5中2g PASC与40mg的酶在50℃下进行。
图21显示了10mM FeSO4对米曲霉CEL3A β-葡糖苷酶的作用。所述水解使用每升50mM乙酸钠pH5中2g纤维二糖与1mg β-葡糖苷酶在50℃下进行。
图22A与22B显示了Fe(II)的氧化与螯合对抑制由纤维素分解酶组合物#2进行的PCS水解的作用。所述水解使用每升50mM乙酸钠pH 5中43g PCS与0.25g的纤维素分解酶组合物#2在50℃下进行。(A)Fe(II)与其氧化的作用:添加至水解的添加剂:(○)无,(□)2.5mM FeSO4,(◇)2.5mM FeSO4与10mMH2O2,(△)2.5mM FeSO4,10mM H2O2与10mM去铁草酰胺。(B)H2O2与去铁草酰胺的作用:添加至水解的添加剂:(○)无,(×)10mM H2O2,(+)10mMH2O2与10mM去铁草酰胺。
图23A,23B,23C与23D显示了Fe(II)螯合剂的作用。所述水解使用每升50mM乙酸钠pH5中43g PCS与0.25g的纤维素分解酶组合物#2在50℃下进行。
定义
氧化还原活性金属阳离子:术语“氧化还原活性金属阳离子”在本文中定义为能够进行还原-氧化(缩写为氧化还原(redox))化学反应,并在该反应中其氧化值(氧化状态)发生变化的金属阳离子。该离子在氧化反应中丧失一个或更多电子。该离子在还原反应中得到一个或更多电子。在此申请中感兴趣的氧化还原活性金属阳离子针对标准氢电极具有范围为-0.4到1.2伏的氧化还原电势。该离子可为游离(仅经水合)于溶液的,或为由配体或螯合剂配位的(以形成金属阳离子络合物)。
氧化还原电势:术语“氧化还原电势”亦称为氧化/还原电势,并通常表示为Eo,在本文中定义为内在的热力学参数,其描述了化学物种(包括金属阳离子)丧失或获得电子的倾向。Eo是愈大的正值(more positive),则该物种对电子的亲和性与其被还原的倾向性(同时氧化其它物种)愈强。
螯合剂:术语“螯合剂(chelator)”,亦称为配体,螯合物(chelant),螯合试剂(chelating agent)或掩蔽剂(sequesting agent),在本文中定义为下述离子或分子,即其通过给出其一个或更多电子填充到中心金属的空轨道中从而与中心金属键合。典型的螯合剂包括在它们的氨基,羧基,巯基或杂原子芳香官能团中的N,O或S原子。本申请的目标螯合剂为那些对氧化还原活性金属阳离子的氧化态(高价)较之其还原态(低价)具有更大偏好的螯合剂。
亚铁离子:术语“亚铁离子”在本文中定义为具有氧化值为+2的铁,其表示为Fe2+或Fe(II),而铁表示其氧化值为+3,其表示为Fe3+或Fe(III)。
纤维素分解活性:术语“纤维素分解活性”在本文中定义为水解含纤维素材料的生物学活性。纤维素分解蛋白可水解滤纸(FP),由此减少不可溶的纸的重量,并增加可溶性糖的量。该反应可通过检测与对羟基苯甲酰肼(p-hydroxybenzoic acid hydrazide)形成有色产物的还原糖来测定,以Filter Paper Assay Unit(滤纸测定单位)(FPU)的形式确定。纤维素分解蛋白可水解微晶纤维素或其它纤维质物质,由此减少不可溶的纤维素的重量并增加可溶性糖的量。该反应可通过用对羟基苯甲酰肼,高效液相色谱(HPLC)或电化学糖检测器(electrochemical sugar detector)检测还原糖的方法来测定。纤维素分解蛋白可水解可溶的,产色的,产荧光的或其它类似的糖苷物质,由此增加发色的,发荧光的或其它物理上可检测出的产物的量。该反应可使用分光光度计,荧光计或其它仪器监测。纤维素分解蛋白可水解羧甲基纤维素(CMC),由此减少培育混合物的粘度。所导致的粘度减少可通过振动粘度计(vibration viscosimeter)(例如,来自Sofraser,France的MIVI 3000)来确定。以Cellulase Viscosity Unit(纤维素酶粘度单位)(CEVU)的形式确定纤维素酶活性,是通过测定样品减少羧甲基纤维素(CMC)溶液粘度的能力来量化存在于该样品中的催化活性。所述分析法在适于所述纤维素分解蛋白与底物的温度与pH下进行。举例而言,对CELLUCLASTTM(Novozymes A/S,Denmark),该分析法在40℃下在0.1M磷酸盐pH9.0缓冲液中以CMC作为底物(33.3g/升羧甲基纤维素Hercules 7LFD)以及大约3.3-4.2CEVU/ml的酶浓度进行。所述CEVU活性相对于已公知的酶标准,例如CELLUZYMETM Standard17-1194(得自Novozymes A/S,Denmark)来计算。
为了本发明的目标,纤维素分解活性通过测定在下述条件下由纤维素分解酶组合物进行的纤维素材料水解的增加来确定:1-10mg的纤维素分解蛋白/g的PCS纤维素在50℃下进行5-7日,与未添加纤维素分解蛋白的对照水解相比较。
内切葡聚糖酶:术语“内切葡聚糖酶”在本文中定义为一种内切-1,4-(1,3;1,4)-β-D-葡聚糖4-葡聚糖水解酶(E.C.No.3.2.1.4),其催化纤维素、纤维素衍生物(诸如羧甲基纤维素和羟乙基纤维素)、地衣淀粉中的1,4-β-D-糖苷联结;混合型β-1,3葡聚糖如谷物(cereal)β-D-葡聚糖或木葡聚糖,和其他含纤维素组分的植物材料中的β-1,4键的内水解(endohydrolysis)。为本发明的目的,内切葡聚糖酶活性是根据Ghose,1987,Pure and Appl.Chem.59:257-268的程序利用羧甲基纤维素(CMC)水解来确定的。
纤维二糖水解酶:术语“纤维二糖水解酶”在本文中定义为一种1,4-β-D-葡聚糖纤维二糖水解酶(E.C.3.2.1.91),其催化水解纤维素、纤维寡糖、或任何含β-1,4-连接的葡萄糖的聚合物中1,4-β-D-葡糖苷联结,从链的还原端或非还原端释放纤维二糖。为本发明的目的,纤维二糖水解酶活性是依照Lever等,1972,Anal.Biochem.47:273-279和van Tilbeurgh等,1982,FEBS Letters149:152-156;van Tilbeurgh和Claeyssens,1985,FEBS Letters 187:283-288记载的程序加以测定的。
β-葡糖苷酶:术语“β-葡糖苷酶”在本文中定义为一种β-D-葡糖苷葡糖水解酶(E.C.3.2.1.21),其催化水解末端非还原性β-D-葡萄糖残基,并释放β-D-葡萄糖。为本发明的目的,β-葡糖苷酶活性是根据Venturi等,2002,J.Basic Microbiol.42:55-66记载的程序来测定的。一个单位的β-葡糖苷酶活性定义为:在100mM柠檬酸钠、0.01%20中,50℃、pH 5条件下每分钟从作为底物的4mM对硝基苯基-β-D-吡喃葡萄糖苷产生1.0微摩尔对硝基苯酚。
纤维素分解增强活性:术语“分解纤维素增强活性”在本文中定义为GH61多肽增强由具有纤维素分解活性的蛋白质对纤维素材料的水解的生物活性。为了本发明的目的,纤维素分解增强活性通过在下述条件下测定由纤维素分解蛋白进行的纤维素材料水解所得的还原糖的增加或总纤维二糖与葡萄糖的增加来确定:1-50mg总蛋白质/gPCS中的纤维素,其中总蛋白质包括80-99.5%w/w纤维素分解蛋白/g的PCS中的纤维素与0.5-20%w/w的具纤维素分解增强活性的蛋白质在50℃下进行1-7日,与用相同总量但无纤维素分解增强活性的蛋白质加样进行的对照水解进行比较(1-50mg纤维素分解蛋白/g的PCS中的纤维素)。
具有纤维素分解增强活性的GH61多肽通过将达到相同程度水解所需的纤维素分解酶的量降低优选至少0.1倍,更优选至少0.2倍,更优选至少0.3倍,更优选至少0.4倍,更优选至少0.5倍,更优选至少1倍,更优选至少3倍,更优选至少4倍,更优选至少5倍,更优选至少10倍,更优选至少20倍,甚至更优选至少30倍,最优选至少50倍,并且甚至最优选至少100倍,来增强由具有纤维素分解活性的蛋白质催化的纤维素材料的水解。
家族61糖苷水解酶:术语“家族61糖苷水解酶”或“家族GH61”在本文中定义为根据Henrissat B.,1991,A classification of glycosyl hydrolases based on amino-acid sequence similarities,Biochem.J.280:309-316,和Henrissat B.,and Bairoch A.,1996,Updating the sequence-based classification of glycosyl hydrolases,Biochem.J.316:695-696落入糖苷水解酶家族61的多肽。目前,Henrissat将GH61家族列为未分类的,这指明对属于该家族的多肽,如机理,催化性亲核体/碱,催化性质子供体,以及3D结构等性质尚在未知之数。
纤维素材料:生物质的初生细胞壁中主要的多糖是纤维素,丰度第二高的是半纤维素,第三是果胶。在细胞停止生长后产生的次生细胞壁也含有多糖,并且通过与半纤维素共价交联的多聚体木质素而加强。纤维素是脱水纤维二糖的均聚物,并因此是一种直链β-(1-4)-D-葡聚糖,而半纤维素包括多种化合物,如木聚糖、木葡聚糖、阿拉伯木聚糖和甘露聚糖,具有复杂的分枝结构和一系列取代基。虽然纤维素一般是无定形的,但植物组织中发现的纤维素主要为由平行葡聚糖链构成的不溶性晶体基质。半纤维素通常通过氢键键合于纤维素以及其他半纤维素上,这有助于细胞壁基质的稳定化。
纤维素材料可以是任何含有纤维素的材料。纤维素通常存在于例如植株的茎、叶、果/种壳(hulls)、果/种皮(husks)和穗轴(cobs),或者树的叶、枝、和木材等之中。纤维素材料可以是,但不限于,草本材料(herbaceous material)、农业残余物(agricultural residues)、林业残余物(forestry residues)、城市固体废物(municipal solid wastes)、废纸(waste paper),以及纸浆和造纸厂残余物(pulp and paper mill residue)。纤维素材料可以是任何类型的生物质,包括但不限于木材资源、城市固体废物、废纸、作物和作物残余物(见例如Wiselogel等,1995,《Handbook on Bioethanol》(Charles E.Wyman编),第105-118页,Taylor &Francis,Washington D.C.;Wyman,1994,Bioresource Technology 50:3-16;Lynd,1990,Applied Biochemistry and Biotechnology 24/25:695-719;Mosier等,1999,Recent Progress in Bioconversion of Lignocellulosics,《Advances in Biochemical Engineering/Biotechnology》,T.Scheper总编,第65卷,第23-40页,Springer-Verlag,New York)。在本文中应当理解,纤维素材料可为木素纤维素的形式,即在混合的基质中包含木质素、纤维素和半纤维素的植物细胞壁材料。
在一方面,所述纤维素材料为草本材料。在另一方面,所述纤维素材料为农业残余物。在另一方面,所述纤维素材料为林业残余物。在另一方面,所述纤维素材料为城市固体废物。在另一方面,所述纤维素材料为废纸。在另一方面,所述纤维素材料为纸浆和造纸厂残余物。
在另一方面,所述纤维素材料为玉米秸秆。在另一优选的方面,所述纤维素材料为玉米纤维。在另一方面,所述纤维素材料为玉米穗轴。在另一方面,所述纤维素材料为橙皮。在另一方面,所述纤维素材料为稻秆。在另一方面所述纤维素材料为麦秆。在另一方面,所述纤维素材料为柳枝稷(switch grass)。在另一方面,所述纤维素材料为芒草(miscanthus)。在另一方面,所述纤维素材料为甘蔗渣。
纤维素材料可以直接使用,或者可以使用本领域已知的常规方法对其进行预处理。例如,物理预处理技术可包括各种类型的粉碎(milling)、辐射(irradiation)、汽蒸/蒸汽爆破(steaming/steam explosion)、和湿热分解作用(hydrothermolysis);化学预处理技术可包括稀酸、碱、有机溶剂、氨、二氧化硫、二氧化碳、和pH受控的湿热分解作用;而生物预处理技术可涉及施用溶解木质素的微生物(参见,例如Hsu,T.-A.,1996,Pretreatment of biomass,《Handbook on Bioethanol:Production and Utilization》,Wyman,C.E.编,Taylor & Francis,Washington,DC,179-212;Ghosh,P.和Singh,A.,1993,Physicochemical and biological treatments for enzymatic/microbial conversion of lignocellulosic biomass,Adv.Appl.Microbiol.39:295-333;McMillan,J.D.,1994,Pretreating lignocellulosic biomass:a review,《Enzymatic Conversion of Biomass for Fuels Production》,Himmel,M.E.,Baker,J.O.和Overend,R.P.编,ACS Symposium Series 566,American Chemical Society,Washington,DC,第15章;Gong,C.S.,Cao,N.J.,Du,J.和Tsao,G.T.,1999,Ethanol production from renewable resources,《Advances in Biochemical Engineering/Biotechnology》,Scheper,T.编,Springer-Verlag Berlin Heidelberg,Germany,65:207-241;Olsson,L.和Hahn-Hagerdal,B.,1996,Fermentation of lignocellulosic hydrolysates for ethanol production,Enz.Microb.Tech.18:312-331;和Vallander,L.和Eriksson,K.-E.L.,1990,Production of ethanol from lignocellulosic materials:State of the art,Adv.Biochem.Eng./Biotechnol.42:63-95)。
预处理玉米秸秆:术语“PCS”或“预处理的玉米秸秆”在本文中定义为通过用热和稀酸处理从玉米秸秆衍生的纤维素材料。为本发明的目的,PCS是由实施例26所述方法或改变其时间、温度和酸量的变化形式来制备的。
分离的多肽:本文所用的术语“分离的多肽”是指自来源分离的多肽。在一个优选的方面,所述多肽是通过SDS-PAGE测定为至少1%纯、优选至少5%纯、更优选至少10%纯、更优选至少20%纯、更优选至少40%纯、更优选至少60%纯、甚至更优选至少80%纯、和最优选至少90%纯的。为了本发明的目的,术语“多肽”应理解为包括全长多肽,成熟多肽或催化结构域;或其具有酶活性的部分或片段。
基本上纯的多肽:术语“基本上纯的多肽”在本文是指这样的多肽制备物,其含有以重量计至多10%,优选至多8%,更优选至多6%,更优选至多5%,更优选至多4%,更优选至多3%,甚至更优选至多2%,最优选至多1%,和甚至最优选至多0.5%的与其天然地或重组地相伴随的(associated)其他多肽物质。因此,优选的是,基本上纯的多肽以制备物中存在的总多肽物质的重量计是至少92%纯、优选至少94%纯、更优选至少95%纯、更优选至少96%纯、更优选至少96%纯、更优选至少97%纯、更优选至少98%纯、甚至更优选至少99%、最优选至少99.5%纯、和甚至最优选100%纯的。多肽优选是基本上纯的形式,即,多肽制备物实质上不含与其天然地或重组地相伴随的其他多肽物质。这可以通过例如用公知的重组技术或通过经典的纯化方法制备所述多肽来实现。
分离的多核苷酸:本文中所用的术语“分离的多核苷酸”是指自来源分离的多核苷酸。在一个优选的方面,所述多核苷酸通过琼脂糖电泳测定为至少1%纯、优选至少5%纯、更优选至少10%纯、更优选至少20%纯、更优选至少40%纯、更优选至少60%纯、甚至更优选至少80%纯、最优选至少90%纯。
基本上纯的多核苷酸:本文中所用的术语“基本上纯的多核苷酸”是指这样的多核苷酸制备物,其不含有其他无关或不需要的核苷酸,并且处于适合在经基因工程改造的蛋白质生产系统中使用的形式。因此,基本上纯的多核苷酸含有以重量计至多10%,优选至多8%,更优选至多6%,更优选至多5%,更优选至多4%,更优选至多3%,甚至更优选至多2%,最优选至多1%,和甚至最优选至多0.5%的与其天然地或重组地相伴随的其他多核苷酸物质。但是,基本上纯的多核苷酸可以包括天然存在的5’和3’非翻译区,如启动子和终止子。优选的是,基本上纯的多核苷酸以重量计为至少90%纯、优选至少92%纯、更优选至少94%纯、更优选至少95%纯、更优选至少96%纯、更优选至少97%纯、甚至更优选至少98%纯、最优选至少99%纯、和甚至最优选至少99.5%纯。多核苷酸优选是处于基本上纯的形式,即多核苷酸制备物实质上不含与其天然地或重组地相伴随的其他多核苷酸物质。多核苷酸可以是基因组、cDNA、RNA、半合成、合成来源的,或者上述来源的任意组合。
cDNA:术语“cDNA”在本文中定义为这样的DNA分子,它能够从获自真核细胞的成熟的、经剪接的mRNA分子通过逆转录制备得到。cDNA缺少在对应的基因组DNA中可能存在的内含子序列。最初的初级RNA转录物是mRNA的前体,它经历一系列步骤被加工之后作为成熟的、经剪接的mRNA出现。这些步骤包括通过一个称为剪接的过程去除内含子序列。因此,从mRNA衍生而来的cDNA缺少任何内含子序列。
核酸构建体:术语“核酸构建体”在用于本文时是指这样的单链或双链核酸分子:其是从天然存在的基因分离的,或者经过修饰而以原本不会存在于自然界中的方式包含核酸的片段,或者是合成的。当核酸构建体包含编码序列的表达所需的控制序列时,术语“核酸构建体”与术语“表达盒”是同义的。
控制序列:术语“控制序列”在本文中定义为包括编码多肽的多核苷酸的表达所必需的所有组件。每个控制序列对于编码多肽的核苷酸序列而言可以是天然的或者外来的,或者每个控制序列对于彼此而言可以是天然的或者外来的。这样的控制序列包括但不限于前导序列、聚腺苷酸化序列、前肽(propeptide)序列、启动子、信号肽序列和转录终止子。在最低程度上,控制序列包括启动子以及转录和翻译终止信号。控制序列可以具有接头,用来引入特异性限制性位点以帮助将控制序列与编码多肽的核苷酸序列的编码区连接。
可操作地连接:术语“可操作地连接”在本文中是指这样一种构型,其中控制序列相对于多核苷酸序列的编码序列被置于合适的位置上,使得该控制序列指导多肽编码序列的表达。
编码序列:当用于本文时,术语“编码序列”是指这样的核苷酸序列,它直接规定其蛋白质产物的氨基酸序列。编码序列的边界一般是由可读框决定的,后者通常以ATG起始密码子或其他可选的起始密码子如GTG及TTG开始,而以终止密码子如TAA、TAG和TGA结束。编码序列可以是DNA、cDNA、或重组的核苷酸序列。
表达:术语“表达”包括多肽产生过程中涉及的任何步骤,包括但不限于转录、转录后修饰、翻译、翻译后修饰、以及分泌。
表达载体:术语“表达载体”在本文中定义为一种线性或环状DNA分子,其包含编码多肽的多核苷酸,且可操作地连接于为其表达而提供的其他核苷酸。
宿主细胞:术语“宿主细胞”在用于本文时包括任何易于用包含多核苷酸的核酸构建体或表达载体所转化、转染、转导等的细胞类型。
发明详述
本发明涉及减少具有氧化还原电势(Eo)范围在约-0.4到约1.2伏的氧化还原活性金属阳离子对纤维素分解酶组合物的抑制作用以改善纤维素材料酶糖化(enzymatic saccharification)成可发酵的糖的效率的方法,所述糖可随即通过发酵转化为所期望的发酵产物。自纤维素材料产生所期望的发酵产物通常需要三个主要步骤,包括预处理,酶水解(糖化)与发酵。
所述纤维素材料优选经预处理以减小颗粒尺寸,破坏纤维壁,并暴露纤维素材料的碳水化合物。所述预处理增加所述纤维素材料碳水化合物对酶水解的易感性。然而,预处理亦可暴露氧化还原活性金属阳离子,例如,亚铁离子,其可在所述碳水化合物的酶水解过程中抑制所述纤维素分解酶组合物的组分。此外,在所述碳水化合物的酶水解过程中,可释放更多的抑制性氧化还原活性金属阳离子,其可进一步抑制所述纤维素分解组合物。因此,本发明改善纤维素材料酶糖化成可发酵糖类以及所述糖类转化为所期望的发酵产物的效率。氧化还原活性金属阳离子通常以无机盐或与视为Lewis碱的有机物质形成的络合物的形式存在于纤维素材料中。
在一方面,本发明涉及产生氧化还原活性金属阳离子减少的纤维素材料的方法,所述氧化还原活性金属阳离子具有范围为约-0.4到约1.2伏的氧化还原电势(Eo),该方法包括用有效量的螯合剂处理所述纤维素材料以减少所述氧化还原活性金属阳离子对酶降解或转化所述纤维素材料的抑制作用,并且可选地还在当所述氧化还原活性金属阳离子具有低价状态时用有效量的氧化剂处理所述纤维素材料以将所述氧化还原活性金属阳离子转化为高价状态,以优先螯合所述氧化还原活性金属阳离子。举例而言,可包含有效量的氧化剂以将Fe(II)转化为Fe(III),从而使得所述螯合剂可结合Fe(III)。
在另一方面,本发明亦涉及降解或转化纤维素材料的方法,包括:用有效量的纤维素分解酶组合物处理所述纤维素材料,其中将所述纤维素材料用有效量的螯合剂处理以减少具有氧化还原电势(Eo)范围为约-0.4到约1.2伏的氧化还原活性金属阳离子对用所述纤维素分解酶组合物酶降解或转化所述纤维素材料的抑制作用,并且可选地还在当所述氧化还原活性金属阳离子具有低价状态时用有效量的氧化剂处理所述纤维素材料以将所述氧化还原活性金属阳离子转化为高价状态,以优先螯合所述氧化还原活性金属阳离子。
在进一步的方面,本发明亦涉及产生发酵产物的方法,包括:(a)用有效量的纤维素分解酶组合物糖化纤维素材料;(b)用一种或多种发酵微生物发酵经糖化的步骤(a)的纤维素材料以产生发酵产物;以及(c)回收发酵产物,其中用有效量的螯合剂处理所述纤维素材料以减少具有氧化还原电势(Eo)范围为约-0.4到约1.2伏的氧化还原活性金属阳离子对酶糖化所述纤维素材料的抑制作用,并且可选地还在当所述氧化还原活性金属阳离子具有低价状态时用有效量的氧化剂处理所述纤维素材料以将所述氧化还原活性金属阳离子转化为高价状态,以优先螯合所述氧化还原活性金属阳离子。
在本发明的方法中,所述氧化还原活性金属阳离子选自下组:Fe(II),Fe(III),Cu(II),Cr(III)与Ru(III)。
在一方面,所述氧化还原活性金属阳离子为Fe(II)。在另一方面,所述氧化还原活性金属阳离子为Fe(III)。在另一方面,所述氧化还原活性金属阳离子为Cu(II)。在另一方面,所述氧化还原活性金属阳离子为Cr(III)。在另一方面,所述氧化还原活性金属阳离子为Ru(III)。
加工纤维素材料
本发明的方法可用于将纤维素材料,例如,木素纤维素,糖化成为可发酵的糖,并将该可发酵的糖转化为多种有用的物质,例如,化学品与染料。自所述纤维素材料产生所期望的发酵产物通常涉及预处理,酶水解(糖化)与发酵。
根据本发明对所述纤维素材料的加工可使用本领域常规方法达成。此外,本发明的方法可使用任何经配置以依照本发明操作的常规生物质加工装置加以实施。
分别或同时的水解(糖化)与发酵包括但不仅限于:分别水解与发酵(SHF);同时糖化与发酵(SSF);同时糖化与共发酵(SSCF);混合水解与发酵(HHF);SHCF(分别水解与共发酵);HHCF(混合水解与共发酵(hybrid hydrolysis and cofermentation)),以及直接微生物转化(DMC)。SHF使用分别的过程步骤以首先将所述纤维素材料,例如,木素纤维素,酶水解为可发酵的糖,例如,葡萄糖,纤维二糖,纤维三糖与戊糖,并随即将所述可发酵的糖发酵为乙醇。在SSF中,所述纤维素材料,例如,木素纤维素的酶水解,以及糖发酵为乙醇合并为一步(Philippidis,G.P.,1996,Cellulose bioconversion technology,《Handbook on Bioethanol:Production and Utilization》,Wyman,C.E.编辑,Taylor & Francis,Washington,DC,179-212)。SSCF涉及多种糖类的共发酵(Sheehan,J.,and Himmel,M.,1999,Enzymes,energy and the environment:A strategic perspective on the U.S.Department of Energy’s research and development activities for bioethanol,Biotechnol.Prog.15:817-827)。HHF涉及分别的水解分离步骤,并另外涉及同时的糖化与水解步骤,其可在同一个反应器中进行。在HHF过程中的步骤可在不同温度下进行,亦即,高温酶糖化继以在较低的、发酵菌株可容忍的温度下的SSF。DMC将所有三个过程(酶产生,木素纤维素水解与发酵)合并于一个或更多步骤,其中使用相同生物体来产生酶以供将所述纤维素材料,例如,木素纤维素,转化为可发酵的糖,并将所述可发酵的糖转化为终产物(Lynd,L.R.,Weimer,P.J.,van Zyl,W.H.,and Pretorius,I.S.,2002,Microbial cellulose utilization:Fundamentals and biotechnology,Microbiol.Mol.Biol.Reviews 66:506-577)。在本文中应理解本领域任何包括预处理,酶水解(糖化),发酵或其组合的已知方法可用于实施本发明的方法。
常规装置可包括分批补料搅拌反应器(fed-batch stirred reactor),分批搅拌反应器(batch stirred reactor),带超滤的连续流动搅拌反应器(continuous flow stirred reactor with ultrafiltration)和/或连续的活塞流柱式反应器(continuous plug-flow column reactor)(Fernanda de Castilhos Corazza,Flávio Faria de Moraes,Gisella Maria Zanin and Ivo Neitzel,2003,Optimal controlin fed-batch reactor for the cellobiose hydrolysis,Acta Scientiarum.Technology 25:33-38;Gusakov,A.V.,and Sinitsyn,A.P.,1985,Kinetics of the enzymatic hydrolysis of cellulose:1.A mathematical model for a batch reactor process,Enz.Microb.Technol.7:346-352),磨耗反应器(an attrition reactor)(Ryu,S.K.,and Lee,J.M.,1983,Bioconversion of waste cellulose by using an attrition bioreactor,Biotechnol.Bioeng.25:53-65),或者带有由电磁场诱导的剧烈搅拌的反应器(areactor with intensive stirring induced by an electromagnetic field)(Gusakov,A.V.,Sinitsyn,A.P.,Davydkin,I.Y.,Davydkin,V.Y.,Protas,O.V.,1996,Enhancement of enzymatic cellulose hydrolysis using a novel type of bioreactor with intensive stirring induced by electromagnetic field,Appl.Biochem.Biotechnol.56:141-153)。其他类型的反应器包括:流化床(fluidized bed)、上流床(upflow blanket)、固定化的以及挤压器(extruder)类型反应器以供水解和/或发酵。
所述纤维素材料可在预处理之前,之中和/或之后,水解过程中,和/或发酵过程中用螯合剂处理。在一个优选方面,所述纤维素材料在预处理前用螯合剂处理。在另一个优选方面,所述纤维素材料在预处理过程中用螯合剂处理。在另一个优选方面,所述纤维素材料在预处理后用螯合剂处理。在另一个优选方面,所述纤维素材料在预处理之前,之中与之后用螯合剂处理。在另一个优选方面,所述纤维素材料在预处理之前,之中与之后中的两个或更多组合的过程中用螯合剂处理。在另一个优选方面,所述纤维素材料在水解过程中用螯合剂处理。在另一个优选方面,所述纤维素材料在发酵过程中用螯合剂处理。在另一个优选方面,所述纤维素材料在预处理之前,之中与之后,在水解过程中,以及在发酵过程中用螯合剂处理。在另一个优选方面,所述纤维素材料在预处理之前,之中与之后,在水解过程中,以及在发酵过程中的任意组合的过程中用螯合剂处理。在上述每一个方面,当所述氧化还原活性金属阳离子处于低价状态(例如,Fe(II)),并需要转化为高价状态(例如Fe(III))时,亦包含氧化剂。
预处理 在实施本发明的方法时,本领域已知的任何预处理过程可用于破坏植物细胞壁组分。所述纤维素材料,例如,木素纤维素,亦可在预处理之前使用本领域已知方法对其进行预浸(pre-soaking),润湿(wetting),或调理(conditioning)。常规预处理包括但不限于,蒸汽预处理(爆炸或不爆炸),稀酸预处理,热水预处理,石灰预处理,湿氧化,湿爆炸,氨纤维爆炸,有机溶剂预处理以及生物预处理。其它预处理包括超声,电穿孔,微波,超临界CO2,超临界H2O,与氨渗滤预处理。
所述纤维素材料可在水解和/或发酵前进行预处理。预处理优选在水解前进行。或者,所述预处理可与水解过程同时进行,例如与用一种或多种纤维素分解酶,或其它酶活性,例如,半纤维素酶处理纤维素材料同时进行,以释放可发酵的糖,例如葡萄糖和/或麦芽糖。在多数情况下,所述预处理步骤本身导致生物质部分转化为可发酵的糖(甚至酶不存在时亦如此)。
蒸汽预处理。在蒸汽预处理中,将所述纤维素材料加热以破坏其植物细胞壁组分,包括,例如,木质素,半纤维素与纤维素,以使所述纤维素与其它部分(例如,半纤维素)易受酶作用(accessible to enzymes)。使所述纤维素材料经过或通过反应容器,在该反应容器中注入蒸汽以增加温度至所需温度并增加压力,并在其中保持到所期望的反应时间。蒸汽预处理优选在140-230℃下进行,更优选为160-200℃,且最优选为170-190℃,其中最佳温度范围取决于任何化学催化剂的添加。蒸汽预处理的滞留时间优选为1-15分钟,更优选为3-12分钟,且最优选为4-10分钟,其中最佳滞留时间取决于温度范围和任何化学催化剂的添加。蒸汽预处理允许相对较高的固体装载,从而使得所述纤维素材料通常仅在预处理过程中为潮湿的。所述蒸汽预处理常常与预处理之后对所述材料的爆破性排出(explosive discharge)组合,其称为蒸汽爆破,亦即,所述材料迅速闪露于大气压力与湍流以通过碎裂增加其可接触表面积(Duff and Murray,1996,Bioresource Technology 855:1-33;Galbe and Zacchi,2002,Appl.Microbiol.Biotechnol.59:618-628;美国专利申请No.20020164730)。在蒸汽预处理过程中,半纤维素乙酰基团遭剪切,且所得的酸自催化半纤维素部分水解为单糖与寡糖。木质素仅部分程度移除。
如H2SO4或SO2等的催化剂(通常为0.3到3%w/w)常常在蒸汽预处理前添加,其减少时间与温度,增加回收,并改善酶水解(Ballesteros等,2006,Appl.Biochem.Biotechnol.129-132:496-508;Varga等,2004,Appl.Biochem.Biotechnol.113-116:509-523;Sassner等,2006,Enzyme Microb.Technol.39:756-762)。
化学预处理:术语“化学预处理”指任何促进纤维素,半纤维素和/或木质素分离和/或释放的化学预处理。合适的化学预处理过程的示例包括,例如,稀酸预处理,石灰预处理,湿氧化,氨纤维/冷冻爆炸(ammonia fiber/freeze explosion,AFEX),氨渗滤(APR)以及有机溶剂预处理。
在稀酸预处理中,将所述纤维素材料与稀酸,通常为H2SO4,以及水混合以形成浆料,由蒸汽加热至所期望的温度,并在滞留时间后闪露于大气压力。所述稀酸预处理可用多种设计的反应器来实施,例如,活塞流反应器,逆流反应器(counter-current reactor)或连续逆流收缩床反应器(continuous counter-current shrinking bed reactor)(Duff and Murray,1996,supra;Schell等,2004,Bioresource Technol.91:179-188;Lee等,1999,Adv.Biochem.Eng.Biotechnol.65:93-115)。
亦可使用数种碱性条件下的预处理方法。这些碱性预处理方法包括但不限于,石灰预处理,湿氧化,氨渗滤(APR)与氨纤维/冷冻爆炸(AFEX)。
石灰预处理使用碳酸钙,氢氧化钠或氨在85-150℃的低温下以及自1小时到数日的滞留时间下进行(Wyman等,2005,Bioresource Technol.96:1959-1966;Mosier等,2005,Bioresource Technol.96:673-686)。WO2006/110891,WO 2006/11899,WO 2006/11900与WO 2006/110901公开了使用氨的预处理方法。
湿氧化为下述的热预处理方法,即其通常在180-200℃下进行5-15分钟,加以如过氧化氢或氧气超压(over-pressure)等的氧化剂(Schmidt and Thomsen,1998,Bioresource Technol.64:139-151;Palonen等,2004,Appl.Biochem.Biotechnol.117:1-17;Varga等,2004,Biotechnol.Bioeng.88:567-574;Martin等,2006,J.Chem.Technol.Biotechnol.81:1669-1677)。该预处理优选以1-40%干物质,更优选2-30%干物质,且最优选5-20%干物质进行,且起始pH常常通过添加碱性物质,例如碳酸钠来增加。
所述湿氧化预处理方法的改进,称为湿爆炸(合并湿氧化与蒸汽爆炸),可处理多达30%的干物质。在湿爆炸中,氧化剂在预处理过程中一定滞留时间之后导入。所述预处理随即通过闪露于大气压力来终止(WO 2006/032282)。
氨纤维爆炸(AFEX)涉及用液态或气态氨在中等温度,例如90-100℃,以及高压,例如17-20巴下对纤维素材料处理5-10分钟,其中干物质含量可高达60%(Gollapalli等,2002,Appl.Biochem.Biotechnol.98:23-35;Chundawat等,2007,Biotechnol.Bioeng.96:219-231;Alizadeh等,2005,Appl.Biochem.Biotechnol.121:1133-1141;Teymouri等,2005,Bioresource Technol. 96:2014-2018)。AFEX预处理导致纤维素的解聚,以及半纤维素的部分水解。木质素-碳水化合物复合物遭剪切。
有机溶剂预处理通过用乙醇水溶液(40-60%乙醇)在160-200℃下提取30-60分钟来将纤维素材料脱木质化(Pan等,2005,Biotechnol.Bioeng.90:473-481;Pan等,2006,Biotechnol.Bioeng.94:851-861;Kurabi等,2005,Appl.Biochem.Biotechnol.121:219-230)。通常添加硫酸作为催化剂。在有机溶剂预处理中,大部分半纤维素得到移除。
合适的预处理方法的其它示例由Schell等,2003,Appl.Biochem.andBiotechnol.Vol.105-108,p.69-85与Mosier等,2005,Bioresource Technology 96:673-686,以及公布的美国申请2002/0164730描述。
在一方面,所述化学预处理优选作为酸处理来进行,且更优选作为连续性稀酸和/或温和酸处理进行。所述酸通常为硫酸,但亦可使用其它酸,例如,乙酸,柠檬酸,硝酸,磷酸,酒石酸,琥珀酸,盐酸或其混合物。温和酸处理在pH范围优选为1-5,更优选为1-4,且最优选为1-3下进行。在一方面,所述酸浓度范围为优选0.01到20wt%的酸,更优选0.05到10wt%的酸,甚至更优选0.1到5wt%的酸,且最优选0.2到2.0wt%的酸。所述酸与纤维素材料接触,并保持在范围优选为160-220℃,且更优选为165-195℃的温度下数秒至数分钟范围的时间段,例如,1秒到60分钟。
在另一方面,预处理作为氨纤维爆炸步骤(AFEX预处理步骤)进行。
在另一方面,预处理在水性浆料中进行。在优选的方面,所述纤维素材料在预处理过程中以优选为10-80wt%,更优选为20-70wt%,且最优选为30-60wt%,例如约50wt%的量存在。所述经预处理的纤维素材料可不经洗涤,或使用本领域任何已知方法洗涤,例如,用水洗涤。
机械预处理:术语“机械预处理”指不同类型的磨碎或碾磨(grinding or milling)(例如,干碾磨,湿碾磨,或振动球碾磨(vibratory ball milling))。
物理预处理:术语“物理预处理”指任何改善自含木素纤维素的材料分离和/或释放纤维素,半纤维素和/或木质素的预处理。举例而言,物理预处理可涉及辐射(例如,微波辐射),汽蒸/蒸汽爆炸,湿热分解以及其组合。
物理预处理可涉及高压和/或高温(蒸汽爆炸)。在一方面,高压意为范围在优选约300到约600psi,更优选约350到约550psi,且最优选约400到约500psi,例如约450psi的压力。在另一方面,高温意为范围在约100到约300℃,优选约140到约235℃的温度。在优选方面,机械预处理在分批过程,蒸汽枪水解仪系统中进行,所述系统使用如上所述定义的高压与高温,例如,可自SundsDefibrator AB,Sweden获取的Sunds Hydrolyzer。
物理和化学联合预处理:所述纤维素材料可经物理与化学方法两者预处理。举例而言,所述预处理步骤可涉及稀酸或温和酸处理以及高温和/或高压处理。所述物理与化学预处理可视需要顺次或同时进行。亦可包含机械预处理。
相应的,在优选方面,可对所述纤维素材料进行机械,化学或物理预处理,或其任意组合以促进纤维素,半纤维素和/或木质素的分离和/或释放。
生物预处理:术语“生物预处理”指任何促进自含木素纤维素的材料分离和/或释放纤维素,半纤维素和/或木质素的生物预处理。生物预处理技术可涉及施用溶解木质素的微生物(参见,例如,Hsu,T.-A.,1996,Pretreatment of biomass,《Handbook on Bioethanol:Production and Utilization》,Wyman,C.E.编辑,Taylor & Francis,Washington,DC,179-212;Ghosh and Singh,1993,Physicochemical and biological treatments for enzymatic/microbial conversion of lignocellulosic biomass,Adv.Appl.Microbiol.39:295-333;McMillan,J.D.,1994,Pretreating lignocellulosic biomass:a review,《Enzymatic Conversion of Biomass.for Fuels Production》,Himmel,M.E.,Baker,J.O.,and Overend,R.P.编辑,ACS Symposium Series 566,American Chemical Society,Washington,DC,chapter 15;Gong,C.S.,Cao,N.J.,Du,J.,and Tsao,G.T.,1999,Ethanol production from renewable resources,《Advances in Biochemical Engineering/Biotechnology》,Scheper,T.编辑,Springer-Verlag Berlin Heidelberg,Germany,65:207-241;Olsson and Hahn-Hagerdal,1996,Fermentation of lignocellulosic hydrolysates for ethanol production,Enz.Microb.Tech.18:312-331;和Vallander and Eriksson,1990,Production of ethanol from lignocellulosic materials:State of the art,Adv.Biochem.Eng./Biotechnol.42:63-95)。
糖化 在亦称为糖化的水解步骤中,将所述经预处理的纤维素材料水解以分解纤维素,并且可选地还将半纤维素分解为可发酵的糖,例如葡萄糖,木糖,木酮糖,阿拉伯糖,麦芽糖,甘露糖,半乳糖或可溶性寡糖。所述水解用酶法通过纤维素分解酶组合物进行。该组合物的酶亦可顺次添加。
酶水解优选在合适的水溶液环境中在本领域技术人员可容易地确定的条件下进行。在优选方面,水解在适于所述酶活性,亦即,对于所述酶为最佳的条件下进行。所述水解可以按分批补料或连续过程的方式进行,在后者中将经预处理的纤维素材料(底物)逐渐进料至,例如,含有酶的水解溶液。
所述糖化通常在搅拌釜式反应器或发酵罐中在受控的pH,温度和混合条件下进行。合适的过程时间,温度与pH条件可由本领域技术人员容易地确定。举例而言,所述糖化可持续长达200小时,但通常优选进行约12到约96小时,更优选约16到约72小时,且最优选约24到约48小时。温度范围优选约25℃到约80℃,更优选约30℃到约70℃,且最优选约40℃到60℃。pH范围优选约3到约8,更优选约3.5到约7,且最优选约4到约6,特别为约pH5。干物质含量范围优选约5到约50wt%,更优选约10到约40wt%,且最优选约20到约30wt%。
所述纤维素分解酶组合物优选包含具有内切葡聚糖酶,纤维二糖水解酶与β-葡糖苷酶活性的酶。在优选方面,所述纤维素分解酶组合物进一步包含一种或多种具有纤维素分解增强活性的多肽。在另一个优选方面,所述纤维素分解酶制备物补充有一种或多种额外的选自下组的酶活性:半纤维素酶,酯酶(例如,脂肪酶,磷脂酶和/或角质酶),蛋白酶,漆酶,过氧化物酶或其混合物。在本发明的方法中,所述额外的酶可在发酵之前或之中添加,包括在发酵微生物繁殖过程之中或之后添加。
所述酶可源自或得自任何合适的来源,包括细菌,真菌,酵母或哺乳动物来源。在本文中术语“得自”意为该酶可分离自天然产生该酶作为天然酶的生物。在本文中术语“得自”亦意为所述酶可在宿主生物中使用本文所描述的方法重组产生,其中所述重组产生的酶对于所述宿主生物可为天然的或外源的,或具有修饰的氨基酸序列,例如,具有一个或更多缺失,插入和/或取代的氨基酸,亦即,该重组产生的酶为天然氨基酸序列的突变体和/或片段,或者其为通过本领域已知的核酸改组过程(nucleic acid shuffling process)产生的酶。天然酶含意所涵盖的范围包括天然变体,而外源酶含意所涵盖的范围包括重组获得的变体,例如,通过定位诱变或改组得到的变体。
用于本发明中的酶可为任何适用于本文所描述的方法中的形式,例如,有或无细胞的粗发酵培养液,或基本上纯的多肽。所述酶可为干粉或颗粒,无尘颗粒,液体,稳定化的液体或受保护的酶。颗粒可以,例如,如美国专利Nos.4106991与4661452中公开的来产生,且可任选地通过本领域已知的过程包被。液体酶制备物可,例如,通过添加稳定剂,例如糖,糖醇或其它多元醇,和/或乳酸或另一个有机酸根据已经建立的过程加以稳定化。经保护的酶可根据公开于EP 238216中的过程加以制备。
所述具有纤维素分解增强活性的酶和多肽的最佳量取决于多种因素,包括但不限于,组分纤维素分解蛋白的混合物,所述纤维素底物,纤维素底物的浓度,所述纤维素底物的预处理,温度,时间,pH以及发酵生物的包括(例如,供同时糖化与发酵的酵母)。
在优选方面,针对纤维素材料纤维素分解蛋白的有效量为每g纤维素材料约0.5到约50mg,优选约0.5到约40mg,更优选约0.5到约25mg,更优选约0.75到约20mg,更优选约0.75到约15mg,甚至更优选约0.5到约10mg,且最优选约2.5到约10mg。
在另一个优选方面,针对纤维素材料具有纤维素分解增强活性的多肽的有效量为每g纤维素材料约0.01到约50.0mg,优选约0.01到约40mg,更优选约0.01到约30mg,更优选约0.01到约20mg,更优选约0.01到约10mg,更优选约0.01到约5mg,更优选约0.025到约1.5mg,更优选约0.05到约1.25mg,更优选约0.075到约1.25mg,更优选约0.1到约1.25mg,甚至更优选约0.15到约1.25mg,且最优选约0.25到约1.0mg。
在另一个优选方面,针对纤维素分解蛋白的具有纤维素分解增强活性的多肽的有效量为每g纤维素分解蛋白约0.005到约1.0g,优选约0.01到约1.0g,更优选约0.15到约0.75g,更优选约0.15到约0.5g,更优选约0.1到约0.5g,甚至更优选约0.1到约0.5g,且最优选约0.05到约0.2g。
发酵得自所述经预处理与水解的纤维素材料的可发酵的糖可由一种或多种能够将所述糖直接或间接发酵为所期望的发酵产物的发酵微生物进行发酵。“发酵”或“发酵过程”指任何发酵过程或任何包含发酵步骤的过程。发酵过程亦包括用于醇类消费品工业(例如,啤酒与葡萄酒),乳制品工业(例如,发酵的乳制品),皮革工业与烟草工业的发酵过程。发酵条件取决于所期望的发酵产物以及发酵生物,且可由本领域技术人员简单地确定。
在所述发酵步骤中,作为预处理与酶水解步骤的结果自所述纤维素材料释放的糖由发酵生物,例如酵母,发酵为产物,例如乙醇。可分别或同时进行水解(糖化)与发酵。上述方法包括但不限于,分别水解与发酵(SHF);同时糖化与发酵(SSF);同时糖化与共发酵(SSCF);混合水解与发酵(HHF);SHCF(分别水解与共发酵);HHCF(混合水解与共发酵),以及直接微生物转化(DMC)。
任何合适的经水解的纤维素材料可在实行本发明时用于所述发酵步骤。所述材料通常基于所期望的发酵产物(即,自发酵获取的物质),以及所用的过程选择,如本领域为众所周知的。
在本文中术语“发酵培养基”应理解为指在添加发酵微生物之前的培养基,例如,由糖化过程产生的培养基,以及用于同时糖化与发酵过程(SSF)的培养基。
“发酵微生物”指任何微生物,包括细菌与真菌生物,其适用于所期望的发酵过程以产生发酵产物。所述发酵生物可为C6和/或C5发酵生物,或其组合。C6与C5发酵生物均在本领域为众所周知。合适的发酵微生物能够将糖,例如葡萄糖,木糖,木酮糖,阿拉伯糖,麦芽糖,甘露糖,半乳糖或寡糖直接或间接发酵(即转化)为所期望的发酵产物。一些生物也能转化可溶的C6与C5寡聚物。
产生乙醇的细菌与真菌发酵生物的示例描述于Lin等,2006,Appl.Microbiol.Biotechnol.69:627-642。
可发酵C6糖的发酵微生物的示例包括细菌与真菌生物,例如酵母。优选的酵母包括酵母属菌种(Saccharomyces spp.),优选为酿酒酵母(Saccharomyces cerevisiae)的菌株。
可发酵C5糖的发酵生物的示例包括细菌与真菌生物,例如酵母。优选的C5发酵酵母包括毕赤氏酵母属(Pichia)的菌株,优选为具柄毕赤氏酵母(Pichia stipitis),例如具柄毕赤酵母CBS 5773;假丝酵母属(Candida)的菌株,优选为博伊丁氏假丝酵母(Candida boidinii),芸薹假丝酵母(Candida brassicae),休哈塔假丝酵母(Candida shehatae),迪丹氏假丝酵母(Candida diddensii),假热带假丝酵母(Candidapseudotropicalis)或产朊假丝酵母(Candida utilis)的菌株。
其它发酵生物包括发酵单胞菌属(Zymomonas)的菌株,例如运动发酵单胞菌(Zymomonas mobilis);汉逊氏酵母属(Hansenula)的菌株,例如异常汉逊氏酵母(Hansenula anomala);克鲁维酵母属(Kluyveromyces)的菌株,例如脆壁克鲁维酵母(Kluyveromyces fragilis);裂殖酵母属(Schizosaccharomyces)的菌株,例如粟酒裂殖酵母(Schizosaccharomyces pombe);以及大肠杆菌(E.coli),特别是经遗传修饰而改善了乙醇产量的大肠杆菌菌株。
在优选方面,所述酵母是酵母属菌种。在更优选方面,所述酵母为酿酒酵母。在另一个更优选方面,所述酵母为糖化酵母(Saccharomyces distaticus)。在另一个更优选方面,所述酵母为葡萄汁酵母(Saccharomyces uvarum)。在另一个优选方面,所述酵母属于克鲁维酵母属。在另一个更优选方面,所述酵母为马克斯克鲁维酵母(Kluyveromyces marxianus)。在另一个更优选方面,所述酵母为脆壁克鲁维酵母。在另一个优选方面,所述酵母属于假丝酵母属。在另一个更优选方面,所述酵母为博伊丁氏假丝酵母。在另一个更优选方面,所述酵母为芸薹假丝酵母。在另一个更优选方面,所述酵母为迪丹氏假丝酵母。在另一个更优选方面,所述酵母为假热带假丝酵母。在另一个更优选方面,所述酵母为产朊假丝酵母。在另一个优选方面,所述酵母为棍孢属(Clavispora)。在另一个更优选方面,所述酵母为葡萄牙棍孢(Clavispora lusitaniae)。在另一个更优选方面,所述酵母为仙人掌棍孢(Clavispora opuntiae)。在另一个优选方面,所述酵母属于管囊酵母属(Pachysolen)。在另一个更优选方面,所述酵母为嗜鞣管囊酵母(Pachysolen tannophilus)。在另一个优选方面,所述酵母属于毕赤氏酵母属。在另一个更优选方面,所述酵母为具柄毕赤氏酵母。在另一个优选方面,所述酵母属于酒香酵母属(Bretannomyces)。在另一个更优选方面,所述酵母为克劳森酒香酵母(Bretannomyces clausenii)(Philippidis,G.P.,1996,Cellulose bioconversion technology,in Handbook on Bioethanol:Production and Utilization,Wyman,C.E.编辑,Taylor&Francis,Washington,DC,179-212)。
可有效将己糖与戊糖发酵为乙醇的细菌包括,例如,运动发酵单胞菌与热纤维梭菌(Clostridium thermocellum)(Philippidis,1996,见上)。
在优选方面,所述细菌属于发酵单胞菌属。在更优选方面,所述细菌为运动发酵单胞菌。在另一个优选方面,所述细菌属于梭菌属(Clostridium)。在另一个更优选方面,所述细菌为热纤维梭菌。
适用于产生乙醇的可市购的酵母包括,例如,ETHANOL REDTM酵母(可得自Fermentis/Lesaffre,USA),FALITM(可得自Fleischmann’s Yeast,USA),SUPERSTARTTM与THERMOSACCTM新鲜酵母(可得自Ethanol Technology,WI,USA),BIOFERMTM AFT与XR(可得自NABC-North American Bioproducts Corporation,GA,USA),GERT STRANDTM(可得自Gert Strand AB,Sweden),以及FERMIOLTM(可得自DSM Specialties)。
在另一方面,所述发酵微生物可经遗传修饰以提供发酵戊糖的能力,例如使用木糖,使用阿拉伯糖以及共同使用木糖与阿拉伯糖的微生物。
将异源基因克隆入多种发酵微生物导致能够将己糖与戊糖转化为乙醇(共发酵)的生物的构建(Chen and Ho,1993,Cloning and improving the expression of Pichia stipitis xylose reductase gene in Saccharomyces cerevisiae,Appl.Biochem.Biotechnol.39-40:135-147;Ho等,1998,Genetically engineered Saccharomyces yeast capable of effectively cofermenting glucose and xylose,Appl.Environ.Microbiol.64:1852-1859;Kotter and Ciriacy,1993,Xylose fermentation by Saccharomyces cerevisiae,Appl.Microbiol.Biotechnol.38:776-783;Walfridsson等,1995,Xylose-metabolizing Saccharomyces cerevisiae strains overexpressing the TKL1 and TAL1 genes encoding the pentose phosphate pathway enzymes transketolase and transaldolase,Appl.Environ.Microbiol.61:4184-4190;Kuyper等,2004,Minimal metabolic engineering of Saccharomyces cerevisiae for efficient anaerobic xylose fermentation:a proof of principle,FEMS Yeast Research 4:655-664;Beall等,1991,Parametric studies of ethanol production from xylose and other sugars by recombinant Escherichia coli,Biotech.Bioeng.38:296-303;Ingram等,1998,Metabolic engineering of bacteria for ethanol production,Biotechnol.Bioeg..58:204-214;Zhang等,1995,Metabolic engineering of a pentose metabolism pathway in ethanologenic Zymomonas mobilis,Science 267:240-243;Deanda等,1996,Development of an arabinose-fermenting Zymomonas mobilis strain by metabolic pathway engineering,Appl.Environ.Microbiol.62:4465-4470)。
在优选方面,所述经遗传修饰的发酵微生物为酿酒酵母。在另一个优选方面,所述经遗传修饰的发酵微生物为运动发酵单胞菌。在另一个优选方面,所述经遗传修饰的发酵微生物为大肠杆菌。在另一个优选方面,所述经遗传修饰的发酵微生物为产酸克雷伯氏菌(Klebsiella oxytoca)。
在本领域众所周知上述生物亦可用于产生其它物质,如本文所述。
所述发酵微生物通常添加至经降解的纤维素材料,且将所述发酵进行约8到约96小时,例如约24到约60小时。温度通常为约26℃到约60℃之间,特别是约32℃或50℃,且在约pH3到约pH8,例如约pH4-5,6或7。
在优选方面,将所述酵母和/或另一微生物施用于经降解的纤维素材料且所述发酵过程进行约12到约96小时,例如通常24-60小时。在优选方面,温度优选在约20℃到约60℃之间,更优选约25℃到约50℃,且最优选约32℃到约50℃,特别是约32℃或50℃,且pH通常为约pH3到约pH7之间,优选约pH4-7。然而,一些微生物,例如,细菌发酵生物具有较高的最佳发酵温度。酵母或其它微生物优选以每ml发酵培养液大约105到1012,更优选大约107到1010,且特别是大约2x108活细胞计数的量施用。关于使用酵母以供发酵的进一步指导可见于,例如“The Alcohol Textbook”(编辑K.Jacques,T.P.Lyons and D.R.Kelsall,Nottingham University Press,United Kingdom 1999),其以参照的方式包含于本文中。
发酵刺激剂(fermentation stimulator)可与任何本文所述的酶方法并用以进一步改善所述发酵过程,以及特别是所述发酵微生物的表现,例如,增强速率与乙醇产量。“发酵刺激剂”指针对所述发酵微生物(具体而言,酵母)生长的刺激剂。优选的针对生长的发酵刺激剂包括维生素与矿物质。维生素的示例包括多种维生素,生物素,泛酸,烟酸,内消旋肌醇,硫胺素,吡哆醇,对氨基苯甲酸,叶酸,核黄素和维生素A,B,C,D及E。参见,例如,Alfenore等,Improving ethanol production and viability of Saccharomyces cerevisiae by a vitamin feeding strategy during fed-batch process,Springer-Verlag(2002),其以参照的方式包含于本文中。矿物质的示例包括矿物质与无机盐,其可供应包括P,K,Mg,S,Ca,Fe,Zn,Mn与Cu的营养物。
发酵产物:发酵产物可为任何源自发酵的物质。所述发酵产物可为,醇(例如,阿拉伯糖醇,丁醇,乙醇,甘油,甲醇,1,3-丙二醇,山梨醇与木糖醇);有机酸(例如,乙酸,醋酮酸,己二酸,抗坏血酸,柠檬酸,2,5-二酮-D-葡萄糖酸,蚁酸,富马酸,葡萄糖二酸,葡萄糖酸,葡糖醛酸,戊二酸,3-羟基丙酸,衣康酸,乳酸,苹果酸,丙二酸,草酸,丙酸,琥珀酸与木质酸);酮(例如,丙酮);氨基酸(例如,天冬氨酸,谷氨酸,甘氨酸,赖氨酸,丝氨酸和苏氨酸);以及气体(例如,甲烷,氢气(H2),二氧化碳(CO2)与一氧化碳(CO)),但不仅限于此。所述发酵产物亦可为作为高价值产物的蛋白质。
在优选方面,所述发酵产物为醇。应理解术语“醇”涵盖下述物质,即其包含一个或更多羟基部分(moiety)。在更优选方面,所述醇为阿拉伯糖醇。在另一个更优选方面,所述醇为丁醇。在另一个更优选方面,所述醇为乙醇。在另一个更优选方面,所述醇为甘油。在另一个更优选方面,所述醇为甲醇,在另一个更优选方面,所述醇为1,3-丙二醇。在另一个更优选方面,所述醇为山梨醇。在另一个更优选方面,所述醇为木糖醇。参见,例如Gong,C.S.,Cao,N.J.,Du,J.,and Tsao,G.T.,1999,Ethanol production from renewable resources,《Advances in Biochemical Engineering/Biotechnology》,Scheper,T.编辑,Springer-Verlag Berlin Heidelberg,Germany,65:207-241;Silveira,M.M.,and Jonas,R.,2002,The biotechnological production of sorbitol,Appl.Microbiol.Biotechnol.59:400-408;Nigam,P.,and Singh,D.,1995,Processes for fermentative production of xylitol-a sugar substitute,Process Biochemistry 30(2):117-124;Ezeji,T.C.,Qureshi,N.and Blaschek,H.P.,2003,Production of acetone,butanol and ethanol by Clostridium beijerinckii BA101 and in siturecovery by gas stripping,World Journal of Microbiology and Biotechnology 19(6):595-603。
在另一个优选方面,所述发酵产物为有机酸。在另一个更优选方面,所述有机酸为乙酸。在另一个更优选方面,所述有机酸为醋酮酸。在另一个更优选方面,所述有机酸为己二酸。在另一个更优选方面,所述有机酸为抗坏血酸。在另一个更优选方面,所述有机酸为柠檬酸。在另一个更优选方面,所述有机酸为2,5-二酮-D-葡萄糖酸。在另一个更优选方面,所述有机酸为蚁酸。在另一个更优选方面,所述有机酸为富马酸。在另一个更优选方面,所述有机酸为葡萄糖二酸。在另一个更优选方面,所述有机酸为葡萄糖酸。在另一个更优选方面,所述有机酸为葡糖醛酸。在另一个更优选方面,所述有机酸为戊二酸。在另一个更优选方面,所述有机酸为3-羟基丙酸。在另一个更优选方面,所述有机酸为衣康酸。在另一个更优选方面,所述有机酸为乳酸。在另一个更优选方面,所述有机酸为苹果酸。在另一个更优选方面,所述有机酸为丙二酸。在另一个更优选方面,所述有机酸为草酸。在另一个更优选方面,所述有机酸为丙酸。在另一个更优选方面,所述有机酸为琥珀酸。在另一个更优选方面,所述有机酸为木质酸。参见,例如,Chen,R.,and Lee,Y.Y.,1997,Membrane-mediated extractive fermentation for lactic acid production from cellulosic biomass,Appl.Biochem.Biotechnol.63-65:435-448。
在另一个优选方面,所述发酵产物为酮。应理解术语“酮”涵盖含有一个或更多酮部分的物质。在另一个更优选方面,所述酮为丙酮。参见,例如,Qureshi and Blaschek,2003,见上。
在另一个优选方面,所述发酵产物为氨基酸。在另一个更优选方面,所述有机酸为天冬氨酸。在另一个更优选方面,所述氨基酸为谷氨酸。在另一个更优选方面,所述氨基酸为甘氨酸。在另一个更优选方面,所述氨基酸为赖氨酸。在另一个更优选方面,所述氨基酸为丝氨酸。在另一个更优选方面,所述氨基酸为苏氨酸。参见,例如,Richard,A.,and Margaritis,A.,2004,Empirical modeling of batch fermentation kinetics for poly(glutamic acid)production and other microbial biopolymers,Biotechnology and Bioengineering 87(4):501-515。
在另一个优选方面,所述发酵产物为气体。在另一个更优选方面,所述气体为甲烷。在另一个更优选方面,所述气体为H2。在另一个更优选方面,所述气体为CO2。在另一个更优选方面,所述气体为CO。参见,例如,Kataoka,N.,A.Miya,and K.Kiriyama,1997,Studies on hydrogen production by continuous culture system of hydrogen-producing anaerobic bacteria,Water Science and Technology 36(6-7):41-47;和Gunaseelan V.N.in Biomass and Bioenergy,Vol.13(1-2),pp.83-114,1997,Anaerobic digestion of biomass for methane production:A review。
回收所述发酵产物可任选地自所述发酵培养基使用任何本领域已知方法加以回收,所述方法包括但不仅限于,层析(例如,离子交换,亲和,疏水,层析聚焦以及大小排阻),电泳过程(例如,制备型等电聚焦),差示溶解度(differential solubility)(例如,硫酸铵沉淀),SDS-PAGE,蒸馏或提取。举例而言,醇自经发酵的纤维素材料分离并通过常规蒸馏方法纯化。可获取纯度高至约96vol.%的乙醇,其可用作,例如,燃料乙醇,饮用乙醇,亦即,可饮用的中性酒精饮料,或工业乙醇。
螯合剂
在本发明的方法中,可使用任何能够螯合氧化还原活性金属阳离子的螯合剂。可使用的金属螯合剂的示例包括,但不仅限于,羧酸化合物如柠檬酸,草酸,琥珀酸,苹果酸,天冬氨酸,醛糖酸,糖醛酸,阿魏酸,苯甲酸,氨三乙酸(NTA)与乙二胺四乙酸(EDTA);含氮化合物如2,2’-联吡啶,1,10-菲咯啉,咪唑,组氨酸,赖氨酸,氨,环烯(氮杂冠)(cyclen(aza-crown)),聚胍(poly(guanidyl)),酞菁,卟啉,植物螯合肽(phytochelatin),7-(1-乙烯基-3,3,5,5-四甲基己基)-8-羟基喹啉;基于硫的化合物如半胱氨酸,甲硫氨酸,二硫代氨基甲酸,二(2,4,4-三甲基戊基)-二硫次膦酸,二(2-乙基己基)单硫磷酸;含氧化合物如冠醚,Calixarene,葡萄糖酸内酯,二(2,4,4-三甲基戊基)-次膦酸与酚类化合物(包括腐殖酸);磷酸(包括三聚磷酸);多聚物质如离子交换树脂(包括)以及无机沸石(包括斜发沸石);或上述的组合。
在一方面,所述螯合剂为羧酸化合物。在另一方面,所述螯合剂为含氧化合物。在另一方面,所述螯合剂为含氮化合物。在另一方面,所述螯合剂为含硫化合物。在另一方面,所述螯合剂为阴离子。在另一方面,所述螯合剂为磷酸。在另一方面,所述螯合剂为多聚物质。
在另一方面,所述螯合剂为柠檬酸。在另一方面,所述螯合剂为草酸。在另一方面,所述螯合剂为琥珀酸。在另一方面,所述螯合剂为苹果酸。在另一方面,所述螯合剂为醛糖酸。在另一方面,所述螯合剂为糖醛酸。在另一方面,所述螯合剂为阿魏酸。在另一方面,所述螯合剂为天冬氨酸。在另一方面,所述螯合剂为EDTA。在另一方面,所述螯合剂为氨三乙酸。
在另一方面,所述螯合剂为2,2’-联吡啶。在另一方面,所述螯合剂为1,10-菲咯啉。在另一方面,所述螯合剂为咪唑。在另一方面,所述螯合剂为组氨酸。在另一方面,所述螯合剂为赖氨酸。在另一方面,所述螯合剂为氨。在另一方面,所述螯合剂为环烯(氮杂冠)。在另一方面,所述螯合剂为植物螯合肽。在另一方面,所述螯合剂为去铁草酰胺(一种铁载体)。在另一方面,所述螯合剂为酞菁。在另一方面,所述螯合剂为卟啉。
在另一方面,所述螯合剂为半胱氨酸。在另一方面,所述螯合剂为甲硫氨酸。在另一方面,所述螯合剂为二硫代氨基甲酸。
在另一方面,所述螯合剂为冠醚。在另一方面,所述螯合剂为葡萄糖酸内酯。在另一方面,所述螯合剂为酚类化合物。在另一方面,所述螯合剂为腐殖酸。
在另一方面,所述螯合剂为磷酸。在另一方面,所述螯合剂为焦磷酸。在另一方面,所述螯合剂为三聚磷酸。在另一方面,所述螯合剂为肌醇六磷酸。在另一方面,所述螯合剂为次膦酸。在另一方面,所述螯合剂为硫代次膦酸。在另一方面,所述螯合剂为Amberlite树脂。在另一方面,所述螯合剂为斜发沸石。在另一方面,所述螯合剂为木素硫酸(lingosulfate)。
在另一方面,所述螯合剂为柠檬酸。在另一方面,所述螯合剂为苹果酸。在另一方面,所述螯合剂为草酸。在另一方面,所述螯合剂为去铁草酰胺。在另一方面,所述螯合剂为植物螯合肽。在另一方面,所述螯合剂为EDTA。在另一方面,所述螯合剂为焦磷酸。
在本发明的方法中,螯合剂的有效量范围为每kg干纤维素材料优选约0.01到约100mM,更优选约0.1到约10mM,且最优选为约0.5到约5mM。
在螯合剂处理过程中,pH范围优选为约1到约11,更优选约3到约9,且最优选约5到约7。温度范围优选为约5℃到约200℃,更优选约20℃到约80℃,且最优选约40℃到约60℃。
在螯合剂处理过程中,纤维素材料装载量范围按干重计优选为约1到50%,更优选约5到约30%,且最优选约10到约20%。
氧化剂
在本发明的方法中,可使用任何能够将具有低价状态的氧化还原活性金属阳离子氧化为高价状态(例如,从亚铁到铁)的氧化剂。可使用的氧化剂的示例包括但不仅限于,O2(充气),臭氧(O3),氯气(Cl2),溴(Br2),过氧化氢(H2O2),无机或有机过氧化物或过酸,次氯酸钠(NaOCl),二氧化氯(ClO2),一氧化氮(NO),高锰酸钾(KMnO4)以及硝酸盐(NO3 -)或亚硝酸盐(NO2 -),或其组合。
在优选方面,所述氧化剂为O2。在另一个优选方面,所述氧化剂为臭氧(O3)。在另一个优选方面,所述氧化剂为过氧化氢(H2O2)。在另一个优选方面,所述氧化剂为无机过氧化物。在另一个优选方面,所述氧化剂为次氯酸钠(NaOCl)。在另一个优选方面,所述氧化剂为二氧化氯(ClO2)。在另一个优选方面,所述氧化剂为硝酸盐(NO3 -)。在另一个优选方面,所述氧化剂为亚硝酸盐(NO2 -)。
在更优选方面,所述氧化剂为过氧化氢(H2O2)。在另一个更优选方面,所述氧化剂为次氯酸钠(NaOCl)。在另一个更优选方面,所述氧化剂为硝酸盐(NO3 -)。
在氧化剂处理过程中,pH范围优选为约1到约11,更优选约3到约9,且最优选约5到约7。温度范围优选为约5℃到约200℃,更优选约20℃到约80℃,且最优选约40℃到约60℃。所述氧化剂优选剂量范围为每kg干纤维素材料约0.01到约100,更优选约0.05到约50,且最优选约0.5到约5g。
在一方面,将所述纤维素材料在用螯合剂处理之前用氧化剂处理。在另一方面,将所述纤维素材料用氧化剂和螯合剂同时处理。
纤维素分解酶组合物
在本发明的方法中,所述纤维素分解酶组合物可包含任何涉及将纤维素材料(例如,木素纤维素)加工为可发酵的糖(例如,葡萄糖)的蛋白质。
对纤维素降解,至少三类酶对将纤维素转化为可发酵的糖为重要的:内切葡聚糖酶(EC 3.2.1.4),其随机水解纤维素链;纤维二糖水解酶(EC3.2.1.91),其自所述纤维素链末端剪切纤维二糖单元;以及β-葡糖苷酶(EC3.2.1.21),其将纤维二糖与可溶性纤维糊精转化为葡萄糖。
所述纤维素分解酶组合物可为单组分制备物,例如,内切葡聚糖酶,多组分制备物,例如,内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶,或多组分与单组分蛋白质制备物的组合。所述纤维素分解蛋白可在酸性,中性或碱性pH范围具有活性,即,可水解纤维素。
具有纤维素分解酶活性的多肽可以是细菌多肽。例如,该多肽可以是革兰氏阳性细菌多肽,诸如芽孢杆菌属(Bacillus)、链球菌属(Streptococcus)、链霉菌属(Streptomyces)、葡萄球菌属(Staphylococcus)、肠球菌属(Enterococcus)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、梭菌属(Clostridium)、地芽孢杆菌属(Geobacillus)或海洋芽孢杆菌属(Oceanobacillus)的具有纤维素分解酶活性的多肽,或革兰氏阴性细菌多肽,如大肠杆菌、假单胞菌属(Pseudomonas)、沙门氏菌属(Salmonella)、弯曲杆菌属(Campylobacter)、螺杆菌属(Helicobacter)、黄杆菌属(Flavobacterium)、梭杆菌属(Fusobacterium)、泥杆菌属(Ilyobacter)、奈瑟氏球菌属(Neisseria)或尿枝原体属(Ureaplasma)的具有纤维素分解酶活性的多肽。
在一个优选的方面,所述多肽是嗜碱芽孢杆菌(Bacillus alkalophilus)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、短芽孢杆菌(Bacillus brevis)、环状芽孢杆菌(Bacillus circulans)、克劳氏芽孢杆菌(Bacillus clausii)、凝结芽孢杆菌(Bacillus coagulans)、坚强芽孢杆菌(Bacillus firmus)、灿烂芽孢杆菌(Bacillus lautus)、缓慢芽孢杆菌(Bacillus lentus)、地衣芽孢杆菌(Bacillus licheniformis)、巨大芽孢杆菌(Bacillus megaterium)、短小芽孢杆菌(Bacillus pumilus)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)、枯草芽孢杆菌(Bacillus subtilis)或苏云金芽孢杆菌(Bacillus thuringiensis)的具有纤维素分解酶活性的多肽。
在另一个优选的方面,所述多肽是似马链球菌(Streptococcus equisimilis)、酿脓链球菌(Streptococcus pyogenes)、乳房链球菌(Streptococcus uberis)或马链球菌兽瘟亚种(Streptococcus equi subsp.Zooepidemicus)的具有纤维素分解酶活性的多肽。
在另一个优选的方面,所述多肽是不产色链霉菌(Streptomyces achromogenes)、除虫链霉菌(Streptomyces avermitilis)、天蓝色链霉菌(Streptomyces coelicolor)、灰色链霉菌(Streptomyces griseus)、或浅青紫链霉菌(Streptomyces lividans)的具有纤维素分解酶活性的多肽。
具有纤维素分解酶活性的多肽还可以是真菌多肽,且更优选酵母多肽,如假丝酵母属(Candida)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)或西洋蓍霉属(Yarrowia)的具有纤维素分解酶活性的多肽;或者更优选丝状真菌多肽,如枝顶孢霉属(Acremonium)、蘑菇属(Agaricus)、链格孢属(Alternaria)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、葡萄座腔菌属(Botryospaeria)、拟蜡菌属(Ceriporiopsis)、毛壳菌属(Chaetomidium)、金孢子菌属(Chrysosporium)、麦角属(Claviceps)、旋孢腔菌属(Cochliobolus)、Coprinopsis、Coptotermes、棒囊壳属(Corynascus)、栗疫病菌属(Cryphonectria)、隐球菌属(Cryptococcus)、色二孢属(Diplodia)、黑耳属(Exidia)、网孢菌属(Filibasidium)、镰孢属(Fusarium)、赤霉属(Gibberella)、全鞭毛虫属(Holomastigotoides)、腐质霉属(Humicola)、耙菌属(Irpex)、香菇属(Lentinula)、小球腔菌属(Leptospaeria)、梨孢菌属(Magnaporthe)、Melanocarpus、多孔菌属(Meripilus)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新考玛脂霉属(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、平革菌属(Phanerochaete)、瘤胃壶菌属(Piromyces)、Poitrasia、假黑盘菌属(Pseudoplectania)、Pseudotrichonympha、根毛霉属(Rhizomucor)、裂褶菌属(Schizophyllum)、柱顶孢属(Scytalidium)、踝节菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、木霉属(Trichoderma)、Trichophaea、轮枝孢属(Verticillium)、小包脚菇属(Volvariella)、或炭角菌属(Xylaria)的具有纤维素分解酶活性的多肽。
在一个优选的方面所述多肽是卡尔酵母(Saccharomyces carlsbergensis)、酿酒酵母(Saccharomyces cerevisiae)、糖化酵母(Saccharomyces diastaticus)、道格拉氏酵母(Saccharomyces douglasii)、克鲁弗酵母(Saccharomyces kluyveri)、诺地酵母(Saccharomyces norbensis)或卵形酵母(Saccharomyces oviformis)的具有纤维素分解酶活性的多肽。
在另一个优选的方面,所述多肽是解纤维枝顶孢霉(Acremonium cellulolyticus)、棘孢曲霉(Aspergillus aculeatus)、泡盛曲霉(Aspergillus awamori)、烟曲霉(Aspergillus fumigatus)、臭曲霉(Aspergillus foetidus)、日本曲霉(Aspergillus japonicus)、构巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillus niger)、米曲霉、嗜角质金孢子菌(Chrysosporium keratinophilum)、Chrysosporium lucknowense、热带金孢子菌(Chrysosporium tropicum)、Chrysosporium merdarium、Chrysosporium inops、Chrysosporium pannicola、Chrysosporium queenslandicum、Chrysosporium zonatum、杆孢状镰孢(Fusarium bactridioides)、禾谷镰孢(Fusarium cerealis)、库威镰孢(Fusarium crookwellense)、大刀镰孢(Fusarium culmorum)、禾本科镰孢(Fusarium graminearum)、禾赤镰孢(Fusarium graminum)、异孢镰孢(Fusarium heterosporum)、合欢木镰孢(Fusarium negundi)、尖镰孢(Fusarium oxysporum)、多枝镰孢(Fusarium reticulatum)、粉红镰孢(Fusarium roseum)、接骨木镰孢(Fusarium sambucinum)、肤色镰孢(Fusarium sarcochroum)、拟分枝孢镰孢(Fusarium sporotrichioides)、硫色镰孢(Fusarium sulphureum)、圆镰孢(Fusarium torulosum)、拟丝孢镰孢(Fusarium trichothecioides)、镶片镰孢(Fusarium venenatum)、灰色腐质霉(Humicola grisea)、特异腐质霉、疏棉状腐质霉(Humicola lanuginosa)、乳白耙菌(Irpex lacteus)、米赫毛霉(Mucor miehei)、嗜热毁丝霉(Myceliophthora thermophila)、粗糙脉孢菌(Neurospora crassa)、绳状青霉(Penicillium funiculosum)、产紫青霉(Penicillium purpurogenum)、黄孢平革菌(Phanerochaete chrysosporium)、无色梭孢壳(Thielavia achromatica)、Thielavia albomyces、Thielavia albopilosa、澳洲梭孢壳(Thielavia australeinsis)、Thielavia fimeti、小孢子梭孢壳(Thielavia microspora)、Thielavia ovispora、Thielavia peruviana、Thielavia spededonium、毛梭孢壳(Thielavia setosa)、Thielavia subthermophila、土生梭孢壳、哈茨木霉(Trichoderma harzianum)、康宁木霉(Trichoderma koningii)、长枝木霉(Trichoderma longibrachiatum)、里氏木霉、绿色木霉(Trichoderma viride)或Trichophaea saccata的具有纤维素分解酶活性的多肽。
亦可使用纤维素分解蛋白的化学修饰的或工程改造的突变体。
所述纤维素分解酶组合物的一个或更多组分可为重组组分,亦即,通过克隆编码所述单一组分的DNA序列,并随后用所述DNA序列转化细胞并在宿主中表达来产生(参见,例如,WO 91/17243与WO 91/17244)。所述宿主优选为异源宿主(酶对宿主为外来的),然而在一定条件下所述宿主亦可为同源宿主(酶对宿主为固有的)。单组分纤维素分解蛋白亦可通过自发酵培养液纯化上述蛋白质来加以制备。
在本发明方法中所用的纤维素分解蛋白可通过在含有合适的碳源与氮源以及无机盐的营养培养基上,使用本领域已知的步骤对上面提及的微生物菌株进行发酵来产生(参见,例如,Bennett,J.W.and LaSure,L.(eds.),More Gene Manipulations in Fungi,Academic Press,CA,1991)。合适的培养基可得自商业供应商或可根据公开发表的配方进行制备(例如,在美国典型培养物保藏中心(American Type Culture Collection)的目录中)。适于生长与纤维素分解蛋白产生的温度范围与其它条件在本领域中为已知的(参见,例如,Bailey,J.E.,and Ollis,D.F.,Biochemical Engineering Fundamentals,McGraw-Hill Book Company,NY,1986)。
所述发酵可为任何培养细胞的方法,只要其导致纤维素分解蛋白的表达或分离。发酵可以因此理解为包含在实验室或工业发酵罐中在合适培养基中并在允许所述纤维素分解蛋白表达或分离的条件下进行的摇瓶培养,或者小或大规模发酵(包括连续,批次,分批补料或固态发酵)。由上面所描述的方法所得的纤维素分解蛋白可自发酵培养基中回收,并通过本文所描述的常规步骤进行纯化。
适用于本发明的商业性纤维素分解酶制备物的示例包括,例如CELLUCLASTTM(可得自Novozymes A/S)与NOVOZYMTM 188(可得自Novozymes A/S)。其它可市购的可用的包含纤维素酶的制备物包括CELLUZYMETM,CEREFLOTM与ULTRAFLOTM(Novozymes A/S),LAMINEXTM与SPEZYMETM CP(Genencor Int.),ROHAMENTTM7069W(GmbH),以及LDI,LBR或150L(Dyadic International,Inc.,Jupiter,FL,USA)。所述纤维素酶以自约0.001%到约5.0%wt.的固体的有效量添加,更优选为自约0.025%到约4.0%wt.的固体,且最优选为自约0.005%到约2.0%wt.的固体。
可用于本发明的方法的细菌内切葡聚糖酶的示例包括但不仅限于,解纤维热酸菌(Acidothermus cellulolyticus)内切葡聚糖酶(WO 91/05039;WO93/15186;美国专利No.5275944;WO 96/02551;美国专利No.5536655,WO 00/70031,WO 05/093050);Thermobifida fusca内切葡聚糖酶III(WO05/093050);以及Thermobifida fusca内切葡聚糖酶V(WO 05/093050)。
可用于本发明方法中的真菌内切葡聚糖酶的示例包括但不仅限于,里氏木霉内切葡聚糖酶I(Penttila等,1986,Gene 45:253-263;GENBANKTM登录号M15665);里氏木霉内切葡聚糖酶II(Saloheimo,等,1988,Gene 63:11-22;GENBANKTM登录号M19373);里氏木霉内切葡聚糖酶III(Okada等,1988,Appl.Environ.Microbiol.64:555-563;GENBANKTM登录号AB003694);里氏木霉内切葡聚糖酶IV(Saloheimo等,1997,Eur.J.Biochem.249:584-591;GENBANKTM登录号Y11113);里氏木霉内切葡聚糖酶V(Saloheimo等,1994,Molecular Microbiology 13:219-228;GENBANKTM登录号Z33381);棘孢曲霉内切葡聚糖酶(Ooi等,1990,Nucleic Acids Research18:5884);川地曲霉(Aspergillus kawachii)内切葡聚糖酶(Sakamoto等,1995,Current Genetics 27:435-439);软腐欧文氏菌(Erwinia carotovara)内切葡聚糖酶(Saarilahti等,1990,Gene 90:9-14);尖镰孢内切葡聚糖酶(GENBANKTM登录号L29381);灰色腐质霉高温变种(Humicola grisea var.thermoidea)内切葡聚糖酶(GENBANKTM登录号AB003107);Melanocarpus albomyces内切葡聚糖酶(GENBANKTM登录号MAL515703);粗糙脉孢菌内切葡聚糖酶(GENBANKTM登录号XM_324477);特异腐质霉内切葡聚糖酶V(SEQ ID NO:12);嗜热毁丝霉CBS117.65内切葡聚糖酶(SEQ ID NO:14);担子菌纲CBS 495.95内切葡聚糖酶(SEQ ID NO:16);担子菌纲CBS 494.95内切葡聚糖酶(SEQ ID NO:18);土生梭孢壳RRL 8126 CEL6B内切葡聚糖酶(SEQ ID NO:20);土生梭孢壳NRRL 8126 CEL6C内切葡聚糖酶(SEQ ID NO:22);土生梭孢壳NRRL 8126CEL7C内切葡聚糖酶(SEQ ID NO:24);土生梭孢壳NRRL 8126 CEL7E内切葡聚糖酶(SEQ ID NO:26);土生梭孢壳NRRL 8126 CEL7F内切葡聚糖酶(SEQ ID NO:28);Cladorrhinum foecundissimum ATCC 62373 CEL7A内切葡聚糖酶(SEQ ID NO:30);以及里氏木霉菌株No.VTT-D-80133内切葡聚糖酶(SEQ ID NO:32;GENBANKTM登录号M15665)。上述SEQ ID NO:12,SEQID NO:14,SEQ ID NO:16,SEQ ID NO:18,SEQ ID NO:20,SEQ ID NO:22,SEQ ID NO:24,SEQ ID NO:26,SEQ ID NO:28,SEQ ID NO:30与SEQ IDNO:32的内切葡聚糖酶分别由SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:17,SEQ ID NO:19,SEQ ID NO:21,SEQ ID NO:23,SEQID NO:25,SEQ ID NO:27,SEQ ID NO:29与SEQ ID NO:31的成熟多肽编码序列所编码。
在本发明的方法中有用的纤维二糖水解酶的示例包括但不仅限于,里氏木霉纤维二糖水解酶I(SEQ ID NO:34);里氏木霉纤维二糖水解酶II(SEQ IDNO:36);特异腐质霉纤维二糖水解酶I(SEQ ID NO:38);嗜热毁丝霉纤维二糖水解酶II(SEQ ID NO:40);土生梭孢壳纤维二糖水解酶II(CEL6A)(SEQ IDNO:42);嗜热毛壳菌(Chaetomium thermophilum)纤维二糖水解酶I(SEQ IDNO:44)以及嗜热毛壳菌纤维二糖水解酶II(SEQ ID NO:46)。上述SEQ ID NO:34,SEQ ID NO:36,SEQ ID NO:38,SEQ ID NO:40,SEQ ID NO:42,SEQID NO:44与SEQ ID NO:46的纤维二糖水解酶分别由SEQ ID NO:33,SEQID NO:35,SEQ ID NO:37,SEQ ID NO:39,SEQ ID NO:41,SEQ ID NO:43与SEQ ID NO:45的成熟多肽编码序列所编码。
在本发明的方法中有用的β-葡糖苷酶的示例包括但不仅限于,米曲霉β-葡糖苷酶(SEQ ID NO:48);烟曲霉β-葡糖苷酶(SEQ ID NO:50);巴西青霉(Penicillium brasilianum)IBT 20888β-葡糖苷酶(SEQ ID NO:52);黑曲霉β-葡糖苷酶(SEQ ID NO:54);和棘孢曲霉β-葡糖苷酶(SEQ ID NO:56)。上述SEQ ID NO:48,SEQ ID NO:50,SEQ ID NO:52,SEQ ID NO:54与SEQ IDNO:56的β-葡糖苷酶分别由SEQ ID NO:47,SEQ ID NO:49,SEQ ID NO:51,SEQ ID NO:53与SEQ ID NO:55的成熟多肽编码序列所编码。
所述具有β-葡糖苷酶活性的米曲霉多肽可以根据WO 2002/095014获得。所述具有β-葡糖苷酶活性的烟曲霉多肽可以根据WO 2005/047499获得。所述具有β-葡糖苷酶活性的巴西青霉多肽可以根据WO 2007/019442获得。所述具有β-葡糖苷酶活性的黑曲霉多肽可以根据Dan等,2000,J.Biol.Chem.275:4973-4980获得。所述具有β-葡糖苷酶活性的棘孢曲霉多肽可以根据Kawaguchi等,1996,Gene 173:287-288获得。
其它内切葡聚糖酶,纤维二糖水解酶与β-葡糖苷酶在多种使用根据Henrissat B.,1991,A classification of glycosyl hydrolases based on amino-acid sequence similarities,Biochem.J.280:309-316,and Henrissat B.,and Bairoch A.,1996,Updating the sequence-based classification of glycosyl hydrolases,Biochem.J.316:695-696的分类法的糖基水解酶家族中得到公开。
在另一个优选的方面,所述β-葡糖苷酶是SEQ ID NO:58的米曲霉β-葡糖苷酶变体BG融合蛋白或SEQ ID NO:60的米曲霉β-葡糖苷酶融合蛋白。在另一个优选的方面,所述米曲霉β-葡糖苷酶变体BG融合蛋白由SEQ IDNO:57的多核苷酸编码或所述米曲霉β-葡糖苷酶融合蛋白由SEQ ID NO:59的多核苷酸编码。
所述纤维素分解酶组合物可进一步包含具有纤维素分解增强活性的多肽,其包含以下基序(motif):
[ILMV]-P-X(4,5)-G-X-Y-[ILMV]-X-R-X-[EQ]-X(4)-[HNQ]和
[FW]-[TF]-K-[AIV],其中X是任意氨基酸,X(4,5)是在4或5个邻接位置上的任意氨基酸并且X(4)是在4个连邻接位置上的任意氨基酸。
包含上述基序的分离的多肽可进一步包含:
H-X(1,2)-G-P-X(3)-[YW]-[AILMV],
[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV],或
H-X(1,2)-G-P-X(3)-[YW]-[AILMV]和
[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV],
其中X是任意氨基酸,X(1,2)是在1个位置或2个邻接位置上的任意氨基酸,X(3)是在3个邻接位置上的任意氨基酸,并且X(2)是在2个邻接位置上的任意氨基酸。在以上基序中,采用公认的IUPAC单字母氨基酸缩写。
在优选的方面,具有纤维素分解增强活性的分离的多肽进一步包含H-X(1,2)-G-P-X(3)-[YW]-[AILMV]。在另一优选的方面,具有纤维素分解增强活性的分离的多肽还包含[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV]。在另一优选的方面,具有纤维素分解增强活性的分离的多肽还包含H-X(1,2)-G-P-X(3)-[YW]-[AILMV]和
[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV]。
具有纤维素分解增强活性的分离的多肽的示例包括具有纤维素分解增强活性的土生梭孢壳多肽(SEQ ID NO:62,SEQ ID NO:64,SEQ ID NO:66,SEQ ID NO:68,SEQ ID NO:70或SEQ ID NO:72的成熟多肽);橙色嗜热子囊菌(Thermoascus auranticus)(SEQ ID NO:74的成熟多肽);或里氏木霉(SEQ ID NO:76的成熟多肽)。上述SEQ ID NO:62,SEQ ID NO:64,SEQ IDNO:66,SEQ ID NO:68,SEQ ID NO:70,SEQ ID NO:72与SEQ ID NO:74的具有纤维素分解增强活性的多肽分别由SEQ ID NO:61,SEQ ID NO:63,SEQ ID NO:65,SEQ ID NO:67,SEQ ID NO:69,SEQ ID NO:71,SEQ IDNO:73与SEQ ID NO:75的成熟多肽编码序列所编码。
关于具有纤维素分解增强活性的多肽与其多核苷酸的进一步细节,参见WO 2005/074647,WO 2005/074656与公布的美国申请流水号No.2007/0077630,其以参照的方式包含于本文中。
所述纤维素分解酶组合物可进一步包含一种或多种选自下组的酶:半纤维素酶,酯酶,蛋白酶,漆酶,过氧化物酶或其混合物。
可使用任何适用于将半纤维素水解(优选水解成木糖)的半纤维素酶。优选的半纤维素酶包括木聚糖酶,阿拉伯呋喃糖苷酶,乙酰木聚糖酯酶,阿魏酸酯酶,葡萄糖醛酸糖苷酶,内切半乳聚糖酶,甘露聚糖酶,内或外切阿拉伯糖酶,外切半乳聚糖酶,木糖苷酶与其组合。优选的,所述半纤维素酶具有在7以下,优选pH3-7的酸性条件下水解半纤维素的能力。适用于本发明的半纤维素酶的示例包括VISCOZYMETM(可得自Novozymes A/S,Denmark)。
在一方面,所述半纤维素酶为木聚糖酶。所述木聚糖酶可为微生物来源,例如真菌来源(例如,木霉属,多孔菌属,腐质霉属,曲霉属,镰孢属)或细菌来源(例如,芽孢杆菌属)。在优选方面,所述木聚糖酶得自丝状真菌,优选得自曲霉属的菌株,例如棘孢曲霉,或腐质霉属的菌株,例如疏绵状腐质霉。所述木聚糖酶优选为内切-1,4-β-木聚糖酶,更优选为GH10或GH11的内切-1,4-β-木聚糖酶。商业性木聚糖酶的示例包括SHEARZYMETM与BIOFEEDWHEATTM(Novozymes A/S,Denmark)。
所述半纤维素酶可以水解半纤维素的有效量添加,例如,以总固体(TS)的0.001到0.5wt.%的量,更优选TS的约0.05到0.5wt.%。
木聚糖酶可以0.001-1.0g/kg DM(干物质)底物的量添加,优选以0.005-0.5g/kg DM底物的量,且最优选0.05-0.10g/kg DM底物。
核酸构建体
可以将编码具有酶活性或者纤维素分解增强活性的多肽的分离的多核苷酸用多种方法进行操作,以通过构建核酸构建体提供多肽的表达,所述核酸构建体含有与一种或多种控制序列可操作连接的编码所述多肽的分离的多核苷酸,所述控制序列指导所述编码序列在合适的宿主细胞中在与所述控制序列相容的条件下表达。取决于表达载体,在插入载体之前对多核苷酸的序列进行操作可能是理想的或者必要的。使用重组DNA方法修饰多核苷酸序列的技术是本领域公知的。
控制序列可以是合适的启动子序列,启动子序列是被宿主细胞所识别来表达编码这样的多肽的多核苷酸的核苷酸序列。启动子序列含有介导多肽表达的转录控制序列。启动子序列可以是任何在所选择的宿主细胞中显示转录活性的核苷酸序列,包括突变的、截短的和杂合的启动子,而且可以从编码对宿主细胞而言为同源或异源的胞外或胞内多肽的基因获得。
适于指导核酸构建体的转录,尤其是在细菌宿主细胞中转录的启动子的例子是获自大肠杆菌lac操纵子、天蓝色链霉菌琼脂糖酶基因(dagA)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌生麦芽糖淀粉酶基因(amyM)、解淀粉芽孢杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因、以及原核β-内酰胺酶基因的启动子(Villa-Kamaroff等,1978,Proceedings of the National Academy of Sciences USA 75:3727-3731),和tac启动子(DeBoer等,1983,Proceedings of the National Academy of Sciences USA 80:21-25)。Scientific American,1980,242:74-94中的″Useful proteins from recombinant bacteria″和Sambrook等,1989(同上)中描述了其它启动子。
适于在丝状真菌宿主细胞中指导核酸构建体的转录的启动子的实例是从下列酶的基因获得的启动子:米曲霉TAKA淀粉酶、米赫根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、米赫根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、构巢曲霉乙酰胺酶、镶片镰孢淀粉葡糖苷酶(WO 00/56900)、镶片镰孢Daria(WO 00/56900)、镶片镰孢Quinn(WO 00/56900)、尖镰孢胰蛋白酶样蛋白酶(WO 96/00787)、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶IV、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉β-木糖苷酶;以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶基因和米曲霉丙糖磷酸异构酶基因的启动子的杂合体);以及它们的突变、截短和杂合的启动子。
在酵母宿主中,有用的启动子是从酿酒酵母烯醇化酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1、ADH2/GAP)、酿酒酵母丙糖磷酸异构酶(TPI)、酿酒酵母金属硫蛋白(CUP1)和酿酒酵母3-磷酸甘油酸激酶的基因获得的。对酵母宿主细胞有用的其他启动子由Romanos等,1992,Yeast 8:423-488描述。
控制序列还可以是合适的转录终止子序列。终止子序列是被宿主细胞识别来终止转录的序列。终止子序列可操作地连接于编码多肽的核苷酸序列的3’末端。任何可在所选的宿主细胞中发挥功能的终止子都可以用于本发明。
优选的用于丝状真菌宿主细胞的终止子是从米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉α-葡糖苷酶和尖镰孢胰蛋白酶样蛋白酶的基因获得的。
优选的用于酵母宿主细胞的终止子是从酿酒酵母烯醇化酶、酿酒酵母细胞色素C(CYC1)和酿酒酵母甘油醛-3-磷酸脱氢酶的基因获得的。对酵母宿主细胞有用的其他终止子由Romanos等,1992(同上)描述。
控制序列也可以是合适的前导序列,前导序列是mRNA中的一种非翻译区,它对于宿主细胞进行的翻译而言是重要的。前导序列可操作地连接于编码多肽的核苷酸序列的5’末端。任何可在所选择的宿主细胞中发挥功能的前导序列都可以用于本发明。
优选的用于丝状真菌宿主细胞的前导序列是从米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶的基因获得的。
用于酵母宿主细胞的合适的前导序列是从酿酒酵母烯醇化酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α-因子和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)的基因获得的。
控制序列还可以是聚腺苷酸化序列,聚腺苷酸化序列是一段与核苷酸序列的3’末端可操作连接的序列,并且在转录后被宿主细胞所识别,作为向被转录的mRNA添加聚腺苷酸残基的信号。任何可在所选择的宿主细胞中发挥功能的聚腺苷酸化序列都可以用于本发明。
优选的用于丝状真菌宿主细胞的聚腺苷酸化序列是从米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖镰孢胰蛋白酶样蛋白酶和黑曲霉α-葡糖苷酶的基因获得的。
Guo和Sherman,1995,Molecular Cellular Biology 15:5983-5990记载了对酵母宿主细胞有用的聚腺苷酸化序列。
控制序列还可以是信号肽编码序列,其编码的氨基酸序列连接于多肽的氨基末端,并引导所述编码的多肽进入细胞的分泌途径。核苷酸序列的编码序列的5’端可以固有地包含信号肽编码序列,该序列天然地以符合翻译阅读框的方式与编码区中编码分泌型多肽的区段连接。或者,编码序列的5’端可以包含对该编码序列而言为外源的信号肽编码序列。在编码序列天然地不包含信号肽编码序列的场合,可能需要外源信号肽编码序列。或者,可以简单地用外源信号肽编码序列取代天然信号肽编码序列以增强多肽的分泌。然而,引导表达的多肽进入所选的宿主细胞的分泌途径,即分泌到培养基中的任何信号肽编码序列都可以用于本发明。
对细菌宿主细胞有效的信号肽编码序列是从芽孢杆菌NCIB 11837产麦芽糖淀粉酶、嗜热脂肪芽孢杆菌α-淀粉酶、地衣芽孢杆菌枯草蛋白酶(subtilisin)、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT、nprS、nprM)、和枯草芽孢杆菌prsA的基因获得的信号肽编码序列。Simonen和Palva,1993,Microbiological Reviews 57:109-137记载了其它信号肽。
对丝状真菌宿主细胞有效的信号肽编码序列是从米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米赫根毛霉天冬氨酸蛋白酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V、和疏棉状腐质霉脂肪酶的基因获得的信号肽编码序列。
对酵母宿主细胞有用的信号肽是从酿酒酵母α-因子和酿酒酵母转化酶的基因获得的。其它有用的信号肽编码序列由Romanos等,1992,同上文描述。
控制序列还可以是前肽编码序列,其编码位于多肽的氨基末端的氨基酸序列。所得的多肽被称为酶原(proenzyme)或原多肽(propolypeptide)(或者在某些情况下称为酶原(zymogen))。原多肽通常是没有活性的,并且通过将前肽从原多肽中催化或自催化切割出来可以转化为成熟的活性多肽。前肽编码序列可以从枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、酿酒酵母α-因子、米赫根毛霉天冬氨酸蛋白酶和嗜热毁丝霉漆酶的基因获得(WO 95/33836)。
在信号肽和前肽序列都存在于多肽氨基末端的场合,前肽序列位于多肽氨基末端的相邻位置,而信号肽序列位于前肽序列的氨基末端的相邻位置。
添加这样的调控序列可能也是理想的:该序列容许相对于宿主细胞的生长调节多肽的表达。调控系统的例子有导致基因的表达响应于化学或物理刺激(包括调控性化合物的存在)而开启或关闭的那些调控系统。原核系统中的调控系统包括lac、tac、和trp操纵基因系统。在酵母中,可以使用ADH2系统或GAL1系统。在丝状真菌中,可以使用TAKAα-淀粉酶启动子、黑曲霉葡糖淀粉酶启动子和米曲霉葡糖淀粉酶启动子作为调控序列。其他调控序列的例子有使基因能够扩增的调控序列。在真核系统中,这些调控序列包括在甲氨蝶呤存在下被扩增的二氢叶酸还原酶基因,和在重金属存在下被扩增的金属硫蛋白基因。在这些场合,编码多肽的核苷酸序列将与调控序列可操作地连接。
表达载体
可以将本文中描述的各种核酸和控制序列连接起来产生重组表达载体,其包含编码具有酶活性或者纤维素分解增强活性的多肽的多核苷酸、启动子以及转录和翻译终止信号。所述表达载体可包括一个或多个便利的限制性位点以便于在这些位点插入或取代编码多肽的多核苷酸序列。或者,可以将多核苷酸序列或包含该序列的核酸构建体插入合适的表达用载体来表达编码这样的多肽的多核苷酸序列。在生成表达载体的过程中,将编码序列置于载体中使得该编码序列与合适的表达用控制序列可操作地连接。
重组表达载体可以是任何可便利地进行重组DNA程序并且能够带来多核苷酸序列的表达的载体(例如质粒或病毒)。载体的选择通常会取决于载体与该载体要导入的宿主细胞的相容性。载体可以是线性的或者闭合环状的质粒。
所述载体可以是自主复制的载体,即作为染色体外实体存在,其复制不依赖于染色体复制的载体,例如质粒、染色体外元件、微型染色体、或人工染色体。载体可含有任何用于保证自我复制的手段。或者,载体可以是这样的载体,当它被导入宿主细胞时,整合到基因组中并随同它整合到其中的染色体一起复制。另外,可以使用单一的载体或质粒,或两个或更多个共同包含要导入宿主细胞基因组的总DNA的载体或质粒,或者转座子。
载体优选含有一个或多个选择标记,这些标记容许容易地选择经过转化、转染、转导等的细胞。选择标记是这样的基因,其产物提供杀生物剂或病毒抗性、对重金属的抗性,对营养缺陷型的原养性,等等。
细菌选择标记的例子有来自枯草芽孢杆菌或者地衣芽孢杆菌的dal基因,或者赋予抗生素抗性如氨苄青霉素、卡那霉素、氯霉素或四环素抗性的标记。用于酵母宿主细胞的合适标记有ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于丝状真菌宿主细胞的选择标记包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草铵膦乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清苷-5’-磷酸脱羧酶)、sC(硫酸腺苷转移酶),和trpC(邻氨基苯甲酸合酶),以及它们的等同物。优选用于曲霉细胞的是构巢曲霉或米曲霉的amdS和pyrG基因,以及吸水链霉菌(Streptomyces hygroscopicus)的bar基因。
载体优选包含容许载体整合到宿主细胞的基因组或者容许载体在细胞中不依赖基因组自主复制的元件。
为了整合到宿主细胞基因组中,载体可能依赖多核苷酸的编码多肽的序列或者载体的任何其它元件来通过同源或异源重组整合到基因组中。或者,载体可含有附加的核苷酸序列,用来指导通过同源重组在染色体上的精确位置整合到宿主细胞的基因组中。为了增加在精确位置上整合的机率,整合元件优选应含有足够数目的与相应靶序列具有高度同一性的核酸,诸如100-10,000个碱基对,优选400-10,000个碱基对,且最优选800-10,000个碱基对,以提高同源重组的概率。整合元件可以是任何与宿主细胞基因组中的靶序列同源的序列。此外,整合元件可以是非编码的或者编码的核苷酸序列。另一方面,载体可以通过非同源重组整合到宿主细胞基因组中。
为了自主复制,载体可进一步包含复制起点,该起点使得载体能够在所讨论的宿主细胞中自主地复制。复制起点可以是在细胞中发挥功能的任何介导自主复制的质粒复制子。术语“复制起点”或“质粒复制子”在本文中定义为使质粒或载体能够在体内复制的核苷酸序列。
细菌复制起点的实例有容许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177和pACYC184的复制起点,以及容许在芽孢杆菌属中复制的质粒pUB110、pE194、pTA1060和pAMβ1的复制起点。
用于在酵母宿主细胞中的复制起点的例子有2微米复制起点、ARS1、ARS4、ARS1和CEN3的组合,以及ARS4和CEN6的组合。
在丝状真菌细胞中有用的复制起点的例子有AMA1和ANS1(Gems等,1991,Gene 98:61-67;Cullen等,1987,Nucleic Acids Research 15:9163-9175;WO 00/24883)。AMA1基因的分离,以及包含该基因的质粒或载体的构建,可以根据WO 00/24883中公开的方法来实现。
可以向宿主细胞中插入编码这样的多肽的多核苷酸的多于一个拷贝以增加所述多肽的生产。可以通过下述方法获得多核苷酸的拷贝数的增加:向宿主细胞基因组中整合至少一个额外拷贝的序列;或者纳入伴随该多核苷酸的可扩增选择标记基因,由此通过在合适的选择剂的存在下培养细胞,可以选择出含有扩增拷贝数的选择标记基因,从而也就含有更多拷贝的所述多核苷酸的细胞。
用于连接上述元件来构建重组表达载体的程序是本领域技术人员公知的(参见例如Sambrook等,1989,同上文)。
宿主细胞
包含编码具有酶活性或者纤维素分解增强活性的多肽的多核苷酸的重组宿主细胞可以有利地用于多肽的重组生产。将包含这样的多核苷酸的载体导入宿主细胞使得载体作为染色体整合子或者如前文所述的自复制的染色体外载体被保持。术语“宿主细胞”涵盖亲本细胞的任何因复制过程中发生的突变而与该亲本细胞不同的后代。宿主细胞的选择在很大程度上会取决于编码多肽的基因及其来源。
宿主细胞可以是单细胞微生物,例如原核生物,或者非单细胞微生物,例如真核生物。
细菌宿主细胞可以是任何革兰氏阳性细菌或革兰氏阴性细菌。革兰氏阳性细菌包括但不限于芽孢杆菌属、链球菌属、链霉菌属、葡萄球菌属、肠球菌属、乳杆菌属、乳球菌属、梭菌属、地芽孢杆菌属和海洋芽孢杆菌属。革兰氏阴性细菌包括但不限于大肠杆菌、假单胞菌属、沙门氏菌属、弯曲杆菌属、螺杆菌属、黄杆菌属、梭杆菌属、泥杆菌属、奈瑟氏球菌属或尿枝原体属。
细菌宿主细胞可以是任何芽孢杆菌属细胞。本发明的实践中有用的芽孢杆菌属细胞包括但不限于嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、缓慢芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌和苏云金芽孢杆菌细胞。
在一个优选的方面,所述细菌宿主细胞是解淀粉芽孢杆菌、缓慢芽孢杆菌、地衣芽孢杆菌、嗜热脂肪芽孢杆菌或枯草芽孢杆菌细胞。在一个更优选的方面,所述细菌宿主细胞是解淀粉芽孢杆菌细胞。在另一个更优选的方面,所述细菌宿主细胞是克劳氏芽孢杆菌细胞。在另一个更优选的方面,所述细菌宿主细胞是地衣芽孢杆菌细胞。在另一个更优选的方面,所述细菌宿主细胞是枯草芽孢杆菌细胞。
细菌宿主细胞也可以是任何链球菌属细胞。本发明的实践中有用的链球菌属细胞包括但不限于似马链球菌、酿脓链球菌、乳房链球菌、和马链球菌兽瘟亚种细胞。
在一个优选的方面,所述细菌宿主细胞是似马链球菌细胞。在另一个优选的方面,所述细菌宿主细胞是酿脓链球菌细胞。在另一个优选的方面,所述细菌宿主细胞是乳房链球菌细胞。在另一个优选的方面,所述细菌宿主细胞是马链球菌兽瘟亚种细胞。
细菌宿主细胞也可以是任何链霉菌属细胞。本发明的实践中有用的链霉菌属细胞包括但不限于不产色链霉菌、除虫链霉菌、天蓝色链霉菌、灰色链霉菌和浅青紫链霉菌细胞。
在一个优选的方面,所述细菌宿主细胞是不产色链霉菌细胞。在另一个优选的方面,所述细菌宿主细胞是除虫链霉菌细胞。在另一个优选的方面,所述细菌宿主细胞是天蓝色链霉菌细胞。在另一个优选的方面,所述细菌宿主细胞是灰色链霉菌细胞。在另一个优选的方面,所述细菌宿主细胞是浅青紫链霉菌细胞。
向芽孢杆菌属细胞中导入DNA可以通过例如原生质体转化(参见例如Chang和Cohen,1979,Molecular General Genetics 168:111-115)、使用感受态细胞(参见例如Young和Spizizen,1961,Journal of Bacteriology 81:823-829,或Dubnau和Davidoff-Abelson,1971,Journal of Molecular Biology 56:209-221)、通过电穿孔(参见例如Shigekawa和Dower,1988,Biotechniques 6:742-751),或通过接合(参见例如Koehler和Thorne,1987,Journal of Bacteriology 169:5271-5278)来实现。向大肠杆菌细胞中导入DNA可以通过例如原生质体转化(参见例如Hanahan,1983,J.Mol.Biol.166:557-580)或电穿孔(参见例如Dower等,1988,Nucleic Acids Res.16:6127-6145)来实现。向链霉菌属细胞中导入DNA可以通过例如原生质体转化和电穿孔来实现(参见例如Gong等,2004,Folia Microbiol.(Praha)49:399-405)、接合(参见例如Mazodier等,1989,J.Bacteriol.171:3583-3585)、或转导(参见例如Burke等,2001,Proc.Natl.Acad. Sci.USA 98:6289-6294)来实现。向假单胞菌属细胞中导入DNA可以通过例如电穿孔(参见例如Choi等,2006,J.Microbiol.Methods 64:391-397)或接合(参见例如Pinedo和Smets,2005,Appl.Environ.Microbiol.71:51-57)来实现。向链球菌属细胞中导入DNA可以通过例如天然感受态(参见例如Perry和Kuramitsu,1981,Infect.Immun.32:1295-1297)、原生质体转化(参见例如Catt和Jollick,1991,Microbios.68:189-2070)、电穿孔(参见例如Buckley等,1999,Appl.Environ.Microbiol.65:3800-3804)、或接合(参见例如Clewell,1981,Microbiol.Rev.45:409-436)来实现。尽管如此,本领域已知的任何用于将DNA导入宿主细胞的方法都可以使用。
宿主细胞也可以是真核生物,诸如哺乳动物、昆虫、植物、或真菌细胞。
在一个优选的方面,所述宿主细胞是真菌细胞。本文所用的“真菌”包括子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)和接合菌门(Zygomycota)(如Hawksworth等在Ainsworth and Bisby’sDictionary of The Fungi,第八版,1995,CAB International,University Press,Cambridge,UK中定义的),和卵菌门(Oomycota)(如Hawksworth等,1995,同上文,第171页引用的)等门,以及全部有丝分裂孢子真菌(mitosporic fungi)(Hawksworth等,1995,同上文)。
在一个更优选的方面,真菌宿主细胞是酵母细胞。本文所用的“酵母”包括产子囊酵母(ascosporogenous yeast)(内孢霉目(Endomycetales))、产担子孢子囊酵母(basidiosporogenous yeast)和属于半知菌类(Fungi Imperfecti)(芽孢纲(Blastomycetes))的酵母。由于酵母的分类在将来可能有所改变,为了本发明的目的,酵母将如Biology and Activities of Yeast(Skinner,F.A.,Passmore,S.M.和Davenport,R.R.编,Soc.App.Bacteriol.Symposium Series No.9,1980)中所述加以定义。
在一个甚至更优选的方面,酵母宿主细胞是假丝酵母属、汉逊酵母属、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属或西洋蓍霉属细胞。
在一个最优选的方面,酵母宿主细胞是卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母或卵形酵母细胞。在另一个最优选的方面,酵母宿主细胞是乳克鲁维酵母(Kluyveromyces lactis)细胞。在另一个最优选的方面,酵母宿主细胞是解脂西洋蓍霉(Yarrowia lipolytica)细胞。
在另一个更优选的方面,真菌宿主细胞是丝状真菌细胞。“丝状真菌”包括真菌(Eumycota)和卵菌(Oomycota)亚门的所有丝状形式(如Hawksworth等,1995,同上文定义)。丝状真菌的一般特征在于由几丁质、纤维素、葡聚糖、壳聚糖、甘露聚糖和其它复杂多糖组成的菌丝壁。营养生长是通过菌丝延伸,且碳分解代谢是专性需氧的。相反,酵母如酿酒酵母的营养生长是通过单细胞菌体的芽殖,且碳分解代谢可以是发酵的。
在一个进一步更优选的方面,丝状真菌宿主细胞枝顶孢霉属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、拟蜡菌属、鬼伞属(Coprinus)、革盖菌属(Coriolus)、隐球菌属、网孢菌属、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属(Phlebia)、瘤胃壶菌属、侧耳属(Pleurotus)、裂褶菌属、踝节菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属(Trametes)、或木霉属细胞。
在一个最优选的方面,丝状真菌宿主细胞是泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉或米曲霉细胞。在另一个更优选的方面,丝状真菌宿主细胞是杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢或镶片镰孢细胞。在另一个最优选的方面,丝状真菌宿主细胞是黑刺烟管菌(Bjerkandera adusta)、干拟蜡菌(Ceriporiopsis aneirina)、干拟蜡菌、Ceriporiopsis caregiea、Ceriporiopsis gilvescens、Ceriporiopsis pannocinta、Ceriporiopsis rivulosa、Ceriporiopsis subrufa、虫拟蜡菌(Ceriporiopsis subvermispora)、灰盖鬼伞(Coprinus cinereus)、毛革盖菌(Coriolus hirsutus)、特异腐质霉、疏棉状腐质霉、米赫毛霉、嗜热毁丝霉、粗糙脉孢菌、产紫青霉、黄孢平革菌、辐射射脉菌(Phlebia radiata)、刺芹侧耳(Pleurotus eryngii)、土生梭孢壳、长绒毛栓菌(Trametes villosa)、杂色栓菌(Trametes versicolor)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉或绿色木霉细胞。
真菌细胞可以用包括方式本身已知的原生质体形成、原生质体转化和细胞壁再生的方法来加以转化。用于曲霉属和木霉属宿主细胞转化的合适方法描述于EP 238 023和Yelton等,1984,Proceedings of the National.Academy ofSciences USA 81:1470-1474。Malardier等,1989,Gene 78:147-156和WO96/00787描述了转化镰孢属菌种的合适方法。酵母可用Becker和Guarente在Abelson,J.N.和Simon,M.I.编的Guide to Yeast Genetics and Molecular Biology,Methods in Enzymology,第194卷,第182-187页,Academic Press,New York;Ito等,1983,Journal of Bacteriology 153:163;和Hinnen等,1978,Proceedings of the National Academy of Sciences USA 75:1920中所述的方法转化。
生产方法
生产具有酶活性或者纤维素分解增强活性的多肽的方法包括:(a)在有助于产生所述多肽的条件下培养细胞,所述细胞以其野生型形式能够产生所述多肽;和(b)回收多肽。
或者,生产具有酶活性或者纤维素分解增强活性的多肽的方法包括:(a)在有助于产生所述多肽的条件下培养重组宿主细胞;和(b)回收多肽。
在产生方法中,用本领域中公知的方法在适于多肽产生的营养培养基中培养细胞。例如,可在实验室或工业发酵罐中通过摇瓶培养、和小规模或大规模发酵(包括连续发酵、分批发酵、分批补料发酵或固态发酵)培养细胞,这在合适的培养基中和使多肽能被表达和/或分离的条件下进行。用本领域中已知的程序,在含有碳源和氮源和无机盐的合适营养培养基中进行培养。合适的培养基可从商业供应商得到或根据公开的组成(例如,于美国典型培养物保藏中心的目录中)制备。如果多肽分泌到营养培养基中,则可直接从培养基中回收该多肽。如果该多肽不被分泌,则可从细胞裂解产物中回收它。
具有酶活性或者纤维素分解增强活性的多肽可用本文记载的方法或本领域已知方法检测。
得到的发酵液可以包括或不包括细胞碎片(debris)地直接使用,或者可以使用本领域已知的方法回收所述多肽。例如,可以通过常规方法,包括,但不限于,离心、过滤、抽提、喷雾干燥、蒸发或沉淀将多肽从营养培养基中回收出来。
多肽可通过本领域中已知的多种方法进行纯化来获得基本上纯的多肽,所述方法包括,但不限于,层析(例如,离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳方法(例如,制备型等电聚焦)、差示溶解度法(例如,硫酸铵沉淀)、SDS-PAGE、或萃取(见,例如,Protein Purification J.-C.Janson和Lars Ryden编,VCH Publishers,New York,1989)。
下面用实施例进一步描述本发明,这些实施例不应解释为对本发明范围的限制。
实施例
DNA测序
DNA测序使用染料终止物化学(dye terminator chemistry)(Giesecke等,1992,Journal of Virol.Methods 38:47-60)用Applied Biosystems Model 3130XGenetic Analyzer(Applied Biosystems,Foster City,CA,USA)进行。序列使用phred/phrap/consed(University of Washington,Seattle,WA,USA)用序列特异性引物进行装配。
培养基和溶液
YP培养基的组成为每升10g酵母提取物和20g细菌用胰蛋白胨。
纤维素酶诱导培养基的组成为每升20g纤维素、10g玉米浆固体、1.45g(NH4)2SO4、2.08g KH2PO4、0.28g CaCl2、0.42g MgSO4·7H2O和0.42ml痕量金属溶液。
痕量金属溶液的组成为每升216g FeCl3·6H2O、58g ZnSO4·7H2O、27gMnSO4·H2O、10g CuSO4·5H2O、2.4g H3BO3和336g柠檬酸。
STC的组成为1M山梨醇、10mM CaCl2和10mM Tris-HCl,pH 7.5。
COVE平板的组成为每升342g蔗糖、10ml COVE盐溶液、10ml 1M乙酰胺、10ml 1.5M CsCl和25g诺布尔琼脂(Noble agar)。
COVE盐溶液的组成为每升26g KCl、26g MgS04、76g KH2PO4和50mlCOVE痕量金属溶液。
COVE痕量金属溶液的组成为每升0.04g的Na2B4O7·10H2O,0.4g的CuSO4·5H2O,1.2g的FeSO4·7H2O,0.7g的MnSO4·H2O,0.8g的Na2MoO2·H2O与10g的ZnSO4·7H2O。
COVE2平板的组成为每升30g蔗糖、20ml COVE盐溶液、25g诺布尔琼脂和10ml 1M乙酰胺。
PDA平板的组成为每升39克马铃薯葡萄糖琼脂。
LB培养基的组成为每升10g胰蛋白胨、5g酵母提取物、5g氯化钠。
2X YT-Amp平板的组成为每升10g胰蛋白胨、5g酵母提取物、5g氯化钠和15g细菌用琼脂,然后在高压灭菌后加入2ml 50mg/ml的氨苄青霉素的过滤除菌溶液。
MDU2BP培养基的组成为每升45g麦芽糖、1g MgSO4·7H2O、1g NaCl、2g K2HSO4、12g KH2PO4、2g尿素和500μl AMG痕量金属溶液,将pH调至5.0并随后用0.22μm过滤元件进行过滤除菌。
AMG痕量金属溶液的组成为每升14.3g ZnSO4·7H2O、2.5gCuSO4·5H2O、0.5g NiCl2·6H2O、13.8g FeSO4·H2O、8.5g MnSO4·7H2O和3g柠檬酸。
基本培养基(minimal medium)平板的组成为每升6g NaNO3、0.52KCl、1.52g KH2PO4、1ml COVE痕量金属溶液、20g诺布尔琼脂、20ml 50%葡萄糖、2.5ml 20%MgSO4·7H2O和20ml生物素贮存溶液。
生物素贮存溶液的组成为每升0.2g生物素。
SOC培养基的组成为2%胰蛋白胨、0.5%酵母提取物、10mM NaCl、2.5mM KCl、10mM MgCl2和10mM MgSO4,高压灭菌后加入过滤除菌的葡萄糖至20mM。
Mandel’s培养基的组成为每升1.4g的(NH4)2SO4,2.0g的KH2PO4,0.3g的尿素,0.3g的CaCl2,0.3g的MgSO4·7H2O,5mg的FeSO4·7H2O,1.6mg的MnSO4·H2O,1.4mg的ZnSO4.H2O与2mg的CoCl2。
材料
用磷酸泡涨的纤维素(PASC)自微晶纤维素(PH101;FMC,Philadelphia,PA,USA)根据Schulein,1997,J.Biotechnol.57:71-81的方法制备。
羧甲基纤维素(CMC,7L2类型,70%取代)自Hercules Inc.,Wilmington,DE,USA获取。
聚乙二醇(PEG 4000)自Alfa Aesar,Ward Hill,MA,USA获取。过氧化氢(30%)自Thermo Fisher Scientific,Waltham,MA,USA获取。硫酸亚铁,氯化亚铁,K3Fe(CN)6,K4Fe(CN)6,柠檬酸铁与其它金属盐,以及1,10-菲咯啉与2,2’-联吡啶,自Sigma-Aldrich,St.Louis,MO,USA获取。除非另行指定,Fe(II)的母液制备为0.25M FeSO4水溶液。Fe(2,2’-联吡啶基)Cl3与Fe(2,2’-联吡啶基)Cl2通过分别将0.1M FeCl3和FeCl2与0.2M 2,2’-联吡啶混合制备成0.1M。Fe(1,10’-菲咯啉)Cl3与Fe(1,10’-菲咯啉)Cl2通过分别将0.1M FeCl3和FeCl2与0.2M 1,10-菲咯啉混合制备成0.1M。FeNaEDTA的母液通过将0.1M FeCl3与0.1M Na4EDTA混合制备为0.1M。
实施例1:制备具有纤维素分解增强活性的橙色嗜热子囊菌(Thermoascus aurantiacus)GH61A多肽
具有纤维素分解增强活性的橙色嗜热子囊菌GH61A多肽在米曲霉JaL250中根据WO 2005/074656重组产生。重组产生的橙色嗜热子囊菌GH61A多肽首先通过使用10kDa膜的超滤浓缩,缓冲液交换至20mMTris-HCl pH 8.0中,并随即使用100ml Q-Big Beads柱(GEHealthcare Life Sciences,Piscataway,NJ,USA)以600ml 0-600mM NaCl的线性梯度在同一缓冲液中纯化。收集10ml的级分并基于SDS-PAGE将其汇集。将汇集的级分(90ml)随即使用20ml MONO柱(GE Healthcare Life Sciences,Piscataway,NJ,USA)以500ml 0-500mM NaCl的线性梯度在同一缓冲液中进一步纯化。收集6ml的级分并基于SDS-PAGE将其汇集。经汇集的级分(24ml)通过使用10kDa膜的超滤浓缩,并使用320ml200SEC柱(GE Healthcare Life Sciences,Piscataway,NJ,USA)以大约1.3升的150mM NaCl-20mM Tris-HCl pH 8.0的无梯度洗脱进行层析。收集20ml的级分并基于SDS-PAGE将其汇集。蛋白质浓度使用Microplate BCATMProtein Assay Kit(Pierce,Rockford,IL,USA)确定。
实施例2:制备里氏木霉CEL7A纤维二糖水解酶I
里氏木霉CEL7A纤维二糖水解酶I如Ding and Xu,2004,“Productive cellulase adsorption on cellulose”in Lignocellulose Biodegradation(Saha,B.C.编辑),Symposium Series 889,154-169页,American Chemical Society,Washington,DC的描述制备。蛋白质浓度使用Microplate BCATMProtein Assay Kit(Pierce,Rockford,IL,USA)确定。
实施例3:制备米曲霉CEL3A β-葡糖苷酶
米曲霉CEL3A β-葡糖苷酶如WO 2004/099228中所述通过重组方法制备,并如Langston等,2006,Biochim.Biophys.Acta Proteins Proteomics 1764:972-978描述进行纯化。蛋白质浓度使用Microplate BCATM Protein Assay Kit(微量滴定板式BCATM蛋白质测定试剂盒)(Pierce,Rockford,IL,USA)确定。
实施例4:制备里氏木霉CEL7B内切葡聚糖酶I
里氏木霉CEL7B内切葡聚糖酶I如WO 2005/067531中的描述进行克隆并在米曲霉JaL250中表达。蛋白质浓度使用Microplate BCATM Protein Assay Kit(Pierce,Rockford,IL,USA)确定。
将所述里氏木霉CEL7B内切葡聚糖酶I脱盐,并使用26/10Desalting Column(26/10脱盐柱)(GE Healthcare Life Sciences,Piscataway,NJ,USA)根据生产商的指示缓冲液交换至150mM NaCl-20mM乙酸钠pH 5.0中。
实施例5:制备里氏木霉CEL6A内切葡聚糖酶II
如下所述将里氏木霉GH5A家族内切葡聚糖酶II基因克隆入米曲霉表达载体中。
设计如下所示的两个合成寡聚核苷酸引物以自里氏木霉RutC30基因组DNA PCR扩增所述内切葡聚糖酶II基因。将基因组DNA使用Plant Maxi Kit(QIAGEN Inc.,Valencia,CA,USA)分离。使用IN-FUSIONTMPCR Cloning Kit(IN-FUSIONTM PCR克隆试剂盒)(BD Biosciences,Palo Alto,CA,USA)将所得片段直接克隆入pAILo2(WO 2004/099228)。
正向引物:
反向引物:
5’-TCACCTCTAGTTAATTAA-3’(SEQ ID NO:68)
粗体字母代表编码序列。剩下的序列与pAlLo2插入位点比较含有序列统一性。
将五十皮摩尔的上述每种引物用于含有下述物质的PCR反应中:200ng里氏木霉基因组DNA,1X Pfx Amplification Buffer(Pfx扩增缓冲液)(Invitrogen,Carlsbad,CA,USA),6μl的10mM dATP、dTTP、dGTP和dCTP混合物,2.5单位的Pfx DNA聚合酶(Invitrogen Corp.,Carlsbad,CA,USA),以及1μl的50mM MgSO4(Invitrogen Corp.,Carlsbad,CA,USA),最终体积为50μl。使用5333(Eppendorf Scientific,Inc.,Westbury,NY,USA)以扩增所述片段,其程序为:一个循环的98℃下2分钟;35个循环的94℃下30秒,61℃下30秒以及68℃下1.5分钟。在35个循环后,将反应在68℃下培育10分钟并随即在10℃下冷却。1.5kb PCR反应产物在0.8%琼脂糖凝胶(Cambrex Bioproducts,Rutherford,NJ,USA)上使用40mM Tris碱-20mM乙酸钠-1mM EDTA二钠(TAE)缓冲液和0.1μg/ml溴化乙锭分离。DNA条带用DARKREADERTM(Clare Chemical Research,Dolores,CO,USA)协助显影。将1.5kb DNA条带用一次性刀片切出,并使用DA旋杯(spin cup)(Millipore,Billerica,MA,USA)根据生产商的指示进行纯化。
质粒pAlLo2(WO 2004/099228)通过用Nco I与Pac I的消化线性化。质粒片段如上所述通过凝胶电泳与超滤来纯化。将纯化的PCR片段克隆入经线性化和纯化的pAlLo2载体用IN-FUSIONTM PCR Cloning Kit(BD Biosciences,Palo Alto,CA,USA)进行。反应(20μl)包含1X IN-FUSIONTMBufffer(BD Biosciences,Palo Alto,CA,USA),1X BSA(BD Biosciences,Palo Alto,CA,USA),1μl IN-FUSIONTM酶(1∶10稀释)(BD Biosciences,Palo Alto,CA,USA),100ng的用NcoI与PacI消化的pAlLo2,以及100ng的里氏木霉CEL6A内切葡聚糖酶II PCR产物。该反应在室温下培育30分钟。使用2μl的反应样品以根据生产商的指示转化大肠杆菌XL10Gold细胞(Stratagene,La Jolla,CA,USA)。在恢复期后,将来自转化反应的两个100μl等分试样铺于补充以100μg/ml氨苄西林的150mm 2X YT板上。将该板在37℃下培养过夜。将一组三个推定的重组克隆自选择培养板上回收,并使用9600(QIAGEN,Inc.,Valencia,CA,USA)自其每个制备质粒DNA。克隆通过Pci I/BspLU11 I限制性消化进行分析。具有所期望的限制性消化样式的克隆随即经测序以确证在克隆插入中无突变。选取克隆#3并将其命名为pAlLo27(图1)。
米曲霉JaL250(WO 99/61651)原生质体根据Christensen等,1988,Bio/Technology 6:1419-1422的方法制备。五微克pAlLo27(以及pAlLo2作为对照)用于转化米曲霉JaL250原生质体。
用pAlLo27转化米曲霉JaL250得到约50个转化体。分离了十一个转化体到单独的PDA板上并在34℃下培育5日。
铺满的孢子板用3ml的0.01%80洗涤,且将孢子悬浮液用于接种125ml玻璃摇瓶中的25ml的MDU2BP培养基。转化体培养物在34℃下以200rpm的恒速振荡进行培育。在接种后第五日,将培养物以6000xg进行离心,并收集其上清。将五微升的每个上清与同体积的2X上样缓冲液(10%β-巯基乙醇)混合,并上样至1.5mm 8%-16%的Tris-甘氨酸SDS-PAGE凝胶上,并用SIMPLYBLUETM SafeStain(Invitrogen Corp.,Carlsbad,CA,USA)染色。所述培养液的SDS-PAGE概貌显示十一个转化体中的十个具有大约45kDa的新蛋白质条带。将命名为JaL250AlLo27的转化体1号在发酵罐中培养。
摇瓶培养基的组成为每升50g的蔗糖,10g的KH2PO4,0.5g的CaCl2,2g的MgSO4·7H2O,2g的K2SO4,2g的尿素,10g的酵母提取物,2g的柠檬酸,以及0.5ml的痕量金属溶液。痕量金属溶液的组成为每升13.8g的FeSO4·7H2O,14.3g的ZnSO4·7H2O,8.5g的MnSO4·H2O,2.5g的CuSO4·5H2O,以及3g的柠檬酸。
将100ml的摇瓶培养基添加至500ml的摇瓶。所述摇瓶用来自固体平板培养物的两个琼脂块(plug)接种,并在34℃下在定轨振荡器上以200rpm培育24小时。使用50ml的摇瓶培养液以接种3升的发酵容器。
发酵分批培养基(fermentation batch medium)的组成为每升10g的酵母提取物,24g的蔗糖,5g的(NH4)2SO4,2g的KH2PO4,0.5g的CaCl2·2H2O,2g的MgSO4.7H2O,1g的柠檬酸2g的K2SO4,0.5ml的消泡剂,以及0.5ml的痕量金属溶液。痕量金属溶液的组成为每升13.8g的FeSO4·7H2O,14.3g的ZnSO4·7H2O,8.5g的MnSO4·H2O,2.5g的CuSO4·5H2O,以及3g的柠檬酸。发酵补料培养基的组成为麦芽糖。
将总计1.8升的发酵分批培养基添加到Applikon Biotechnology三升玻璃套发酵器中。发酵补料培养基以0到4.4g/l/hr的速度在185小时的期间内添加。所述发酵容器保持在34℃的温度下,且pH使用Applikon 1030控制系统控制于6.1+/-0.1的固定点。将空气以1vvm的速率添加到所述容器中,且用以1100到1300rpm旋转的Rushton叶轮搅拌。在发酵结束时,自所述容器收获全部培养液,并在3000xg下离心以移除生物质。上清经过滤除菌储藏于5-10℃。
使用26/10脱盐柱根据生产商的指示将上清脱盐并缓冲液交换至20mM乙酸钠-150mM NaCl pH 5.0中。蛋白质浓度使用Microplate BCATM Protein Assay Kit确定。
实施例6:制备里氏木霉CEL6A纤维二糖水解酶II
里氏木霉CEL6A纤维二糖水解酶II基因如WO 2005/056772所描述的分离自里氏木霉RutC30。
将里氏木霉CEL6A纤维二糖水解酶II基因在镶片镰孢中使用pEJG61作为表达载体根据描述于公布的美国申请No.20060156437中的过程进行表达。如公布的美国申请No.20060156437中所述进行发酵。蛋白质浓度使用Microplate BCATM Protein Assay Kit确定。
实施例7:pMJ04表达载体的构建
使用如下所示的引物993429(反义)和993428(有义)从里氏木霉RutC30基因组DNA PCR扩增了里氏木霉纤维二糖水解酶1基因(cbh1,CEL7A)终止子,由此构建了表达载体pMJ04。经过工程改造,所述反义引物在5’末端具有PacI位点,并且所述有义引物在3’末端具有SpeI位点。
引物993429(反义):
5’-AACGTTAATTAAGGAATCGTTTTGTGTTT-3’(SEQ ID NO:69)
引物993428(有义):
5’-AGTACTAGTAGCTCCGTGGCGAAAGCCTG-3’(SEQ ID NO:70)
扩增反应(50μl)的组成为1X ThermoPol Reaction Buffer(ThermoPol反应缓冲液)(New England Biolabs,Beverly,MA,USA)、0.3mM dNTP、100ng里氏木霉RutC30基因组DNA、0.3μM引物993429、0.3μM引物993428和2单位的Vent DNA聚合酶(New England Biolabs,Beverly,MA,USA)。将所述反应物在如下编程的5333(Eppendorf Scientific,Inc.,Westbury,NY,USA)中温育:进行5个循环的94℃30秒、50℃30秒和72℃60秒,然后进行25个循环的94℃30秒、65℃30秒和72℃120秒(最终延伸5分钟)。反应产物在1.0%琼脂糖凝胶上用TAE缓冲液分离,从凝胶上切下229bp的产物条带,并使用GelExtraction Kit(凝胶提取试剂盒)(QIAGEN Inc.,Valencia,CA,USA)依照制造商的说明进行纯化。
所得的PCR片段用PacI和SpeI消化后,用Rapid DNA Ligation Kit(快速DNA连接试剂盒)(Roche,Indianapolis,IN,USA)连接到经相同的限制酶消化的pAlLo1(WO 05/067531)中产生pMJ04(图2)。
实施例8:pCaHj568的构建
从pCaHj170(美国专利No.5,763,254)和pMT2188构建了质粒pCaHj568。质粒pCaHj170包含特异腐质霉内切葡聚糖酶V(CEL45A)全长编码区(SEQ ID NO:1,其编码SEQ ID NO:2的氨基酸序列)。pMT2188的构建最先是用如下所示的引物142779和142780从pCaHj483(WO 98/00529)PCR扩增出pUC19复制起点。引物142780在PCR片段中引入BbuI位点。
引物142779:
5’-TTGAATTGAAAATAGATTGATTTAAAACTTC-3’(SEQ ID NO:71)
引物142780:
5’-TTGCATGCGTAATCATGGTCATAGC-3’(SEQ ID NO:72)
该扩增使用PCR System(Roche Molecular Biochemicals,Basel,Switzerland)依照制造商的说明进行。在琼脂糖凝胶上分离PCR产物,使用Jetquick Gel Extraction Spin Kit(离心式快速凝胶提取试剂盒)(Genomed,Wielandstr,Germany)分离并纯化出1160bp的片段。
使用如下所示的引物140288和142778,利用PCR System从通用酿酒酵母克隆载体pYES2(Invitrogen,Carlsbad,CA,USA)中扩增出URA3基因。引物140288在PCR片段中引入EcoRI位点。
引物140288:
5’-TTGAATTCATGGGTAATAACTGATAT-3’(SEQ ID NO:73)
引物142778:
5’-AAATCAATCTATTTTCAATTCAATTCATCATT-3’(SEQ ID NO:74)
在琼脂糖凝胶上分离PCR产物,使用Jetquick Gel Extraction Spin Kit分离并纯化出1126bp的片段。
通过混合所述两个PCR片段并用如上所示的引物142780和140288通过重叠剪接(overlap splicing)法(Horton等,1989,Gene 77:61-68)进行扩增,将这两个片段融合。在琼脂糖凝胶上分离PCR产物,再使用Jetquick Gel Extraction Spin Kit分离并纯化出2263bp的片段。
所得的片段用EcoRI和BbuI消化,并使用标准规程连接到用相同的限制酶消化过的pCaHj483的最大片段中。将连接混合物转化到依照Mandel和Higa,1970,J.Mol.Biol.45:154的方法制成感受态的pyrF阴性大肠杆菌菌株DB6507(ATCC 35673)中。在每升添加了1g酪蛋白氨基酸、500μg硫胺素和10mg卡那霉素的固体M9培养基(Sambrook等,1989,Molecular Cloning,A Laboratory Manual,2nd edition,Cold Spring Harbor Laboratory Press)上选择转化体。分离了来自一个转化体的质粒,命名为pCaHj527(图3)。
使用PCR System依照制造商的说明,通过PCR对pCaHj527上存在的NA2-tpi启动子进行定点诱变。利用如下所示的诱变引物141223,将核苷酸134-144从GTACTAAAACC(SEQ ID NO:75)转变为CCGTTAAATTT(SEQ ID NO:76)。
引物141223:
5’-GGATGCTGTTGACTCCGGAAATTTAACGGTTTGGTCTTGCATCCC-3’(SEQ ID NO:77)
利用如下所示的诱变引物141222,将核苷酸423-436从ATGCAATTTAAACT(SEQ ID NO:78)转变为CGGCAATTTAACGG(SEQ IDNO:79)。
引物141222:
5’-GGTATTGTCCTGCAGACGGCAATTTAACGGCTTCTGCGAATCGC-3’(SEQ ID NO:80)
所得的质粒命名为pMT2188(图4)。
将特异腐质霉内切葡聚糖酶V编码区从pCaHj170作为Bam HI-SalI片段转移到用Bam HI和Xho I消化过的pMT2188中,生成pCaHj568(图5)。质粒pCaHj568包含与特异腐质霉内切葡聚糖酶V全长编码序列可操作地连接的突变的NA2-tpi启动子。
实施例9:pMJ05的构建
质粒pMJ05的构建是通过使用如下所示的引物HiEGV-F和HiEGV-R从pCaHj568PCR扩增出915bp的特异腐质霉内切葡聚糖酶V全长编码区。
引物HiEGV-F(有义):
5’-AAGCTTAAGCATGCGTTCCTCCCCCCTCC-3’(SEQ ID NO:81)
引物HiEGV-R(反义):
5’-CTGCAGAATTCTACAGGCACTGATGGTACCAG-3’(SEQ ID NO:82)
扩增反应(50μl)的组成为1X ThermoPol Reaction Buffer(ThermoPol反应缓冲液)(New England Biolabs,Beverly,MA,USA)、0.3mM dNTP、10ng/μlpCaHj568、0.3μM HiEGV-F引物、0.3μM HiEGV-R引物、和2单位Vent DNA聚合酶(New England Biolabs,Beverly,MA,USA)。将所述反应物在如下编程的5333中温育:5个循环的94℃30秒、50℃30秒和72℃60秒,然后进行25个循环的94℃30秒、65℃30秒和72℃120秒(最终延伸5分钟)。反应产物在1.0%琼脂糖凝胶上用TAE缓冲液分离,从凝胶上切下937bp的产物条带,并使用Gel Extraction Kit依照生产商的说明进行纯化。
用937bp的纯化片段作为模板DNA用下述引物进行后续扩增:
引物HiEGV-R(反义):
5’-CTGCAGAATTCTACAGGCACTGATGGTACCAG-3’(SEQ ID NO:83)
引物HiEGV-F-overlap(有义):
斜体表示的引物序列与里氏木霉纤维二糖水解酶I基因(cbh1)启动子的17bp同源,而带下划线的引物序列与特异腐质霉内切葡聚糖酶V编码区的29bp同源。启动子和编码序列之间36bp的重叠使得包含里氏木霉cbh1启动子的994bp片段能够精确的融合于包含特异腐质霉内切葡聚糖酶V编码区的918bp片段。
扩增反应(50μl)的组成为1X ThermoPol Reaction Buffer(ThermoPol反应缓冲液)、0.3mM dNTP、1μl纯化的937bp PCR片段、0.3μMHiEGV-F-overlap引物、0.3μM HiEGV-R引物、和2单位Vent DNA聚合酶。将所述反应物在如下编程的5333中温育:5个循环的94℃30秒、50℃30秒和72℃60秒,然后进行25个循环的94℃30秒、65℃30秒和72℃120秒(最终延伸5分钟)。反应产物在1.0%琼脂糖凝胶上用TAE缓冲液分离,从凝胶上切下945bp的产物条带,并使用Gel Extraction Kit依照生产商的说明进行纯化。
另外使用如下所示的引物(该有义引物经工程改造在5’末端具有SalI限制位点)进行PCR,来从里氏木霉RutC30基因组DNA扩增里氏木霉cbh1启动子序列,该序列从所述基因的ATG起始密码子上游994bp开始延伸。里氏木霉RutC30基因组DNA是用Plant Maxi Kit分离的。
引物TrCBHIpro-F(有义):
5’-AAACGTCGACCGAATGTAGGATTGTTATC-3’(SEQ ID NO:85)
引物TrCBHIpro-R(反义):
5’-GATGCGCAGTCCGCGGT-3’(SEQ ID NO:86)
扩增反应(50μl)的组成为1X ThermoPol Reaction Buffer(ThermoPol反应缓冲液)、0.3mM dNTP、100ng/μl里氏木霉RutC30基因组DNA、0.3μMTrCBHIpro-F引物、0.3μM TrCBHIpro-R引物、和2单位Vent DNA聚合酶。将所述反应物在如下编程的5333中温育:30个循环的94℃30秒、55℃30秒和72℃120秒(最终延伸5分钟)。将反应产物通过1.0%琼脂糖凝胶上用TAE缓冲液分离,从凝胶上切下998bp的产物条带,并使用Gel Extraction Kit(凝胶提取试剂盒)依照生产商的说明进行纯化。
用纯化的998bp PCR片段作为模板DNA用下述引物进行后续扩增。
引物TrCBHIpro-F:
5’-AAACGTCGACCGAATGTAGGATTGTTATC-3’(SEQ ID NO:87)
引物TrCBHIpro-R-overlap:
5’-GGAGGGGGGAGGAACGCAT -3’(SEQ IDNO:88)
斜体表示的序列与里氏木霉cbh1启动子的17bp同源,而带下划线的序列与特异腐质霉内切葡聚糖酶V编码区的29bp同源。启动子和编码序列之间36bp的重叠使得包含里氏木霉cbh1启动子的994bp片段能够精确的融合于包含特异腐质霉内切葡聚糖酶V全长编码区的918bp片段。
扩增反应(50μl)的组成为1X ThermoPol Reaction Buffer(ThermoPol反应缓冲液)、0.3mM dNTP、1μl纯化的998bp PCR片段、0.3μM TrCBH1pro-F引物、0.3μM TrCBH1pro-R-overlap引物、和2单位Vent DNA聚合酶。将这些反应物在如下编程的5333中温育:5个循环的94℃30秒、50℃30秒和72℃60秒,然后进行25个循环的94℃30秒、65℃30秒和72℃120秒(最终延伸5分钟)。反应产物在1.0%琼脂糖凝胶上用TAE缓冲液分离,从凝胶上切下1017bp的产物条带,并使用Gel Extraction Kit(凝胶提取试剂盒)依照生产商的说明进行纯化。
用1017bp里氏木霉cbh1启动子PCR片段和945bp特异腐质霉内切葡聚糖酶V PCR片段作为模板DNA用下述引物进行后续扩增,以利用重叠PCR精确地将994bp cbh1启动子融合于918bp内切葡聚糖酶V全长编码区。
引物TrCBHIpro-F:
5’-AAACGTCGACCGAATGTAGGATTGTTATC-3’(SEQ ID NO:89)
引物HiEGV-R:
5’-CTGCAGAATTCTACAGGCACTGATGGTACCAG-3’(SEQ ID NO:90)
扩增反应(50μl)的组成为1X ThermoPol Reaction Buffer(ThermoPol反应缓冲液)、0.3mM dNTP、0.3μM TrCBH1pro-F引物、0.3μM HiEGV-R引物和2单位Vent DNA聚合酶。将所述反应物在如下编程的 5333中温育:5个循环的94℃30秒、50℃30秒和72℃60秒,然后进行25个循环的94℃30秒、65℃30秒和72℃120秒(最终延伸5分钟)。反应产物在1.0%琼脂糖凝胶上用TAE缓冲液分离,从凝胶上切下1926bp的产物条带,使用Gel Extraction Kit(凝胶提取试剂盒)依照生产商的说明进行纯化。
将所得的1926bp片段使用PCR Cloning Kit(PCR克隆试剂盒)(Invitrogen,Carlsbad,CA,USA)依照制造商的规程克隆到-Blunt-II-载体(Invitrogen,Carlsbad,CA,USA)中。所得的质粒用NotI和SalI消化,并使用Gel Extraction Kit(凝胶提取试剂盒)凝胶纯化1926bp片段,然后使用T4DNA连接酶(Roche,Indianapolis,IN,USA)连接到pMJ04(其也用同样两种限制酶消化过)中,产生pMJ05(图6)。质粒pMJ05包含与特异腐质霉内切葡聚糖酶V全长编码序列可操作地连接的里氏木霉纤维二糖水解酶I启动子及终止子。
实施例10:pSMai130表达载体的构建
从作为模板的pJaL660(WO 2002/095014)用如下所示的引物993467(有义)和993456(反义)PCR扩增了米曲霉β-葡糖苷酶全长编码序列中从ATG起始密码子直到TAA终止密码子的2586bp的DNA片段(cDNA序列:SEQID NO:37;和推定的氨基酸序列:SEQ ID NO:38;大肠杆菌DSM 14240)。将Spe I位点工程构建到反义引物的5’末端以便于连接。斜体字的引物序列与里氏木霉cbh1启动子的24bp同源,且带下划线的序列与米曲霉β-葡糖苷酶编码区的22bp同源。
引物993467:
引物993456:
5’-ACTAGTTTACTGGGCCTTAGGCAGCG-3’(SEQ ID NO:92)
扩增反应(50μl)的组成为Pfx扩增缓冲液(Invitrogen,Carlsbad,CA,USA),0.25mM dNTP,10ng pJaL660,6.4μM引物993467,3.2μM引物993456,1mM MgCl2和2.5单位Pfx DNA聚合酶(Invitrogen,Carlsbad,CA,USA)。将这些反应物在如下编程的5333中温育:30个循环,每个为94℃1分钟、55℃1分钟和72℃3分钟(最终延伸15分钟)。反应产物在1.0%琼脂糖凝胶上用TAE缓冲液分离,从凝胶上切下2586bp的产物条带,并使用Gel Extraction Kit(凝胶提取试剂盒)依照生产商的说明进行纯化。
另外使用如下所示的引物993453(有义)和引物993463(反义)进行PCR,来扩增里氏木霉cbh1启动子序列(其从该基因ATG起始密码子上游1000bp处开始延伸),产生1000bp的PCR片段。
引物993453:
5’-GTCGACTCGAAGCCCGAATGTAGGAT-3’(SEQ ID NO:93)
引物993463:
斜体表示的引物序列与里氏木霉cbh1启动子的24bp同源,而带下划线的引物序列与米曲霉β-葡糖苷酶全长编码区的22bp同源。启动子和编码序列之间46bp的重叠使得包含里氏木霉cbh1启动子的1000bp片段能够精确的融合于包含米曲霉β-葡糖苷酶编码区的2586bp片段。
扩增反应(50μl)的组成为Pfx扩增缓冲液、0.25mM dNTP、100ng里氏木霉RutC30基因组DNA、6.4μM引物993453、3.2μM引物993463、1mMMgCl2和2.5单位Pfx DNA聚合酶。将这些反应物在如下编程的5333中温育:30个循环,每个为进行94℃1分钟、55℃1分钟和72℃3分钟(最终延伸15分钟)。反应产物在1.0%琼脂糖凝胶上用TAE缓冲液分离,从凝胶上切下1000bp的产物条带,并使用Gel Extraction Kit(凝胶提取试剂盒)依照生产商的说明进行纯化。
用纯化的片段作为模板DNA,进一步通过使用上文所示的引物993453(有义)和引物993456(反义)的重叠PCR进行扩增,来将包含里氏木霉cbh1启动子的1000bp片段精确地融合于包含米曲霉β-葡糖苷酶全长编码区的2586bp片段。
扩增反应(50μl)的组成为Pfx扩增缓冲液、0.25mM dNTP、6.4μM引物993453、3.2μM引物993456、1mM MgCl2和2.5单位Pfx DNA聚合酶。将这些反应物在如下编程的5333中温育:30个循环,每个进行94℃1分钟、60℃1分钟和72℃4分钟(最终延伸15分钟)。
将所得的3586bp片段用Sal I和Spe I消化,并连接到用同样两种限制酶消化过的pMJ04中,产生pSMai130(图7)。质粒pSMai130包含与米曲霉天然β-葡糖苷酶信号序列及编码序列(即全长米曲霉β-葡糖苷酶编码序列)可操作地连接的里氏木霉纤维二糖水解酶I基因启动子及终止子。
实施例11:pSMai135的构建
从作为模板的pJaL660利用如下所示的引物993728(有义)及引物993727(反义)PCR扩增出从Lys-20到TAA终止密码子的米曲霉β-葡糖苷酶成熟编码区(减去天然信号序列,见图8;SEQ ID NO:95和96代表信号肽和它的编码序列)。
引物993728:
引物993727:
5’-GACTAGTCTTACTGGGCCTTAGGCAGCG-3’(SEQ ID NO:98)
斜体字的序列与特异腐质霉内切葡聚糖酶V信号序列的20bp同源,而带下划线的序列与米曲霉β-葡糖苷酶编码区的22bp同源。将Spe I位点工程化到反义引物的5’端中。
扩增反应(50μl)的组成为Pfx扩增缓冲液、0.25mM dNTP、10ng/μlpJaL660、6.4μM引物993728、3.2μM引物993727、1mM MgCl2和2.5单位Pfx DNA聚合酶。将这些反应物在如下编程的 5333中温育:30个循环,每个进行94℃1分钟、55℃1分钟和72℃3分钟(最终延伸15分钟)。反应产物在1.0%琼脂糖凝胶上用TAE缓冲液分离,从凝胶上切下2523bp的产物条带,并使用GelExtraction Kit(凝胶提取试剂盒)依照生产商的说明进行纯化。
另外使用如下所示的引物993724(有义)和引物993729(反义)进行PCR扩增,来扩增里氏木霉cbh1启动子的1000bp和特异腐质霉内切葡聚糖酶V信号序列的63bp(ATG起始密码子到Ala-21,图9,SEQ ID NO:99和100)。
引物993724:
5’-ACGCGTCGACCGAATGTAGGATTGTTATCC-3’(SEQ ID NO:101)
引物993729:
5’-GGGAGTACGCGAGATCATCCTT -3’(SEQ ID NO:102)
斜体字的引物序列与特异腐质霉内切葡聚糖酶V信号序列的20bp同源,而带下划线的引物序列与米曲霉β-葡糖苷酶编码区的22bp同源。
用包含cbh1启动子控制下的特异腐质霉内切葡聚糖酶V编码区的质粒pMJ05作为模板,产生了包含里氏木霉cbh1启动子和特异腐质霉内切葡聚糖酶V信号序列片段的1063bp片段。里氏木霉cbh1启动子和特异腐质霉内切葡聚糖酶V信号序列与米曲霉β-葡糖苷酶成熟编码序列之间有42bp的重叠,以提供所述启动子与2523bp米曲霉β-葡糖苷酶编码区的ATG起始密码子之间的完美连结。
扩增反应(50μl)的组成为Pfx扩增缓冲液、0.25mM dNTP、10ng/μlpMJ05、6.4μM引物993728、3.2μM引物993727、1mM MgCl2和2.5单位Pfx DNA聚合酶。将这些反应物在如下编程的 5333中温育:30个循环,每个进行94℃1分钟、60℃1分钟和72℃4分钟(最终延伸15分钟)。反应产物在1.0%琼脂糖凝胶上用TAE缓冲液分离,从凝胶上切下1063bp的产物条带,并使用GelExtraction Kit(凝胶提取试剂盒)依照生产商的说明进行纯化。
用纯化的重叠片段作为模板,用如上所述的引物993724(有义)和引物993727(反义)进行扩增,通过重叠PCR将所述包含里氏木霉cbh1启动子和特异腐质霉内切葡聚糖酶V信号序列的1063bp片段精确地融合于所述包含米曲霉β-葡糖苷酶成熟编码区框的2523bp片段。
扩增反应(50μl)的组成为Pfx扩增缓冲液、0.25mM dNTP、6.4μM引物993724、3.2μM引物993727、1mM MgCl2和2.5单位Pfx DNA聚合酶。将这些反应物在如下编程的5333中温育:30个循环,每个进行94℃1分钟、60℃1分钟和72℃4分钟(最终延伸15分钟)。反应产物在1.0%琼脂糖凝胶上用TAE缓冲液分离,从凝胶上切下3591bp的产物条带,并使用Gel Extraction Kit(凝胶提取试剂盒)依照生产商的说明进行纯化。
将所得的3591bp片段用Sal I和Spe I消化,并连接到用相同的限制酶消化过的pMJ04中产生pSMai135(图10)。质粒pSMai135包含可操作地连接于特异腐质霉内切葡聚糖酶V信号序列和米曲霉β-葡糖苷酶成熟编码序列的里氏木霉纤维二糖水解酶I基因启动子和终止子。
实施例12:带有特异腐质霉内切葡聚糖酶V分泌信号的米曲霉β-葡糖苷酶的表达
通过PEG-介导的转化(Penttila等,1987,Gene 61155-164)将编码与特异腐质霉内切葡聚糖酶V分泌信号连接的成熟米曲霉β-葡糖苷酶的质粒pSMai135(图9)导入里氏木霉RutC30中。该质粒含有构巢曲霉amdS基因,使得转化体可以利用乙酰胺作为唯一氮源生长。
将里氏木霉RutC30在25ml添加了2%(w/v)葡萄糖和10mM尿苷的YP培养基中27℃、90rpm条件下培养17个小时。用Vacuum Driven Disposable Filtration System(一次性真空驱动过滤系统)(Millipore,Bedford,MA,USA)过滤收集菌丝体,并用去离子水和1.2M山梨醇各洗涤两次。将经过洗涤的菌丝体悬浮在含15mg/ml(Novozymes A/S,Denmark)和0.36单位/ml壳多糖酶(Sigma Chemical Co.,St.Louis,MO,USA)的20ml 1.2M山梨醇中,并在90rpm轻柔振荡下34℃温育15-25分钟,由此来生成原生质体。400xg离心7分钟收集原生质体,并用冷的1.2M山梨醇洗涤两次。原生质体用血细胞计数器计数后重悬于STC中至终浓度1X108个原生质体/ml。多余的原生质体在Cryo 1℃Freezing Container(1℃冷冻柜)(Nalgene,Rochester,NY,USA)中在-80℃保存。
将大约7μg经Pme I消化的pSMai135加入100μl原生质体溶液中,轻柔混合,然后加入260μl PEG缓冲液,混合,室温温育30分钟。然后加入STC(3ml),混合,并将转化溶液涂布到使用构巢曲霉amdS选择的COVE平板上。将平板在28℃温育5-7天。将转化体传代培养到COVE2平板上,并在28℃培养。
将用pSMai135获得的67个转化体(称为SMA135)传代培养到含有乙酰胺的新鲜平板上,让它们在28℃进行7天的孢子形成。
将这67个SMA135里氏木霉转化体在含25ml pH 6.0纤维素酶诱导培养基的125ml带挡板摇瓶中培养,其中用所述转化体的孢子接种培养基,在28℃、200rpm条件下温育7天。将里氏木霉RutC30作为对照进行。在第7天取出培养液样品。将每种培养液1ml在微量离心管中以15,700xg离心5分钟,并将上清液转移到新管中。样品保存在4℃直到进行酶测定。用对硝基苯基-β-D-吡喃葡萄糖苷作为底物测定上清液的β-葡糖苷酶活性,如下所述。
β-葡糖苷酶活性测定在环境温度下进行,使用25μl等份的在50mM琥珀酸盐(succinate)pH 5.0中1∶10稀释过的培养上清液,在作为底物的200μl0.5mg/ml对硝基苯基-β-D-吡喃葡萄糖苷(溶于50mM琥珀酸盐pH 5.0)中实施。温育15分钟后加入100μl 1M Tris-HCl pH 8.0终止反应,用分光光度计读取405nm吸光度。1个单位的β-葡糖苷酶活性对应于在环境温度、pH 5.0条件下每升每分钟产生1μmol对硝基苯。用黑曲霉β-葡糖苷酶(NOVOZYMTM 188,Novozymes A/S,Denmark)作为酶标准品。
若干个SMA135转化体显示了比里氏木霉RutC30所分泌的高数倍的β-葡糖苷酶活性。一个命名为SMA135-04的转化体产生了最高的β-葡糖苷酶活性。
用系统(Bio-Rad,Hercules,CA,USA)使用Tris-HCl(5%分离型)凝胶(Bio-Rad,Hercules,CA,USA)进行SDS-PAGE。将5μl第7天上清液(见上文)悬浮在2X浓度的Laemmli Sample Buffer(Laemmli样品缓冲液)(Bio-Rad,Hercules,CA,USA)中,在5%β-巯基乙醇存在下煮沸3分钟。将上清液样品加载到聚丙烯酰胺凝胶上,并用1X Tris/甘氨酸/SDS作为运行缓冲液(Bio-Rad,Hercules,CA,USA)进行电泳。所得的凝胶用BIO-Coomassie Blue Stain(考马斯亮蓝染料)(Bio-Rad,Hercules,CA,USA)染色。
通过SDS-PAGE分析的38个里氏木霉SMA135转化体中,26个产生了大约110kDa的蛋白质,其未见于作为对照的里氏木霉RutC30。转化体里氏木霉SMA135-04产生的β-葡糖苷酶水平最高,这一点有通过SDS-PAGE所见的所述110kDa条带的丰度为证。
将里氏木霉SMA135-04进行孢子划线接种经过在板上的两轮生长以保证其为克隆菌株,且将多个小瓶在将生产扩大至生产规模的发酵罐前进行冻结(and multiple vials frozen prior to production scaled to process scale fermentor)。将所得的蛋白质培养液自真菌细胞群中回收,并对其进行过滤,浓缩与配制。所得的纤维素分解酶制备物命名为纤维素分解酶组合物#1。
实施例13:表达载体pSMai140的构建
表达载体pSMai140通过用Nco I消化质粒pSATe111BG41(WO04/099228)而构建,质粒pSATe111BG41携带米曲霉β-葡糖苷酶变体BG41全长编码区(SEQ ID NO:103,其编码SEQ ID NO:104的氨基酸序列)。所得1243bp的片段用TAE缓冲液在1.0%的琼脂糖凝胶上分离并使用Gel Extraction Kit根据制造商的说明进行纯化。
将表达载体pSMai135用Nco I消化,并将8286bp片段用TAE缓冲液在1.0%琼脂糖凝胶上分离并使用Gel Extraction Kit根据制造商的说明进行纯化。然后用T4DNA连接酶(Roche,Indianapolis,IN,USA)根据制造商的规程将1243bp经Nco I消化的米曲霉β-葡糖苷酶变体BG41片段与所述8286bp的载体连接产生表达载体pSMai140(图11)。质粒pSMai140包含与特异腐质霉内切葡聚糖酶V信号序列以及米曲霉β-葡糖苷酶变体的成熟编码序列可操作地连接的里氏木霉纤维二糖水解酶I(CEL7A)基因启动子和终止子。
实施例14:用pSMai140转化里氏木霉RutC30
用Pme I将质粒pSMai140线性化并如实施例12所述转化入里氏木霉RutC30菌株。从四个独立的转化实验中共获得了100个转化体,将所有转化体在摇瓶中在纤维素酶诱导性培养基上培养,然后如实施例12所述从转化体的培养基中测定β-葡糖苷酶活性。许多里氏木霉SMA140转化体显示比里氏木霉RutC30高数倍的β-葡糖苷酶活性。
通过实施例12所述的SDS-聚丙烯酰胺凝胶电泳和Coomassie染色从分析过酶活性的同样13个培养物上清检测到培养基中米曲霉β-葡糖苷酶变体BG41蛋白质的存在。所有13个具有高β-葡糖苷酶活性的转化体也以不同产率表达约110kDa的米曲霉β-葡糖苷酶变体BG41。
将经过β-葡糖苷酶活性测定和SDS-聚丙烯酰胺凝胶电泳评价的表达最高β-葡糖苷酶变体的转化体命名为里氏木霉SMA140-43。
实施例15:表达载体pSaMe-F1的构建
用pMJ05作为模板使用下述引物PCR扩增包含209bp的里氏木霉纤维二糖水解酶I基因启动子和特异腐质霉内切葡聚糖酶V基因的核心区(SEQID NO:1的核苷酸1-702,其编码SEQ ID NO:2的氨基酸1-234,WO 91/17243)的DNA片段。
引物995103:
5’-cccaagcttagccaagaaca-3’(SEQ ID NO:105)
引物995137:
5’-gggggaggaacgcatgggatctggacggc-3’(SEQ ID NO:106)
扩增反应(50μl)的组成为1X Pfx扩增缓冲液、10mM dNTP、50mMMgSO4、10ng/μl pMJ05、50皮摩尔995103引物、50皮摩尔995137引物和2单位Pfx DNA聚合酶。所述反应物在如下编程的 5333中温育:30个循环,每个进行94℃30秒、55℃30秒和72℃60秒(3分钟最后延伸)。
用pSMai140作为模板与下述引物PCR扩增包含806bp米曲霉β-葡糖苷酶变体BG41基因的DNA片段。
引物995133:
5’-gccgtccagatccccatgcgttcctccccc-3’(SEQ ID NO:107)
引物995111:
5’-ccaagcttgttcagagtttc-3’(SEQ ID NO:108)
扩增反应(50μl)的组成为1X Pfx扩增缓冲液、10mM dNTP、50mMMgSO4、100ng pSMai140、50皮摩尔995133引物、50皮摩尔995111引物和2单位Pfx DNA聚合酶。所述反应物在如下编程的 5333中温育:30个循环,每个进行94℃30秒、55℃30秒和72℃120秒(3分钟最后延伸)。
反应产物用TAE缓冲液在1.0%琼脂糖凝胶上分离,将806bp的产物条带从凝胶上切下并根据制造商的说明用Gel Extraction Kit纯化。
然后将以上两个PCR片段进行重叠PCR。使用纯化的重叠片段作为扩增模板,用于使用上述引物995103(有义)和引物995111(反义)进行扩增,以将包含209bp的里氏木霉纤维二糖水解酶I基因启动子和特异腐质霉内切葡聚糖酶V核心序列的702bp片段与包含米曲霉β-葡糖苷酶变体BG41一部分编码区的806bp片段通过重叠PCR精确融合。
扩增反应(50μl)的组成为1X Pfx扩增缓冲液、10mM dNTP、50mMMgSO4、2.5μl的每一种片段(20ng/μl)、50皮摩尔995103引物、50皮摩尔995111引物和2单位的高保真Pfx DNA聚合酶。所述反应物在如下编程的5333中温育:进行95℃初始变性3分钟,然后是30个驯养换,每个进行1分钟变性、1分钟60℃退火和3分钟72℃延伸。
根据制造商的说明将1.7kb的片段连入平末端载体(Invitrogen,Carlsbad,CA,USA)。然后根据制造商的快速化学转化步骤将构建体转化入ONETOP 10化学感受态大肠杆菌细胞(Invitrogen,Carlsbad,CA,USA)。用质粒分离与消化的方法选择和分析菌落,其中消化使用Hind III进行以释放1.7kb的重叠PCR片段。
同样用Hind III消化质粒pSMai140以线性化质粒。将两个消化的片段根据制造商的说明在使用Rapid DNA Ligation Kit的连接反应中组合起来产生pSaMe-F1(图12)。
将大肠杆菌XL 1-Blue Subcloning-Grade Competent Cells(大肠杆菌XL 1-蓝色亚克隆级感受态细胞)(Stratagene,La Jolla,CA,USA)用连接产物转化。构建体的身份通过对从经转化的大肠杆菌中纯化的质粒的如下序列进行DNA测序来确认:里氏木霉纤维二糖水解酶I基因启动子、特异腐质霉内切葡聚糖酶V信号序列、特异腐质霉内切葡聚糖酶V核心、特异腐质霉内切葡聚糖酶V信号序列、米曲霉β-葡糖苷酶变体BG41和里氏木霉纤维二糖水解酶I基因终止子序列。一个包含重组质粒的克隆被命名为pSaMe-F1。质粒pSaMe-F1包含里氏木霉纤维二糖水解酶I基因启动子和终止子,还有特异腐质霉内切葡聚糖酶V信号肽序列,特异腐质霉内切葡聚糖酶V信号肽序列直接与特异腐质霉内切葡聚糖酶V核心多肽连接,特异腐质霉内切葡聚糖酶V核心多肽直接与特异腐质霉内切葡聚糖酶V信号肽融合,特异腐质霉内切葡聚糖酶V信号肽直接与米曲霉β-葡糖苷酶变体BG41成熟编码序列连接。米曲霉β-葡糖苷酶变体BG融合蛋白的DNA序列和推定的氨基酸序列分别示于SEQ ID NO:47和48。
实施例16:用pSaMe-F1转化里氏木霉RutC30
将含有25ml添加了2%葡萄糖和10mM尿苷的YP培养基的摇瓶用5X107个里氏木霉RutC30的孢子接种。在27℃,90rpm的条件下大约16小时温育过夜之后,用一次性真空驱动过滤系统收集菌丝体。将菌丝体在100ml去离子水中洗涤两次,在1.2M的山梨醇中洗涤两次。如实施例12所述那样产生原生质体。
将两微克经Pme I线性化的pSaMe-F1DNA,100μl的里氏木霉RutC30原生质体和50%PEG(4000)混合并在室温下温育30分钟。然后加入3ml STC并将内容物倒至添加了10mM尿苷的COVE平板上。然后将平板在28℃温育。转化体在第6天开始出现并被挑出至COVE2平板上在28℃生长6天。回收了22个里氏木霉转化体。
将转化体在摇瓶中在纤维素酶诱导性培养基上培养,并如实施例12所述测定β-葡糖苷酶活性。许多pSaMe-F1转化体都产生β-葡糖苷酶活性。一个命名为里氏木霉SaMeF1-9的转化体产生了最大量的β-葡糖苷酶,并具有两倍于表达米曲霉β-葡糖苷酶变体的菌株(实施例15)的活性。
内切葡聚糖酶的活性根据Beguin,1983,Analytical Biochem.131(2):333-336用羧甲基纤维素(CMC)覆盖测定法测定。将从5个培养液样品(那些具有最高β-葡糖苷酶活性的)中得到的5μg总蛋白用Native Sample Buffer(天然样品缓冲液)(Bio-Rad,Hercules,CA,USA)稀释并用10X Tris/甘氨酸运行缓冲液(Bio-Rad,Hercules,CA,USA)在8-16%Tris-HCl凝胶(Bio-Rad,Hercules,CA,USA)上运行,然后将凝胶铺在含有1%羧甲基纤维素(carboxymethylcellulose,CMC)的平板上方。在37℃温育1小时后,将凝胶用0.1%Congo Red染色20分钟。然后用1M NaCl为平板脱色以鉴定指示内切葡聚糖酶活性的澄清区域。两个澄清区域可见,一个为约110kDa的上方区域,另一个为约25kDa的下方区域。特异腐质霉内切葡聚糖酶V和米曲霉β-葡糖苷酶变体BG41融合蛋白的预测蛋白大小是118kDa,如果两个蛋白质未被切割而是作为单个多肽保留的话;单个内切葡聚糖酶V核心结构域的糖基化和β-葡糖苷酶的糖基化导致单个蛋白质迁移到比根据一级序列预测的更高的分子量。如果两个蛋白质被切割,那么特异腐质霉内切葡聚糖酶V核心结构域的预测大小是24kDa而米曲霉β-葡糖苷酶变体BG41的预测大小是94kDa。由于110kDa处有澄清区域,这一结果表明最起码内切葡聚糖酶和β-葡糖苷酶融合蛋白群体作为单个的大蛋白保持完整。下方澄清区域很可能代表内源的内切葡聚糖酶活性,且可能是由于特异腐质霉内切葡聚糖酶V核心结构域从米曲霉β-葡糖苷酶的部分断裂而额外导致的。
所述结果证明特异腐质霉内切葡聚糖酶V核心是有活性的,即使是将其连接到米曲霉β-葡糖苷酶。此外,β-葡糖苷酶活性的提高似乎是由于相对于非融合的β-葡糖苷酶的分泌效率,蛋白质分泌有所提高所致。通过将米曲霉β-葡糖苷酶变体BG41序列连接到高效分泌的特异腐质霉内切葡聚糖酶V核心,使更多的β-葡糖苷酶被分泌。
实施例17:载体pSaMe-FX的构建
质粒pSaMe-FX通过修饰pSaMe-F1而构建。用Bst Z17和Eco RI消化质粒pSaMe-F1以产生含有β-葡糖苷酶变体BG41编码序列的1kb片段和包含质粒剩余部分的9.2kb片段。所述片段用TAE缓冲液在1.0%琼脂糖凝胶上分离,将9.2kb的片段切下并根据制造商的说明用GelExtraction Kit纯化。质粒pSMai135也用Bst Z17和Eco RI消化以产生含有与米曲霉β-葡糖苷酶变体BG41编码序列同源的碱基的1kb片段和含有质粒剩余部分的8.5kb片段。如上分离和纯化所述1kb片段。
根据制造商的说明在用Rapid DNA Ligation Kit的连接反应中组合9.2kb和1kb的片段以产生pSaMe-FX,除了它含有野生型β-葡糖苷酶成熟编码序列而不是变体成熟编码序列之外,其与pSaMe-F1相同。
用连接产物转化大肠杆菌感受态细胞(Stratagene,La Jolla,CA,USA)。构建体的身份通过对来自从经转化的大肠杆菌中纯化的质粒的里氏木霉纤维二糖水解酶I基因启动子、特异腐质霉内切葡聚糖酶V信号序列、特异腐质霉内切葡聚糖酶V核心序列、特异腐质霉内切葡聚糖酶V信号序列、米曲霉β-葡糖苷酶成熟编码序列和里氏木霉纤维二糖水解酶I基因终止子序列进行DNA测序来确定。将一个含有所述重组质粒的克隆命名为pSaMe-FX(图13)。米曲霉β-葡糖苷酶融合蛋白的DNA序列和推定的氨基酸序列分别为SEQ ID NO:49和50。
实施例18:木霉转化体的转化和表达
如实施例16所述用Pme I线性化pSaMe-FX构建体并将其转化入里氏木霉RutC30菌株。单次转化共获得63个转化体。将转化体在摇瓶中的纤维素酶诱导性培养基上培养并如实施例12所述测定β-葡糖苷酶活性。许多pSaMe-FX转化体产生了β-葡糖苷酶活性。一个命名为SaMe-FX16的转化体与里氏木霉SaMeF1-9(实施例16)相比产生了两倍量的β-葡糖苷酶活性。
实施例19:里氏木霉转化体的分析
如实施例15所述通过融合特异腐质霉内切葡聚糖酶V核心(包含其自身的天然信号序列)和与特异腐质霉内切葡聚糖酶V信号序列连接的米曲霉β-葡糖苷酶变体BG41成熟编码序列来构建融合蛋白。这种融合构建体和与特异腐质霉内切葡聚糖酶V信号序列连接的米曲霉β-葡糖苷酶变体BG41成熟编码序列相比,导致分泌的β-葡糖苷酶的活性提高了两倍。第二个融合构建体如实施例17所述产生,其由与米曲霉野生型β-葡糖苷酶编码序列(该序列与特异腐质霉内切葡聚糖酶V信号序列连接)融合的特异腐质霉内切葡聚糖酶V核心(包括其自身信号序列)组成,而这导致β-葡糖苷酶活性的进一步提高。用野生型融合物转化的菌株相对于用β-葡糖苷酶变体BG41融合物转化的菌株具有两倍的分泌的β-葡糖苷酶活性。
实施例20:将β-葡糖苷酶融合蛋白编码序列克隆入米曲霉表达载体
设计如下所示的两个合成寡核苷酸引物,用以从编码β-葡糖苷酶融合蛋白的pSaMeFX PCR扩增全长开放式读码框。
PCR正向引物:
PCR反向引物:
5’-AGTTAATTAA-3’(SEQ ID NO:110)
黑体字母代表编码序列。正向引物中带有下划线的“G”表示引入的用以产生SphI限制性位点的碱基改变。剩余的序列与pSaMeFX插入位点相比具有序列同一性。反向引物中带有下划线的序列表示添加的Pac I限制性位点,其有助于将该基因克隆在表达载体pAlLo2中(WO 04/099228)。
在终体积为50μl的PCR反应中使用50皮摩尔的以上每种引物,所述PCR反应包含50ng pSaMeFX DNA、1X Pfx扩增缓冲液、6μl10mM dATP、dTTP、dGTP和dCTP的混合物、2.5单位Pfx DNA聚合酶,和1μl 50mM MgSO4。用如下设定程序的 5333扩增片段:进行98℃2分钟的1个循环;和96℃30秒、61℃30秒和68℃3分钟的35个循环。35个循环之后,反应物在68℃温育10分钟,然后于10℃冷却。用TAE缓冲液和0.1μg/ml溴化乙锭在0.8%GTG-琼脂糖凝胶(Cambrex Bioproducts One Meadowlands Plaza East Rutherford,NJ,USA)上分离3.3kb的PCR反应产物。为了避免UV-诱导的突变,借助DARK READERTM使DNA显像。用一次性剃刀片将3.3kb的DNA条带切下并根据制造商的说明用-DA旋杯(spin cup)纯化。
将纯化的3.3kb PCR产物克隆入4Blunt-载体(Invitrogen,Carlsbad,CA,USA)。将4微升纯化的PCR产物与1μl 2M氯化钠溶液和1μl载体混合。将反应物在室温下温育15分钟,然后根据制造商的说明用2μl反应物转化OneTOP10化学感受态大肠杆菌细胞。将每个转化反应的三个83μl的等份试样涂布在添加了100μg/ml氨苄青霉素的三个150mm 2X YT平板上并在37℃温育过夜。
用8个重组菌落接种含有补充了100μg/ml氨苄青霉素的3ml LB培养基的液体培养物。用9600(QIAGEN Inc.,Valencia,CA,USA)从这些培养物中制备质粒DNA。将克隆用Pac I限制酶消化进行分析。将来自每个克隆的质粒DNA用Pac I消化并用TAE缓冲液通过1.0%琼脂糖凝胶电泳分析。所有的8个克隆都具有期望的限制性消化图式,选择克隆5、6、7和8进行测序以确认在克隆的插入物中没有突变。对它们的5’和3’末端的序列分析显示所有的4个克隆都具有正确的序列。选择克隆5和7进行后续测序。两个克隆都测序为Phred Q值超过40以确保没有PCR导致的错误。克隆5和7显示具有期望的序列而选择克隆5重克隆入pAlLo2。
通过用Sph I消化将来自克隆5的质粒DNA线性化。然后通过加入1.2μl 10mM的dATP、dTTP、dGTP和dCTP的混合物和6单位的T4DNA聚合酶(New England Bioloabs,Inc.,Ipswich,MA,USA)将线性化的克隆平末端化。所述混合物在12℃温育20分钟,然后通过加入1μl 0.5M EDTA并在75℃加热20分钟停止反应使酶失活。编码β-葡糖苷酶融合蛋白的3.3kb片段如上所述通过凝胶电泳和超滤纯化。
通过用Nco I消化使载体pAlLo2线性化。然后通过加入0.5μl10mM的dATP、dTTP、dGTP和dCTP的混合物和1单位的DNA聚合酶I使线性化的载体平末端化。在25℃将混合物温育15分钟,然后通过加入1μl 0.5MEDTA并在75℃加热15分钟停止反应使酶失活。然后用Pac I消化载体。平末端化的载体如上所述通过凝胶电泳和超滤纯化。
将编码β-葡糖苷酶融合蛋白的3.3kb片段克隆入经线性化和纯化的pAlLo2载体,所述克隆是用Rapid DNA Ligation Kit进行的。根据制造商的说明用1μl反应样品转化大肠杆菌XL10Gold细胞(Stratagene,La Jolla,CA,USA)。在恢复阶段之后,将来自转化反应的2个100μl等份试样铺板在补充了100μg/ml氨苄青霉素的2个150mm 2X YT平板上并在37℃温育过夜。从选择平板上随机挑选一组8个推定的重组克隆并用9600从每个克隆制备质粒DNA。选择克隆1-4用pAlLo2特异性引物测序以确认连接载体/插入物具有正确的序列。克隆3具有完美的载体/插入物连接并被命名为pAlLo47(图14)。
为了获得无标记的表达菌株,进行限制性内切核酸酶消化将赋予对抗生素氨苄青霉素的抗性的blaA基因与表达构建体的其它部分分离。用Pme I消化30微克pAlLo47。然后将经消化的DNA如上所述用琼脂糖凝胶电泳纯化。用剃刀片将含有表达构建体但缺少blaA基因的6.4kb DNA条带切下并用Gel Extraction Kit纯化。
实施例21:特异腐质霉/米曲霉cel45A核心-cel3A融合基因在米曲霉JaL355中的表达
根据Christensen等,1988,见上的方法制备了米曲霉JaL355(WO00/240694)的原生质体。使用10微升实施例20的经纯化的表达构建体转化米曲霉JaL355原生质体。米曲霉JaL355的转化产生了大约90个转化体。分离50个转化体至单独的PDA平板上并在34℃温育5天。
用3ml 0.01%80洗涤48个铺满的孢子平板,并用孢子悬浮液接种125ml玻璃摇瓶中的25ml MDU2BP培养基。转化体培养物在34℃温育并以200rpm持续摇动。5天之后,将每个培养物的1ml等份试样在12,000xg下离心并收集其上清。5μl的每种上清与等体积的2X上样缓冲液(10%β-巯基乙醇)混合并上样至1.5mm 8%-16%Tris-甘氨酸SDS-PAGE凝胶,用BIO-Coomassie Blue染料染色。培养液的SDS-PAGE概貌显示,48个转化体中的33个能够表达表观分子量与期望的118kDa非常相近的新蛋白质。转化体21具有最佳产率并被选择用于进一步研究。
实施例22:米曲霉JaL355转化体21的单孢子分离
将米曲霉JaL355转化体21的孢子涂布在PDA平板上并在34℃温育5天。将铺满孢子的平板上的一小块区域用0.5ml 0.01%80洗涤以重悬孢子。将孢子悬浮液100μl的等份试样用5ml 0.01%80稀释至终体积5ml。借助血细胞计数器测定孢子浓度并将其稀释至终浓度为每微升0.1个孢子。将孢子稀释液200μl的等份试样涂布在150mm基础培养基平板上并在34℃温育2-3天。将出现的菌落从平板上切下转移至PDA平板并在34℃温育3天。然后将孢子涂布在平板上并在34℃再温育5天。
将铺满孢子的平板用3ml 0.01%80洗涤并用孢子悬浮液接种125ml玻璃摇瓶中的25ml MDU2BP培养基。单孢子培养物在34℃下温育并以200rpm持续摇动。5天之后,将每个培养物的1ml等份试样以12,000xg离心并收集其上清。将5μl的每种上清与等体积的2X上样缓冲液(10%β-巯基乙醇)混合并上样至1.5mm 8%-16%Tris-甘氨酸SDS-PAGE凝胶,用BIO-Coomassie Blue染料染色。培养液的SDS-PAGE概貌显示所有的8个转化体都能够以非常高的水平表达β-葡糖苷酶融合蛋白,而名为米曲霉JaL355AlLo47的培养物之一产生了最高产率。
实施例23:pCW087的构建
设计如下所示的2个合成寡核苷酸引物以从质粒pDZA2-7(WO2005/074656)中PCR扩增橙色嗜热子囊菌GH61A多肽基因。正向引物产生平的5’末端而反向引物在3’末端引入Pac I位点。
正向引物:
5’-ATGTCCTTTTCCAAGATAATTGCTACTG-3’(SEQ ID NO:111)
反向引物:
5’-GCTTAATTAACCAGTATACAGAGGAG-3’(SEQ ID NO:112)
将50皮摩尔的以上各种引物用于终体积为50μl的PCR反应中,所述反应的组成为50ng pDZA2-7、1μl10mM dATP、dTTP、dGTP和dCTP的混合物、5μl10X ACCUTAQTM DNA聚合酶缓冲液(Sigma-Aldrich,St.Louis,MO,USA)和5单位ACCUTAQTM DNA聚合酶(Sigma-Aldrich,St.Louis,MO,USA)。用程序设定如下的5333扩增DNA片段:1个循环的95℃3分钟;30个循环,每个为94℃45秒、55℃60秒和72℃1分30秒。25个循环之后,将反应在72℃温育10分钟然后冷却至4℃等待后续处理。用Pac I消化橙色嗜热子囊菌GH61A PCR片段的3’末端。根据制造商的说明用MINELUTETM Reaction Cleanup Kit(MINELUTETM反应清除试剂盒)(QIAGEN Inc.,Valencia,CA,USA)纯化消化产物。
利用5’末端平的Nco I位点和3’末端的Pac I位点将GH61A片段直接克隆入pSMai155(WO 2005/074647)。质粒pSMai155用Nco I和Pac I消化。然后用Klenow酶将Nco I位点变平以填补Nco I位点的5’凹陷。Klenow反应由20μl pSma155消化反应混合物加1mM dNTP和1μl Klenow酶组成,将该反应物短暂地在室温温育。将刚刚线性化的pSMai155质粒根据制造商的说明用MINELUTETM Reaction Cleanup Kit纯化。这些反应导致与新产生的GH61A片段相相容的5’平末端和3’Pac I位点的产生。然后根据制造商的说明用Rapid DNA Ligation Kit(快速DNA连接试剂盒)将GH61A片段克隆入pSMai155表达载体。用连接产物转化大肠杆菌XL1-Blue亚克隆级感受态细胞(Stratagene,La Jolla,CA,USA)。构建体的身份通过DNA测序来自质粒的GH61A编码序列加以确认,该质粒是从经转化的大肠杆菌中纯化的。含有重组质粒的一个大肠杆菌克隆被命名为pCW087-8。
实施例24:pSaMe-Ta61A的构建
表达载体pSaMe-Ta61通过用Nsi I消化含有amdS选择标记的质粒pMJ09,释放2.7kb的amdS片段而构建。然后用TAE缓冲液在1.0%琼脂糖凝胶上分离2.7kb的amdS片段并用Gel Extraction Kit纯化。
用Nsi I消化表达载体pCW087,并将4.7kb的片段用TAE缓冲液在1.0%琼脂糖凝胶上分离并用Gel Extraction Kit纯化。然后根据制造商的规程用T4DNA连接酶(Roche,Indianapolis,IN,USA)将所述2.7kb的amdS片段与4.7kb的载体片段连接以产生表达载体pSaMe-Ta61A。质粒pSaMe-Ta61A包含可操作地连接到橙色嗜热子囊菌GH61A成熟编码序列的里氏木霉纤维二糖水解酶I(CEL7A)基因的启动子和终止子。
实施例25:里氏木霉菌株SaMe-MF268的构建
用共转化将质粒pSaMe-FX和pSaMe-Ta61A导入里氏木霉RutC30。将质粒pSaMe-FX和pSaMe-Ta61A通过PEG-介导的转化(Penttila等,1987,同上)导入里氏木霉RutC30。每个质粒含有构巢曲霉amdS基因以使转化体能够用乙酰胺作为唯一氮源生长。
将里氏木霉RutC30在27℃和90rpm条件下在添加了2%(w/v)葡萄糖和10mM尿苷的25ml YP培养基中培养17小时。用一次性真空驱动过滤系统通过过滤收集菌丝体并用去离子水洗涤2次,1.2M山梨醇洗涤2次。在含有15mg/ml和0.36单位/ml壳多糖酶(Sigma Chemical Co.,St.Louis,MO,USA)的20ml 1.2M山梨醇中悬浮洗涤后的菌丝体并在34℃以90rpm轻摇条件下温育15-25分钟以产生原生质体。通过在400xg离心7分钟收集原生质体并用冷的1.2M山梨醇洗涤2次。原生质体用血细胞计数器计数并在STC中重悬至终浓度1X108个原生质体/ml。将过量的原生质体贮存在-80℃下的Cryo 1℃Freezing Container中。
用Pme I消化各约4μg的质粒pSaMe-FX和pSaMe-Ta61A以促进去除氨苄西林抗性标记。用Pme I消化之后,将线性片段用TAE缓冲液在1%琼脂糖凝胶上运行以分开不同的片段。将来自pSaMe-FX的7.5kb片段和来自pSaMe-Ta61A的4.7kb片段从凝胶上切下并根据制造商的说明用Gel Extraction Kit纯化。这些纯化的片段含有amdS选择性标记盒以及里氏木霉cbh1基因启动子和终止子。此外,所述片段包括特异腐质霉EGV核心/米曲霉BG融合编码序列或橙色嗜热子囊菌GH61A编码序列。转化中使用的片段不包含抗生素抗性标记,因为ampR片段通过这一凝胶纯化步骤被去除。然后将纯化的片段加至100μl原生质体溶液并轻柔混合,然后加入260μl PEG缓冲液,混合,并在室温下温育30分钟。然后加入STC(3ml)并混合,将转化溶液涂布在使用构巢曲霉amdS进行选择的COVE平板上。将平板在28℃温育5-7天。将转化体传代培养到COVE2平板上并在28℃下生长。
将超过400个转化体传代培养至新鲜的含有乙酰胺的平板上并允许其在28℃进行7天的孢子形成。
里氏木霉转化体在含有用转化体孢子接种的25ml pH 6.0纤维素酶诱导性培养基的125ml带挡板摇瓶中培养,并在28℃和200rpm条件下温育5天。将里氏木霉RutC30作为对照。在第5天将培养液样品除去。在15,700xg条件下在微离心管中离心1ml的各种培养液5分钟并将上清转移至新管。
用Tris-HCl(5%分离型)凝胶和系统进行SDS-PAGE。在2X浓度的Laemmli Sample Buffer(Bio-Rad,Hercules,CA,USA)中悬浮5μl的第5天上清(见上)并在5%β-巯基乙醇存在下煮沸3分钟。将上清样品上样至聚丙烯酰胺凝胶并用1X Tris/甘氨酸/SDS作为运行缓冲液(Bio-Rad,Hercules,CA,USA)进行电泳。所得凝胶用BIO-CoomassieBlue染料染色。将SDS-PAGE凝胶条带可视化后观察到,显示出同时表达橙色嗜热子囊菌GH61A多肽和由特异腐质霉内切葡聚糖酶V核心(CEL45A)与米曲霉β-葡糖苷酶融合组成的融合蛋白的转化体,然后在PCS水解反应中测试所述转化体以鉴定产生最佳水解液的菌株。
实施例26:里氏木霉菌株SaMe-MF268的鉴定
显示同时表达橙色嗜热子囊菌GH61A多肽以及米曲霉β-葡糖苷酶融合蛋白的转化体在含有25ml pH 6.0的纤维素酶诱导性培养基的125ml带挡板摇瓶中培养,其中将培养基用转化体的孢子接种,并在28℃和200rpm下温育5天。
将摇瓶培养液以6000xg离心并在水解前用STERICUPTM EXPRESSTM(Millipore,Bedford,MA,USA)过滤至0.22μm。培养液的活性通过其水解PCS并产生糖的能力来测定,所述糖可以通过化学测定其还原端来检测。
在美国能源部国家可再生能源实验室(U.S.Department of Energy National Renewable Energy Laboratory(NREL),Boulder,CO,USA)用稀硫酸预处理玉米秸秆。用以下条件进行预处理:0.048g硫酸/g干生物质,190℃和25%w/w干固体,进行约1分钟。预处理的玉米秸秆(pretreated corn stover,PCS)中的水不溶固体包含59.2%纤维素,其通过极限消化PCS释放葡萄糖和纤维二糖来确定。酶水解之前,用大体积的双去离子水(double deionized water)洗涤PCS;水洗后PCS的干重为17.73%。
将1kg量的PCS悬浮在约20升双去离子水中,并在PCS沉降之后将水倒出。重复这一操作直到洗涤用水在pH 4.0以上,同时还原性的糖低于每升0.06g。如果是小量测定(如1ml),将沉降后的浆料(slurry)用100目的网过筛以确保能够吸取。洗涤后PCS的百分比干重含量通过在105℃的烘箱干燥样品至少24小时(直至恒重)并与湿重比较而测定。
PCS水解在1ml体积中在96深孔板(Axygen Scientific)上进行,用ALPS300TM自动实验室平板密封机(automated lab plate sealer)(ABgene Inc.,Rochester,NY,USA)对所述深孔板进行加热密封。在pH 5.0的50mM乙酸钠中,PCS浓度为每升10g。PCS水解在50℃进行,除在取样期间按照描述搅动以外不用额外地搅动。每个反应一式三份进行。释放的还原糖如下所述通过对羟基苯甲酰肼(p-hydroxy benzoic acid hydrazide,PHBAH)试剂分析。
将体积为0.8ml的PCS(每升水中12.5g)移液至96深孔板的每个孔中,然后是0.10ml pH 5.0的0.5M乙酸钠,然后是0.10ml稀释的酶溶液以起始终反应体积为1.0ml、PCS浓度为每升10g的反应。将平板密封。反应混合物在水解开始时和取得每个样品的时间点(taking each sample time point)前通过颠倒深孔板进行混合。在每个样品时间点,将平板混合然后将深孔板在2000rpm离心(带有RTH-250转子的RT7)10分钟,然后将20μl水解物(上清)移出并加至96孔微量滴定板中的180μl 0.4%NaOH中。在必要时,将这种反应已停止的溶液进一步稀释至合适的还原糖的范围。释放的还原糖用对羟基苯甲酰肼试剂(PHBAH,Sigma,4-hydroxy benzyhydrazide)测定:将50μl的PHBAH试剂(1.5%)与100μl样品在V型底的96孔THERMOWELLTM平板(Costar 6511)中混合,在95℃的平板加热块上温育10分钟,然后向每个孔加入50μl双去离子水,混合,然后转移100μl至另一个平底的96孔板(Costar 9017)并在410nm处读取吸光度。还原糖使用同样条件下的葡萄糖校准曲线(calibration curve)进行计算。纤维素转化为还原糖的百分比转化如下计算:
%转化=还原糖(mg/ml)/(所添加的纤维素(mg/ml)x1.11)
因子1.11修正将纤维素水解为葡萄糖的重量增加。
1ml的PCS水解测试之后,将最佳候选者在2升发酵罐中一式两份培养。
摇瓶培养基的组成为每升20g葡萄糖、10g玉米浆固体、1.45g(NH4)2SO4、2.08g KH2PO4、0.36g CaCl2、0.42g MgSO4·7H2O和0.42ml痕量金属溶液。痕量金属溶液的组成为每升216g FeCl3·6H2O、58gZnSO4·7H2O、27g MnSO4·H2O、10g CuSO4·5H2O、2.4g H3BO3和336g柠檬酸。
将10ml摇瓶培养基添加至500ml摇瓶。用2块固体平板培养物的琼脂块(plug)接种摇瓶,温育在定轨摇床上以200rpm在28℃进行48小时。用50ml摇瓶培养液接种3升发酵容器。
发酵分批培养基的组成为每升30g纤维素、4g葡萄糖、10g玉米浆固体、3.8g(NH4)2SO4、2.8g KH2PO4、2.64g CaCl2、1.63g MgSO4.7H2O、1.8ml消泡剂和0.66ml痕量金属溶液。痕量金属溶液的组成为每升216gFeCl3·6H2O、58g ZnSO4·7H2O、27g MnSO4·H2O、10g CuSO4·5H2O、2.4gH3BO3和336g柠檬酸。发酵补料培养基的组成为葡萄糖和纤维素。
将总共1.8升的发酵分批培养基添加至3升发酵罐。发酵补料培养基以0-4g/l/hr的速率定量提供165小时的时间。将发酵容器的温度保持在28℃,且pH控制在调定点4.75+/-0.1。以1vvm的速率向容器中加入空气,用以1100-1300rpm旋转的Rushton叶轮搅动培养液。在发酵结束时,自所述容器收获全部的培养液,并以3000rpm xg离心以移除生物质。将上清过滤除菌并储存在35到40℃。
测定总蛋白浓度并在50g的PCS水解反应中再次测试培养液,如下所述。每次实验之前,酶稀释剂从储存在4℃的贮存酶溶液中新鲜地制备。
PCS的水解使用125ml有旋塞的Erlenmeyer烧瓶(VWR,West Chester,PA,USA)用50g总反应质量根据NREL Laboratory Analytical Protocol#008(NREL实验室分析规程#008)进行。在这一规程中PCS的水解(约11.4%的PCS和在pH 5.0的50mM乙酸钠中6.8%的纤维素)用不同蛋白质加载量(表达为mg蛋白质/g纤维素)的2升发酵液样品进行。PCS水解能力的测定用4080培养箱(New Brunswick Scientific,Edison,NJ,USA)在50℃以150rpm的轨道摇动进行。在水解过程中的72、120和168小时取等份试样并离心,使用HV 0.45μm膜(Millipore,Billerica,MA,USA)通过使用RT7平板离心机(Thermo Fisher Scientific,Waltham,MA,USA)在2000rpm离心10分钟来过滤上清液。不即刻使用时,将过滤的等份试样在-20℃冷冻。通过在65℃以每分钟0.4ml的流速用0.005M H2SO4从4.6x250mmHPX-87H柱(Bio-Rad,Hercules,CA,USA)洗脱后测定在0.005M H2SO4中稀释后的样品中糖的浓度,其数值是通过整合葡萄糖和纤维二糖信号得到的,该信号得自经纯糖样品校准的、使用1100HPLC(Agilent Technologies,Santa Clara,CA,USA)进行的折射率(refractive index)检测。所得当量(equivalent)用以计算每个反应的百分比纤维素转化。
用以下等式计算纤维素转化为葡萄糖加纤维二糖的程度(转化,%):
转化率(%)=(葡萄糖+纤维二糖x1.053)(mg/ml)x100x162/(纤维素(mg/ml)x180)
=
(葡萄糖+纤维二糖x1.053)(mg/ml)x100/(纤维素(mg/ml)x1.111)
在此等式中,因子1.111反映将纤维素转化为葡萄糖时的重量增加,而因子1.053反映将纤维二糖转化为葡萄糖时的重量增加。
表1显示上述50g烧瓶测定中PCS水解反应的结果。产生性能最佳培养液的一个菌株被命名为里氏木霉SaMe-MF268。
表1:168小时时间点时转化为糖的百分比
相对于蛋白质加载量的百分比转化率
(葡萄糖加纤维二糖)
培养液ID-菌株名称 2.5mg/g纤维素 4.0mg/g纤维素
XCL-461-SaMe-MF268 66.29 80.08
XCL-465-SaMe-MF268 69.13 82.80
XCL-462-SaMe-MF330 62.98 77.99
XCL-466-SaMe-MF330 63.34 77.90
XCL-463-SaMe-MF377 64.03 78.45
XCL-467-SaMe-MF377 64.19 79.06
实施例27:构建载体pSaMe-FH
表达载体pSaMe-FH(图15)通过用Bsp120I与PacI消化质粒pSMai155(WO 2005/074647)与质粒pSaMe-FX(实施例17)构建。来自pSMai155的5.5kb片段与来自pSaMeFX的3.9kb片段在1.0%琼脂糖凝胶上使用TAE缓冲液分离,并用Gel Extraction Kit纯化。所述两个片段随即使用T4DNA连接酶根据生产商的实验方案连接。用所述连接产物转化大肠杆菌感受态细胞。构建体的身份通过对来自纯化自经转化大肠杆菌的质粒的里氏木霉纤维二糖水解酶I基因启动子,特异腐质霉内切葡聚糖酶V信号序列,特异腐质霉内切葡聚糖酶V核心序列,特异腐质霉内切葡聚糖酶V信号序列,米曲霉β-葡糖苷酶成熟编码序列,以及里氏木霉纤维二糖水解酶I基因终止子序列进行DNA测序来确定。将一个包含所述重组质粒的克隆命名为pSaMe-FH。质粒pSaMe-FH包含可操作的连接于特异腐质霉CEL45A核心/米曲霉β-葡糖苷酶的基因融合物的里氏木霉纤维二糖水解酶I(CEL7A)基因启动子与终止子。除移除了amdS选择性标记并取代以潮霉素抗性选择性标记之外,质粒pSaMe-FH与pSaMe-FX相同。
实施例28:分离具有增加的纤维素产生与增强的经预处理的玉米秸秆(PCS)降解能力的里氏木霉SMA135-04的突变体
将PCS(实施例26)用作纤维素底物用于纤维素分解酶测定法与选择平板。在测定之前,用大体积的去离子蒸馏水洗涤PCS直至滤液的pH大于pH4.0。另外,用100MF金属过滤器筛滤PCS以移除颗粒。将经洗涤与过滤的PCS重悬于蒸馏水中至浓度为60mg/ml悬浮液,并储藏于4℃
对里氏木霉菌株SMA135-04(实施例12)用N-甲基-N-硝基-N-亚硝基胍(NTG)(Sigma Chemical Co.,St.Louis,MO,USA)进行诱变处理,NTG为主要诱导碱基取代和一些缺失的化学诱变剂(Rowlands,1984,Enzyme Microb.Technol.6:3-10)。存活曲线用恒定时间的接触和多种剂量的NTG,与恒定浓度的NTG和不同时间的接触制作,以获取10%的存活水平。为了获取此存活率,用0.2mg/ml的NTG对分生孢子悬浮液在37℃下随着轻柔的旋转处理20分钟。每个实验均与所述分生孢子未经NTG处理的对照一同进行。
突变体的初步选择在NTG处理后进行。将总共8x106个经诱变后仍存活的分生孢子混合在30ml Mandel’s培养基中,所述培养基包含0.5%蛋白胨,0.1%X-100与1.5g琼脂。随即将该悬浮液添加于深板(deep plate)(150mm直径,25mm深,Corning Inc.,NY,USA),并允许所述琼脂在室温下硬化。在使该琼脂硬化之后,添加200ml的Mandels培养基,其包含0.5%蛋白胨,0.1%X-100,1.5%琼脂糖,和1.0%PCS。在琼脂硬化后将所述平板在28℃下温育。在3-5日的温育后,使用700个在未经处理的菌株之前穿越PCS选择膜的克隆以供二次选择。
对于二次选择,将来自每个分离物的三接种环的分生孢子(three loopfulof conidia)添加至含有25ml纤维素酶诱导培养基的125ml摇瓶中,并在28℃与200rpm下培育5日以诱导纤维素酶的表达与分泌。1ml的每种培养液在微离心机中在400xg下离心5分钟,并分析上清的PCS水解活性以及总蛋白质收率。
“机器人化”的PCS水解测定法通过以1∶20将摇瓶培养液样品稀释于50mM乙酸钠pH 5.0中进行。将稀释样品以稀释前每g PCS 400μl样品添加至分析板(96-孔平底板)。使用FX(Beckman Coulter,Fullerton,CA,USA),以每升10g PCS添加PCS,继以添加50mM乙酸钠pH 5.0使总体积为180μl。所述分析板在30℃下在增湿盒(humidified box)中培育5天,将所述盒以250rpm振荡。为了增加该测定法的统计学精确性,对每个样品进行6次重复。然而,对1∶20样品稀释进行2次重复。在培育5天后,使用PHBAH测定法测定在水解的PCS样品中还原糖(RS)的浓度,该测定法经修改并适应于96-孔微量滴定板形式。使用ORCATM机器人(Beckman Coulter,Fullerton,CA,USA),将所述培养板运送到FX,并自所述分析板移出9μl的培养液样品,并将其等分于96-孔V底板中(MJ Research,Waltham,MA,USA)。反应通过添加135μl的0.533%PHBAH的2%氢氧化钠溶液来起始。每个分析板在Thermal Cycler(热循环仪)(MJ Research,Waltham,MA,USA)上在95℃加热10分钟,再冷却至室温。在培育后,将40μl反应样品稀释于160μl去离子水中,并转移至96-孔平底板。随即,使用250(Molecular Devices,Sunnyvale,CA,USA)测定所述样品在405nm处的吸光度。使用自经与样品相似处理的六个葡萄糖标准品(每ml的去离子水0.000,0.040,0.800,0.120,0.165与0.200mg)产生的标准曲线将A405值转化为相应的葡萄糖量。所述标准曲线的平均相关系数大于0.98。纤维素转化为还原糖的程度(RS产率)使用描述于实施例26中的方程计算。
总蛋白产量使用二辛可宁酸(bicinchoninic acid,BCA)分析法确定。将样品以1∶8稀释于水中以使浓度位于合适范围内。将白蛋白标准品(BSA)在水中稀释至自2.0mg/ml浓度至0.25mg/ml浓度的多种水平。使用FX将总共20μl的每个稀释液(包括标准品)转移至96-孔平底板中。将两百微升的BCA底物溶液(BCA Protein Assay Kit(BCA蛋白测定试剂盒),Pierce,Rockford,IL,USA)添加到每个孔中,并随即在37℃下培育45分钟。在培育完成时,使用250测定所述96孔板在562nm处的吸光度。样品浓度通过自Microsoft Excel(Microsoft Corporation,Redmond,WA,USA)产生的标准曲线外推确定。
在挑取的初步分离物中,二十个产生了较之来自菌株SMA134-04的培养液显示改善的PCS水解活性的培养液。这些分离物产生了纤维素分解培养液,其能够产生相对于亲本菌株高5-15%的还原糖水平。一些分离物,例如,SMai-M104显示了每单位体积的培养液水解PCS纤维素的性力增加,此外分泌更高水平的总蛋白。
选取性能最佳的里氏木霉突变体菌株SMai-M104,是通过评估发酵产生的培养液的纤维素酶性能来确定的。所述发酵如实施例26中所述进行7天。将发酵样品在有螺旋瓶盖的125-ml Erlenmeyer烧瓶(VWR,West Chester,PA,USA)中在50g PCS水解中进行测试。反应条件如下:纤维素上样量为6.7%,酶上样量为6与12mg/g纤维素;总反应物为50g;50℃与pH 5.0。称量每个摇瓶与瓶盖,并且将所期望量的PCS添加至所述摇瓶,并记录总重量。将10ml蒸馏水添加至每个摇瓶中,并随即将所有摇瓶在121℃下高压灭菌30分钟。在高压灭菌后,允许所述烧瓶冷却至室温。为了将每个烧瓶的总重量调整为50克,添加5ml的0.5M乙酸钠pH 5.0再加培养液以达成所期望的上样量。随即添加合适量的蒸馏水以达到所期望的最终50g的重量。随即将所述烧瓶以50℃与130rpm置于培养箱振荡器中(New Brunswick Scientific,Edison,NJ,USA)。在第3,5与7天,将1ml样品自每个烧瓶移出,并添加至96-深孔板(总体积2.0ml)。所述96孔板随即在3000rpm下使用RT7平板离心机(Thermo Fisher Scientific,Waltham,MA,USA)离心15分钟。在离心后,将200μl上清转移至96孔0.45μm孔径过滤板(Millipore,Bedford,MA,USA),并施加真空以收集滤液。随即将滤液用0.4%NaOH稀释至还原糖为合适范围,并使用PHBAH试剂(1.5%)用下述方法测定:将50μl PHBAH试剂与100μl样品添加至V底的96孔板中,并在95℃下培育10分钟。为了完成该反应,将50μl蒸馏水添加至每个孔中,并在混合样品后,将100μl的混合物转移至另一个平底96孔板以测定在410nm处的吸光度。还原糖的量使用葡萄糖校准曲线计算,且如下计算百分比消化率:
%消化=还原糖(mg/ml)/(添加的纤维素(mg/ml)x1.11),其中因子1.11反映了将纤维素转化为葡萄糖过程中重量的增加。
所述PCS水解分析法结果显示一个命名为SMai-M104的突变体略微(大约增加5%的葡萄糖)胜过亲本SMA135-04,特别是在高上样量的情况下(12mg/g纤维素)。
实施例29:构建里氏木霉菌株SMai26-30
使用共转化以将质粒pCW085(WO 2006/074435),pSaMe-FH与pCW087(实施例23)导入里氏木霉SMai-M104。质粒pCW085为供土生梭孢壳NRRL8126纤维二糖水解酶(CEL6A)的表达载体。通过PEG介导转化将所有三个质粒导入里氏木霉SMai-M104(Penttila等,1987,见上)。每个质粒均含有大肠杆菌潮霉素B磷酸转移酶(hph)基因以使转化体能够在潮霉素B上生长。
将里氏木霉SMai-M104在27℃与90rpm在补充以2%(w/v)葡萄糖与10mM尿苷的25ml YP培养基中培养17小时。菌丝体通过使用Vacuum Driven Disposable Filtration System过滤来收集,并用去离子水与1.2M山梨醇各洗涤两次。原生质体通过将经洗涤的菌丝体悬浮在含15mg/ml与0.36单位/ml的壳多糖酶的20ml 1.2M山梨醇中并在34℃下以90rpm的轻微振荡进行温育来生成。原生质体通过在400xg下离心7分钟来收集并用冷的1.2M山梨醇洗涤两次。所述原生质体用血细胞计数器来计数,并在STC中重悬至终浓度为每ml 1X108个原生质体。多余的原生质体在-80℃下储藏于Cryo 1℃Freezing Container中。
将质粒pCW085,pSaMe-FH与pCW087各大约10μg用Pme I消化,并添加至100μl的原生质体溶液中并轻轻混合,继以添加260μl PEG缓冲液,混匀并在室温下温育30分钟。随即添加STC(3ml)并混合并将转化溶液涂布于含1M蔗糖与10mM尿苷的PDA平板上。该平板在28℃下培养16小时,并随即添加含潮霉素B(终浓度30μg/ml)的琼脂糖覆盖层,并继续温育4-6日。将八十个转化体在PDA板上传代培养,并使其于28℃下生长。
将里氏木霉转化体在含25ml纤维素酶诱导培养基的125ml带挡板摇瓶中在pH6.0培养,其中所述培养基用所述转化体的孢子进行接种,并在28℃与200rpm条件下温育5日。里氏木霉SMai-M140作为对照运行。培养液样品在第5日移出。将每种培养液中的1ml在微离心机中以15700xg离心5分钟并将上清转移至新试管。
SDS-PAGE使用Tris-HCl(5%分离型)凝胶用系统进行。将第5日上清(见上)中的5μl悬浮于2X浓缩的Laemmli样品缓冲液中,并在5%β-巯基乙醇的存在下煮沸3分钟。将上清样品上样于聚丙烯酰胺凝胶并以1X Tris/甘氨酸/SDS作为运行缓冲液对其进行电泳。所得凝胶用BIO-Coomassie Blue Stain进行染色。如见于SDS-PAGE凝胶条带的显影,显示表达橙色嗜热子囊菌GH61A多肽和由特异腐质霉内切葡聚糖酶V核心(CEL45A)与米曲霉β-葡糖苷酶及土生梭孢壳纤维二糖水解酶II融合组成的融合蛋白的转化体随即在如实施例26中描述的PCS水解反应中进行测试以鉴定产生最佳水解培养液的菌株。将一个产生最佳性能培养液的转化体命名为里氏木霉SMai26-30。
由里氏木霉菌株SMai26-30培养液进行的PCS水解如实施例26所描述进行,但包括下述修饰。PCS的批次与用于实施例26中的不同,但是在相似条件下制备。在该实验方案中,PCS的水解(在PCS中,大约11.3%,以及在50mM柠檬酸钠pH5.0缓冲水溶液中6.7%纤维素)使用不同蛋白质上样量(表示为每克纤维素的蛋白质mg数)的所述里氏木霉菌株SMai26-30发酵培养液来进行。在水解过程中,在48,120与168小时处取得等分试样。在上述50g烧瓶分析中PCS水解反应的结果如表2所示。
表2:在48,120与168小时处转化为糖的百分比转化率
将里氏木霉SMai26-30进行孢子划线接种通过在板上两轮的生长对以保证其为克隆菌株,并将多个小瓶在将生产扩大至生产规模的发酵罐前进行冻结。所得蛋白质培养液自真菌细胞群回收,对其进行过滤,浓缩与配制。所得纤维素分解酶制备物命名为纤维素分解酶组合物#2。
实施例30:不同盐对PCS水解的作用
在美国能源部国家可再生能源实验室(U.S.Department of Energy National Renewable Energy Laboratory(NREL),Boulder,CO,USA)用稀硫酸预处理玉米秸秆。用以下条件进行预处理:1.4wt%硫酸,195℃下4.5分钟。根据用过量纤维素酶的极限消化,预处理的玉米秸秆(PCS)中的水不溶固体包含59.5%纤维素。使用之前,用大体积的去离子水洗涤PCS直至可溶的酸与糖被移除。水洗后PCS的干重为19.16%。
不同盐(FeSO4,FeCl2,NaCl,Na2SO4,MnSO4,MnCl2)的作用在纤维素分解酶组合物#2导致的PCS水解中确定。PCS水解以一式两份在50mM乙酸钠pH5中含1ml 43.4g/l PCS(干重量)、10mM盐的加盖管(“小规模”(“mini-scale”))中进行。纤维素分解酶组合物#2以0.25g每升添加。未添加所述盐的反应充当对照。将加盖试管在50℃下在4080培养箱振荡器(New Brunswick Scientific Co.,Inc.,Edison,NJ,USA)中以150rpm进行培育。
经时取样的悬浮液的等分试样通过使用0.45μmHV膜(Millipore,Billerica,MA,USA)在2000rpm下用RT7离心机(Thermo Fisher Scientific,Waltham,MA,USA)离心15分钟进行过滤。当不即刻使用时,将经过滤的糖等分试样于-20℃冷冻。稀释于0.005M H2SO4中的样品的糖浓度在自4.6x250mmHPX-87H柱(Bio-Rad,Hercules,CA,USA)通过0.005M H2SO4以0.4ml/分钟的流速在65℃下洗脱后,用通过整合使用折光率检测的葡萄糖与纤维二糖(1100HPLC,Agilent Technologies,Santa Clara,CA,USA)来量化测定,所述折光率经葡萄糖与纤维二糖的标准品校准。所得当量用以计算每个反应的百分比纤维素转化。
纤维素转化为葡萄糖加纤维二糖(%转化)的程度使用下述方程计算:
%转化=(葡萄糖+纤维二糖x1.053)(mg/ml)x100x162/纤维素(mg/ml)x180)=(葡萄糖+纤维二糖x1.053)(mg/ml)x100/(纤维素(mg/ml)x1.111)
在此方程中因子1.111反映了将纤维素转化为葡萄糖过程中的重量增加,而因子1.053反映了将纤维二糖转化为葡萄糖过程中的重量增加。PCS中的纤维素通过对PCS进行极限消化以释放葡萄糖与纤维二糖来确定。
图16所示的结果说明仅FeSO4与FeCl2造成对水解的显著抑制。因为其它测试的硫酸盐与氯化物是无害的(benign),该抑制作用归结于Fe(II)。
实施例31:亚铁离子对PCS水解的作用
用纤维素分解酶组合物#1与纤维素分解酶组合物#2两者重复实施例30。可溶性还原糖通过HPLC如实施例30所述测定。将未添加FeSO4的反应充当对照。
示于图17A与17B的结果说明FeSO4显著抑制纤维素分解酶组合物#1与纤维素分解酶组合物#2两者对PCS的水解。
实施例32:金属阳离子对酶分解纤维素的差异抑制
将具有不同离子半径的不同(生物学上常见的)二价金属阳离子在含1ml50mM乙酸钠pH5中25g/l的悬浮液的2.8ml深孔微量滴定板(VWRInternational,West Chester,PA,USA)(“微板规模”)中在50℃下进行测试。对每个水解过程,以每升0.25g添加纤维素分解酶组合物#1。将所述微板用ALPS 300TM密封机(ABgene,Rochester,NY,USA)在160℃下封闭2秒。将经封闭的微板在4080培养箱振荡器中以150rpm于50℃下培育。可溶性还原糖通过HPLC如实施例30所描述进行测定。对水解,在10mM下,MgCl2与CaCl2略显增强作用,而CoSO4,MnSO4,NiCl2与ZnSO4显示略微或中等的抑制作用(表3)。与之相对,FeSO4,FeCl2与CuSO4导致丧失大约70%或更多的起始水解速率以及4日后的水解程度(表3)。MnSO4亦于0.1到10mM的范围内受测试,且未观察到其对水解的作用,虽然在相同范围内的FeSO4导致了浓度依赖性的抑制。
表3受测试金属阳离子的特性与作用
1这些金属阳离子化合物的反荷离子,SO4 2-与Cl-在水解条件下是惰性的。2晶体中的离子半径,对于6配体的配位作用(Lide,1993,CRC Handbook of Chemistry and Physics,73rd ed.,CRC Press,Boca Raton,FL)。3针对NHE的单电子氧化还原电势。所列出的金属阳离子作为氧化剂(Fe(II)除外,其被氧化为Fe(III))使用。对于Mn(II)与Co(II),无法获知其单电子Eo,因其还原直接得到Mn(O)与Co(O),是故仅给出其双电子Eo(示于括号中)。对于Ni(II)与Zn(II)的Eo:M.V.SMIRNOV and A.M.Potapov,Ekctmchimica Acta 39:143-149(1994);M.Domae等,Radiation Physics and Chemistry 56:315-322(1999)。4纤维素分解酶组合物#1对的“微板规模”的水解。
由于其对O2氧化的易感性,起初加入水解的Fe(II)不断转化为Fe(III),如所述水解悬浮液的棕色外观所示。为研究Fe(III),将FeCl3添加至一系列纤维素分解酶组合物#1对的“微板规模”水解反应(如上所述)。在10mM,FeCl3造成了初始水解速率与4日后水解程度两者约90%的丧失(表3)。
除Fe(III)外,亦如上所述在用的“微板规模”水解反应中测试了两种其它的三价氧化性金属阳离子Cr(III)与Ru(III)。在10mM,CrCl3与RuCl3分别对纤维素分解酶组合物#1施加中等和显著的抑制作用。
在如上所述,只不过使用在每升50mM乙酸钠pH5中2g的PASC与0.01g纤维素分解酶组合物#1进行的另一系列的“微板规模”水解反应中,10mM FeCl3导致起始水解速率与4日后水解程度两者大约80%的丧失,较之FeCl2导致的大约30%的丧失。因此,Fe(III)较之Fe(II)施加更大的抑制作用。
实施例33:铁-螯合剂络合物对纤维素酶水解的差异抑制
对不同大小或氧化还原特性的铁-螯合剂络合物测试了其抑制纤维素酶水解的能力。在使用如实施例32中所描述相同的过程的一系列“微板规模”水解反应中,评估了10mM Fe(2,2’-联吡啶基)3Cl3,FeCl3,FeCl2,Fe(2,2’-联吡啶基)3Cl2,FeNa(EDTA),K4Fe(CN)6,K3Fe(CN)6或柠檬酸铁在纤维素分解酶组合物#1对的水解中的抑制作用。结果显示所述铁络合物施加了完全,中等,略微的抑制作用或无抑制作用(表4)。具有更高氧化还原电势(Eo)的铁络合物较之具有低Eo的铁络合物导致了对水解的更大抑制(图18)。
表4.铁-螯合剂络合物的氧化电势与抑制作用
1单电子氧化电势(Lide,1993,CRC Handbook of Chemistry and Physics,73rd ed.,CRC Press,Boca Raton,FL)。2Florence,1984,J.Inorg.Biochem.22:221-230,Dhungana等,2003,Proc.Natl.Acad.Sci.USA.100:3659-3664。未标明Eo的铁-螯合剂络合物为其相应的氧化络合物(给出Eo)对应的还原形式(reduced counterpart)。3纤维素分解酶组合物#1对的“微板规模”水解
实施例34:亚铁离子抑制作用的浓度依赖性
在根据描述于实施例30的过程进行的一个系列的“小规模”水解反应中,在纤维素分解酶组合物#1对的水解中评估1mM到10mM FeSO4的作用。在根据描述于实施例32的过程进行的一个系列的“微板规模”水解反应中,在纤维素分解酶组合物#1对PASC的水解中评估1mM到10mMFeSO4的作用,但是使用每升50mM乙酸钠pH5中2g的PASC与0.05g纤维素分解酶组合物#1。
示于图19A与19C的结果说明亚铁离子在自1mM到10mM FeSO4的浓度范围上具有增加的抑制作用。Dixon曲线(起始速率的倒数相对于抑制剂浓度)指明FeSO4的Ki(x-轴截距)对大约为1.3mM(图19B),而对PASC为大约14mM(图19D)。
亚铁离子的有效抑制浓度范围亦根据实施例30所描述的过程针对由纤维素分解酶组合物#2进行的PCS水解来确定。在0.1与1mM,FeSO4并不显著影响纤维素酶,这与用10mM Fe(II)观察到的大约70%的活性丧失相反(图17B)。
将上述研究扩展至某个范围的Fe(II)与纤维素浓度。在一系列的根据实施例32所描述的过程,但是使用每升50mM乙酸钠pH5的0.1到10mM的FeSO4,0.6到4g的PASC以及0.01g的纤维素分解酶组合物#1而进行的“微板规模”水解反应中,观察到的“双倒数曲线”(1/(起始速率)相对于1/[PASC]作为[FeSO4]的函数)指明混合类型的抑制作用,其复杂性使得不可能从中得出Ki。
在另一系列的根据实施例32所描述的过程,但是使用每升50mM乙酸钠pH5中0.5到4mM的FeSO4和0.6到4g的进行的“微板规模”水解反应中,所得的“双倒数曲线”指明混合类型的抑制作用,其复杂性使得不可能从中得出Ki。表5显示了自起始速率相对于FeSO4浓度的曲线得到的I50(导致丧失50%水解速率的抑制剂浓度)。
表5.Fe(II)对酶促纤维素分解的抑制参数I50(均值±SD,以mM表示)
酶:纤维素分解酶组合物#1。ND:未确定。1对纤维二糖水解。
亦在一系列的根据实施例32所描述的过程使用0.2到2mM抑制剂进行的“微板规模”水解反应中研究了其它所选金属阳离子与络合物抑制作用的浓度依赖性。如表6所示,氧化性Fe(III),Ru(III)与Cu(II)物种具有远较Fe(II)为低的I50。对FeNaEDTA,醌,FeNa2EDTA与CrCl3,分别根据有限的数据预计出大约10,大约5,<10与>10mM的I50。
实施例35:亚铁离子对个别纤维素分解酶的抑制作用
Fe(II)对里氏木霉Cel7A纤维二糖水解酶I,里氏木霉Cel7B内切葡聚糖酶I以及里氏木霉Cel5A内切葡聚糖酶II的抑制作用通过一系列的根据实施例32所描述的过程而进行的“微板规模”水解来测定,但是使用每升50mM乙酸钠pH5中0,3,7,10,或15mM的FeSO4与0.6,1,2或4g的PASC以及40mg的酶以及长达4小时的反应时间。Fe(II)对米曲霉CEL3A β-葡糖苷酶的抑制作用相似地测定,但是用纤维二糖替代PASC。起始速率相对于Fe(II)浓度的曲线表现为“混合”类型,其复杂性使得无法从中得到Ki。上面的表5显示了所得的I50。
使用PASC作为底物确定了亚铁离子对里氏木霉Cel7A纤维二糖水解酶I,里氏木霉Cel6A纤维二糖水解酶II,里氏木霉Cel7B内切葡聚糖酶I与里氏木霉Cel5A内切葡聚糖酶II的抑制作用。
根据实施例30所描述的过程进行了一系列的重复的“小规模”水解反应,但是使用每升50mM乙酸钠pH5中10mM FeSO4与2g的PASC(干重),以及40mg的酶。
示于图20A,20B,20C以及20D的结果说明FeSO4显著抑制了里氏木霉的酶。仅有FeSO4时未观察到PASC的水解。
FeSO4对米曲霉Cel3A β-葡糖苷酶的作用亦通过一系列的根据实施例30所描述的过程进行的“小规模”水解反应来评估,但是在存在或不存在10mMFeSO4的情况下使用每升50mM乙酸钠pH5中2g的纤维二糖与1mg的米曲霉Cel3A β-葡糖苷酶。
示于图21的结果说明FeSO4略微抑制米曲霉Cel3A β-葡糖苷酶。
实施例36:过氧化氢与铁离子螯合剂对亚铁离子抑制的减少
对铁离子螯合剂去铁草酰胺与过氧化氢就其减少亚铁离子对由纤维素分解酶组合物#2进行的PCS水解的抑制作用的能力进行评估。
水解在根据实施例32所描述的步骤的一系列重复实验的“微板规模”水解反应中进行,但在存在或不存在2.5mM FeSO4的情况下使用每升50mM乙酸钠pH 5中43g的PCS与0.25g的纤维素分解酶组合物#2。然而,在添加纤维素分解酶组合物#2之前,用10mM H2O2处理PCS与FeSO4的混合物30分钟。在一些情况下,亦添加10mM去铁草酰胺。未添加FeSO4或H2O2的反应充当对照。
示于图22A与22B的结果说明用H2O2预处理FeSO4减少了亚铁离子对纤维素分解酶组合物#2的抑制作用。去铁草酰胺,一种Fe3+强螯合剂的存在减弱了几乎所有的Fe(II)抑制作用。
在Fe(II)不存在的情况下,有或没有去铁草酰胺,H2O2仅在测试的水平轻微的影响水解(图22B)。在1与10mM,柠檬酸铁(Fe3+)并不影响由纤维素分解酶组合物#2进行的PCS水解。在10mM,单独的去铁草酰胺(一种铁载体)轻微增强(大约2%的水解程度增加)由纤维素分解酶组合物#2进行的PCS水解。
实施例37:亚铁离子螯合剂对亚铁离子导致的纤维素酶抑制的作用
对两种亚铁离子螯合剂,1,10-菲咯啉与2,2’-联吡啶就其对FeSO4对由纤维素分解酶组合物#2进行的PCS水解的抑制作用的作用进行了评估。
水解在一系列根据实施例30所描述的步骤的重复“小规模”水解反应中进行。
示于图23A,23B,23C与23D的结果说明所述螯合剂,即1,10-菲咯啉与2,2’-联吡啶,在FeSO4不存在的情况下显示了对纤维素分解酶组合物#1显著的抑制作用。发现1,7-菲咯啉,其同1,10-菲咯啉具有相同的组成与平面结构,但缺乏亚铁离子螯合性质,基本上在抑制纤维素分解酶组合物#1方面是无害的(图24B与24D)。然而,在1,10-与1,7-菲咯啉两者均存在的情况下,水解产物中的纤维二糖水平约为所述化合物不存在时的两倍。这种1,10-菲咯啉与2,2’-联吡啶的抑制作用使其用于减少Fe(II)对纤维素酶的抑制作用变得复杂。
在另一个实验中,对2,2’-联吡啶就其对实施例30所描述的“小规模”水解的作用进行了评估,但在3mM 2,2’-联吡啶存在或不存在的情况下使用了每升50mM乙酸钠pH5中23g的与0.25g的纤维素分解酶组合物#1。未观察到2,2’-联吡啶显著的抑制作用。
实施例38:对纤维素酶与纤维素的铁离子抑制作用的差异靶向
为测试Fe(II)是否影响纤维素或纤维素酶,将10mM FeCl2与每升50mM乙酸钠pH 5中25g的或0.25g的纤维素分解酶组合物#1预培育三日。洗涤“经Fe预处理的”并用BioSpin 6脱盐柱(Bio-Rad,Hercules,CA,USA)凝胶过滤纤维素分解酶组合物#1以移除残余的铁离子。用新鲜的纤维素分解酶组合物#1或经“无FeCl2”预培育与凝胶过滤的纤维素分解酶组合物#1水解经Fe预处理的施用经Fe预处理的纤维素分解酶组合物#1以水解新鲜或经“无FeCl2”预培育与洗涤的与在有或没有10mM FeCl2的情况下用新鲜的纤维素分解酶组合物#1(0.16g/L)水解新鲜的(2g/L)相比较。所有的水解使用描述于实施例32中的“微板规模”水解反应步骤进行,但如上所述改变纤维素或纤维素酶。用或纤维素分解酶组合物#1预处理FeCl2分别导致水解初始速率与程度大约10或20%的损失。新鲜FeCl2导致新鲜纤维素分解酶组合物#1对新鲜的水解的初始速率与程度二者大约50%的损失。用缓冲液预培育纤维素分解酶组合物#1或对水解未产生作用。用FeSO4替换FeCl2导致相似的结果。
为测试Fe(III)是否影响纤维素或纤维素酶,将10mM FeCl3用每升50mM乙酸钠pH5中25g的或0.25g的纤维素分解酶组合物#1预培育三日。所有的水解使用根据描述于实施例32中的步骤的“微板规模”水解反应进行,但如上所述改变纤维素或纤维素酶。与或纤维素分解酶组合物#1一起预培育FeCl3分别导致水解初始速率与程度大约80或20%的损失。新鲜FeCl3导致由新鲜纤维素分解酶组合物#1对新鲜的水解在水解初始速率和程度二者上大约90%的损失。
亦对PASC的水解进行了所述“预培育”研究。所述实验类似于上述的那些,但是2g PASC替代并且使用每升50mM乙酸钠pH50.01g的纤维素分解酶组合物#1,以及三日的预培育。所有的水解使用所述“微板规模”水解反应根据描述于实施例32的步骤进行,但如上所述改变纤维素或纤维素酶。与PASC一起预培育FeCl2导致水解初始速率大约60%的损失,而未导致水解程度损失。与纤维素分解酶组合物#1一起预培育FeCl2导致水解初始速率大约70%的损失,而未导致水解程度损失。新鲜FeCl2导致了纤维素分解酶组合物#1(新鲜的或经缓冲液预培育的)对PASC的水解的初始速率大约30%的损失,而未导致水解程度损失。用FeSO4替换FeCl2导致了类似的结果。与PASC一起预培育FeCl3分别导致水解初始速率与程度大约50%与10%损失。与纤维素分解酶组合物#1一起预培育FeCl3导致水解初始速率大约50%的损失,而未导致水解程度损失。新鲜FeCl3分别导致纤维素分解酶组合物#1(新鲜的或经缓冲液预培育的)对PASC的水解的初始速率与程度大约70%与30%损失。
为测试是否在PCS中有任何显著量的(易接近的)Fe(II)存在,以及是否用螯合剂将其剥除(stripping)会改善PCS水解,将经洗涤的PCS(43g每升)用10mM的2,2’-联吡啶,1,10-菲咯啉或1,7-菲咯啉“剥除”。在预培育过夜后,将所述PCS全面洗涤以移除所述螯合剂。水解在一系列重复“小规模”水解反应中根据描述于实施例30进行的步骤进行。所得结果显示用2,2’-联吡啶剥除PCS导致增强的水解(水解程度大约4%的增加),其可归结于螯合剂在经洗涤的NREL PCS中螯合Fe(II)的作用。
本文中所描述并要求保护的发明的范围不应受到本文中公开的具体方面的限制,因为公开这些方面是为了举例说明本发明的一些方面。任何等同的方面都应落入本发明的范围。事实上,除了本文中显示和描述的那些之外,本领域技术人员根据前面的说明书可以容易地想到本发明的各种修改。这些修改也应落入本发明的范围。在冲突的情况下,应以包括定义在内的本公开内容为准。
本文引用了多种参考文献,它们以其整体纳入本文参考。
序列表
<110>诺维信股份有限公司(Novozymes,Inc.)
Xu,Feng
<120>减少氧化还原活性金属离子对纤维素材料酶水解抑制作用的方法
<130>11260.204-WO
<150>60/984,660
<151>2007-11-01
<160>112
<170>PatentIn version 3.5
<210>1
<211>923
<212>DNA
<213>特异腐质霉(Humicola insolens)
<400>1
atgcgttcct cccccctcct ccgctccgcc gttgtggccg ccctgccggt gttggccctt 60
gccgctgatg gcaggtccac ccgctactgg gactgctgca agccttcgtg cggctgggcc 120
aagaaggctc ccgtgaacca gcctgtcttt tcctgcaacg ccaacttcca gcgtatcacg 180
gacttcgacg ccaagtccgg ctgcgagccg ggcggtgtcg cctactcgtg cgccgaccag 240
accccatggg ctgtgaacga cgacttcgcg ctcggttttg ctgccacctc tattgccggc 300
agcaatgagg cgggctggtg ctgcgcctgc tacgagctca ccttcacatc cggtcctgtt 360
gctggcaaga agatggtcgt ccagtccacc agcactggcg gtgatcttgg cagcaaccac 420
ttcgatctca acatccccgg cggcggcgtc ggcatcttcg acggatgcac tccccagttc 480
ggcggtctgc ccggccagcg ctacggcggc atctcgtccc gcaacgagtg cgatcggttc 540
cccgacgccc tcaagcccgg ctgctactgg cgcttcgact ggttcaagaa cgccgacaat 600
ccgagcttca gcttccgtca ggtccagtgc ccagccgagc tcgtcgctcg caccggatgc 660
cgccgcaacg acgacggcaa cttccctgcc gtccagatcc cctccagcag caccagctct 720
ccggtcaacc agcctaccag caccagcacc acgtccacct ccaccacctc gagcccgcca 780
gtccagccta cgactcccag cggctgcact gctgagaggt gggctcagtg cggcggcaat 840
ggctggagcg gctgcaccac ctgcgtcgct ggcagcactt gcacgaagat taatgactgg 900
taccatcagt gcctgtagaa ttc 923
<210>2
<211>305
<212>PRT
<213>特异腐质霉
<400>2
Met Arg Ser Ser Pro Leu Leu Arg Ser Ala Val Val Ala Ala Leu Pro
1 5 10 15
Val Leu Ala Leu Ala Ala Asp Gly Arg Ser Thr Arg Tyr Trp Asp Cys
20 25 30
Cys Lys Pro Ser Cys Gly Trp Ala Lys Lys Ala Pro Val Asn Gln Pro
35 40 45
Val Phe Ser Cys Asn Ala Asn Phe Gln Arg Ile Thr Asp Phe Asp Ala
50 55 60
Lys Ser Gly Cys Glu Pro Gly Gly Val Ala Tyr Ser Cys Ala Asp Gln
65 70 75 80
Thr Pro Trp Ala Val Asn Asp Asp Phe Ala Leu Gly Phe Ala Ala Thr
85 90 95
Ser Ile Ala Gly Ser Asn Glu Ala Gly Trp Cys Cys Ala Cys Tyr Glu
100 105 110
Leu Thr Phe Thr Ser Gly Pro Val Ala Gly Lys Lys Met Val Val Gln
115 120 125
Ser Thr Ser Thr Gly Gly Asp Leu Gly Ser Asn His Phe Asp Leu Asn
130 135 140
Ile Pro Gly Gly Gly Val Gly Ile Phe Asp Gly Cys Thr Pro Gln Phe
145 150 155 160
Gly Gly Leu Pro Gly Gln Arg Tyr Gly Gly Ile Ser Ser Arg Asn Glu
165 170 175
Cys Asp Arg Phe Pro Asp Ala Leu Lys Pro Gly Cys Tyr Trp Arg Phe
180 185 190
Asp Trp Phe Lys Asn Ala Asp Asn Pro Ser Phe Ser Phe Arg Gln Val
195 200 205
Gln Cys Pro Ala Glu Leu Val Ala Arg Thr Gly Cys Arg Arg Asn Asp
210 215 220
Asp Gly Asn Phe Pro Ala Val Gln Ile Pro Ser Ser Ser Thr Ser Ser
225 230 235 240
Pro Val Asn Gln Pro Thr Ser Thr Ser Thr Thr Ser Thr Ser Thr Thr
245 250 255
Ser Ser Pro Pro Val Gln Pro Thr Thr Pro Ser Gly Cys Thr Ala Glu
260 265 270
Arg Trp Ala Gln Cys Gly Gly Asn Gly Trp Ser Gly Cys Thr Thr Cys
275 280 285
Val Ala Gly Ser Thr Cys Thr Lys Ile Asn Asp Trp Tyr His Gln Cys
290 295 300
Leu
305
<210>3
<211>1188
<212>DNA
<213>嗜热毁丝霉(Myceliophthora thermophila)
<400>3
cgacttgaaa cgccccaaat gaagtcctcc atcctcgcca gcgtcttcgc cacgggcgcc 60
gtggctcaaa gtggtccgtg gcagcaatgt ggtggcatcg gatggcaagg atcgaccgac 120
tgtgtgtcgg gctaccactg cgtctaccag aacgattggt acagccagtg cgtgcctggc 180
gcggcgtcga caacgctgca gacatcgacc acgtccaggc ccaccgccac cagcaccgcc 240
cctccgtcgt ccaccacctc gcctagcaag ggcaagctga agtggctcgg cagcaacgag 300
tcgggcgccg agttcgggga gggcaattac cccggcctct ggggcaagca cttcatcttc 360
ccgtcgactt cggcgattca gacgctcatc aatgatggat acaacatctt ccggatcgac 420
ttctcgatgg agcgtctggt gcccaaccag ttgacgtcgt ccttcgacca gggttacctc 480
cgcaacctga ccgaggtggt caacttcgtg acgaacgcgg gcaagtacgc cgtcctggac 540
ccgcacaact acggccggta ctacggcaac atcatcacgg acacgaacgc gttccggacc 600
ttctggacca acctggccaa gcagttcgcc tccaactcgc tcgtcatctt cgacaccaac 660
aacgagtaca acacgatgga ccagaccctg gtgctcaacc tcaaccaggc cgccatcgac 720
ggcatccggg ccgccggcgc gacctcgcag tacatcttcg tcgagggcaa cgcgtggagc 780
ggggcctgga gctggaacac gaccaacacc aacatggccg ccctgacgga cccgcagaac 840
aagatcgtgt acgagatgca ccagtacctc gactcggaca gctcgggcac ccacgccgag 900
tgcgtcagca gcaccatcgg cgcccagcgc gtcgtcggag ccacccagtg gctccgcgcc 960
aacggcaagc tcggcgtcct cggcgagttc gccggcggcg ccaacgccgt ctgccagcag 1020
gccgtcaccg gcctcctcga ccacctccag gacaacagcg acgtctggct gggtgccctc 1080
tggtgggccg ccggtccctg gtggggcgac tacatgtact cgttcgagcc tccttcgggc 1140
accggctatg tcaactacaa ctcgatcttg aagaagtact tgccgtaa 1188
<210>4
<211>389
<212>PRT
<213>嗜热毁丝霉
<400>4
Met Lys Ser Ser Ile Leu Ala Ser Val Phe Ala Thr Gly Ala Val Ala
1 5 10 15
Gln Ser Gly Pro Trp Gln Gln Cys Gly Gly Ile Gly Trp Gln Gly Ser
20 25 30
Thr Asp Cys Val Ser Gly Tyr His Cys Val Tyr Gln Asn Asp Trp Tyr
35 40 45
Ser Gln Cys Val Pro Gly Ala Ala Ser Thr Thr Leu Gln Thr Ser Thr
50 55 60
Thr Ser Arg Pro Thr Ala Thr Ser Thr Ala Pro Pro Ser Ser Thr Thr
65 70 75 80
Ser Pro Ser Lys Gly Lys Leu Lys Trp Leu Gly Ser Asn Glu Ser Gly
85 90 95
Ala Glu Phe Gly Glu Gly Asn Tyr Pro Gly Leu Trp Gly Lys His Phe
100 105 110
Ile Phe Pro Ser Thr Ser Ala Ile Gln Thr Leu Ile Asn Asp Gly Tyr
115 120 125
Asn Ile Phe Arg Ile Asp Phe Ser Met Glu Arg Leu Val Pro Asn Gln
130 135 140
Leu Thr Ser Ser Phe Asp Gln Gly Tyr Leu Arg Asn Leu Thr Glu Val
145 150 155 160
Val Asn Phe Val Thr Asn Ala Gly Lys Tyr Ala Val Leu Asp Pro His
165 170 175
Asn Tyr Gly Arg Tyr Tyr Gly Asn Ile Ile Thr Asp Thr Asn Ala Phe
180 185 190
Arg Thr Phe Trp Thr Asn Leu Ala Lys Gln Phe Ala Ser Asn Ser Leu
195 200 205
Val Ile Phe Asp Thr Asn Asn Glu Tyr Asn Thr Met Asp Gln Thr Leu
210 215 220
Val Leu Asn Leu Asn Gln Ala Ala Ile Asp Gly Ile Arg Ala Ala Gly
225 230 235 240
Ala Thr Ser Gln Tyr Ile Phe Val Glu Gly Asn Ala Trp Ser Gly Ala
245 250 255
Trp Ser Trp Asn Thr Thr Asn Thr Asn Met Ala Ala Leu Thr Asp Pro
260 265 270
Gln Asn Lys Ile Val Tyr Glu Met His Gln Tyr Leu Asp Ser Asp Ser
275 280 285
Ser Gly Thr His Ala Glu Cys Val Ser Ser Thr Ile Gly Ala Gln Arg
290 295 300
Val Val Gly Ala Thr Gln Trp Leu Arg Ala Asn Gly Lys Leu Gly Val
305 310 315 320
Leu Gly Glu Phe Ala Gly Gly Ala Asn Ala Val Cys Gln Gln Ala Val
325 330 335
Thr Gly Leu Leu Asp His Leu Gln Asp Asn Ser Asp Val Trp Leu Gly
340 345 350
Ala Leu Trp Trp Ala Ala Gly Pro Trp Trp Gly Asp Tyr Met Tyr Ser
355 360 365
Phe Glu Pro Pro Ser Gly Thr Gly Tyr Val Asn Tyr Asn Ser Ile Leu
370 375 380
Lys Lys Tyr Leu Pro
385
<210>5
<211>1232
<212>DNA
<213>担子菌纲CBS 495.95(Basidiomycete CBS 495.95)
<400>5
ggatccactt agtaacggcc gccagtgtgc tggaaagcat gaagtctctc ttcctgtcac 60
ttgtagcgac cgtcgcgctc agctcgccag tattctctgt cgcagtctgg gggcaatgcg 120
gcggcattgg cttcagcgga agcaccgtct gtgatgcagg cgccggctgt gtgaagctca 180
acgactatta ctctcaatgc caacccggcg ctcccactgc tacatccgcg gcgccaagta 240
gcaacgcacc gtccggcact tcgacggcct cggccccctc ctccagcctt tgctctggca 300
gccgcacgcc gttccagttc ttcggtgtca acgaatccgg cgcggagttc ggcaacctga 360
acatccccgg tgttctgggc accgactaca cctggccgtc gccatccagc attgacttct 420
tcatgggcaa gggaatgaat accttccgta ttccgttcct catggagcgt cttgtccccc 480
ctgccactgg catcacagga cctctcgacc agacgtactt gggcggcctg cagacgattg 540
tcaactacat caccggcaaa ggcggctttg ctctcattga cccgcacaac tttatgatct 600
acaatggcca gacgatctcc agtaccagcg acttccagaa gttctggcag aacctcgcag 660
gagtgtttaa atcgaacagt cacgtcatct tcgatgttat gaacgagcct cacgatattc 720
ccgcccagac cgtgttccaa ctgaaccaag ccgctgtcaa tggcatccgt gcgagcggtg 780
cgacgtcgca gctcattctg gtcgagggca caagctggac tggagcctgg acctggacga 840
cctctggcaa cagcgatgca ttcggtgcca ttaaggatcc caacaacaac gtcgcgatcc 900
agatgcatca gtacctggat agcgatggct ctggcacttc gcagacctgc gtgtctccca 960
ccatcggtgc cgagcggttg caggctgcga ctcaatggtt gaagcagaac aacctcaagg 1020
gcttcctggg cgagatcggc gccggctcta actccgcttg catcagcgct gtgcagggtg 1080
cgttgtgttc gatgcagcaa tctggtgtgt ggctcggcgc tctctggtgg gctgcgggcc 1140
cgtggtgggg cgactactac cagtccatcg agccgccctc tggcccggcg gtgtccgcga 1200
tcctcccgca ggccctgctg ccgttcgcgt aa 1232
<210>6
<211>397
<212>PRT
<213>担子菌纲CBS 495.95
<400>6
Met Lys Ser Leu Phe Leu Ser Leu Val Ala Thr Val Ala Leu Ser Ser
1 5 10 15
Pro Val Phe Ser Val Ala Val Trp Gly Gln Cys Gly Gly Ile Gly Phe
20 25 30
Ser Gly Ser Thr Val Cys Asp Ala Gly Ala Gly Cys Val Lys Leu Asn
35 40 45
Asp Tyr Tyr Ser Gln Cys Gln Pro Gly Ala Pro Thr Ala Thr Ser Ala
50 55 60
Ala Pro Ser Ser Asn Ala Pro Ser Gly Thr Ser Thr Ala Ser Ala Pro
65 70 75 80
Ser Ser Ser Leu Cys Ser Gly Ser Arg Thr Pro Phe Gln Phe Phe Gly
85 90 95
Val Asn Glu Ser Gly Ala Glu Phe Gly Asn Leu Asn Ile Pro Gly Val
100 105 110
Leu Gly Thr Asp Tyr Thr Trp Pro Ser Pro Ser Ser Ile Asp Phe Phe
115 120 125
Met Gly Lys Gly Met Asn Thr Phe Arg Ile Pro Phe Leu Met Glu Arg
130 135 140
Leu Val Pro Pro Ala Thr Gly Ile Thr Gly Pro Leu Asp Gln Thr Tyr
145 150 155 160
Leu Gly Gly Leu Gln Thr Ile Val Asn Tyr Ile Thr Gly Lys Gly Gly
165 170 175
Phe Ala Leu Ile Asp Pro His Asn Phe Met Ile Tyr Asn Gly Gln Thr
180 185 190
Ile Ser Ser Thr Ser Asp Phe Gln Lys Phe Trp Gln Asn Leu Ala Gly
195 200 205
Val Phe Lys Ser Asn Ser His Val Ile Phe Asp Val Met Asn Glu Pro
210 215 220
His Asp Ile Pro Ala Gln Thr Val Phe Gln Leu Asn Gln Ala Ala Val
225 230 235 240
Asn Gly Ile Arg Ala Ser Gly Ala Thr Ser Gln Leu Ile Leu Val Glu
245 250 255
Gly Thr Ser Trp Thr Gly Ala Trp Thr Trp Thr Thr Ser Gly Asn Ser
260 265 270
Asp Ala Phe Gly Ala Ile Lys Asp Pro Asn Asn Asn Val Ala Ile Gln
275 280 285
Met His Gln Tyr Leu Asp Ser Asp Gly Ser Gly Thr Ser Gln Thr Cys
290 295 300
Val Ser Pro Thr Ile Gly Ala Glu Arg Leu Gln Ala Ala Thr Gln Trp
305 310 315 320
Leu Lys Gln Asn Asn Leu Lys Gly Phe Leu Gly Glu Ile Gly Ala Gly
325 330 335
Ser Asn Ser Ala Cys Ile Ser Ala Val Gln Gly Ala Leu Cys Ser Met
340 345 350
Gln Gln Ser Gly Val Trp Leu Gly Ala Leu Trp Trp Ala Ala Gly Pro
355 360 365
Trp Trp Gly Asp Tyr Tyr Gln Ser Ile Glu Pro Pro Ser Gly Pro Ala
370 375 380
Val Ser Ala Ile Leu Pro Gln Ala Leu Leu Pro Phe Ala
385 390 395
<210>7
<211>1303
<212>DNA
<213>担子菌纲CBS 494.95
<400>7
ggaaagcgtc agtatggtga aatttgcgct tgtggcaact gtcggcgcaa tcttgagcgc 60
ttctgcggcc aatgcggctt ctatctacca gcaatgtgga ggcattggat ggtctgggtc 120
cactgtttgc gacgccggtc tcgcttgcgt tatcctcaat gcgtactact ttcagtgctt 180
gacgcccgcc gcgggccaga caacgacggg ctcgggcgca ccggcgtcaa catcaacctc 240
tcactcaacg gtcactacgg ggagctcaca ctcaacaacc gggacgacgg cgacgaaaac 300
aactaccact ccgtcgacca ccacgaccct acccgccatc tctgtgtctg gtcgcgtctg 360
ctctggctcc aggacgaagt tcaagttctt cggtgtgaat gaaagcggcg ccgaattcgg 420
gaacactgct tggccagggc agctcgggaa agactataca tggccttcgc ctagcagcgt 480
ggactacttc atgggggctg gattcaatac attccgtatc accttcttga tggagcgtat 540
gagccctccg gctaccggac tcactggccc attcaaccag acgtacctgt cgggcctcac 600
caccattgtc gactacatca cgaacaaagg aggatacgct cttattgacc cccacaactt 660
catgcgttac aacaacggca taatcagcag cacatctgac ttcgcgactt ggtggagcaa 720
tttggccact gtattcaaat ccacgaagaa cgccatcttc gacatccaga acgagccgta 780
cggaatcgat gcgcagaccg tatacgaact gaatcaagct gccatcaatt cgatccgcgc 840
cgctggcgct acgtcacagt tgattctggt tgaaggaacg tcatacactg gagcttggac 900
gtgggtctcg tccggaaacg gagctgcttt cgcggccgtt acggatcctt acaacaacac 960
ggcaattgaa atgcaccaat acctcgacag cgacggttct gggacaaacg aagactgtgt 1020
ctcctccacc attgggtcgc aacgtctcca agctgccact gcgtggctgc aacaaacagg 1080
actcaaggga ttcctcggag agacgggtgc tgggtcgaat tcccagtgca tcgacgccgt 1140
gttcgatgaa ctttgctata tgcaacagca aggcggctcc tggatcggtg cactctggtg 1200
ggctgcgggt ccctggtggg gcacgtacat ttactcgatt gaacctccga gcggtgccgc 1260
tatcccagaa gtccttcctc agggtctcgc tccattcctc tag 1303
<210>8
<211>429
<212>PRT
<213>担子菌纲CBS 494.95
<400>8
Met Val Lys Phe Ala Leu Val Ala Thr Val Gly Ala Ile Leu Ser Ala
1 5 10 15
Ser Ala Ala Asn Ala Ala Ser Ile Tyr Gln Gln Cys Gly Gly Ile Gly
20 25 30
Trp Ser Gly Ser Thr Val Cys Asp Ala Gly Leu Ala Cys Val Ile Leu
35 40 45
Asn Ala Tyr Tyr Phe Gln Cys Leu Thr Pro Ala Ala Gly Gln Thr Thr
50 55 60
Thr Gly Ser Gly Ala Pro Ala Ser Thr Ser Thr Ser His Ser Thr Val
65 70 75 80
Thr Thr Gly Ser Ser His Ser Thr Thr Gly Thr Thr Ala Thr Lys Thr
85 90 95
Thr Thr Thr Pro Ser Thr Thr Thr Thr Leu Pro Ala Ile Ser Val Ser
100 105 110
Gly Arg Val Cys Ser Gly Ser Arg Thr Lys Phe Lys Phe Phe Gly Val
115 120 125
Asn Glu Ser Gly Ala Glu Phe Gly Asn Thr Ala Trp Pro Gly Gln Leu
130 135 140
Gly Lys Asp Tyr Thr Trp Pro Ser Pro Ser Ser Val Asp Tyr Phe Met
145 150 155 160
Gly Ala Gly Phe Asn Thr Phe Arg Ile Thr Phe Leu Met Glu Arg Met
165 170 175
Ser Pro Pro Ala Thr Gly Leu Thr Gly Pro Phe Asn Gln Thr Tyr Leu
180 185 190
Ser Gly Leu Thr Thr Ile Val Asp Tyr Ile Thr Asn Lys Gly Gly Tyr
195 200 205
Ala Leu Ile Asp Pro His Asn Phe Met Arg Tyr Asn Asn Gly Ile Ile
210 215 220
Ser Ser Thr Ser Asp Phe Ala Thr Trp Trp Ser Asn Leu Ala Thr Val
225 230 235 240
Phe Lys Ser Thr Lys Asn Ala Ile Phe Asp Ile Gln Asn Glu Pro Tyr
245 250 255
Gly Ile Asp Ala Gln Thr Val Tyr Glu Leu Asn Gln Ala Ala Ile Asn
260 265 270
Ser Ile Arg Ala Ala Gly Ala Thr Ser Gln Leu Ile Leu Val Glu Gly
275 280 285
Thr Ser Tyr Thr Gly Ala Trp Thr Trp Val Ser Ser Gly Asn Gly Ala
290 295 300
Ala Phe Ala Ala Val Thr Asp Pro Tyr Asn Asn Thr Ala Ile Glu Met
305 310 315 320
His Gln Tyr Leu Asp Ser Asp Gly Ser Gly Thr Asn Glu Asp Cys Val
325 330 335
Ser Ser Thr Ile Gly Ser Gln Arg Leu Gln Ala Ala Thr Ala Trp Leu
340 345 350
Gln Gln Thr Gly Leu Lys Gly Phe Leu Gly Glu Thr Gly Ala Gly Ser
355 360 365
Asn Ser Gln Cys Ile Asp Ala Val Phe Asp Glu Leu Cys Tyr Met Gln
370 375 380
Gln Gln Gly Gly Ser Trp Ile Gly Ala Leu Trp Trp Ala Ala Gly Pro
385 390 395 400
Trp Trp Gly Thr Tyr Ile Tyr Ser Ile Glu Pro Pro Ser Gly Ala Ala
405 410 415
Ile Pro Glu Val Leu Pro Gln Gly Leu Ala Pro Phe Leu
420 425
<210>9
<211>1580
<212>DNA
<213>土生梭孢壳(Thielavia terrestris)
<400>9
agccccccgt tcaggcacac ttggcatcag atcagcttag cagcgcctgc acagcatgaa 60
gctctcgcag tcggccgcgc tggcggcact caccgcgacg gcgctcgccg ccccctcgcc 120
cacgacgccg caggcgccga ggcaggcttc agccggctgc tcgtctgcgg tcacgctcga 180
cgccagcacc aacgtttgga agaagtacac gctgcacccc aacagctact accgcaagga 240
ggttgaggcc gcggtggcgc agatctcgga cccggacctc gccgccaagg ccaagaaggt 300
ggccgacgtc ggcaccttcc tgtggctcga ctcgatcgag aacatcggca agctggagcc 360
ggcgatccag gacgtgccct gcgagaacat cctgggcctg gtcatctacg acctgccggg 420
ccgcgactgc gcggccaagg cgtccaacgg cgagctcaag gtcggcgaga tcgaccgcta 480
caagaccgag tacatcgaca gtgagtgctg ccccccgggt tcgagaagag cgtgggggaa 540
agggaaaggg ttgactgact gacacggcgc actgcagaga tcgtgtcgat cctcaaggca 600
caccccaaca cggcgttcgc gctggtcatc gagccggact cgctgcccaa cctggtgacc 660
aacagcaact tggacacgtg ctcgagcagc gcgtcgggct accgcgaagg cgtggcttac 720
gccctcaaga acctcaacct gcccaacgtg atcatgtacc tcgacgccgg ccacggcggc 780
tggctcggct gggacgccaa cctgcagccc ggcgcgcagg agctagccaa ggcgtacaag 840
aacgccggct cgcccaagca gctccgcggc ttctcgacca acgtggccgg ctggaactcc 900
tggtgagctt ttttccattc catttcttct tcctcttctc tcttcgctcc cactctgcag 960
ccccccctcc cccaagcacc cactggcgtt ccggcttgct gactcggcct ccctttcccc 1020
gggcaccagg gatcaatcgc ccggcgaatt ctcccaggcg tccgacgcca agtacaacaa 1080
gtgccagaac gagaagatct acgtcagcac cttcggctcc gcgctccagt cggccggcat 1140
gcccaaccac gccatcgtcg acacgggccg caacggcgtc accggcctgc gcaaggagtg 1200
gggtgactgg tgcaacgtca acggtgcagg ttcgttgtct tctttttctc ctcttttgtt 1260
tgcacgtcgt ggtccttttc aagcagccgt gtttggttgg gggagatgga ctccggctga 1320
tgttctgctt cctctctagg cttcggcgtg cgcccgacga gcaacacggg cctcgagctg 1380
gccgacgcgt tcgtgtgggt caagcccggc ggcgagtcgg acggcaccag cgacagctcg 1440
tcgccgcgct acgacagctt ctgcggcaag gacgacgcct tcaagccctc gcccgaggcc 1500
ggcacctgga acgaggccta cttcgagatg ctgctcaaga acgccgtgcc gtcgttctaa 1560
gacggtccag catcatccgg 1580
<210>10
<211>396
<212>PRT
<213>土生梭孢壳
<400>10
Met Lys Leu Ser Gln Ser Ala Ala Leu Ala Ala Leu Thr Ala Thr Ala
1 5 10 15
Leu Ala Ala Pro Ser Pro Thr Thr Pro Gln Ala Pro Arg Gln Ala Ser
20 25 30
Ala Gly Cys Ser Ser Ala Val Thr Leu Asp Ala Ser Thr Asn Val Trp
35 40 45
Lys Lys Tyr Thr Leu His Pro Asn Ser Tyr Tyr Arg Lys Glu Val Glu
50 55 60
Ala Ala Val Ala Gln Ile Ser Asp Pro Asp Leu Ala Ala Lys Ala Lys
65 70 75 80
Lys Val Ala Asp Val Gly Thr Phe Leu Trp Leu Asp Ser Ile Glu Asn
85 90 95
Ile Gly Lys Leu Glu Pro Ala Ile Gln Asp Val Pro Cys Glu Asn Ile
100 105 110
Leu Gly Leu Val Ile Tyr Asp Leu Pro Gly Arg Asp Cys Ala Ala Lys
115 120 125
Ala Ser Asn Gly Glu Leu Lys Val Gly Glu Ile Asp Arg Tyr Lys Thr
130 135 140
Glu Tyr Ile Asp Lys Ile Val Ser Ile Leu Lys Ala His Pro Asn Thr
145 150 155 160
Ala Phe Ala Leu Val Ile Glu Pro Asp Ser Leu Pro Asn Leu Val Thr
165 170 175
Asn Ser Asn Leu Asp Thr Cys Ser Ser Ser Ala Ser Gly Tyr Arg Glu
180 185 190
Gly Val Ala Tyr Ala Leu Lys Asn Leu Asn Leu Pro Asn Val Ile Met
195 200 205
Tyr Leu Asp Ala Gly His Gly Gly Trp Leu Gly Trp Asp Ala Asn Leu
210 215 220
Gln Pro Gly Ala Gln Glu Leu Ala Lys Ala Tyr Lys Asn Ala Gly Ser
225 230 235 240
Pro Lys Gln Leu Arg Gly Phe Ser Thr Asn Val Ala Gly Trp Asn Ser
245 250 255
Trp Asp Gln Ser Pro Gly Glu Phe Ser Gln Ala Ser Asp Ala Lys Tyr
260 265 270
Asn Lys Cys Gln Asn Glu Lys Ile Tyr Val Ser Thr Phe Gly Ser Ala
275 280 285
Leu Gln Ser Ala Gly Met Pro Asn His Ala Ile Val Asp Thr Gly Arg
290 295 300
Asn Gly Val Thr Gly Leu Arg Lys Glu Trp Gly Asp Trp Cys Asn Val
305 310 315 320
Asn Gly Ala Gly Phe Gly Val Arg Pro Thr Ser Asn Thr Gly Leu Glu
325 330 335
Leu Ala Asp Ala Phe Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly
340 345 350
Thr Ser Asp Ser Ser Ser Pro Arg Tyr Asp Ser Phe Cys Gly Lys Asp
355 360 365
Asp Ala Phe Lys Pro Ser Pro Glu Ala Gly Thr Trp Asn Glu Ala Tyr
370 375 380
Phe Glu Met Leu Leu Lys Asn Ala Val Pro Ser Phe
385 390 395
<210>11
<211>1203
<212>DNA
<213>土生梭孢壳
<400>11
atgaagtacc tcaacctcct cgcagctctc ctcgccgtcg ctcctctctc cctcgctgca 60
cccagcatcg aggccagaca gtcgaacgtc aacccataca tcggcaagag cccgctcgtt 120
attaggtcgt acgcccaaaa gcttgaggag accgtcagga ccttccagca acgtggcgac 180
cagctcaacg ctgcgaggac acggacggtg cagaacgttg cgactttcgc ctggatctcg 240
gataccaatg gtattggagc cattcgacct ctcatccaag atgctctcgc ccagcaggct 300
cgcactggac agaaggtcat cgtccaaatc gtcgtctaca acctcccaga tcgcgactgc 360
tctgccaacg cctcgactgg agagttcacc gtaggaaacg acggtctcaa ccgatacaag 420
aactttgtca acaccatcgc ccgcgagctc tcgactgctg acgctgacaa gctccacttt 480
gccctcctcc tcgaacccga cgcacttgcc aacctcgtca ccaacgcgaa tgcccccagg 540
tgccgaatcg ccgctcccgc ttacaaggag ggtatcgcct acaccctcgc caccttgtcc 600
aagcccaacg tcgacgtcta catcgacgcc gccaacggtg gctggctcgg ctggaacgac 660
aacctccgcc ccttcgccga actcttcaag gaagtctacg acctcgcccg ccgcatcaac 720
cccaacgcca aggtccgcgg cgtccccgtc aacgtctcca actacaacca gtaccgcgct 780
gaagtccgcg agcccttcac cgagtggaag gacgcctggg acgagagccg ctacgtcaac 840
gtcctcaccc cgcacctcaa cgccgtcggc ttctccgcgc acttcatcgt tgaccaggga 900
cgcggtggca agggcggtat caggacggag tggggccagt ggtgcaacgt taggaacgct 960
gggttcggta tcaggcctac tgcggatcag ggcgtgctcc agaacccgaa tgtggatgcg 1020
attgtgtggg ttaagccggg tggagagtcg gatggcacga gtgatttgaa ctcgaacagg 1080
tatgatccta cgtgcaggag tccggtggcg catgttcccg ctcctgaggc tggccagtgg 1140
ttcaacgagt atgttgttaa cctcgttttg aacgctaacc cccctcttga gcctacctgg 1200
taa 1203
<210>12
<211>400
<212>PRT
<213>土生梭孢壳
<400>12
Met Lys Tyr Leu Asn Leu Leu Ala Ala Leu Leu Ala Val Ala Pro Leu
1 5 10 15
Ser Leu Ala Ala Pro Ser Ile Glu Ala Arg Gln Ser Asn Val Asn Pro
20 25 30
Tyr Ile Gly Lys Ser Pro Leu Val Ile Arg Ser Tyr Ala Gln Lys Leu
35 40 45
Glu Glu Thr Val Arg Thr Phe Gln Gln Arg Gly Asp Gln Leu Asn Ala
50 55 60
Ala Arg Thr Arg Thr Val Gln Asn Val Ala Thr Phe Ala Trp Ile Ser
65 70 75 80
Asp Thr Asn Gly Ile Gly Ala Ile Arg Pro Leu Ile Gln Asp Ala Leu
85 90 95
Ala Gln Gln Ala Arg Thr Gly Gln Lys Val Ile Val Gln Ile Val Val
100 105 110
Tyr Asn Leu Pro Asp Arg Asp Cys Ser Ala Asn Ala Ser Thr Gly Glu
115 120 125
Phe Thr Val Gly Asn Asp Gly Leu Asn Arg Tyr Lys Asn Phe Val Asn
130 135 140
Thr Ile Ala Arg Glu Leu Ser Thr Ala Asp Ala Asp Lys Leu His Phe
145 150 155 160
Ala Leu Leu Leu Glu Pro Asp Ala Leu Ala Asn Leu Val Thr Asn Ala
165 170 175
Asn Ala Pro Arg Cys Arg Ile Ala Ala Pro Ala Tyr Lys Glu Gly Ile
180 185 190
Ala Tyr Thr Leu Ala Thr Leu Ser Lys Pro Asn Val Asp Val Tyr Ile
195 200 205
Asp Ala Ala Asn Gly Gly Trp Leu Gly Trp Asn Asp Asn Leu Arg Pro
210 215 220
Phe Ala Glu Leu Phe Lys Glu Val Tyr Asp Leu Ala Arg Arg Ile Asn
225 230 235 240
Pro Asn Ala Lys Val Arg Gly Val Pro Val Asn Val Ser Asn Tyr Asn
245 250 255
Gln Tyr Arg Ala Glu Val Arg Glu Pro Phe Thr Glu Trp Lys Asp Ala
260 265 270
Trp Asp Glu Ser Arg Tyr Val Asn Val Leu Thr Pro His Leu Asn Ala
275 280 285
Val Gly Phe Ser Ala His Phe Ile Val Asp Gln Gly Arg Gly Gly Lys
290 295 300
Gly Gly Ile Arg Thr Glu Trp Gly Gln Trp Cys Asn Val Arg Asn Ala
305 310 315 320
Gly Phe Gly Ile Arg Pro Thr Ala Asp Gln Gly Val Leu Gln Asn Pro
325 330 335
Asn Val Asp Ala Ile Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly
340 345 350
Thr Ser Asp Leu Asn Ser Asn Arg Tyr Asp Pro Thr Cys Arg Ser Pro
355 360 365
Val Ala His Val Pro Ala Pro Glu Ala Gly Gln Trp Phe Asn Glu Tyr
370 375 380
Val Val Asn Leu Val Leu Asn Ala Asn Pro Pro Leu Glu Pro Thr Trp
385 390 395 400
<210>13
<211>1501
<212>DNA
<213>土生梭孢壳
<400>13
gccgttgtca agatgggcca gaagacgctg cacggattcg ccgccacggc tttggccgtt 60
ctcccctttg tgaaggctca gcagcccggc aacttcacgc cggaggtgca cccgcaactg 120
ccaacgtgga agtgcacgac cgccggcggc tgcgttcagc aggacacttc ggtggtgctc 180
gactggaact accgttggat ccacaatgcc gacggcaccg cctcgtgcac gacgtccagc 240
ggggtcgacc acacgctgtg tccagatgag gcgacctgcg cgaagaactg cttcgtggaa 300
ggcgtcaact acacgagcag cggtgtcacc acatccggca gttcgctgac gatgaggcag 360
tatttcaagg ggagcaacgg gcagaccaac agcgtttcgc ctcgtctcta cctgctcggc 420
tcggatggaa actacgtaat gctcaagctg ctcggccagg agctgagctt cgatgtcgat 480
ctctccacgc tcccctgcgg cgagaacggc gcgctgtacc tgtccgagat ggacgcgacc 540
ggtggcagga accagtacaa caccggcggt gccaactacg gctcgggcta ctgtgacgcc 600
cagtgtcccg tgcagacgtg gatgaacggc acgctgaaca ccaacgggca gggctactgc 660
tgcaacgaga tggacatcct cgaggccaac tcccgcgcca acgcgatgac acctcacccc 720
tgcgccaacg gcagctgcga caagagcggg tgcggactca acccctacgc cgagggctac 780
aagagctact acggaccggg cctcacggtt gacacgtcga agcccttcac catcattacc 840
cgcttcatca ccgacgacgg cacgaccagc ggcaccctca accagatcca gcggatctat 900
gtgcagaatg gcaagacggt cgcgtcggct gcgtccggag gcgacatcat cacggcatcc 960
ggctgcacct cggcccaggc gttcggcggg ctggccaaca tgggcgcggc gcttggacgg 1020
ggcatggtgc tgaccttcag catctggaac gacgctgggg gctacatgaa ctggctcgac 1080
agcggcaaca acggcccgtg cagcagcacc gagggcaacc cgtccaacat cctggccaac 1140
tacccggaca cccacgtggt cttctccaac atccgctggg gagacatcgg ctcgacggtc 1200
caggtctcgg gaggcggcaa cggcggctcg accaccacca cgtcgaccac cacgctgagg 1260
acctcgacca cgaccaccac caccgccccg acggccactg ccacgcactg gggacaatgc 1320
ggcggaatcg gggtacgtca accgcctcct gcattctgtt gaggaagtta actaacgtgg 1380
cctacgcagt ggactggacc gaccgtctgc gaatcgccgt acgcatgcaa ggagctgaac 1440
ccctggtact accagtgcct ctaaagtatt gcagtgaagc catactccgt gctcggcatg 1500
g 1501
<210>14
<211>464
<212>PRT
<213>土生梭孢壳
<400>14
Met Gly Gln Lys Thr Leu His Gly Phe Ala Ala Thr Ala Leu Ala Val
1 5 10 15
Leu Pro Phe Val Lys Ala Gln Gln Pro Gly Asn Phe Thr Pro Glu Val
20 25 30
His Pro Gln Leu Pro Thr Trp Lys Cys Thr Thr Ala Gly Gly Cys Val
35 40 45
Gln Gln Asp Thr Ser Val Val Leu Asp Trp Asn Tyr Arg Trp Ile His
50 55 60
Asn Ala Asp Gly Thr Ala Ser Cys Thr Thr Ser Ser Gly Val Asp His
65 70 75 80
Thr Leu Cys Pro Asp Glu Ala Thr Cys Ala Lys Asn Cys Phe Val Glu
85 90 95
Gly Val Asn Tyr Thr Ser Ser Gly Val Thr Thr Ser Gly Ser Ser Leu
100 105 110
Thr Met Arg Gln Tyr Phe Lys Gly Ser Asn Gly Gln Thr Asn Ser Val
115 120 125
Ser Pro Arg Leu Tyr Leu Leu Gly Ser Asp Gly Asn Tyr Val Met Leu
130 135 140
Lys Leu Leu Gly Gln Glu Leu Ser Phe Asp Val Asp Leu Ser Thr Leu
145 150 155 160
Pro Cys Gly Glu Asn Gly Ala Leu Tyr Leu Ser Glu Met Asp Ala Thr
165 170 175
Gly Gly Arg Asn Gln Tyr Asn Thr Gly Gly Ala Asn Tyr Gly Ser Gly
180 185 190
Tyr Cys Asp Ala Gln Cys Pro Val Gln Thr Trp Met Asn Gly Thr Leu
195 200 205
Asn Thr Asn Gly Gln Gly Tyr Cys Cys Asn Glu Met Asp Ile Leu Glu
210 215 220
Ala Asn Ser Arg Ala Asn Ala Met Thr Pro His Pro Cys Ala Asn Gly
225 230 235 240
Ser Cys Asp Lys Ser Gly Cys Gly Leu Asn Pro Tyr Ala Glu Gly Tyr
245 250 255
Lys Ser Tyr Tyr Gly Pro Gly Leu Thr Val Asp Thr Ser Lys Pro Phe
260 265 270
Thr Ile Ile Thr Arg Phe Ile Thr Asp Asp Gly Thr Thr Ser Gly Thr
275 280 285
Leu Asn Gln Ile Gln Arg Ile Tyr Val Gln Asn Gly Lys Thr Val Ala
290 295 300
Ser Ala Ala Ser Gly Gly Asp Ile Ile Thr Ala Ser Gly Cys Thr Ser
305 310 315 320
Ala Gln Ala Phe Gly Gly Leu Ala Asn Met Gly Ala Ala Leu Gly Arg
325 330 335
Gly Met Val Leu Thr Phe Ser Ile Trp Asn Asp Ala Gly Gly Tyr Met
340 345 350
Asn Trp Leu Asp Ser Gly Asn Asn Gly Pro Cys Ser Ser Thr Glu Gly
355 360 365
Asn Pro Ser Asn Ile Leu Ala Asn Tyr Pro Asp Thr His Val Val Phe
370 375 380
Ser Asn Ile Arg Trp Gly Asp Ile Gly Ser Thr Val Gln Val Ser Gly
385 390 395 400
Gly Gly Asn Gly Gly Ser Thr Thr Thr Thr Ser Thr Thr Thr Leu Arg
405 410 415
Thr Ser Thr Thr Thr Thr Thr Thr Ala Pro Thr Ala Thr Ala Thr His
420 425 430
Trp Gly Gln Cys Gly Gly Ile Gly Trp Thr Gly Pro Thr Val Cys Glu
435 440 445
Ser Pro Tyr Ala Cys Lys Glu Leu Asn Pro Trp Tyr Tyr Gln Cys Leu
450 455 460
<210>15
<211>1368
<212>DNA
<213>土生梭孢壳
<400>15
accgatccgc tcgaagatgg cgcccaagtc tacagttctg gccgcctggc tgctctcctc 60
gctggccgcg gcccagcaga tcggcaaagc cgtgcccgag gtccacccca aactgacaac 120
gcagaagtgc actctccgcg gcgggtgcaa gcctgtccgc acctcggtcg tgctcgactc 180
gtccgcgcgc tcgctgcaca aggtcgggga ccccaacacc agctgcagcg tcggcggcga 240
cctgtgctcg gacgcgaagt cgtgcggcaa gaactgcgcg ctcgagggcg tcgactacgc 300
ggcccacggc gtggcgacca agggcgacgc cctcacgctg caccagtggc tcaagggggc 360
cgacggcacc tacaggaccg tctcgccgcg cgtatacctc ctgggcgagg acgggaagaa 420
ctacgaggac ttcaagctgc tcaacgccga gctcagcttc gacgtcgacg tgtcccagct 480
cgtctgcggc atgaacggcg ccctgtactt ctccgagatg gagatggacg gcggccgcag 540
cccgctgaac ccggcgggcg ccacgtacgg cacgggctac tgcgacgcgc agtgccccaa 600
gttggacttt atcaacggcg aggtatttct tctctcttct gtttttcttt tccatcgctt 660
tttctgaccg gaatccgccc tcttagctca acaccaacca cacgtacggg gcgtgctgca 720
acgagatgga catctgggag gccaacgcgc tggcgcaggc gctcacgccg cacccgtgca 780
acgcgacgcg ggtgtacaag tgcgacacgg cggacgagtg cgggcagccg gtgggcgtgt 840
gcgacgaatg ggggtgctcg tacaacccgt ccaacttcgg ggtcaaggac tactacgggc 900
gcaacctgac ggtggacacg aaccgcaagt tcacggtgac gacgcagttc gtgacgtcca 960
acgggcgggc ggacggcgag ctgaccgaga tccggcggct gtacgtgcag gacggcgtgg 1020
tgatccagaa ccacgcggtc acggcgggcg gggcgacgta cgacagcatc acggacggct 1080
tctgcaacgc gacggccacc tggacgcagc agcggggcgg gctcgcgcgc atgggcgagg 1140
ccatcggccg cggcatggtg ctcatcttca gcctgtgggt tgacaacggc ggcttcatga 1200
actggctcga cagcggcaac gccgggccct gcaacgccac cgagggcgac ccggccctga 1260
tcctgcagca gcacccggac gccagcgtca ccttctccaa catccgatgg ggcgagatcg 1320
gcagcacgta caagagcgag tgcagccact agagtagagc ttgtaatt 1368
<210>16
<211>423
<212>PRT
<213>土生梭孢壳
<400>16
Met Ala Pro Lys Ser Thr Val Leu Ala Ala Trp Leu Leu Ser Ser Leu
1 5 10 15
Ala Ala Ala Gln Gln Ile Gly Lys Ala Val Pro Glu Val His Pro Lys
20 25 30
Leu Thr Thr Gln Lys Cys Thr Leu Arg Gly Gly Cys Lys Pro Val Arg
35 40 45
Thr Ser Val Val Leu Asp Ser Ser Ala Arg Ser Leu His Lys Val Gly
50 55 60
Asp Pro Asn Thr Ser Cys Ser Val Gly Gly Asp Leu Cys Ser Asp Ala
65 70 75 80
Lys Ser Cys Gly Lys Asn Cys Ala Leu Glu Gly Val Asp Tyr Ala Ala
85 90 95
His Gly Val Ala Thr Lys Gly Asp Ala Leu Thr Leu His Gln Trp Leu
100 105 110
Lys Gly Ala Asp Gly Thr Tyr Arg Thr Val Ser Pro Arg Val Tyr Leu
115 120 125
Leu Gly Glu Asp Gly Lys Asn Tyr Glu Asp Phe Lys Leu Leu Asn Ala
130 135 140
Glu Leu Ser Phe Asp Val Asp Val Ser Gln Leu Val Cys Gly Met Asn
145 150 155 160
Gly Ala Leu Tyr Phe Ser Glu Met Glu Met Asp Gly Gly Arg Ser Pro
165 170 175
Leu Asn Pro Ala Gly Ala Thr Tyr Gly Thr Gly Tyr Cys Asp Ala Gln
180 185 190
Cys Pro Lys Leu Asp Phe Ile Asn Gly Glu Leu Asn Thr Asn His Thr
195 200 205
Tyr Gly Ala Cys Cys Asn Glu Met Asp Ile Trp Glu Ala Asn Ala Leu
210 215 220
Ala Gln Ala Leu Thr Pro His Pro Cys Asn Ala Thr Arg Val Tyr Lys
225 230 235 240
Cys Asp Thr Ala Asp Glu Cys Gly Gln Pro Val Gly Val Cys Asp Glu
245 250 255
Trp Gly Cys Ser Tyr Asn Pro Ser Asn Phe Gly Val Lys Asp Tyr Tyr
260 265 270
Gly Arg Asn Leu Thr Val Asp Thr Asn Arg Lys Phe Thr Val Thr Thr
275 280 285
Gln Phe Val Thr Ser Asn Gly Arg Ala Asp Gly Glu Leu Thr Glu Ile
290 295 300
Arg Arg Leu Tyr Val Gln Asp Gly Val Val Ile Gln Asn His Ala Val
305 310 315 320
Thr Ala Gly Gly Ala Thr Tyr Asp Ser Ile Thr Asp Gly Phe Cys Asn
325 330 335
Ala Thr Ala Thr Trp Thr Gln Gln Arg Gly Gly Leu Ala Arg Met Gly
340 345 350
Glu Ala Ile Gly Arg Gly Met Val Leu Ile Phe Ser Leu Trp Val Asp
355 360 365
Asn Gly Gly Phe Met Asn Trp Leu Asp Ser Gly Asn Ala Gly Pro Cys
370 375 380
Asn Ala Thr Glu Gly Asp Pro Ala Leu Ile Leu Gln Gln His Pro Asp
385 390 395 400
Ala Ser Val Thr Phe Ser Asn Ile Arg Trp Gly Glu Ile Gly Ser Thr
405 410 415
Tyr Lys Ser Glu Cys Ser His
420
<210>17
<211>1011
<212>DNA
<213>土生梭孢壳
<400>17
atgaccctac ggctccctgt catcagcctg ctggcctcgc tggcagcagg cgccgtcgtc 60
gtcccacggg cggagtttca cccccctctc ccgacttgga aatgcacgac ctccgggggc 120
tgcgtgcagc agaacaccag cgtcgtcctg gaccgtgact cgaagtacgc cgcacacagc 180
gccggctcgc ggacggaatc ggattacgcg gcaatgggag tgtccacttc gggcaatgcc 240
gtgacgctgt accactacgt caagaccaac ggcaccctcg tccccgcttc gccgcgcatc 300
tacctcctgg gcgcggacgg caagtacgtg cttatggacc tcctcaacca ggagctgtcg 360
gtggacgtcg acttctcggc gctgccgtgc ggcgagaacg gggccttcta cctgtccgag 420
atggcggcgg acgggcgggg cgacgcgggg gcgggcgacg ggtactgcga cgcgcagtgc 480
cagggctact gctgcaacga gatggacatc ctcgaggcca actcgatggc gacggccatg 540
acgccgcacc cgtgcaaggg caacaactgc gaccgcagcg gctgcggcta caacccgtac 600
gccagcggcc agcgcggctt ctacgggccc ggcaagacgg tcgacacgag caagcccttc 660
accgtcgtca cgcagttcgc cgccagcggc ggcaagctga cccagatcac ccgcaagtac 720
atccagaacg gccgggagat cggcggcggc ggcaccatct ccagctgcgg ctccgagtct 780
tcgacgggcg gcctgaccgg catgggcgag gcgctggggc gcggaatggt gctggccatg 840
agcatctgga acgacgcggc ccaggagatg gcatggctcg atgccggcaa caacggccct 900
tgcgccagtg gccagggcag cccgtccgtc attcagtcgc agcatcccga cacccacgtc 960
gtcttctcca acatcaggtg gggcgacatc gggtctacca cgaagaacta g 1011
<210>18
<211>336
<212>PRT
<213>土生梭孢壳
<400>18
Met Thr Leu Arg Leu Pro Val Ile Ser Leu Leu Ala Ser Leu Ala Ala
1 5 10 15
Gly Ala Val Val Val Pro Arg Ala Glu Phe His Pro Pro Leu Pro Thr
20 25 30
Trp Lys Cys Thr Thr Ser Gly Gly Cys Val Gln Gln Asn Thr Ser Val
35 40 45
Val Leu Asp Arg Asp Ser Lys Tyr Ala Ala His Ser Ala Gly Ser Arg
50 55 60
Thr Glu Ser Asp Tyr Ala Ala Met Gly Val Ser Thr Ser Gly Asn Ala
65 70 75 80
Val Thr Leu Tyr His Tyr Val Lys Thr Asn Gly Thr Leu Val Pro Ala
85 90 95
Ser Pro Arg Ile Tyr Leu Leu Gly Ala Asp Gly Lys Tyr Val Leu Met
100 105 110
Asp Leu Leu Asn Gln Glu Leu Ser Val Asp Val Asp Phe Ser Ala Leu
115 120 125
Pro Cys Gly Glu Asn Gly Ala Phe Tyr Leu Ser Glu Met Ala Ala Asp
130 135 140
Gly Arg Gly Asp Ala Gly Ala Gly Asp Gly Tyr Cys Asp Ala Gln Cys
145 150 155 160
Gln Gly Tyr Cys Cys Asn Glu Met Asp Ile Leu Glu Ala Asn Ser Met
165 170 175
Ala Thr Ala Met Thr Pro His Pro Cys Lys Gly Asn Asn Cys Asp Arg
180 185 190
Ser Gly Cys Gly Tyr Asn Pro Tyr Ala Ser Gly Gln Arg Gly Phe Tyr
195 200 205
Gly Pro Gly Lys Thr Val Asp Thr Ser Lys Pro Phe Thr Val Val Thr
210 215 220
Gln Phe Ala Ala Ser Gly Gly Lys Leu Thr Gln Ile Thr Arg Lys Tyr
225 230 235 240
Ile Gln Asn Gly Arg Glu Ile Gly Gly Gly Gly Thr Ile Ser Ser Cys
245 250 255
Gly Ser Glu Ser Ser Thr Gly Gly Leu Thr Gly Met Gly Glu Ala Leu
260 265 270
Gly Arg Gly Met Val Leu Ala Met Ser Ile Trp Asn Asp Ala Ala Gln
275 280 285
Glu Met Ala Trp Leu Asp Ala Gly Asn Asn Gly Pro Cys Ala Ser Gly
290 295 300
Gln Gly Ser Pro Ser Val Ile Gln Ser Gln His Pro Asp Thr His Val
305 310 315 320
Val Phe Ser Asn Ile Arg Trp Gly Asp Ile Gly Ser Thr Thr Lys Asn
325 330 335
<210>19
<211>1480
<212>DNA
<213>Cladorrhinum foecundissimum
<400>19
gatccgaatt cctcctctcg ttctttagtc acagaccaga catctgccca cgatggttca 60
caagttcgcc ctcctcaccg gcctcgccgc ctccctcgca tctgcccagc agatcggcac 120
cgtcgtcccc gagtctcacc ccaagcttcc caccaagcgc tgcactctcg ccggtggctg 180
ccagaccgtc gacacctcca tcgtcatcga cgccttccag cgtcccctcc acaagatcgg 240
cgacccttcc actccttgcg tcgtcggcgg ccctctctgc cccgacgcca agtcctgcgc 300
tgagaactgc gcgctcgagg gtgtcgacta tgcctcctgg ggcatcaaga ccgagggcga 360
cgccctaact ctcaaccagt ggatgcccga cccggcgaac cctggccagt acaagacgac 420
tactccccgt acttaccttg ttgctgagga cggcaagaac tacgaggatg tgaagctcct 480
ggctaaggag atctcgtttg atgccgatgt cagcaacctt ccctgcggca tgaacggtgc 540
tttctacttg tctgagatgt tgatggatgg tggacgtggc gacctcaacc ctgctggtgc 600
cgagtatggt accggttact gtgatgcgca gtgcttcaag ttggatttca tcaacggcga 660
ggccaacatc gaccaaaagc acggcgcctg ctgcaacgaa atggacattt tcgaatccaa 720
ctcgcgcgcc aagaccttcg tcccccaccc ctgcaacatc acgcaggtct acaagtgcga 780
aggcgaagac gagtgcggcc agcccgtcgg cgtgtgcgac aagtgggggt gcggcttcaa 840
cgagtacaaa tggggcgtcg agtccttcta cggccggggc tcgcagttcg ccatcgactc 900
ctccaagaag ttcaccgtca ccacgcagtt cctgaccgac aacggcaagg aggacggcgt 960
cctcgtcgag atccgccgct tgtggcacca ggatggcaag ctgatcaaga acaccgctat 1020
ccaggttgag gagaactaca gcacggactc ggtgagcacc gagttctgcg agaagactgc 1080
ttctttcacc atgcagcgcg gtggtctcaa ggcgatgggc gaggctatcg gtcgtggtat 1140
ggtgctggtt ttcagcatct gggcggatga ttcgggtttt atgaactggt tggatgcgga 1200
gggtaatggc ccttgcagcg cgactgaggg cgatccgaag gagattgtca agaataagcc 1260
ggatgctagg gttacgttct caaacattag gattggtgag gttggtagca cgtatgctcc 1320
gggtgggaag tgcggtgtta agagcagggt tgctaggggg cttactgctt cttaaggggg 1380
gtgtgaagag aggaggaggt gttgttgggg gttggagatg ataattgggc gagatggtgt 1440
agagcgggtt ggttggatat gaatacgttg aattggatgt 1480
<210>20
<211>440
<212>PRT
<213>Cladorrhinum foecundissimum
<400>20
Met Val His Lys Phe Ala Leu Leu Thr Gly Leu Ala Ala Ser Leu Ala
1 5 10 15
Ser Ala Gln Gln Ile Gly Thr Val Val Pro Glu Ser His Pro Lys Leu
20 25 30
Pro Thr Lys Arg Cys Thr Leu Ala Gly Gly Cys Gln Thr Val Asp Thr
35 40 45
Ser Ile Val Ile Asp Ala Phe Gln Arg Pro Leu His Lys Ile Gly Asp
50 55 60
Pro Ser Thr Pro Cys Val Val Gly Gly Pro Leu Cys Pro Asp Ala Lys
65 70 75 80
Ser Cys Ala Glu Asn Cys Ala Leu Glu Gly Val Asp Tyr Ala Ser Trp
85 90 95
Gly Ile Lys Thr Glu Gly Asp Ala Leu Thr Leu Asn Gln Trp Met Pro
100 105 110
Asp Pro Ala Asn Pro Gly Gln Tyr Lys Thr Thr Thr Pro Arg Thr Tyr
115 120 125
Leu Val Ala Glu Asp Gly Lys Asn Tyr Glu Asp Val Lys Leu Leu Ala
130 135 140
Lys Glu Ile Ser Phe Asp Ala Asp Val Ser Asn Leu Pro Cys Gly Met
145 150 155 160
Asn Gly Ala Phe Tyr Leu Ser Glu Met Leu Met Asp Gly Gly Arg Gly
165 170 175
Asp Leu Asn Pro Ala Gly Ala Glu Tyr Gly Thr Gly Tyr Cys Asp Ala
180 185 190
Gln Cys Phe Lys Leu Asp Phe Ile Asn Gly Glu Ala Asn Ile Asp Gln
195 200 205
Lys His Gly Ala Cys Cys Asn Glu Met Asp Ile Phe Glu Ser Asn Ser
210 215 220
Arg Ala Lys Thr Phe Val Pro His Pro Cys Asn Ile Thr Gln Val Tyr
225 230 235 240
Lys Cys Glu Gly Glu Asp Glu Cys Gly Gln Pro Val Gly Val Cys Asp
245 250 255
Lys Trp Gly Cys Gly Phe Asn Glu Tyr Lys Trp Gly Val Glu Ser Phe
260 265 270
Tyr Gly Arg Gly Ser Gln Phe Ala Ile Asp Ser Ser Lys Lys Phe Thr
275 280 285
Val Thr Thr Gln Phe Leu Thr Asp Asn Gly Lys Glu Asp Gly Val Leu
290 295 300
Val Glu Ile Arg Arg Leu Trp His Gln Asp Gly Lys Leu Ile Lys Asn
305 310 315 320
Thr Ala Ile Gln Val Glu Glu Asn Tyr Ser Thr Asp Ser Val Ser Thr
325 330 335
Glu Phe Cys Glu Lys Thr Ala Ser Phe Thr Met Gln Arg Gly Gly Leu
340 345 350
Lys Ala Met Gly Glu Ala Ile Gly Arg Gly Met Val Leu Val Phe Ser
355 360 365
Ile Trp Ala Asp Asp Ser Gly Phe Met Asn Trp Leu Asp Ala Glu Gly
370 375 380
Asn Gly Pro Cys Ser Ala Thr Glu Gly Asp Pro Lys Glu Ile Val Lys
385 390 395 400
Asn Lys Pro Asp Ala Arg Val Thr Phe Ser Asn Ile Arg Ile Gly Glu
405 410 415
Val Gly Ser Thr Tyr Ala Pro Gly Gly Lys Cys Gly Val Lys Ser Arg
420 425 430
Val Ala Arg Gly Leu Thr Ala Ser
435 440
<210>21
<211>1380
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>21
atggcgccct cagttacact gccgttgacc acggccatcc tggccattgc ccggctcgtc 60
gccgcccagc aaccgggtac cagcaccccc gaggtccatc ccaagttgac aacctacaag 120
tgtacaaagt ccggggggtg cgtggcccag gacacctcgg tggtccttga ctggaactac 180
cgctggatgc acgacgcaaa ctacaactcg tgcaccgtca acggcggcgt caacaccacg 240
ctctgccctg acgaggcgac ctgtggcaag aactgcttca tcgagggcgt cgactacgcc 300
gcctcgggcg tcacgacctc gggcagcagc ctcaccatga accagtacat gcccagcagc 360
tctggcggct acagcagcgt ctctcctcgg ctgtatctcc tggactctga cggtgagtac 420
gtgatgctga agctcaacgg ccaggagctg agcttcgacg tcgacctctc tgctctgccg 480
tgtggagaga acggctcgct ctacctgtct cagatggacg agaacggggg cgccaaccag 540
tataacacgg ccggtgccaa ctacgggagc ggctactgcg atgctcagtg ccccgtccag 600
acatggagga acggcaccct caacactagc caccagggct tctgctgcaa cgagatggat 660
atcctggagg gcaactcgag ggcgaatgcc ttgacccctc actcttgcac ggccacggcc 720
tgcgactctg ccggttgcgg cttcaacccc tatggcagcg gctacaaaag ctactacggc 780
cccggagata ccgttgacac ctccaagacc ttcaccatca tcacccagtt caacacggac 840
aacggctcgc cctcgggcaa ccttgtgagc atcacccgca agtaccagca aaacggcgtc 900
gacatcccca gcgcccagcc cggcggcgac accatctcgt cctgcccgtc cgcctcagcc 960
tacggcggcc tcgccaccat gggcaaggcc ctgagcagcg gcatggtgct cgtgttcagc 1020
atttggaacg acaacagcca gtacatgaac tggctcgaca gcggcaacgc cggcccctgc 1080
agcagcaccg agggcaaccc atccaacatc ctggccaaca accccaacac gcacgtcgtc 1140
ttctccaaca tccgctgggg agacattggg tctactacga actcgactgc gcccccgccc 1200
ccgcctgcgt ccagcacgac gttttcgact acacggagga gctcgacgac ttcgagcagc 1260
ccgagctgca cgcagactca ctgggggcag tgcggtggca ttgggtacag cgggtgcaag 1320
acgtgcacgt cgggcactac gtgccagtat agcaacgact actactcgca atgcctttag 1380
<210>22
<211>459
<212>PRT
<213>里氏木霉
<400>22
Met Ala Pro Ser Val Thr Leu Pro Leu Thr Thr Ala Ile Leu Ala Ile
1 5 10 15
Ala Arg Leu Val Ala Ala Gln Gln Pro Gly Thr Ser Thr Pro Glu Val
20 25 30
His Pro Lys Leu Thr Thr Tyr Lys Cys Thr Lys Ser Gly Gly Cys Val
35 40 45
Ala Gln Asp Thr Ser Val Val Leu Asp Trp Asn Tyr Arg Trp Met His
50 55 60
Asp Ala Asn Tyr Asn Ser Cys Thr Val Asn Gly Gly Val Asn Thr Thr
65 70 75 80
Leu Cys Pro Asp Glu Ala Thr Cys Gly Lys Asn Cys Phe Ile Glu Gly
85 90 95
Val Asp Tyr Ala Ala Ser Gly Val Thr Thr Ser Gly Ser Ser Leu Thr
100 105 110
Met Asn Gln Tyr Met Pro Ser Ser Ser Gly Gly Tyr Ser Ser Val Ser
115 120 125
Pro Arg Leu Tyr Leu Leu Asp Ser Asp Gly Glu Tyr Val Met Leu Lys
130 135 140
Leu Asn Gly Gln Glu Leu Ser Phe Asp Val Asp Leu Ser Ala Leu Pro
145 150 155 160
Cys Gly Glu Asn Gly Ser Leu Tyr Leu Ser Gln Met Asp Glu Asn Gly
165 170 175
Gly Ala Asn Gln Tyr Asn Thr Ala Gly Ala Asn Tyr Gly Ser Gly Tyr
180 185 190
Cys Asp Ala Gln Cys Pro Val Gln Thr Trp Arg Asn Gly Thr Leu Asn
195 200 205
Thr Ser His Gln Gly Phe Cys Cys Asn Glu Met Asp Ile Leu Glu Gly
210 215 220
Asn Ser Arg Ala Asn Ala Leu Thr Pro His Ser Cys Thr Ala Thr Ala
225 230 235 240
Cys Asp Ser Ala Gly Cys Gly Phe Asn Pro Tyr Gly Ser Gly Tyr Lys
245 250 255
Ser Tyr Tyr Gly Pro Gly Asp Thr Val Asp Thr Ser Lys Thr Phe Thr
260 265 270
Ile Ile Thr Gln Phe Asn Thr Asp Asn Gly Ser Pro Ser Gly Asn Leu
275 280 285
Val Ser Ile Thr Arg Lys Tyr Gln Gln Asn Gly Val Asp Ile Pro Ser
290 295 300
Ala Gln Pro Gly Gly Asp Thr Ile Ser Ser Cys Pro Ser Ala Ser Ala
305 310 315 320
Tyr Gly Gly Leu Ala Thr Met Gly Lys Ala Leu Ser Ser Gly Met Val
325 330 335
Leu Val Phe Ser Ile Trp Asn Asp Asn Ser Gln Tyr Met Asn Trp Leu
340 345 350
Asp Ser Gly Asn Ala Gly Pro Cys Ser Ser Thr Glu Gly Asn Pro Ser
355 360 365
Asn Ile Leu Ala Asn Asn Pro Asn Thr His Val Val Phe Ser Asn Ile
370 375 380
Arg Trp Gly Asp Ile Gly Ser Thr Thr Asn Ser Thr Ala Pro Pro Pro
385 390 395 400
Pro Pro Ala Ser Ser Thr Thr Phe Ser Thr Thr Arg Arg Ser Ser Thr
405 410 415
Thr Ser Ser Ser Pro Ser Cys Thr Gln Thr His Trp Gly Gln Cys Gly
420 425 430
Gly Ile Gly Tyr Ser Gly Cys Lys Thr Cys Thr Ser Gly Thr Thr Cys
435 440 445
Gln Tyr Ser Asn Asp Tyr Tyr Ser Gln Cys Leu
450 455
<210>23
<211>1545
<212>DNA
<213>里氏木霉
<400>23
atgtatcgga agttggccgt catctcggcc ttcttggcca cagctcgtgc tcagtcggcc 60
tgcactctcc aatcggagac tcacccgcct ctgacatggc agaaatgctc gtctggtggc 120
acgtgcactc aacagacagg ctccgtggtc atcgacgcca actggcgctg gactcacgct 180
acgaacagca gcacgaactg ctacgatggc aacacttgga gctcgaccct atgtcctgac 240
aacgagacct gcgcgaagaa ctgctgtctg gacggtgccg cctacgcgtc cacgtacgga 300
gttaccacga gcggtaacag cctctccatt ggctttgtca cccagtctgc gcagaagaac 360
gttggcgctc gcctttacct tatggcgagc gacacgacct accaggaatt caccctgctt 420
ggcaacgagt tctctttcga tgttgatgtt tcgcagctgc cgtgcggctt gaacggagct 480
ctctacttcg tgtccatgga cgcggatggt ggcgtgagca agtatcccac caacaccgct 540
ggcgccaagt acggcacggg gtactgtgac agccagtgtc cccgcgatct gaagttcatc 600
aatggccagg ccaacgttga gggctgggag ccgtcatcca acaacgcgaa cacgggcatt 660
ggaggacacg gaagctgctg ctctgagatg gatatctggg aggccaactc catctccgag 720
gctcttaccc cccacccttg cacgactgtc ggccaggaga tctgcgaggg tgatgggtgc 780
ggcggaactt actccgataa cagatatggc ggcacttgcg atcccgatgg ctgcgactgg 840
aacccatacc gcctgggcaa caccagcttc tacggccctg gctcaagctt taccctcgat 900
accaccaaga aattgaccgt tgtcacccag ttcgagacgt cgggtgccat caaccgatac 960
tatgtccaga atggcgtcac tttccagcag cccaacgccg agcttggtag ttactctggc 1020
aacgagctca acgatgatta ctgcacagct gaggaggcag aattcggcgg atcctctttc 1080
tcagacaagg gcggcctgac tcagttcaag aaggctacct ctggcggcat ggttctggtc 1140
atgagtctgt gggatgatta ctacgccaac atgctgtggc tggactccac ctacccgaca 1200
aacgagacct cctccacacc cggtgccgtg cgcggaagct gctccaccag ctccggtgtc 1260
cctgctcagg tcgaatctca gtctcccaac gccaaggtca ccttctccaa catcaagttc 1320
ggacccattg gcagcaccgg caaccctagc ggcggcaacc ctcccggcgg aaacccgcct 1380
ggcaccacca ccacccgccg cccagccact accactggaa gctctcccgg acctacccag 1440
tctcactacg gccagtgcgg cggtattggc tacagcggcc ccacggtctg cgccagcggc 1500
acaacttgcc aggtcctgaa cccttactac tctcagtgcc tgtaa 1545
<210>24
<211>514
<212>PRT
<213>里氏木霉
<400>24
Met Tyr Arg Lys Leu Ala Val Ile Ser Ala Phe Leu Ala Thr Ala Arg
1 5 10 15
Ala Gln Ser Ala Cys Thr Leu Gln Ser Glu Thr His Pro Pro Leu Thr
20 25 30
Trp Gln Lys Cys Ser Ser Gly Gly Thr Cys Thr Gln Gln Thr Gly Ser
35 40 45
Val Val Ile Asp Ala Asn Trp Arg Trp Thr His Ala Thr Asn Ser Ser
50 55 60
Thr Asn Cys Tyr Asp Gly Asn Thr Trp Ser Ser Thr Leu Cys Pro Asp
65 70 75 80
Asn Glu Thr Cys Ala Lys Asn Cys Cys Leu Asp Gly Ala Ala Tyr Ala
85 90 95
Ser Thr Tyr Gly Val Thr Thr Ser Gly Asn Ser Leu Ser Ile Gly Phe
100 105 110
Val Thr Gln Ser Ala Gln Lys Asn Val Gly Ala Arg Leu Tyr Leu Met
115 120 125
Ala Ser Asp Thr Thr Tyr Gln Glu Phe Thr Leu Leu Gly Asn Glu Phe
130 135 140
Ser Phe Asp Val Asp Val Ser Gln Leu Pro Cys Gly Leu Asn Gly Ala
145 150 155 160
Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Val Ser Lys Tyr Pro
165 170 175
Thr Asn Thr Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln
180 185 190
Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu Gly
195 200 205
Trp Glu Pro Ser Ser Asn Asn Ala Asn Thr Gly Ile Gly Gly His Gly
210 215 220
Ser Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Glu
225 230 235 240
Ala Leu Thr Pro His Pro Cys Thr Thr Val Gly Gln Glu Ile Cys Glu
245 250 255
Gly Asp Gly Cys Gly Gly Thr Tyr Ser Asp Asn Arg Tyr Gly Gly Thr
260 265 270
Cys Asp Pro Asp Gly Cys Asp Trp Asn Pro Tyr Arg Leu Gly Asn Thr
275 280 285
Ser Phe Tyr Gly Pro Gly Ser Ser Phe Thr Leu Asp Thr Thr Lys Lys
290 295 300
Leu Thr Val Val Thr Gln Phe Glu Thr Ser Gly Ala Ile Asn Arg Tyr
305 310 315 320
Tyr Val Gln Asn Gly Val Thr Phe Gln Gln Pro Asn Ala Glu Leu Gly
325 330 335
Ser Tyr Ser Gly Asn Glu Leu Asn Asp Asp Tyr Cys Thr Ala Glu Glu
340 345 350
Ala Glu Phe Gly Gly Ser Ser Phe Ser Asp Lys Gly Gly Leu Thr Gln
355 360 365
Phe Lys Lys Ala Thr Ser Gly Gly Met Val Leu Val Met Ser Leu Trp
370 375 380
Asp Asp Tyr Tyr Ala Asn Met Leu Trp Leu Asp Ser Thr Tyr Pro Thr
385 390 395 400
Asn Glu Thr Ser Ser Thr Pro Gly Ala Val Arg Gly Ser Cys Ser Thr
405 410 415
Ser Ser Gly Val Pro Ala Gln Val Glu Ser Gln Ser Pro Asn Ala Lys
420 425 430
Val Thr Phe Ser Asn Ile Lys Phe Gly Pro Ile Gly Ser Thr Gly Asn
435 440 445
Pro Ser Gly Gly Asn Pro Pro Gly Gly Asn Pro Pro Gly Thr Thr Thr
450 455 460
Thr Arg Arg Pro Ala Thr Thr Thr Gly Ser Ser Pro Gly Pro Thr Gln
465 470 475 480
Ser His Tyr Gly Gln Cys Gly Gly Ile Gly Tyr Ser Gly Pro Thr Val
485 490 495
Cys Ala Ser Gly Thr Thr Cys Gln Val Leu Asn Pro Tyr Tyr Ser Gln
500 505 510
Cys Leu
<210>25
<211>1611
<212>DNA
<213>里氏木霉
<400>25
atgattgtcg gcattctcac cacgctggct acgctggcca cactcgcagc tagtgtgcct 60
ctagaggagc ggcaagcttg ctcaagcgtc tggtaattat gtgaaccctc tcaagagacc 120
caaatactga gatatgtcaa ggggccaatg tggtggccag aattggtcgg gtccgacttg 180
ctgtgcttcc ggaagcacat gcgtctactc caacgactat tactcccagt gtcttcccgg 240
cgctgcaagc tcaagctcgt ccacgcgcgc cgcgtcgacg acttctcgag tatcccccac 300
aacatcccgg tcgagctccg cgacgcctcc acctggttct actactacca gagtacctcc 360
agtcggatcg ggaaccgcta cgtattcagg caaccctttt gttggggtca ctccttgggc 420
caatgcatat tacgcctctg aagttagcag cctcgctatt cctagcttga ctggagccat 480
ggccactgct gcagcagctg tcgcaaaggt tccctctttt atgtggctgt aggtcctccc 540
ggaaccaagg caatctgtta ctgaaggctc atcattcact gcagagatac tcttgacaag 600
acccctctca tggagcaaac cttggccgac atccgcaccg ccaacaagaa tggcggtaac 660
tatgccggac agtttgtggt gtatgacttg ccggatcgcg attgcgctgc ccttgcctcg 720
aatggcgaat actctattgc cgatggtggc gtcgccaaat ataagaacta tatcgacacc 780
attcgtcaaa ttgtcgtgga atattccgat atccggaccc tcctggttat tggtatgagt 840
ttaaacacct gcctcccccc ccccttccct tcctttcccg ccggcatctt gtcgttgtgc 900
taactattgt tccctcttcc agagcctgac tctcttgcca acctggtgac caacctcggt 960
actccaaagt gtgccaatgc tcagtcagcc taccttgagt gcatcaacta cgccgtcaca 1020
cagctgaacc ttccaaatgt tgcgatgtat ttggacgctg gccatgcagg atggcttggc 1080
tggccggcaa accaagaccc ggccgctcag ctatttgcaa atgtttacaa gaatgcatcg 1140
tctccgagag ctcttcgcgg attggcaacc aatgtcgcca actacaacgg gtggaacatt 1200
accagccccc catcgtacac gcaaggcaac gctgtctaca acgagaagct gtacatccac 1260
gctattggac gtcttcttgc caatcacggc tggtccaacg ccttcttcat cactgatcaa 1320
ggtcgatcgg gaaagcagcc taccggacag caacagtggg gagactggtg caatgtgatc 1380
ggcaccggat ttggtattcg cccatccgca aacactgggg actcgttgct ggattcgttt 1440
gtctgggtca agccaggcgg cgagtgtgac ggcaccagcg acagcagtgc gccacgattt 1500
gactcccact gtgcgctccc agatgccttg caaccggcgc ctcaagctgg tgcttggttc 1560
caagcctact ttgtgcagct tctcacaaac gcaaacccat cgttcctgta a 1611
<210>26
<211>471
<212>PRT
<213>里氏木霉
<400>26
Met Ile Val Gly Ile Leu Thr Thr Leu Ala Thr Leu Ala Thr Leu Ala
1 5 10 15
Ala Ser Val Pro Leu Glu Glu Arg Gln Ala Cys Ser Ser Val Trp Gly
20 25 30
Gln Cys Gly Gly Gln Asn Trp Ser Gly Pro Thr Cys Cys Ala Ser Gly
35 40 45
Ser Thr Cys Val Tyr Ser Asn Asp Tyr Tyr Ser Gln Cys Leu Pro Gly
50 55 60
Ala Ala Ser Ser Ser Ser Ser Thr Arg Ala Ala Ser Thr Thr Ser Arg
65 70 75 80
Val Ser Pro Thr Thr Ser Arg Ser Ser Ser Ala Thr Pro Pro Pro Gly
85 90 95
Ser Thr Thr Thr Arg Val Pro Pro Val Gly Ser Gly Thr Ala Thr Tyr
100 105 110
Ser Gly Asn Pro Phe Val Gly Val Thr Pro Trp Ala Asn Ala Tyr Tyr
115 120 125
Ala Ser Glu Val Ser Ser Leu Ala Ile Pro Ser Leu Thr Gly Ala Met
130 135 140
Ala Thr Ala Ala Ala Ala Val Ala Lys Val Pro Ser Phe Met Trp Leu
145 150 155 160
Asp Thr Leu Asp Lys Thr Pro Leu Met Glu Gln Thr Leu Ala Asp Ile
165 170 175
Arg Thr Ala Asn Lys Asn Gly Gly Asn Tyr Ala Gly Gln Phe Val Val
180 185 190
Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Leu Ala Ser Asn Gly Glu
195 200 205
Tyr Ser Ile Ala Asp Gly Gly Val Ala Lys Tyr Lys Asn Tyr Ile Asp
210 215 220
Thr Ile Arg Gln Ile Val Val Glu Tyr Ser Asp Ile Arg Thr Leu Leu
225 230 235 240
Val Ile Glu Pro Asp Ser Leu Ala Asn Leu Val Thr Asn Leu Gly Thr
245 250 255
Pro Lys Cys Ala Asn Ala Gln Ser Ala Tyr Leu Glu Cys Ile Asn Tyr
260 265 270
Ala Val Thr Gln Leu Asn Leu Pro Asn Val Ala Met Tyr Leu Asp Ala
275 280 285
Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Gln Asp Pro Ala Ala
290 295 300
Gln Leu Phe Ala Asn Val Tyr Lys Asn Ala Ser Ser Pro Arg Ala Leu
305 310 315 320
Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Gly Trp Asn Ile Thr
325 330 335
Ser Pro Pro Ser Tyr Thr Gln Gly Asn Ala Val Tyr Asn Glu Lys Leu
340 345 350
Tyr Ile His Ala Ile Gly Arg Leu Leu Ala Asn His Gly Trp Ser Asn
355 360 365
Ala Phe Phe Ile Thr Asp Gln Gly Arg Ser Gly Lys Gln Pro Thr Gly
370 375 380
Gln Gln Gln Trp Gly Asp Trp Cys Asn Val Ile Gly Thr Gly Phe Gly
385 390 395 400
Ile Arg Pro Ser Ala Asn Thr Gly Asp Ser Leu Leu Asp Ser Phe Val
405 410 415
Trp Val Lys Pro Gly Gly Glu Cys Asp Gly Thr Ser Asp Ser Ser Ala
420 425 430
Pro Arg Phe Asp Ser His Cys Ala Leu Pro Asp Ala Leu Gln Pro Ala
435 440 445
Pro Gln Ala Gly Ala Trp Phe Gln Ala Tyr Phe Val Gln Leu Leu Thr
450 455 460
Asn Ala Asn Pro Ser Phe Leu
465 470
<210>27
<211>2046
<212>DNA
<213>特异腐质霉
<400>27
gccgtgacct tgcgcgcttt gggtggcggt ggcgagtcgt ggacggtgct tgctggtcgc 60
cggccttccc ggcgatccgc gtgatgagag ggccaccaac ggcgggatga tgctccatgg 120
ggaacttccc catggagaag agagagaaac ttgcggagcc gtgatctggg gaaagatgct 180
ccgtgtctcg tctatataac tcgagtctcc ccgagccctc aacaccacca gctctgatct 240
caccatcccc atcgacaatc acgcaaacac agcagttgtc gggccattcc ttcagacaca 300
tcagtcaccc tccttcaaaa tgcgtaccgc caagttcgcc accctcgccg cccttgtggc 360
ctcggccgcc gcccagcagg cgtgcagtct caccaccgag aggcaccctt ccctctcttg 420
gaacaagtgc accgccggcg gccagtgcca gaccgtccag gcttccatca ctctcgactc 480
caactggcgc tggactcacc aggtgtctgg ctccaccaac tgctacacgg gcaacaagtg 540
ggatactagc atctgcactg atgccaagtc gtgcgctcag aactgctgcg tcgatggtgc 600
cgactacacc agcacctatg gcatcaccac caacggtgat tccctgagcc tcaagttcgt 660
caccaagggc cagcactcga ccaacgtcgg ctcgcgtacc tacctgatgg acggcgagga 720
caagtatcag agtacgttct atcttcagcc ttctcgcgcc ttgaatcctg gctaacgttt 780
acacttcaca gccttcgagc tcctcggcaa cgagttcacc ttcgatgtcg atgtctccaa 840
catcggctgc ggtctcaacg gcgccctgta cttcgtctcc atggacgccg atggtggtct 900
cagccgctat cctggcaaca aggctggtgc caagtacggt accggctact gcgatgctca 960
gtgcccccgt gacatcaagt tcatcaacgg cgaggccaac attgagggct ggaccggctc 1020
caccaacgac cccaacgccg gcgcgggccg ctatggtacc tgctgctctg agatggatat 1080
ctgggaagcc aacaacatgg ctactgcctt cactcctcac ccttgcacca tcattggcca 1140
gagccgctgc gagggcgact cgtgcggtgg cacctacagc aacgagcgct acgccggcgt 1200
ctgcgacccc gatggctgcg acttcaactc gtaccgccag ggcaacaaga ccttctacgg 1260
caagggcatg accgtcgaca ccaccaagaa gatcactgtc gtcacccagt tcctcaagga 1320
tgccaacggc gatctcggcg agatcaagcg cttctacgtc caggatggca agatcatccc 1380
caactccgag tccaccatcc ccggcgtcga gggcaattcc atcacccagg actggtgcga 1440
ccgccagaag gttgcctttg gcgacattga cgacttcaac cgcaagggcg gcatgaagca 1500
gatgggcaag gccctcgccg gccccatggt cctggtcatg tccatctggg atgaccacgc 1560
ctccaacatg ctctggctcg actcgacctt ccctgtcgat gccgctggca agcccggcgc 1620
cgagcgcggt gcctgcccga ccacctcggg tgtccctgct gaggttgagg ccgaggcccc 1680
caacagcaac gtcgtcttct ccaacatccg cttcggcccc atcggctcga ccgttgctgg 1740
tctccccggc gcgggcaacg gcggcaacaa cggcggcaac cccccgcccc ccaccaccac 1800
cacctcctcg gctccggcca ccaccaccac cgccagcgct ggccccaagg ctggccgctg 1860
gcagcagtgc ggcggcatcg gcttcactgg cccgacccag tgcgaggagc cctacatttg 1920
caccaagctc aacgactggt actctcagtg cctgtaaatt ctgagtcgct gactcgacga 1980
tcacggccgg tttttgcatg aaaggaaaca aacgaccgcg ataaaaatgg agggtaatga 2040
gatgtc 2046
<210>28
<211>525
<212>PRT
<213>特异腐质霉
<400>28
Met Arg Thr Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Ser Ala
1 5 10 15
Ala Ala Gln Gln Ala Cys Ser Leu Thr Thr Glu Arg His Pro Ser Leu
20 25 30
Ser Trp Asn Lys Cys Thr Ala Gly Gly Gln Cys Gln Thr Val Gln Ala
35 40 45
Ser Ile Thr Leu Asp Ser Asn Trp Arg Trp Thr His Gln Val Ser Gly
50 55 60
Ser Thr Asn Cys Tyr Thr Gly Asn Lys Trp Asp Thr Ser Ile Cys Thr
65 70 75 80
Asp Ala Lys Ser Cys Ala Gln Asn Cys Cys Val Asp Gly Ala Asp Tyr
85 90 95
Thr Ser Thr Tyr Gly Ile Thr Thr Asn Gly Asp Ser Leu Ser Leu Lys
100 105 110
Phe Val Thr Lys Gly Gln His Ser Thr Asn Val Gly Ser Arg Thr Tyr
115 120 125
Leu Met Asp Gly Glu Asp Lys Tyr Gln Thr Phe Glu Leu Leu Gly Asn
130 135 140
Glu Phe Thr Phe Asp Val Asp Val Ser Asn Ile Gly Cys Gly Leu Asn
145 150 155 160
Gly Ala Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Leu Ser Arg
165 170 175
Tyr Pro Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp
180 185 190
Ala Gln Cys Pro Arg Asp Ile Lys Phe Ile Asn Gly Glu Ala Asn Ile
195 200 205
Glu Gly Trp Thr Gly Ser Thr Asn Asp Pro Asn Ala Gly Ala Gly Arg
210 215 220
Tyr Gly Thr Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Asn Met
225 230 235 240
Ala Thr Ala Phe Thr Pro His Pro Cys Thr Ile Ile Gly Gln Ser Arg
245 250 255
Cys Glu Gly Asp Ser Cys Gly Gly Thr Tyr Ser Asn Glu Arg Tyr Ala
260 265 270
Gly Val Cys Asp Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Gln Gly
275 280 285
Asn Lys Thr Phe Tyr Gly Lys Gly Met Thr Val Asp Thr Thr Lys Lys
290 295 300
Ile Thr Val Val Thr Gln Phe Leu Lys Asp Ala Asn Gly Asp Leu Gly
305 310 315 320
Glu Ile Lys Arg Phe Tyr Val Gln Asp Gly Lys Ile Ile Pro Asn Ser
325 330 335
Glu Ser Thr Ile Pro Gly Val Glu Gly Asn Ser Ile Thr Gln Asp Trp
340 345 350
Cys Asp Arg Gln Lys Val Ala Phe Gly Asp Ile Asp Asp Phe Asn Arg
355 360 365
Lys Gly Gly Met Lys Gln Met Gly Lys Ala Leu Ala Gly Pro Met Val
370 375 380
Leu Val Met Ser Ile Trp Asp Asp His Ala Ser Asn Met Leu Trp Leu
385 390 395 400
Asp Ser Thr Phe Pro Val Asp Ala Ala Gly Lys Pro Gly Ala Glu Arg
405 410 415
Gly Ala Cys Pro Thr Thr Ser Gly Val Pro Ala Glu Val Glu Ala Glu
420 425 430
Ala Pro Asn Ser Asn Val Val Phe Ser Asn Ile Arg Phe Gly Pro Ile
435 440 445
Gly Ser Thr Val Ala Gly Leu Pro Gly Ala Gly Asn Gly Gly Asn Asn
450 455 460
Gly Gly Asn Pro Pro Pro Pro Thr Thr Thr Thr Ser Ser Ala Pro Ala
465 470 475 480
Thr Thr Thr Thr Ala Ser Ala Gly Pro Lys Ala Gly Arg Trp Gln Gln
485 490 495
Cys Gly Gly Ile Gly Phe Thr Gly Pro Thr Gln Cys Glu Glu Pro Tyr
500 505 510
Ile Cys Thr Lys Leu Asn Asp Trp Tyr Ser Gln Cys Leu
515 520 525
<210>29
<211>1812
<212>DNA
<213>嗜热毁丝霉
<400>29
atggccaaga agcttttcat caccgccgcc cttgcggctg ccgtgttggc ggcccccgtc 60
attgaggagc gccagaactg cggcgctgtg tggtaagaaa gcccggtctg agtttcccat 120
gactttctca tcgagtaatg gcataaggcc caccccttcg actgactgtg agaatcgatc 180
aaatccagga ctcaatgcgg cggcaacggg tggcagggtc ccacatgctg cgcctcgggc 240
tcgacctgcg ttgcgcagaa cgagtggtac tctcagtgcc tgcccaacaa tcaggtgacg 300
agttccaaca ctccgtcgtc gacttccacc tcgcagcgca gcagcagcac ctccagcagc 360
agcaccagga gcggcagctc ctcctcctcc accaccacgc cccctcccgt ctccagcccc 420
gtgactagca ttcccggcgg tgcgaccacc acggcgagct actctggcaa ccccttctcg 480
ggcgtccggc tcttcgccaa cgactactac aggtccgagg tccacaatct cgccattcct 540
agcatgaccg gtactctggc ggccaaggct tccgccgtcg ccgaagtccc tagcttccag 600
tggctcgacc ggaacgtcac catcgacacc ctgatggtcc agactctgtc ccagatccgg 660
gctgccaata atgccggtgc caatcctccc tatgctggtg agttacatgg cggcgacttg 720
ccttctcgtc ccccaccttt cttgacggga tcggttacct gacctggagg caaaacaaaa 780
ccagcccaac ttgtcgtcta cgacctcccc gaccgtgact gcgccgccgc tgcgtccaac 840
ggcgagtttt cgattgcaaa cggcggcgcc gccaactaca ggagctacat cgacgctatc 900
cgcaagcaca tcattgagta ctcggacatc cggatcatcc tggttatcga gcccgactcg 960
atggccaaca tggtgaccaa catgaacgtg gccaagtgca gcaacgccgc gtcgacgtac 1020
cacgagttga ccgtgtacgc gctcaagcag ctgaacctgc ccaacgtcgc catgtatctc 1080
gacgccggcc acgccggctg gctcggctgg cccgccaaca tccagcccgc cgccgacctg 1140
tttgccggca tctacaatga cgccggcaag ccggctgccg tccgcggcct ggccactaac 1200
gtcgccaact acaacgcctg gagtatcgct tcggccccgt cgtacacgtc ccctaaccct 1260
aactacgacg agaagcacta catcgaggcc ttcagcccgc tcctgaacgc ggccggcttc 1320
cccgcacgct tcattgtcga cactggccgc aacggcaaac aacctaccgg tatggttttt 1380
ttcttttttt ttctctgttc ccctccccct tccccttcag ttggcgtcca caaggtctct 1440
tagtcttgct tcttctcgga ccaaccttcc cccaccccca aaacgcaccg cccacaaccg 1500
ttcgactcta tactcttggg aatgggcgcc gaaactgacc gttcgacagg ccaacaacag 1560
tggggtgact ggtgcaatgt caagggcact ggctttggcg tgcgcccgac ggccaacacg 1620
ggccacgacc tggtcgatgc ctttgtctgg gtcaagcccg gcggcgagtc cgacggcaca 1680
agcgacacca gcgccgcccg ctacgactac cactgcggcc tgtccgatgc cctgcagcct 1740
gctccggagg ctggacagtg gttccaggcc tacttcgagc agctgctcac caacgccaac 1800
ccgcccttct aa 1812
<210>30
<211>482
<212>PRT
<213>嗜热毁丝霉
<400>30
Met Ala Lys Lys Leu Phe Ile Thr Ala Ala Leu Ala Ala Ala Val Leu
1 5 10 15
Ala Ala Pro Val Ile Glu Glu Arg Gln Asn Cys Gly Ala Val Trp Thr
20 25 30
Gln Cys Gly Gly Asn Gly Trp Gln Gly Pro Thr Cys Cys Ala Ser Gly
35 40 45
Ser Thr Cys Val Ala Gln Asn Glu Trp Tyr Ser Gln Cys Leu Pro Asn
50 55 60
Asn Gln Val Thr Ser Ser Asn Thr Pro Ser Ser Thr Ser Thr Ser Gln
65 70 75 80
Arg Ser Ser Ser Thr Ser Ser Ser Ser Thr Arg Ser Gly Ser Ser Ser
85 90 95
Ser Ser Thr Thr Thr Pro Pro Pro Val Ser Ser Pro Val Thr Ser Ile
100 105 110
Pro Gly Gly Ala Thr Thr Thr Ala Ser Tyr Ser Gly Asn Pro Phe Ser
115 120 125
Gly Val Arg Leu Phe Ala Asn Asp Tyr Tyr Arg Ser Glu Val His Asn
130 135 140
Leu Ala Ile Pro Ser Met Thr Gly Thr Leu Ala Ala Lys Ala Ser Ala
145 150 155 160
Val Ala Glu Val Pro Ser Phe Gln Trp Leu Asp Arg Asn Val Thr Ile
165 170 175
Asp Thr Leu Met Val Gln Thr Leu Ser Gln Ile Arg Ala Ala Asn Asn
180 185 190
Ala Gly Ala Asn Pro Pro Tyr Ala Ala Gln Leu Val Val Tyr Asp Leu
195 200 205
Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser Asn Gly Glu Phe Ser Ile
210 215 220
Ala Asn Gly Gly Ala Ala Asn Tyr Arg Ser Tyr Ile Asp Ala Ile Arg
225 230 235 240
Lys His Ile Ile Glu Tyr Ser Asp Ile Arg Ile Ile Leu Val Ile Glu
245 250 255
Pro Asp Ser Met Ala Asn Met Val Thr Asn Met Asn Val Ala Lys Cys
260 265 270
Ser Asn Ala Ala Ser Thr Tyr His Glu Leu Thr Val Tyr Ala Leu Lys
275 280 285
Gln Leu Asn Leu Pro Asn Val Ala Met Tyr Leu Asp Ala Gly His Ala
290 295 300
Gly Trp Leu Gly Trp Pro Ala Asn Ile Gln Pro Ala Ala Asp Leu Phe
305 310 315 320
Ala Gly Ile Tyr Asn Asp Ala Gly Lys Pro Ala Ala Val Arg Gly Leu
325 330 335
Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp Ser Ile Ala Ser Ala Pro
340 345 350
Ser Tyr Thr Ser Pro Asn Pro Asn Tyr Asp Glu Lys His Tyr Ile Glu
355 360 365
Ala Phe Ser Pro Leu Leu Asn Ala Ala Gly Phe Pro Ala Arg Phe Ile
370 375 380
Val Asp Thr Gly Arg Asn Gly Lys Gln Pro Thr Gly Gln Gln Gln Trp
385 390 395 400
Gly Asp Trp Cys Asn Val Lys Gly Thr Gly Phe Gly Val Arg Pro Thr
405 410 415
Ala Asn Thr Gly His Asp Leu Val Asp Ala Phe Val Trp Val Lys Pro
420 425 430
Gly Gly Glu Ser Asp Gly Thr Ser Asp Thr Ser Ala Ala Arg Tyr Asp
435 440 445
Tyr His Cys Gly Leu Ser Asp Ala Leu Gln Pro Ala Pro Glu Ala Gly
450 455 460
Gln Trp Phe Gln Ala Tyr Phe Glu Gln Leu Leu Thr Asn Ala Asn Pro
465 470 475 480
Pro Phe
<210>31
<211>1446
<212>DNA
<213>土生梭孢壳
<400>31
atggctcaga agctccttct cgccgccgcc cttgcggcca gcgccctcgc tgctcccgtc 60
gtcgaggagc gccagaactg cggttccgtc tggagccaat gcggcggcat tggctggtcc 120
ggcgcgacct gctgcgcttc gggcaatacc tgcgttgagc tgaacccgta ctactcgcag 180
tgcctgccca acagccaggt gactacctcg accagcaaga ccacctccac caccaccagg 240
agcagcacca ccagccacag cagcggtccc accagcacga gcaccaccac caccagcagt 300
cccgtggtca ctaccccgcc gagtacctcc atccccggcg gtgcctcgtc aacggccagc 360
tggtccggca acccgttctc gggcgtgcag atgtgggcca acgactacta cgcctccgag 420
gtctcgtcgc tggccatccc cagcatgacg ggcgccatgg ccaccaaggc ggccgaggtg 480
gccaaggtgc ccagcttcca gtggcttgac cgcaacgtca ccatcgacac gctgttcgcc 540
cacacgctgt cgcagatccg cgcggccaac cagaaaggcg ccaacccgcc ctacgcgggc 600
atcttcgtgg tctacgacct tccggaccgc gactgcgccg ccgccgcgtc caacggcgag 660
ttctccatcg cgaacaacgg ggcggccaac tacaagacgt acatcgacgc gatccggagc 720
ctcgtcatcc agtactcaga catccgcatc atcttcgtca tcgagcccga ctcgctggcc 780
aacatggtga ccaacctgaa cgtggccaag tgcgccaacg ccgagtcgac ctacaaggag 840
ttgaccgtct acgcgctgca gcagctgaac ctgcccaacg tggccatgta cctggacgcc 900
ggccacgccg gctggctcgg ctggcccgcc aacatccagc cggccgccaa cctcttcgcc 960
gagatctaca cgagcgccgg caagccggcc gccgtgcgcg gcctcgccac caacgtggcc 1020
aactacaacg gctggagcct ggccacgccg ccctcgtaca cccagggcga ccccaactac 1080
gacgagagcc actacgtcca ggccctcgcc ccgctgctca ccgccaacgg cttccccgcc 1140
cacttcatca ccgacaccgg ccgcaacggc aagcagccga ccggacaacg gcaatgggga 1200
gactggtgca acgttatcgg aactggcttc ggcgtgcgcc cgacgacaaa caccggcctc 1260
gacatcgagg acgccttcgt ctgggtcaag cccggcggcg agtgcgacgg cacgagcaac 1320
acgacctctc cccgctacga ctaccactgc ggcctgtcgg acgcgctgca gcctgctccg 1380
gaggccggca cttggttcca ggcctacttc gagcagctcc tgaccaacgc caacccgccc 1440
ttttaa 1446
<210>32
<211>481
<212>PRT
<213>土生梭孢壳
<400>32
Met Ala Gln Lys Leu Leu Leu Ala Ala Ala Leu Ala Ala Ser Ala Leu
1 5 10 15
Ala Ala Pro Val Val Glu Glu Arg Gln Asn Cys Gly Ser Val Trp Ser
20 25 30
Gln Cys Gly Gly Ile Gly Trp Ser Gly Ala Thr Cys Cys Ala Ser Gly
35 40 45
Asn Thr Cys Val Glu Leu Asn Pro Tyr Tyr Ser Gln Cys Leu Pro Asn
50 55 60
Ser Gln Val Thr Thr Ser Thr Ser Lys Thr Thr Ser Thr Thr Thr Arg
65 70 75 80
Ser Ser Thr Thr Ser His Ser Ser Gly Pro Thr Ser Thr Ser Thr Thr
85 90 95
Thr Thr Ser Ser Pro Val Val Thr Thr Pro Pro Ser Thr Ser Ile Pro
100 105 110
Gly Gly Ala Ser Ser Thr Ala Ser Trp Ser Gly Asn Pro Phe Ser Gly
115 120 125
Val Gln Met Trp Ala Asn Asp Tyr Tyr Ala Ser Glu Val Ser Ser Leu
130 135 140
Ala Ile Pro Ser Met Thr Gly Ala Met Ala Thr Lys Ala Ala Glu Val
145 150 155 160
Ala Lys Val Pro Ser Phe Gln Trp Leu Asp Arg Asn Val Thr Ile Asp
165 170 175
Thr Leu Phe Ala His Thr Leu Ser Gln Ile Arg Ala Ala Asn Gln Lys
180 185 190
Gly Ala Asn Pro Pro Tyr Ala Gly Ile Phe Val Val Tyr Asp Leu Pro
195 200 205
Asp Arg Asp Cys Ala Ala Ala Ala Ser Asn Gly Glu Phe Ser Ile Ala
210 215 220
Asn Asn Gly Ala Ala Asn Tyr Lys Thr Tyr Ile Asp Ala Ile Arg Ser
225 230 235 240
Leu Val Ile Gln Tyr Ser Asp Ile Arg Ile Ile Phe Val Ile Glu Pro
245 250 255
Asp Ser Leu Ala Asn Met Val Thr Asn Leu Asn Val Ala Lys Cys Ala
260 265 270
Asn Ala Glu Ser Thr Tyr Lys Glu Leu Thr Val Tyr Ala Leu Gln Gln
275 280 285
Leu Asn Leu Pro Asn Val Ala Met Tyr Leu Asp Ala Gly His Ala Gly
290 295 300
Trp Leu Gly Trp Pro Ala Asn Ile Gln Pro Ala Ala Asn Leu Phe Ala
305 310 315 320
Glu Ile Tyr Thr Ser Ala Gly Lys Pro Ala Ala Val Arg Gly Leu Ala
325 330 335
Thr Asn Val Ala Asn Tyr Asn Gly Trp Ser Leu Ala Thr Pro Pro Ser
340 345 350
Tyr Thr Gln Gly Asp Pro Asn Tyr Asp Glu Ser His Tyr Val Gln Ala
355 360 365
Leu Ala Pro Leu Leu Thr Ala Asn Gly Phe Pro Ala His Phe Ile Thr
370 375 380
Asp Thr Gly Arg Asn Gly Lys Gln Pro Thr Gly Gln Arg Gln Trp Gly
385 390 395 400
Asp Trp Cys Asn Val Ile Gly Thr Gly Phe Gly Val Arg Pro Thr Thr
405 410 415
Asn Thr Gly Leu Asp Ile Glu Asp Ala Phe Val Trp Val Lys Pro Gly
420 425 430
Gly Glu Cys Asp Gly Thr Ser Asn Thr Thr Ser Pro Arg Tyr Asp Tyr
435 440 445
His Cys Gly Leu Ser Asp Ala Leu Gln Pro Ala Pro Glu Ala Gly Thr
450 455 460
Trp Phe Gln Ala Tyr Phe Glu Gln Leu Leu Thr Asn Ala Asn Pro Pro
465 470 475 480
Phe
<210>33
<211>1593
<212>DNA
<213>嗜热毛壳菌(Chaetomium thermophilum)
<400>33
atgatgtaca agaagttcgc cgctctcgcc gccctcgtgg ctggcgccgc cgcccagcag 60
gcttgctccc tcaccactga gacccacccc agactcactt ggaagcgctg cacctctggc 120
ggcaactgct cgaccgtgaa cggcgccgtc accatcgatg ccaactggcg ctggactcac 180
actgtttccg gctcgaccaa ctgctacacc ggcaacgagt gggatacctc catctgctct 240
gatggcaaga gctgcgccca gacctgctgc gtcgacggcg ctgactactc ttcgacctat 300
ggtatcacca ccagcggtga ctccctgaac ctcaagttcg tcaccaagca ccagcacggc 360
accaatgtcg gctctcgtgt ctacctgatg gagaacgaca ccaagtacca gatgttcgag 420
ctcctcggca acgagttcac cttcgatgtc gatgtctcta acctgggctg cggtctcaac 480
ggcgccctct acttcgtctc catggacgct gatggtggta tgagcaagta ctctggcaac 540
aaggctggcg ccaagtacgg taccggctac tgcgatgctc agtgcccgcg cgaccttaag 600
ttcatcaacg gcgaggccaa cattgagaac tggacccctt cgaccaatga tgccaacgcc 660
ggtttcggcc gctatggcag ctgctgctct gagatggata tctgggatgc caacaacatg 720
gctactgcct tcactcctca cccttgcacc attatcggcc agagccgctg cgagggcaac 780
agctgcggtg gcacctacag ctctgagcgc tatgctggtg tttgcgatcc tgatggctgc 840
gacttcaacg cctaccgcca gggcgacaag accttctacg gcaagggcat gaccgtcgac 900
accaccaaga agatgaccgt cgtcacccag ttccacaaga actcggctgg cgtcctcagc 960
gagatcaagc gcttctacgt tcaggacggc aagatcattg ccaacgccga gtccaagatc 1020
cccggcaacc ccggcaactc catcacccag gagtggtgcg atgcccagaa ggtcgccttc 1080
ggtgacatcg atgacttcaa ccgcaagggc ggtatggctc agatgagcaa ggccctcgag 1140
ggccctatgg tcctggtcat gtccgtctgg gatgaccact acgccaacat gctctggctc 1200
gactcgacct accccattga caaggccggc acccccggcg ccgagcgcgg tgcttgcccg 1260
accacctccg gtgtccctgc cgagattgag gcccaggtcc ccaacagcaa cgttatcttc 1320
tccaacatcc gcttcggccc catcggctcg accgtccctg gcctcgacgg cagcaccccc 1380
agcaacccga ccgccaccgt tgctcctccc acttctacca ccaccagcgt gagaagcagc 1440
actactcaga tttccacccc gactagccag cccggcggct gcaccaccca gaagtggggc 1500
cagtgcggtg gtatcggcta caccggctgc actaactgcg ttgctggcac tacctgcact 1560
gagctcaacc cctggtacag ccagtgcctg taa 1593
<210>34
<211>530
<212>PRT
<213>嗜热毛壳菌
<400>34
Met Met Tyr Lys Lys Phe Ala Ala Leu Ala Ala Leu Val Ala Gly Ala
1 5 10 15
Ala Ala Gln Gln Ala Cys Ser Leu Thr Thr Glu Thr His Pro Arg Leu
20 25 30
Thr Trp Lys Arg Cys Thr Ser Gly Gly Asn Cys Ser Thr Val Asn Gly
35 40 45
Ala Val Thr Ile Asp Ala Asn Trp Arg Trp Thr His Thr Val Ser Gly
50 55 60
Ser Thr Asn Cys Tyr Thr Gly Asn Glu Trp Asp Thr Ser Ile Cys Ser
65 70 75 80
Asp Gly Lys Ser Cys Ala Gln Thr Cys Cys Val Asp Gly Ala Asp Tyr
85 90 95
Ser Ser Thr Tyr Gly Ile Thr Thr Ser Gly Asp Ser Leu Asn Leu Lys
100 105 110
Phe Val Thr Lys His Gln His Gly Thr Asn Val Gly Ser Arg Val Tyr
115 120 125
Leu Met Glu Asn Asp Thr Lys Tyr Gln Met Phe Glu Leu Leu Gly Asn
130 135 140
Glu Phe Thr Phe Asp Val Asp Val Ser Asn Leu Gly Cys Gly Leu Asn
145 150 155 160
Gly Ala Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Met Ser Lys
165 170 175
Tyr Ser Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp
180 185 190
Ala Gln Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Glu Ala Asn Ile
195 200 205
Glu Asn Trp Thr Pro Ser Thr Asn Asp Ala Asn Ala Gly Phe Gly Arg
210 215 220
Tyr Gly Ser Cys Cys Ser Glu Met Asp Ile Trp Asp Ala Asn Asn Met
225 230 235 240
Ala Thr Ala Phe Thr Pro His Pro Cys Thr Ile Ile Gly Gln Ser Arg
245 250 255
Cys Glu Gly Asn Ser Cys Gly Gly Thr Tyr Ser Ser Glu Arg Tyr Ala
260 265 270
Gly Val Cys Asp Pro Asp Gly Cys Asp Phe Asn Ala Tyr Arg Gln Gly
275 280 285
Asp Lys Thr Phe Tyr Gly Lys Gly Met Thr Val Asp Thr Thr Lys Lys
290 295 300
Met Thr Val Val Thr Gln Phe His Lys Asn Ser Ala Gly Val Leu Ser
305 310 315 320
Glu Ile Lys Arg Phe Tyr Val Gln Asp Gly Lys Ile Ile Ala Asn Ala
325 330 335
Glu Ser Lys Ile Pro Gly Asn Pro Gly Asn Ser Ile Thr Gln Glu Trp
340 345 350
Cys Asp Ala Gln Lys Val Ala Phe Gly Asp Ile Asp Asp Phe Asn Arg
355 360 365
Lys Gly Gly Met Ala Gln MetSer Lys Ala Leu Glu Gly Pro Met Val
370 375 380
Leu Val Met Ser Val Trp Asp Asp His Tyr Ala Asn Met Leu Trp Leu
385 390 395 400
Asp Ser Thr Tyr Pro Ile Asp Lys Ala Gly Thr Pro Gly Ala Glu Arg
405 410 4l5
Gly Ala Cys Pro Thr Thr Ser Gly Val Pro Ala Glu Ile Glu Ala Gln
420 425 430
Val Pro Asn Ser Asn Val Ile Phe Ser Asn Ile Arg Phe Gly Pro Ile
435 440 445
Gly Ser Thr Val Pro Gly Leu Asp Gly Ser Thr Pro Ser Asn Pro Thr
450 455 460
Ala Thr Val Ala Pro Pro Thr Ser Thr Thr Thr Ser Val Arg Ser Ser
465 470 475 480
Thr Thr Gln Ile Ser Thr Pro Thr Ser Gln Pro Gly Gly Cys Thr Thr
485 490 495
Gln Lys Trp Gly Gln Cys Gly Gly Ile Gly Tyr Thr Gly Cys Thr Asn
500 505 510
Cys Val Ala Gly Thr Thr Cys Thr Glu Leu Asn Pro Trp Tyr Ser Gln
515 520 525
Cys Leu
530
<210>35
<211>1434
<212>DNA
<213>嗜热毛壳菌
<400>35
atggctaagc agctgctgct cactgccgct cttgcggcca cttcgctggc tgcccctctc 60
cttgaggagc gccagagctg ctcctccgtc tggggtcaat gcggtggcat caattacaac 120
ggcccgacct gctgccagtc cggcagtgtt tgcacttacc tgaatgactg gtacagccag 180
tgcattcccg gtcaggctca gcccggcacg actagcacca cggctcggac caccagcacc 240
agcaccacca gcacttcgtc ggtccgcccg accacctcga atacccctgt gacgactgct 300
cccccgacga ccaccatccc gggcggcgcc tcgagcacgg ccagctacaa cggcaacccg 360
ttttcgggtg ttcaactttg ggccaacacc tactactcgt ccgaggtgca cactttggcc 420
atccccagct tgtctcctga gctggctgcc aaggccgcca aggtcgctga ggttcccagc 480
ttccagtggc tcgaccgcaa tgtgactgtt gacactctct tctccggcac tcttgccgaa 540
atccgcgccg ccaaccagcg cggtgccaac ccgccttatg ccggcatttt cgtggtttat 600
gacttaccag accgtgattg cgcggctgct gcttcgaacg gcgagtggtc tatcgccaac 660
aatggtgcca acaactacaa gcgctacatc gaccggatcc gtgagctcct tatccagtac 720
tccgatatcc gcactattct ggtcattgaa cctgattccc tggccaacat ggtcaccaac 780
atgaacgtcc agaagtgctc gaacgctgcc tccacttaca aggagcttac tgtctatgcc 840
ctcaaacagc tcaatcttcc tcacgttgcc atgtacatgg atgctggcca cgctggctgg 900
cttggctggc ccgccaacat ccagcctgct gctgagctct ttgctcaaat ctaccgcgac 960
gctggcaggc ccgctgctgt ccgcggtctt gcgaccaacg ttgccaacta caatgcttgg 1020
tcgatcgcca gccctccgtc ctacacctct cctaacccga actacgacga gaagcactat 1080
attgaggcct ttgctcctct tctccgcaac cagggcttcg acgcaaagtt catcgtcgac 1140
accggccgta acggcaagca gcccactggc cagcttgaat ggggtcactg gtgcaatgtc 1200
aagggaactg gcttcggtgt gcgccctact gctaacactg ggcatgaact tgttgatgct 1260
ttcgtgtggg tcaagcccgg tggcgagtcc gacggcacca gtgcggacac cagcgctgct 1320
cgttatgact atcactgcgg cctttccgac gcactgactc cggcgcctga ggctggccaa 1380
tggttccagg cttatttcga acagctgctc atcaatgcca accctccgct ctga 1434
<210>36
<211>477
<212>PRT
<213>嗜热毛壳菌
<400>36
Met Ala Lys Gln Leu Leu Leu Thr Ala Ala Leu Ala Ala Thr Ser Leu
1 5 10 15
Ala Ala Pro Leu Leu Glu Glu Arg Gln Ser Cys Ser Ser Val Trp Gly
20 25 30
Gln Cys Gly Gly Ile Asn Tyr Asn Gly Pro Thr Cys Cys Gln Ser Gly
35 40 45
Ser Val Cys Thr Tyr Leu Asn Asp Trp Tyr Ser Gln Cys Ile Pro Gly
50 55 60
Gln Ala Gln Pro Gly Thr Thr Ser Thr Thr Ala Arg Thr Thr Ser Thr
65 70 75 80
Ser Thr Thr Ser Thr Ser Ser Val Arg Pro Thr Thr Ser Asn Thr Pro
85 90 95
Val Thr Thr Ala Pro Pro Thr Thr Thr Ile Pro Gly Gly Ala Ser Ser
100 105 110
Thr Ala Ser Tyr Asn Gly Asn Pro Phe Ser Gly Val Gln Leu Trp Ala
115 120 125
Asn Thr Tyr Tyr Ser Ser Glu Val His Thr Leu Ala Ile Pro Ser Leu
130 135 140
Ser Pro Glu Leu Ala Ala Lys Ala Ala Lys Val Ala Glu Val Pro Ser
145 150 155 160
Phe Gln Trp Leu Asp Arg Asn Val Thr Val Asp Thr Leu Phe Ser Gly
165 170 175
Thr Leu Ala Glu Ile Arg Ala Ala Asn Gln Arg Gly Ala Asn Pro Pro
180 185 190
Tyr Ala Gly Ile Phe Val Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala
195 200 205
Ala Ala Ala Ser Asn Gly Glu Trp Ser Ile Ala Asn Asn Gly Ala Asn
210 215 220
Asn Tyr Lys Arg Tyr Ile Asp Arg Ile Arg Glu Leu Leu Ile Gln Tyr
225 230 235 240
Ser Asp Ile Arg Thr Ile Leu Val Ile Glu Pro Asp Ser Leu Ala Asn
245 250 255
Met Val Thr Asn Met Asn Val Gln Lys Cys Ser Asn Ala Ala Ser Thr
260 265 270
Tyr Lys Glu Leu Thr Val Tyr Ala Leu Lys Gln Leu Asn Leu Pro His
275 280 285
Val Ala Met Tyr Met Asp Ala Gly His Ala Gly Trp Leu Gly Trp Pro
290 295 300
Ala Asn Ile Gln Pro Ala Ala Glu Leu Phe Ala Gln Ile Tyr Arg Asp
305 310 315 320
Ala Gly Arg Pro Ala Ala Val Arg Gly Leu Ala Thr Asn Val Ala Asn
325 330 335
Tyr Asn Ala Trp Ser Ile Ala Ser Pro Pro Ser Tyr Thr Ser Pro Asn
340 345 350
Pro Asn Tyr Asp Glu Lys His Tyr Ile Glu Ala Phe Ala Pro Leu Leu
355 360 365
Arg Asn Gln Gly Phe Asp Ala Lys Phe Ile Val Asp Thr Gly Arg Asn
370 375 380
Gly Lys Gln Pro Thr Gly Gln Leu Glu Trp Gly His Trp Cys Asn Val
385 390 395 400
Lys Gly Thr Gly Phe Gly Val Arg Pro Thr Ala Asn Thr Gly His Glu
405 410 415
Leu Val Asp Ala Phe Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly
420 425 430
Thr Ser Ala Asp Thr Ser Ala Ala Arg Tyr Asp Tyr His Cys Gly Leu
435 440 445
Ser Asp Ala Leu Thr Pro Ala Pro Glu Ala Gly Gln Trp Phe Gln Ala
450 455 460
Tyr Phe Glu Gln Leu Leu Ile Asn Ala Asn Pro Pro Leu
465 470 475
<210>37
<211>2586
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>37
atgaagcttg gttggatcga ggtggccgca ttggcggctg cctcagtagt cagtgccaag 60
gatgatctcg cgtactcccc tcctttctac ccttccccat gggcagatgg tcagggtgaa 120
tgggcggaag tatacaaacg cgctgtagac atagtttccc agatgacgtt gacagagaaa 180
gtcaacttaa cgactggaac aggatggcaa ctagagaggt gtgttggaca aactggcagt 240
gttcccagac tcaacatccc cagcttgtgt ttgcaggata gtcctcttgg tattcgtttc 300
tcggactaca attcagcttt ccctgcgggt gttaatgtcg ctgccacctg ggacaagacg 360
ctcgcctacc ttcgtggtca ggcaatgggt gaggagttca gtgataaggg tattgacgtt 420
cagctgggtc ctgctgctgg ccctctcggt gctcatccgg atggcggtag aaactgggaa 480
ggtttctcac cagatccagc cctcaccggt gtactttttg cggagacgat taagggtatt 540
caagatgctg gtgtcattgc gacagctaag cattatatca tgaacgaaca agagcatttc 600
cgccaacaac ccgaggctgc gggttacgga ttcaacgtaa gcgacagttt gagttccaac 660
gttgatgaca agactatgca tgaattgtac ctctggccct tcgcggatgc agtacgcgct 720
ggagtcggtg ctgtcatgtg ctcttacaac caaatcaaca acagctacgg ttgcgagaat 780
agcgaaactc tgaacaagct tttgaaggcg gagcttggtt tccaaggctt cgtcatgagt 840
gattggaccg ctcatcacag cggcgtaggc gctgctttag caggtctgga tatgtcgatg 900
cccggtgatg ttaccttcga tagtggtacg tctttctggg gtgcaaactt gacggtcggt 960
gtccttaacg gtacaatccc ccaatggcgt gttgatgaca tggctgtccg tatcatggcc 1020
gcttattaca aggttggccg cgacaccaaa tacacccctc ccaacttcag ctcgtggacc 1080
agggacgaat atggtttcgc gcataaccat gtttcggaag gtgcttacga gagggtcaac 1140
gaattcgtgg acgtgcaacg cgatcatgcc gacctaatcc gtcgcatcgg cgcgcagagc 1200
actgttctgc tgaagaacaa gggtgccttg cccttgagcc gcaaggaaaa gctggtcgcc 1260
cttctgggag aggatgcggg ttccaactcg tggggcgcta acggctgtga tgaccgtggt 1320
tgcgataacg gtacccttgc catggcctgg ggtagcggta ctgcgaattt cccatacctc 1380
gtgacaccag agcaggcgat tcagaacgaa gttcttcagg gccgtggtaa tgtcttcgcc 1440
gtgaccgaca gttgggcgct cgacaagatc gctgcggctg cccgccaggc cagcgtatct 1500
ctcgtgttcg tcaactccga ctcaggagaa ggctatctta gtgtggatgg aaatgagggc 1560
gatcgtaaca acatcactct gtggaagaac ggcgacaatg tggtcaagac cgcagcgaat 1620
aactgtaaca acaccgttgt catcatccac tccgtcggac cagttttgat cgatgaatgg 1680
tatgaceacc ccaatgteac tggtattctc tgggctggtc tgccaggcca ggagtctggt 1740
aactccattg ccgatgtgct gtacggtcgt gtcaaccctg gcgccaagtc tcctttcact 1800
tggggcaaga cccgggagtc gtatggttct cccttggtca aggatgccaa caatggcaac 1860
ggagcgcccc agtctgattt cacccagggt gttttcatcg attaccgcca tttcgataag 1920
ttcaatgaga cccctatcta cgagtttggc tacggcttga gctacaccac cttcgagctc 1980
tccgacctcc atgttcagcc cctgaacgcg tcccgataca ctcccaccag tggcatgact 2040
gaagctgcaa agaactttgg tgaaattggc gatgcgtcgg agtacgtgta tccggagggg 2100
ctggaaagga tccatgagtt tatctatccc tggatcaact ctaccgacct gaaggcatcg 2160
tctgacgatt ctaactacgg ctgggaagac tccaagtata ttcccgaagg cgccacggat 2220
gggtctgccc agccccgttt gcccgctagt ggtggtgccg gaggaaaccc cggtctgtac 2280
gaggatcttt tccgcgtctc tgtgaaggtc aagaacacgg gcaatgtcgc cggtgatgaa 2340
gttcctcagc tgtacgtttc cctaggcggc ccgaatgagc ccaaggtggt actgcgcaag 2400
tttgagcgta ttcacttggc cccttcgcag gaggccgtgt ggacaacgac ccttacccgt 2460
cgtgaccttg caaactggga cgtttcggct caggactgga ccgtcactcc ttaccccaag 2520
acgatctacg ttggaaactc ctcacggaaa ctgccgctcc aggcctcgct gcctaaggcc 2580
cagtaa 2586
<210>38
<211>861
<212>PRT
<213>米曲霉
<400>38
Met Lys Leu Gly Trp Ile Glu Val Ala Ala Leu Ala Ala Ala Ser Val
1 5 10 15
Val Ser Ala Lys Asp Asp Leu Ala Tyr Ser Pro Pro Phe Tyr Pro Ser
20 25 30
Pro Trp Ala Asp Gly Gln Gly Glu Trp Ala Glu Val Tyr Lys Arg Ala
35 40 45
Val Asp Ile Val Ser Gln Met Thr Leu Thr Glu Lys Val Asn Leu Thr
50 55 60
Thr Gly Thr Gly Trp Gln Leu Glu Arg Cys Val Gly Gln Thr Gly Ser
65 70 75 80
Val Pro Arg Leu Asn Ile Pro Ser Leu Cys Leu Gln Asp Ser Pro Leu
85 90 95
Gly Ile Arg Phe Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn
100 105 110
Val Ala Ala Thr Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Gln Ala
115 120 125
Met Gly Glu Glu Phe Ser Asp Lys Gly Ile Asp Val Gln Leu Gly Pro
130 135 140
Ala Ala Gly Pro Leu Gly Ala His Pro Asp Gly Gly Arg Asn Trp Glu
145 150 155 160
Gly Phe Ser Pro Asp Pro Ala Leu Thr Gly Val Leu Phe Ala Glu Thr
165 170 175
Ile Lys Gly Ile Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr
180 185 190
Ile Met Asn Glu Gln Glu His Phe Arg Gln Gln Pro Glu Ala Ala Gly
195 200 205
Tyr Gly Phe Asn Val Ser Asp Ser Leu Ser Ser Asn Val Asp Asp Lys
210 215 220
Thr Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala
225 230 235 240
Gly Val Gly Ala Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr
245 250 255
Gly Cys Glu Asn Ser Glu Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu
260 265 270
Gly Phe Gln Gly Phe Val Met Ser Asp Trp Thr Ala His His Ser Gly
275 280 285
Val Gly Ala Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val
290 295 300
Thr Phe Asp Ser Gly Thr Ser Phe Trp Gly Ala Asn Leu Thr Val Gly
305 310 315 320
Val Leu Asn Gly Thr Ile Pro Gln Trp Arg Val Asp Asp Met Ala Val
325 330 335
Arg Ile Met Ala Ala Tyr Tyr Lys Val Gly Arg Asp Thr Lys Tyr Thr
340 345 350
Pro Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Ala His
355 360 365
Asn His Val Ser Glu Gly Ala Tyr Glu Arg Val Asn Glu Phe Val Asp
370 375 380
Val Gln Arg Asp His Ala Asp Leu Ile Arg Arg Ile Gly Ala Gln Ser
385 390 395 400
Thr Val Leu Leu Lys Asn Lys Gly Ala Leu Pro Leu Ser Arg Lys Glu
405 410 415
Lys Leu Val Ala Leu Leu Gly Glu Asp Ala Gly Ser Asn Ser Trp Gly
420 425 430
Ala Asn Gly Cys Asp Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met
435 440 445
Ala Trp Gly Ser Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu
450 455 460
Gln Ala Ile Gln Asn Glu Val Leu Gln Gly Arg Gly Asn Val Phe Ala
465 470 475 480
Val Thr Asp Ser Trp Ala Leu Asp Lys Ile Ala Ala Ala Ala Arg Gln
485 490 495
Ala Ser Val Ser Leu Val Phe Val Asn Ser Asp Ser Gly Glu Gly Tyr
500 505 510
Leu Ser Val Asp Gly Asn Glu Gly Asp Arg Asn Asn Ile Thr Leu Trp
515 520 525
Lys Asn Gly Asp Asn Val Val Lys Thr Ala Ala Asn Asn Cys Asn Asn
530 535 540
Thr Val Val Ile Ile His Ser Val Gly Pro Val Leu Ile Asp Glu Trp
545 550 555 560
Tyr Asp His Pro Asn Val Thr Gly Ile Leu Trp Ala Gly Leu Pro Gly
565 570 575
Gln Glu Ser Gly Asn Ser Ile Ala Asp Val Leu Tyr Gly Arg Val Asn
580 585 590
Pro Gly Ala Lys Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr
595 600 605
Gly Ser Pro Leu Val Lys Asp Ala Asn Asn Gly Asn Gly Ala Pro Gln
610 615 620
Ser Asp Phe Thr Gln Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys
625 630 635 640
Phe Asn Glu Thr Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr
645 650 655
Thr Phe Glu Leu Ser Asp Leu His Val Gln Pro Leu Asn Ala Ser Arg
660 665 670
Tyr Thr Pro Thr Ser Gly Met Thr Glu Ala Ala Lys Asn Phe Gly Glu
675 680 685
Ile Gly Asp Ala Ser Glu Tyr Val Tyr Pro Glu Gly Leu Glu Arg Ile
690 695 700
His Glu Phe Ile Tyr Pro Trp Ile Asn Ser Thr Asp Leu Lys Ala Ser
705 710 715 720
Ser Asp Asp Ser Asn Tyr Gly Trp Glu Asp Ser Lys Tyr Ile Pro Glu
725 730 735
Gly Ala Thr Asp Gly Ser Ala Gln Pro Arg Leu Pro Ala Ser Gly Gly
740 745 750
Ala Gly Gly Asn Pro Gly Leu Tyr Glu Asp Leu Phe Arg Val Ser Val
755 760 765
Lys Val Lys Asn Thr Gly Asn Val Ala Gly Asp Glu Val Pro Gln Leu
770 775 780
Tyr Val Ser Leu Gly Gly Pro Asn Glu Pro Lys Val Val Leu Arg Lys
785 790 795 800
Phe Glu Arg Ile His Leu Ala Pro Ser Gln Glu Ala Val Trp Thr Thr
805 810 815
Thr Leu Thr Arg Arg Asp Leu Ala Asn Trp Asp Val Ser Ala Gln Asp
820 825 830
Trp Thr Val Thr Pro Tyr Pro Lys Thr Ile Tyr Val Gly Asn Ser Ser
835 840 845
Arg Lys Leu Pro Leu Gln Ala Ser Leu Pro Lys Ala Gln
850 855 860
<210>39
<211>3060
<212>DNA
<213>烟曲霉(Aspergillus fumigatus)
<400>39
atgagattcg gttggctcga ggtggccgct ctgacggccg cttctgtagc caatgcccag 60
gtttgtgatg ctttcccgtc attgtttcgg atatagttga caatagtcat ggaaataatc 120
aggaattggc tttctctcca ccattctacc cttcgccttg ggctgatggc cagggagagt 180
gggcagatgc ccatcgacgc gccgtcgaga tcgtttctca gatgacactg gcggagaagg 240
ttaaccttac aacgggtact gggtgggttg cgactttttt gttgacagtg agctttcttc 300
actgaccatc tacacagatg ggaaatggac cgatgcgtcg gtcaaaccgg cagcgttccc 360
aggtaagctt gcaattctgc aacaacgtgc aagtgtagtt gctaaaacgc ggtggtgcag 420
acttggtatc aactggggtc tttgtggcca ggattcccct ttgggtatcc gtttctgtga 480
gctatacccg cggagtcttt cagtccttgt attatgtgct gatgattgtc tctgtatagc 540
tgacctcaac tccgccttcc ctgctggtac taatgtcgcc gcgacatggg acaagacact 600
cgcctacctt cgtggcaagg ccatgggtga ggaattcaac gacaagggcg tggacatttt 660
gctggggcct gctgctggtc ctctcggcaa atacccggac ggcggcagaa tctgggaagg 720
cttctctcct gatccggttc tcactggtgt acttttcgcc gaaactatca agggtatcca 780
agacgcgggt gtgattgcta ctgccaagca ttacattctg aatgaacagg agcatttccg 840
acaggttggc gaggcccagg gatatggtta caacatcacg gagacgatca gctccaacgt 900
ggatgacaag accatgcacg agttgtacct ttggtgagta gttgacactg caaatgagga 960
ccttgattga tttgactgac ctggaatgca ggccctttgc agatgctgtg cgcggtaaga 1020
ttttccgtag acttgacctc gcgacgaaga aatcgctgac gaaccatcgt agctggcgtt 1080
ggcgctgtca tgtgttccta caatcaaatc aacaacagct acggttgtca aaacagtcaa 1140
actctcaaca agctcctcaa ggctgagctg ggcttccaag gcttcgtcat gagtgactgg 1200
agcgctcacc acagcggtgt cggcgctgcc ctcgctgggt tggatatgtc gatgcctgga 1260
gacatttcct tcgacgacgg actctccttc tggggcacga acctaactgt cagtgttctt 1320
aacggcaccg ttccagcctg gcgtgtcgat gacatggctg ttcgtatcat gaccgcgtac 1380
tacaaggttg gtcgtgaccg tcttcgtatt ccccctaact tcagctcctg gacccgggat 1440
gagtacggct gggagcattc tgctgtctcc gagggagcct ggaccaaggt gaacgacttc 1500
gtcaatgtgc agcgcagtca ctctcagatc atccgtgaga ttggtgccgc tagtacagtg 1560
ctcttgaaga acacgggtgc tcttcctttg accggcaagg aggttaaagt gggtgttctc 1620
ggtgaagacg ctggttccaa cccgtggggt gctaacggct gccccgaccg cggctgtgat 1680
aacggcactc ttgctatggc ctggggtagt ggtactgcca acttccctta ccttgtcacc 1740
cccgagcagg ctatccagcg agaggtcatc agcaacggcg gcaatgtctt tgctgtgact 1800
gataacgggg ctctcagcca gatggcagat gttgcatctc aatccaggtg agtgcgggct 1860
cttagaaaaa gaacgttctc tgaatgaagt tttttaacca ttgcgaacag cgtgtctttg 1920
gtgtttgtca acgccgactc tggagagggt ttcatcagtg tcgacggcaa cgagggtgac 1980
cgcaaaaatc tcactctgtg gaagaacggc gaggccgtca ttgacactgt tgtcagccac 2040
tgcaacaaca cgattgtggt tattcacagt gttgggcccg tcttgatcga ccggtggtat 2100
gataacccca acgtcactgc catcatctgg gccggcttgc ccggtcagga gagtggcaac 2160
tccctggtcg acgtgctcta tggccgcgtc aaccccagcg ccaagacccc gttcacctgg 2220
ggcaagactc gggagtctta cggggctccc ttgctcaccg agcctaacaa tggcaatggt 2280
gctccccagg atgatttcaa cgagggcgtc ttcattgact accgtcactt tgacaagcgc 2340
aatgagaccc ccatttatga gtttggccat ggcttgagct acaccacctt tggttactct 2400
caccttcggg ttcaggccct caatagttcg agttcggcat atgtcccgac tagcggagag 2460
accaagcctg cgccaaccta tggtgagatc ggtagtgccg ccgactacct gtatcccgag 2520
ggtctcaaaa gaattaccaa gtttatttac ccttggctca actcgaccga cctcgaggat 2580
tcttctgacg acccgaacta cggctgggag gactcggagt acattcccga aggcgctagg 2640
gatgggtctc ctcaacccct cctgaaggct ggcggcgctc ctggtggtaa ccctaccctt 2700
tatcaggatc ttgttagggt gtcggccacc ataaccaaca ctggtaacgt cgccggttat 2760
gaagtccctc aattggtgag tgacccgcat gttccttgcg ttgcaatttg gctaactcgc 2820
ttctagtatg tttcactggg cggaccgaac gagcctcggg tcgttctgcg caagttcgac 2880
cgaatcttcc tggctcctgg ggagcaaaag gtttggacca cgactcttaa ccgtcgtgat 2940
ctcgccaatt gggatgtgga ggctcaggac tgggtcatca caaagtaccc caagaaagtg 3000
cacgtcggca gctcctcgcg taagctgcct ctgagagcgc ctctgccccg tgtctactag 3060
<210>40
<211>863
<212>PRT
<213>烟曲霉
<400>40
Met Arg Phe Gly Trp Leu Glu Val Ala Ala Leu Thr Ala Ala Ser Val
1 5 10 15
Ala Asn Ala Gln Glu Leu Ala Phe Ser Pro Pro Phe Tyr Pro Ser Pro
20 25 30
Trp Ala Asp Gly Gln Gly Glu Trp Ala Asp Ala His Arg Arg Ala Val
35 40 45
Glu Ile Val Ser Gln Met Thr Leu Ala Glu Lys Val Asn Leu Thr Thr
50 55 60
Gly Thr Gly Trp Glu Met Asp Arg Cys Val Gly Gln Thr Gly Ser Val
65 70 75 80
Pro Arg Leu Gly Ile Asn Trp Gly Leu Cys Gly Gln Asp Ser Pro Leu
85 90 95
Gly Ile Arg Phe Ser Asp Leu Asn Ser Ala Phe Pro Ala Gly Thr Asn
100 105 110
Val Ala Ala Thr Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Lys Ala
115 120 125
Met Gly Glu Glu Phe Asn Asp Lys Gly Val Asp Ile Leu Leu Gly Pro
130 135 140
Ala Ala Gly Pro Leu Gly Lys Tyr Pro Asp Gly Gly Arg Ile Trp Glu
145 150 155 160
Gly Phe Ser Pro Asp Pro Val Leu Thr Gly Val Leu Phe Ala Glu Thr
165 170 175
Ile Lys Gly Ile Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr
180 185 190
Ile Leu Asn Glu Gln Glu His Phe Arg Gln Val Gly Glu Ala Gln Gly
195 200 205
Tyr Gly Tyr Asn Ile Thr Glu Thr Ile Ser Ser Asn Val Asp Asp Lys
210 215 220
Thr Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala
225 230 235 240
Gly Val Gly Ala Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr
245 250 255
Gly Cys Gln Asn Ser Gln Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu
260 265 270
Gly Phe Gln Gly Phe Val Met Ser Asp Trp Ser Ala His His Ser Gly
275 280 285
Val Gly Ala Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Ile
290 295 300
Ser Phe Asp Asp Gly Leu Ser Phe Trp Gly Thr Asn Leu Thr Val Ser
305 310 315 320
Val Leu Asn Gly Thr Val Pro Ala Trp Arg Val Asp Asp Met Ala Val
325 330 335
Arg Ile Met Thr Ala Tyr Tyr Lys Val Gly Arg Asp Arg Leu Arg Ile
340 345 350
Pro Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Trp Glu His
355 360 365
Ser Ala Val Ser Glu Gly Ala Trp Thr Lys Val Asn Asp Phe Val Asn
370 375 380
Val Gln Arg Ser His Ser Gln Ile Ile Arg Glu Ile Gly Ala Ala Ser
385 390 395 400
Thr Val Leu Leu Lys Asn Thr Gly Ala Leu Pro Leu Thr Gly Lys Glu
405 410 415
Val Lys Val Gly Val Leu Gly Glu Asp Ala Gly Ser Asn Pro Trp Gly
420 425 430
Ala Asn Gly Cys Pro Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met
435 440 445
Ala Trp Gly Ser Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu
450 455 460
Gln Ala Ile Gln Arg Glu Val Ile Ser Asn Gly Gly Asn Val Phe Ala
465 470 475 480
Val Thr Asp Asn Gly Ala Leu Ser Gln Met Ala Asp Val Ala Ser Gln
485 490 495
Ser Ser Val Ser Leu Val Phe Val Asn Ala Asp Ser Gly Glu Gly Phe
500 505 510
Ile Ser Val Asp Gly Asn Glu Gly Asp Arg Lys Asn Leu Thr Leu Trp
515 520 525
Lys Asn Gly Glu Ala Val Ile Asp Thr Val Val Ser His Cys Asn Asn
530 535 540
Thr Ile Val Val Ile His Ser Val Gly Pro Val Leu Ile Asp Arg Trp
545 550 555 560
Tyr Asp Asn Pro Asn Val Thr Ala Ile Ile Trp Ala Gly Leu Pro Gly
565 570 575
Gln Glu Ser Gly Asn Ser Leu Val Asp Val Leu Tyr Gly Arg Val Asn
580 585 590
Pro Ser Ala Lys Thr Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr
595 600 605
Gly Ala Pro Leu Leu Thr Glu Pro Asn Asn Gly Asn Gly Ala Pro Gln
610 615 620
Asp Asp Phe Asn Glu Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys
625 630 635 640
Arg Asn Glu Thr Pro Ile Tyr Glu Phe Gly His Gly Leu Ser Tyr Thr
645 650 655
Thr Phe Gly Tyr Ser His Leu Arg Val Gln Ala Leu Asn Ser Ser Ser
660 665 670
Ser Ala Tyr Val Pro Thr Ser Gly Glu Thr Lys Pro Ala Pro Thr Tyr
675 680 685
Gly Glu Ile Gly Ser Ala Ala Asp Tyr Leu Tyr Pro Glu Gly Leu Lys
690 695 700
Arg Ile Thr Lys Phe Ile Tyr Pro Trp Leu Asn Ser Thr Asp Leu Glu
705 710 715 720
Asp Ser Ser Asp Asp Pro Asn Tyr Gly Trp Glu Asp Ser Glu Tyr Ile
725 730 735
Pro Glu Gly Ala Arg Asp Gly Ser Pro Gln Pro Leu Leu Lys Ala Gly
740 745 750
Gly Ala Pro Gly Gly Asn Pro Thr Leu Tyr Gln Asp Leu Val Arg Val
755 760 765
Ser Ala Thr Ile Thr Asn Thr Gly Asn Val Ala Gly Tyr Glu Val Pro
770 775 780
Gln Leu Tyr Val Ser Leu Gly Gly Pro Asn Glu Pro Arg Val Val Leu
785 790 795 800
Arg Lys Phe Asp Arg Ile Phe Leu Ala Pro Gly Glu Gln Lys Val Trp
805 810 815
Thr Thr Thr Leu Asn Arg Arg Asp Leu Ala Asn Trp Asp Val Glu Ala
820 825 830
Gln Asp Trp Val Ile Thr Lys Tyr Pro Lys Lys Val His Val Gly Ser
835 840 845
Ser Ser Arg Lys Leu Pro Leu Arg Ala Pro Leu Pro Arg Val Tyr
850 855 860
<210>41
<211>2800
<212>DNA
<213>巴西青霉(Penicillium brasilianum)
<400>41
tgaaaatgca gggttctaca atctttctgg ctttcgcctc atgggcgagc caggttgctg 60
ccattgcgca gcccatacag aagcacgagg tttgttttat cttgctcatg gacgtgcttt 120
gacttgacta attgttttac atacagcccg gatttctgca cgggccccaa gccatagaat 180
cgttctcaga accgttctac ccgtcgccct ggatgaatcc tcacgccgag ggctgggagg 240
ccgcatatca gaaagctcaa gattttgtct cgcaactcac tatcttggag aaaataaatc 300
tgaccaccgg tgttgggtaa gtctctccga ctgcttctgg gtcacggtgc gacgagccac 360
tgactttttg aagctgggaa aatgggccgt gtgtaggaaa cactggatca attcctcgtc 420
tcggattcaa aggattttgt acccaggatt caccacaggg tgttcggttc gcagattatt 480
cctccgcttt cacatctagc caaatggccg ccgcaacatt tgaccgctca attctttatc 540
aacgaggcca agccatggca caggaacaca aggctaaggg tatcacaatt caattgggcc 600
ctgttgccgg ccctctcggt cgcatccccg agggcggccg caactgggaa ggattctccc 660
ctgatcctgt cttgactggt atagccatgg ctgagacaat taagggcatg caggatactg 720
gagtgattgc ttgcgctaaa cattatattg gaaacgagca ggagcacttc cgtcaagtgg 780
gtgaagctgc gggtcacgga tacactattt ccgatactat ttcatctaat attgacgacc 840
gtgctatgca tgagctatac ttgtggccat ttgctgatgc cgttcgcgct ggtgtgggtt 900
ctttcatgtg ctcatactct cagatcaaca actcctacgg atgccaaaac agtcagaccc 960
tcaacaagct cctcaagagc gaattgggct tccaaggctt tgtcatgagc gattggggtg 1020
cccatcactc tggagtgtca tcggcgctag ctggacttga tatgagcatg ccgggtgata 1080
ccgaatttga ttctggcttg agcttctggg gctctaacct caccattgca attctgaacg 1140
gcacggttcc cgaatggcgc ctggatgaca tggcgatgcg aattatggct gcatacttca 1200
aagttggcct tactattgag gatcaaccag atgtcaactt caatgcctgg acccatgaca 1260
cctacggata taaatacgct tatagcaagg aagattacga gcaggtcaac tggcatgtcg 1320
atgttcgcag cgaccacaat aagctcattc gcgagactgc cgcgaagggt acagttctgc 1380
tgaagaacaa ctttcatgct ctccctctga agcagcccag gttcgtggcc gtcgttggtc 1440
aggatgccgg gccaaacccc aagggcccta acggctgcgc agaccgagga tgcgaccaag 1500
gcactctcgc aatgggatgg ggctcagggt ctaccgaatt cccttacctg gtcactcctg 1560
acactgctat tcagtcaaag gtcctcgaat acgggggtcg atacgagagt atttttgata 1620
actatgacga caatgctatc ttgtcgcttg tctcacagcc tgatgcaacc tgtatcgttt 1680
ttgcaaatgc cgattccggt gaaggctaca tcactgtcga caacaactgg ggtgaccgca 1740
acaatctgac cctctggcaa aatgccgatc aagtgattag cactgtcagc tcgcgatgca 1800
acaacacaat cgttgttctc cactctgtcg gaccagtgtt gctaaatggt atatatgagc 1860
acccgaacat cacagctatt gtctgggcag ggatgccagg cgaagaatct ggcaatgctc 1920
tcgtggatat tctttggggc aatgttaacc ctgccggtcg cactccgttc acctgggcca 1980
aaagtcgaga ggactatggc actgatataa tgtacgagcc caacaacggc cagcgtgcgc 2040
ctcagcagga tttcaccgag agcatctacc tcgactaccg ccatttcgac aaagctggta 2100
tcgagccaat ttacgagttt ggattcggcc tctcctatac caccttcgaa tactctgacc 2160
tccgtgttgt gaagaagtat gttcaaccat acagtcccac gaccggcacc ggtgctcaag 2220
caccttccat cggacagcca cctagccaga acctggatac ctacaagttc cctgctacat 2280
acaagtacat caaaaccttc atttatccct acctgaacag cactgtctcc ctccgcgctg 2340
cttccaagga tcccgaatac ggtcgtacag actttatccc accccacgcg cgtgatggct 2400
cccctcaacc tctcaacccc gctggagacc cagtggccag tggtggaaac aacatgctct 2460
acgacgaact ttacgaggtc actgcacaga tcaaaaacac tggcgacgtg gccggcgacg 2520
aagtcgtcca gctttacgta gatctcgggg gtgacaaccc gcctcgtcag ttgagaaact 2580
ttgacaggtt ttatctgctg cccggtcaga gctcaacatt ccgggctaca ttgacgcgcc 2640
gtgatttgag caactgggat attgaggcgc agaactggcg agttacggaa tcgcctaaga 2700
gagtgtatgt tggacggtcg agtcgggatt tgccgctgag ctcacaattg gagtaatgat 2760
catgtctacc aatagatgtt gaatgtctgg tgtggatatt 2800
<210>42
<211>878
<212>PRT
<213>巴西青霉
<400>42
Met Gln Gly Ser Thr Ile Phe Leu Ala Phe Ala Ser Trp Ala Ser Gln
1 5 10 15
Val Ala Ala Ile Ala Gln Pro Ile Gln Lys His Glu Pro Gly Phe Leu
20 25 30
His Gly Pro Gln Ala Ile Glu Ser Phe Ser Glu Pro Phe Tyr Pro Ser
35 40 45
Pro Trp Met Asn Pro His Ala Glu Gly Trp Glu Ala Ala Tyr Gln Lys
50 55 60
Ala Gln Asp Phe Val Ser Gln Leu Thr Ile Leu Glu Lys Ile Asn Leu
65 70 75 80
Thr Thr Gly Val Gly Trp Glu Asn Gly Pro Cys Val Gly Asn Thr Gly
85 90 95
Ser Ile Pro Arg Leu Gly Phe Lys Gly Phe Cys Thr Gln Asp Ser Pro
100 105 110
Gln Gly Val Arg Phe Ala Asp Tyr Ser Ser Ala Phe Thr Ser Ser Gln
115 120 125
Met Ala Ala Ala Thr Phe Asp Arg Ser Ile Leu Tyr Gln Arg Gly Gln
130 135 140
Ala Met Ala Gln Glu His Lys Ala Lys Gly Ile Thr Ile Gln Leu Gly
145 150 155 160
Pro Val Ala Gly Pro Leu Gly Arg Ile Pro Glu Gly Gly Arg Asn Trp
165 170 175
Glu Gly Phe Ser Pro Asp Pro Val Leu Thr Gly Ile Ala Met Ala Glu
180 185 190
Thr Ile Lys Gly Met Gln Asp Thr Gly Val Ile Ala Cys Ala Lys His
195 200 205
Tyr Ile Gly Asn Glu Gln Glu His Phe Arg Gln Val Gly Glu Ala Ala
210 215 220
Gly His Gly Tyr Thr Ile Ser Asp Thr Ile Ser Ser Asn Ile Asp Asp
225 230 235 240
Arg Ala Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg
245 250 255
Ala Gly Val Gly Ser Phe Met Cys Ser Tyr Ser Gln Ile Asn Asn Ser
260 265 270
Tyr Gly Cys Gln Asn Ser Gln Thr Leu Asn Lys Leu Leu Lys Ser Glu
275 280 285
Leu Gly Phe Gln Gly Phe Val Met Ser Asp Trp Gly Ala His His Ser
290 295 300
Gly Val Ser Ser Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp
305 310 315 320
Thr Glu Phe Asp Ser Gly Leu Ser Phe Trp Gly Ser Asn Leu Thr Ile
325 330 335
Ala Ile Leu Asn Gly Thr Val Pro Glu Trp Arg Leu Asp Asp Met Ala
340 345 350
Met Arg Ile Met Ala Ala Tyr Phe Lys Val Gly Leu Thr Ile Glu Asp
355 360 365
Gln Pro Asp Val Asn Phe Asn Ala Trp Thr His Asp Thr Tyr Gly Tyr
370 375 380
Lys Tyr Ala Tyr Ser Lys Glu Asp Tyr Glu Gln Val Asn Trp His Val
385 390 395 400
Asp Val Arg Ser Asp His Asn Lys Leu Ile Arg Glu Thr Ala Ala Lys
405 410 415
Gly Thr Val Leu Leu Lys Asn Asn Phe His Ala Leu Pro Leu Lys Gln
420 425 430
Pro Arg Phe Val Ala Val Val Gly Gln Asp Ala Gly Pro Asn Pro Lys
435 440 445
Gly Pro Asn Gly Cys Ala Asp Arg Gly Cys Asp Gln Gly Thr Leu Ala
450 455 460
Met Gly Trp Gly Ser Gly Ser Thr Glu Phe Pro Tyr Leu Val Thr Pro
465 470 475 480
Asp Thr Ala Ile Gln Ser Lys Val Leu Glu Tyr Gly Gly Arg Tyr Glu
485 490 495
Ser Ile Phe Asp Asn Tyr Asp Asp Asn Ala Ile Leu Ser Leu Val Ser
500 505 510
Gln Pro Asp Ala Thr Cys Ile Val Phe Ala Asn Ala Asp Ser Gly Glu
515 520 525
Gly Tyr Ile Thr Val Asp Asn Asn Trp Gly Asp Arg Asn Asn Leu Thr
530 535 540
Leu Trp Gln Asn Ala Asp Gln Val Ile Ser Thr Val Ser Ser Arg Cys
545 550 555 560
Asn Asn Thr Ile Val Val Leu His Ser Val Gly Pro Val Leu Leu Asn
565 570 575
Gly Ile Tyr Glu His Pro Asn Ile Thr Ala Ile Val Trp Ala Gly Met
580 585 590
Pro Gly Glu Glu Ser Gly Asn Ala Leu Val Asp Ile Leu Trp Gly Asn
595 600 605
Val Asn Pro Ala Gly Arg Thr Pro Phe Thr Trp Ala Lys Ser Arg Glu
610 615 620
Asp Tyr Gly Thr Asp Ile Met Tyr Glu Pro Asn Asn Gly Gln Arg Ala
625 630 635 640
Pro Gln Gln Asp Phe Thr Glu Ser Ile Tyr Leu Asp Tyr Arg His Phe
645 650 655
Asp Lys Ala Gly Ile Glu Pro Ile Tyr Glu Phe Gly Phe Gly Leu Ser
660 665 670
Tyr Thr Thr Phe Glu Tyr Ser Asp Leu Arg Val Val Lys Lys Tyr Val
675 680 685
Gln Pro Tyr Ser Pro Thr Thr Gly Thr Gly Ala Gln Ala Pro Ser Ile
690 695 700
Gly Gln Pro Pro Ser Gln Asn Leu Asp Thr Tyr Lys Phe Pro Ala Thr
705 710 715 720
Tyr Lys Tyr Ile Lys Thr Phe Ile Tyr Pro Tyr Leu Asn Ser Thr Val
725 730 735
Ser Leu Arg Ala Ala Ser Lys Asp Pro Glu Tyr Gly Arg Thr Asp Phe
740 745 750
Ile Pro Pro His Ala Arg Asp Gly Ser Pro Gln Pro Leu Asn Pro Ala
755 760 765
Gly Asp Pro Val Ala Ser Gly Gly Asn Asn Met Leu Tyr Asp Glu Leu
770 775 780
Tyr Glu Val Thr Ala Gln Ile Lys Asn Thr Gly Asp Val Ala Gly Asp
785 790 795 800
Glu Val Val Gln Leu Tyr Val Asp Leu Gly Gly Asp Asn Pro Pro Arg
805 810 815
Gln Leu Arg Asn Phe Asp Arg Phe Tyr Leu Leu Pro Gly Gln Ser Ser
820 825 830
Thr Phe Arg Ala Thr Leu Thr Arg Arg Asp Leu Ser Asn Trp Asp Ile
835 840 845
Glu Ala Gln Asn Trp Arg Val Thr Glu Ser Pro Lys Arg Val Tyr Val
850 855 860
Gly Arg Ser Ser Arg Asp Leu Pro Leu Ser Ser Gln Leu Glu
865 870 875
<210>43
<211>2583
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>43
atgaggttca ctttgatcga ggcggtggct ctgactgccg tctcgctggc cagcgctgat 60
gaattggcct actccccacc gtattaccca tccccttggg ccaatggcca gggcgactgg 120
gcgcaggcat accagcgcgc tgttgatatt gtctcgcaaa tgacattgga tgagaaggtc 180
aatctgacca caggaactgg atgggaattg gaactatgtg ttggtcagac tggcggtgtt 240
ccccgattgg gagttccggg aatgtgttta caggatagcc ctctgggcgt tcgcgactcc 300
gactacaact ctgctttccc tgccggcatg aacgtggctg caacctggga caagaatctg 360
gcataccttc gcggcaaggc tatgggtcag gaatttagtg acaagggtgc cgatatccaa 420
ttgggtccag ctgccggccc tctcggtaga agtcccgacg gtggtcgtaa ctgggagggc 480
ttctccccag accctgccct aagtggtgtg ctctttgccg agaccatcaa gggtatccaa 540
gatgctggtg tggttgcgac ggctaagcac tacattgctt acgagcaaga gcatttccgt 600
caggcgcctg aagcccaagg ttttggattt aatatttccg agagtggaag tgcgaacctc 660
gatgataaga ctatgcacga gctgtacctc tggcccttcg cggatgccat ccgtgcaggt 720
gctggcgctg tgatgtgctc ctacaaccag atcaacaaca gttatggctg ccagaacagc 780
tacactctga acaagctgct caaggccgag ctgggcttcc agggctttgt catgagtgat 840
tgggctgctc accatgctgg tgtgagtggt gctttggcag gattggatat gtctatgcca 900
ggagacgtcg actacgacag tggtacgtct tactggggta caaacttgac cattagcgtg 960
ctcaacggaa cggtgcccca atggcgtgtt gatgacatgg ctgtccgcat catggccgcc 1020
tactacaagg tcggccgtga ccgtctgtgg actcctccca acttcagctc atggaccaga 1080
gatgaatacg gctacaagta ctactacgtg tcggagggac cgtacgagaa ggtcaaccag 1140
tacgtgaatg tgcaacgcaa ccacagcgaa ctgattcgcc gcattggagc ggacagcacg 1200
gtgctcctca agaacgacgg cgctctgcct ttgactggta aggagcgcct ggtcgcgctt 1260
atcggagaag atgcgggctc caacccttat ggtgccaacg gctgcagtga ccgtggatgc 1320
gacaatggaa cattggcgat gggctgggga agtggtactg ccaacttccc atacctggtg 1380
acccccgagc aggccatctc aaacgaggtg cttaagcaca agaatggtgt attcaccgcc 1440
accgataact gggctatcga tcagattgag gcgcttgcta agaccgccag tgtctctctt 1500
gtctttgtca acgccgactc tggtgagggt tacatcaatg tggacggaaa cctgggtgac 1560
cgcaggaacc tgaccctgtg gaggaacggc gataatgtga tcaaggctgc tgctagcaac 1620
tgcaacaaca caatcgttgt cattcactct gtcggaccag tcttggttaa cgagtggtac 1680
gacaacccca atgttaccgc tatcctctgg ggtggtttgc ccggtcagga gtctggcaac 1740
tctcttgccg acgtcctcta tggccgtgtc aaccccggtg ccaagtcgcc ctttacctgg 1800
ggcaagactc gtgaggccta ccaagactac ttggtcaccg agcccaacaa cggcaacgga 1860
gcccctcagg aagactttgt cgagggcgtc ttcattgact accgtggatt tgacaagcgc 1920
aacgagaccc cgatctacga gttcggctat ggtctgagct acaccacttt caactactcg 1980
aaccttgagg tgcaggtgct gagcgcccct gcatacgagc ctgcttcggg tgagaccgag 2040
gcagcgccaa ccttcggaga ggttggaaat gcgtcggatt acctctaccc cagcggattg 2100
cagagaatta ccaagttcat ctacccctgg ctcaacggta ccgatctcga ggcatcttcc 2160
ggggatgcta gctacgggca ggactcctcc gactatcttc ccgagggagc caccgatggc 2220
tctgcgcaac cgatcctgcc tgccggtggc ggtcctggcg gcaaccctcg cctgtacgac 2280
gagctcatcc gcgtgtcagt gaccatcaag aacaccggca aggttgctgg tgatgaagtt 2340
ccccaactgt atgtttccct tggcggtccc aatgagccca agatcgtgct gcgtcaattc 2400
gagcgcatca cgctgcagcc gtcggaggag acgaagtgga gcacgactct gacgcgccgt 2460
gaccttgcaa actggaatgt tgagaagcag gactgggaga ttacgtcgta tcccaagatg 2520
gtgtttgtcg gaagctcctc gcggaagctg ccgctccggg cgtctctgcc tactgttcac 2580
taa 2583
<210>44
<211>860
<212>PRT
<213>黑曲霉
<400>44
Met Arg Phe Thr Leu Ile Glu Ala Val Ala Leu Thr Ala Val Ser Leu
1 5 10 15
Ala Ser Ala Asp Glu Leu Ala Tyr Ser Pro Pro Tyr Tyr Pro Ser Pro
20 25 30
Trp Ala Asn Gly Gln Gly Asp Trp Ala Gln Ala Tyr Gln Arg Ala Val
35 40 45
Asp Ile Val Ser Gln Met Thr Leu Asp Glu Lys Val Asn Leu Thr Thr
50 55 60
Gly Thr Gly Trp Glu Leu Glu Leu Cys Val Gly Gln Thr Gly Gly Val
65 70 75 80
Pro Arg Leu Gly Val Pro Gly Met Cys Leu Gln Asp Ser Pro Leu Gly
85 90 95
Val Arg Asp Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Met Asn Val
100 105 110
Ala Ala Thr Trp Asp Lys Asn Leu Ala Tyr Leu Arg Gly Lys Ala Met
115 120 125
Gly Gln Glu Phe Ser Asp Lys Gly Ala Asp Ile Gln Leu Gly Pro Ala
130 135 140
Ala Gly Pro Leu Gly Arg Ser Pro Asp Gly Gly Arg Asn Trp Glu Gly
145 150 155 160
Phe Ser Pro Asp Pro Ala Leu Ser Gly Val Leu Phe Ala Glu Thr Ile
165 170 175
Lys Gly Ile Gln Asp Ala Gly Val Val Ala Thr Ala Lys His Tyr Ile
180 185 190
Ala Tyr Glu Gln Glu His Phe Arg Gln Ala Pro Glu Ala Gln Gly Phe
195 200 205
Gly Phe Asn Ile Ser Glu Ser Gly Ser Ala Asn Leu Asp Asp Lys Thr
210 215 220
Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Ile Arg Ala Gly
225 230 235 240
Ala Gly Ala Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr Gly
245 250 255
Cys Gln Asn Ser Tyr Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu Gly
260 265 270
Phe Gln Gly Phe Val Met Ser Asp Trp Ala Ala His His Ala Gly Val
275 280 285
Ser Gly Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val Asp
290 295 300
Tyr Asp Ser Gly Thr Ser Tyr Trp Gly Thr Asn Leu Thr Ile Ser Val
305 310 315 320
Leu Asn Gly Thr Val Pro Gln Trp Arg Val Asp Asp Met Ala Val Arg
325 330 335
Ile Met Ala Ala Tyr Tyr Lys Val Gly Arg Asp Arg Leu Trp Thr Pro
340 345 350
Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Tyr Lys Tyr Tyr
355 360 365
Tyr Val Ser Glu Gly Pro Tyr Glu Lys Val Asn Gln Tyr Val Asn Val
370 375 380
Gln Arg Asn His Ser Glu Leu Ile Arg Arg Ile Gly Ala Asp Ser Thr
385 390 395 400
Val Leu Leu Lys Asn Asp Gly Ala Leu Pro Leu Thr Gly Lys Glu Arg
405 410 415
Leu Val Ala Leu Ile Gly Glu Asp Ala Gly Ser Asn Pro Tyr Gly Ala
420 425 430
Asn Gly Cys Ser Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met Gly
435 440 445
Trp Gly Ser Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu Gln
450 455 460
Ala Ile Ser Asn Glu Val Leu Lys His Lys Asn Gly Val Phe Thr Ala
465 470 475 480
Thr Asp Asn Trp Ala Ile Asp Gln Ile Glu Ala Leu Ala Lys Thr Ala
485 490 495
Ser Val Ser Leu Val Phe Val Asn Ala Asp Ser Gly Glu Gly Tyr Ile
500 505 510
Asn Val Asp Gly Asn Leu Gly Asp Arg Arg Asn Leu Thr Leu Trp Arg
515 520 525
Asn Gly Asp Asn Val Ile Lys Ala Ala Ala Ser Asn Cys Asn Asn Thr
530 535 540
Ile Val Val Ile His Ser Val Gly Pro Val Leu Val Asn Glu Trp Tyr
545 550 555 560
Asp Asn Pro Asn Val Thr Ala Ile Leu Trp Gly Gly Leu Pro Gly Gln
565 570 575
Glu Ser Gly Asn Ser Leu Ala Asp Val Leu Tyr Gly Arg Val Asn Pro
580 585 590
Gly Ala Lys Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ala Tyr Gln
595 600 605
Asp Tyr Leu Val Thr Glu Pro Asn Asn Gly Asn Gly Ala Pro Gln Glu
610 615 620
Asp Phe Val Glu Gly Val Phe Ile Asp Tyr Arg Gly Phe Asp Lys Arg
625 630 635 640
Asn Glu Thr Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr Thr
645 650 655
Phe Asn Tyr Ser Asn Leu Glu Val Gln Val Leu Ser Ala Pro Ala Tyr
660 665 670
Glu Pro Ala Ser Gly Glu Thr Glu Ala Ala Pro Thr Phe Gly Glu Val
675 680 685
Gly Asn Ala Ser Asp Tyr Leu Tyr Pro Ser Gly Leu Gln Arg Ile Thr
690 695 700
Lys Phe Ile Tyr Pro Trp Leu Asn Gly Thr Asp Leu Glu Ala Ser Ser
705 710 715 720
Gly Asp Ala Ser Tyr Gly Gln Asp Ser Ser Asp Tyr Leu Pro Glu Gly
725 730 735
Ala Thr Asp Gly Ser Ala Gln Pro Ile Leu Pro Ala Gly Gly Gly Pro
740 745 750
Gly Gly Asn Pro Arg Leu Tyr Asp Glu Leu Ile Arg Val Ser Val Thr
755 760 765
Ile Lys Asn Thr Gly Lys Val Ala Gly Asp Glu Val Pro Gln Leu Tyr
770 775 780
Val Ser Leu Gly Gly Pro Asn Glu Pro Lys Ile Val Leu Arg Gln Phe
785 790 795 800
Glu Arg Ile Thr Leu Gln Pro Ser Glu Glu Thr Lys Trp Ser Thr Thr
805 810 815
Leu Thr Arg Arg Asp Leu Ala Asn Trp Asn Val Glu Lys Gln Asp Trp
820 825 830
Glu Ile Thr Ser Tyr Pro Lys Met Val Phe Val Gly Ser Ser Ser Arg
835 840 845
Lys Leu Pro Leu Arg Ala Ser Leu Pro Thr Val His
850 855 860
<210>45
<21l>2583
<212>DNA
<213>棘孢曲霉(Aspergillus aculeatus)
<400>45
atgaagctca gttggcttga ggcggctgcc ttgacggctg cttcagtcgt cagcgctgat 60
gaactggcgt tctctcctcc tttctacccc tctccgtggg ccaatggcca gggagagtgg 120
gcggaagcct accagcgtgc agtggccatt gtatcccaga tgactctgga tgagaaggtc 180
aacctgacca ccggaactgg atgggagctg gagaagtgcg tcggtcagac tggtggtgtc 240
ccaagactga acatcggtgg catgtgtctt caggacagtc ccttgggaat tcgtgatagt 300
gactacaatt cggctttccc tgctggtgtc aacgttgctg cgacatggga caagaacctt 360
gcttatctac gtggtcaggc tatgggtcaa gagttcagtg acaaaggaat tgatgttcaa 420
ttgggaccgg ccgcgggtcc cctcggcagg agccctgatg gaggtcgcaa ctgggaaggt 480
ttctctccag acccggctct tactggtgtg ctctttgcgg agacgattaa gggtattcaa 540
gacgctggtg tcgtggcgac agccaagcat tacattctca atgagcaaga gcatttccgc 600
caggtcgcag aggctgcggg ctacggattc aatatctccg acacgatcag ctctaacgtt 660
gatgacaaga ccattcatga aatgtacctc tggcccttcg cggatgccgt tcgcgccggc 720
gttggcgcca tcatgtgttc ctacaaccag atcaacaaca gctacggttg ccagaacagt 780
tacactctga acaagcttct gaaggccgag ctcggcttcc agggctttgt gatgtctgac 840
tggggtgctc accacagtgg tgttggctct gctttggccg gcttggatat gtcaatgcct 900
ggcgatatca ccttcgattc tgccactagt ttctggggta ccaacctgac cattgctgtg 960
ctcaacggta ccgtcccgca gtggcgcgtt gacgacatgg ctgtccgtat catggctgcc 1020
tactacaagg ttggccgcga ccgcctgtac cagccgccta acttcagctc ctggactcgc 1080
gatgaatacg gcttcaagta tttctacccc caggaagggc cctatgagaa ggtcaatcac 1140
tttgtcaatg tgcagcgcaa ccacagcgag gttattcgca agttgggagc agacagtact 1200
gttctactga agaacaacaa tgccctgccg ctgaccggaa aggagcgcaa agttgcgatc 1260
ctgggtgaag atgctggatc caactcgtac ggtgccaatg gctgctctga ccgtggctgt 1320
gacaacggta ctcttgctat ggcttggggt agcggcactg ccgaattccc atatctcgtg 1380
acccctgagc aggctattca agccgaggtg ctcaagcata agggcagcgt ctacgccatc 1440
acggacaact gggcgctgag ccaggtggag accctcgcta aacaagccag tgtctctctt 1500
gtatttgtca actcggacgc gggagagggc tatatctccg tggacggaaa cgagggcgac 1560
cgcaacaacc tcaccctctg gaagaacggc gacaacctca tcaaggctgc tgcaaacaac 1620
tgcaacaaca ccatcgttgt catccactcc gttggacctg ttttggttga cgagtggtat 1680
gaccacccca acgttactgc catcctctgg gcgggcttgc ctggccagga gtctggcaac 1740
tccttggctg acgtgctcta cggccgcgtc aacccgggcg ccaaatctcc attcacctgg 1800
ggcaagacga gggaggcgta cggggattac cttgtccgtg agctcaacaa cggcaacgga 1860
gctccccaag atgatttctc ggaaggtgtt ttcattgact accgcggatt cgacaagcgc 1920
aatgagaccc cgatctacga gttcggacat ggtctgagct acaccacttt caactactct 1980
ggccttcaca tccaggttct caacgcttcc tccaacgctc aagtagccac tgagactggc 2040
gccgctccca ccttcggaca agtcggcaat gcctctgact acgtgtaccc tgagggattg 2100
accagaatca gcaagttcat ctatccctgg cttaattcca cagacctgaa ggcctcatct 2160
ggcgacccgt actatggagt cgacaccgcg gagcacgtgc ccgagggtgc tactgatggc 2220
tctccgcagc ccgttctgcc tgccggtggt ggctctggtg gtaacccgcg cctctacgat 2280
gagttgatcc gtgtttcggt gacagtcaag aacactggtc gtgttgccgg tgatgctgtg 2340
cctcaattgt atgtttccct tggtggaccc aatgagccca aggttgtgtt gcgcaaattc 2400
gaccgcctca ccctcaagcc ctccgaggag acggtgtgga cgactaccct gacccgccgc 2460
gatctgtcta actgggacgt tgcggctcag gactgggtca tcacttctta cccgaagaag 2520
gtccatgttg gtagctcttc gcgtcagctg ccccttcacg cggcgctccc gaaggtgcaa 2580
tga 2583
<210>46
<211>860
<212>PRT
<213>棘孢曲霉
<400>46
Met Lys Leu Ser Trp Leu Glu Ala Ala Ala Leu Thr Ala Ala Ser Val
1 5 10 15
Val Ser Ala Asp Glu Leu Ala Phe Ser Pro Pro Phe Tyr Pro Ser Pro
20 25 30
Trp Ala Asn Gly Gln Gly Glu Trp Ala Glu Ala Tyr Gln Arg Ala Val
35 40 45
Ala Ile Val Ser Gln Met Thr Leu Asp Glu Lys Val Asn Leu Thr Thr
50 55 60
Gly Thr Gly Trp Glu Leu Glu Lys Cys Val Gly Gln Thr Gly Gly Val
65 70 75 80
Pro Arg Leu Asn Ile Gly Gly Met Cys Leu Gln Asp Ser Pro Leu Gly
85 90 95
Ile Arg Asp Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn Val
100 105 110
Ala Ala Thr Trp Asp Lys Asn Leu Ala Tyr Leu Arg Gly Gln Ala Met
115 120 125
Gly Gln Glu Phe Ser Asp Lys Gly Ile Asp Val Gln Leu Gly Pro Ala
130 135 140
Ala Gly Pro Leu Gly Arg Ser Pro Asp Gly Gly Arg Asn Trp Glu Gly
145 150 155 160
Phe Ser Pro Asp Pro Ala Leu Thr Gly Val Leu Phe Ala Glu Thr Ile
165 170 175
Lys Gly Ile Gln Asp Ala Gly Val Val Ala Thr Ala Lys His Tyr Ile
180 185 190
Leu Asn Glu Gln Glu His Phe Arg Gln Val Ala Glu Ala Ala Gly Tyr
195 200 205
Gly Phe Asn Ile Ser Asp Thr Ile Ser Ser Asn Val Asp Asp Lys Thr
210 215 220
Ile His Glu Met Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala Gly
225 230 235 240
Val Gly Ala Ile Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr Gly
245 250 255
Cys Gln Asn Ser Tyr Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu Gly
260 265 270
Phe Gln Gly Phe Val Met Ser Asp Trp Gly Ala His His Ser Gly Val
275 280 285
Gly Ser Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Ile Thr
290 295 300
Phe Asp Ser Ala Thr Ser Phe Trp Gly Thr Asn Leu Thr Ile Ala Val
305 310 315 320
Leu Asn Gly Thr Val Pro Gln Trp Arg Val Asp Asp Met Ala Val Arg
325 330 335
Ile Met Ala Ala Tyr Tyr Lys Val Gly Arg Asp Arg Leu Tyr Gln Pro
340 345 350
Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Lys Tyr Phe
355 360 365
Tyr Pro Gln Glu Gly Pro Tyr Glu Lys Val Asn His Phe Val Asn Val
370 375 380
Gln Arg Asn His Ser Glu Val Ile Arg Lys Leu Gly Ala Asp Ser Thr
385 390 395 400
Val Leu Leu Lys Asn Asn Asn Ala Leu Pro Leu Thr Gly Lys Glu Arg
405 410 415
Lys Val Ala Ile Leu Gly Glu Asp Ala Gly Ser Asn Ser Tyr Gly Ala
420 425 430
Asn Gly Cys Ser Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met Ala
435 440 445
Trp Gly Ser Gly Thr Ala Glu Phe Pro Tyr Leu Val Thr Pro Glu Gln
450 455 460
Ala Ile Gln Ala Glu Val Leu Lys His Lys Gly Ser Val Tyr Ala Ile
465 470 475 480
Thr Asp Asn Trp Ala Leu Ser Gln Val Glu Thr Leu Ala Lys Gln Ala
485 490 495
Ser Val Ser Leu Val Phe Val Asn Ser Asp Ala Gly Glu Gly Tyr Ile
500 505 510
Ser Val Asp Gly Asn Glu Gly Asp Arg Asn Asn Leu Thr Leu Trp Lys
515 520 525
Asn Gly Asp Asn Leu Ile Lys Ala Ala Ala Asn Asn Cys Asn Asn Thr
530 535 540
Ile Val Val Ile His Ser Val Gly Pro Val Leu Val Asp Glu Trp Tyr
545 550 555 560
Asp His Pro Asn Val Thr Ala Ile Leu Trp Ala Gly Leu Pro Gly Gln
565 570 575
Glu Ser Gly Asn Ser Leu Ala Asp Val Leu Tyr Gly Arg Val Asn Pro
580 585 590
Gly Ala Lys Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ala Tyr Gly
595 600 605
Asp Tyr Leu Val Arg Glu Leu Asn Asn Gly Asn Gly Ala Pro Gln Asp
610 615 620
Asp Phe Ser Glu Gly Val Phe Ile Asp Tyr Arg Gly Phe Asp Lys Arg
625 630 635 640
Asn Glu Thr Pro Ile Tyr Glu Phe Gly His Gly Leu Ser Tyr Thr Thr
645 650 655
Phe Asn Tyr Ser Gly Leu His Ile Gln Val Leu Asn Ala Ser Ser Asn
660 665 670
Ala Gln Val Ala Thr Glu Thr Gly Ala Ala Pro Thr Phe Gly Gln Val
675 680 685
Gly Asn Ala Ser Asp Tyr Val Tyr Pro Glu Gly Leu Thr Arg Ile Ser
690 695 700
Lys Phe Ile Tyr Pro Trp Leu Asn Ser Thr Asp Leu Lys Ala Ser Ser
705 710 715 720
Gly Asp Pro Tyr Tyr Gly Val Asp Thr Ala Glu His Val Pro Glu Gly
725 730 735
Ala Thr Asp Gly Ser Pro Gln Pro Val Leu Pro Ala Gly Gly Gly Ser
740 745 750
Gly Gly Asn Pro Arg Leu Tyr Asp Glu Leu Ile Arg Val Ser Val Thr
755 760 765
Val Lys Asn Thr Gly Arg Val Ala Gly Asp Ala Val Pro Gln Leu Tyr
770 775 780
Val Ser Leu Gly Gly Pro Asn Glu Pro Lys Val Val Leu Arg Lys Phe
785 790 795 800
Asp Arg Leu Thr Leu Lys Pro Ser Glu Glu Thr Val Trp Thr Thr Thr
805 810 815
Leu Thr Arg Arg Asp Leu Ser Asn Trp Asp Val Ala Ala Gln Asp Trp
820 825 830
Val Ile Thr Ser Tyr Pro Lys Lys Val His Val Gly Ser Ser Ser Arg
835 840 845
Gln Leu Pro Leu His Ala Ala Leu Pro Lys Val Gln
850 855 860
<210>47
<211>3294
<212>DNA
<213>米曲霉
<400>47
atgcgttcct cccccctcct ccgctccgcc gttgtggccg ccctgccggt gttggccctt 60
gccgctgatg gcaggtccac ccgctactgg gactgctgca agccttcgtg cggctgggcc 120
aagaaggctc ccgtgaacca gcctgtcttt tcctgcaacg ccaacttcca gcgtatcacg 180
gacttcgacg ccaagtccgg ctgcgagccg ggcggtgtcg cctactcgtg cgccgaccag 240
accccatggg ctgtgaacga cgacttcgcg ctcggttttg ctgccacctc tattgccggc 300
agcaatgagg cgggctggtg ctgcgcctgc tacgagctca ccttcacatc cggtcctgtt 360
gctggcaaga agatggtcgt ccagtccacc agcactggcg gtgatcttgg cagcaaccac 420
ttcgatctca acatccccgg cggcggcgtc ggcatcttcg acggatgcac tccccagttc 480
ggtggtctgc ccggccagcg ctacggcggc atctcgtccc gcaacgagtg cgatcggttc 540
cccgacgccc tcaagcccgg ctgctactgg cgcttcgact ggttcaagaa cgccgacaat 600
ccgagcttca gcttccgtca ggtccagtgc ccagccgagc tcgtcgctcg caccggatgc 660
cgccgcaacg acgacggcaa cttccctgcc gtccagatcc ccatgcgttc ctcccccctc 720
ctccgctccg ccgttgtggc cgccctgccg gtgttggccc ttgccaagga tgatctcgcg 780
tactcccctc ctttctaccc ttccccatgg gcagatggtc agggtgaatg ggcggaagta 840
tacaaacgcg ctgtagacat agtttcccag atgacgttga cagagaaagt caacttaacg 900
actggaacag gatggcaact agagaggtgt gttggacaaa ctggcagtgt tcccagactc 960
aacatcccca gcttgtgttt gcaggatagt cctcttggta ttcgtttctc ggactacaat 1020
tcagctttcc ctgcgggtgt taatgtcgct gccacctggg acaagacgct cgcctacctt 1080
cgtggtcagg caatgggtga ggagttcagt gataagggta ttgacgttca gctgggtcct 1140
gctgctggcc ctctcggtgc tcatccggat ggcggtagaa actgggaagg tttctcacca 1200
gatccagccc tcaccggtgt actttttgcg gagacgatta agggtattca agatgctggt 1260
gtcattgcga cagctaagca ttatatcatg aacgaacaag agcatttccg ccaacaaccc 1320
gaggctgcgg gttacggatt caacgtaagc gacagtttga gttccaacgt tgatgacaag 1380
actatgcatg aattgtacct ctggcccttc gcggatgcag tacgcgctgg agtcggtgct 1440
gtcatgtgct cttacaacca aatcaacaac agctacggtt gcgagaatag cgaaactctg 1500
aacaagcttt tgaaggcgga gcttggtttc caaggcttcg tcatgagtga ttggaccgct 1560
catcacagcg gcgtaggcgc tgctttagca ggtctggata tgtcgatgcc cggtgatgtt 1620
accttcgata gtggtacgtc tttctggggt gcaaacttga cggtcggtgt ccttaacggt 1680
acaatccccc aatggcgtgt tgatgacatg gctgtccgta tcatggccgc ttattacaag 1740
gttggccgcg acaccaaata cacccctccc aacttcagct cgtggaccag ggacgaatat 1800
ggtttcgcgc ataaccatgt ttcggaaggt gcttacgaga gggtcaacga attcgtggac 1860
gtgcaacgcg atcatgccga cctaatccgt cgcatcggcg cgcagagcac tgttctgctg 1920
aagaacaagg gtgccttgcc cttgagccgc aaggaaaagc tggtcgccct tctgggagag 1980
gatgcgggtt ccaactcgtg gggcgctaac ggctgtgatg accgtggttg cgataacggt 2040
acccttgcca tggcctgggg tagcggtact gcgaatttcc catacctcgt gacaccagag 2100
caggcgattc agaacgaagt tcttcagggc cgtggtaatg tcttcgccgt gaccgacagt 2160
tgggcgctcg acaagatcgc tgcggctgcc cgccaggcca gcgtatctct cgtgttcgtc 2220
aactccgact caggagaagg ctatcttagt gtggatggaa atgagggcga tcgtaacaac 2280
atcactctgt ggaagaacgg cgacaatgtg gtcaagaccg cagcgaataa ctgtaacaac 2340
accgttgtca tcatccactc cgtcggacca gttttgatcg atgaatggta tgaccacccc 2400
aatgtcactg gtattctctg ggctggtctg ccaggccagg agtctggtaa ctccattgcc 2460
gatgtgctgt acggtcgtgt caaccctggc gccaagtctc ctttcacttg gggcaagacc 2520
cgggagtcgt atggttctcc cttggtcaag gatgccaaca atggcaacgg agcgccccag 2580
tctgatttca cccagggtgt tttcatcgat taccgccatt tcgataagtt caatgagacc 2640
cctatctacg agtttggcta cggcttgagc tacaccacct tcgagctctc cgacctccat 2700
gttcagcccc tgaacgcgtc ccgatacact cccaccagtg gcatgactga agctgcaaag 2760
aactttggtg aaattggcga tgcgtcggag tacgtgtatc cggaggggct ggaaaggatc 2820
catgagttta tctatccctg gatcaactct accgacctga aggcatcgtc tgacgattct 2880
aactacggct gggaagactc caagtatatt cccgaaggcg ccacggatgg gtctgcccag 2940
ccccgtttgc ccgctagtgg tggtgccgga ggaaaccccg gtctgtacga ggatcttttc 3000
cgcgtctctg tgaaggtcaa gaacacgggc aatgtcgccg gtgatgaagt tcctcagctg 3060
tacgtttccc taggcggccc gaatgagccc aaggtggtac tgcgcaagtt tgagcgtatt 3120
cacttggccc cttcgcagga ggccgtgtgg acaacgaccc ttacccgtcg tgaccttgca 3180
aactgggacg tttcggctca ggactggacc gtcactcctt accccaagac gatctacgtt 3240
ggaaactcct cacggaaact gccgctccag gcctcgctgc ctaaggccca gtaa 3294
<210>48
<211>1097
<212>PRT
<213>米曲霉
<400>48
Met Arg Ser Ser Pro Leu Leu Arg Ser Ala Val Val Ala Ala Leu Pro
1 5 10 15
Val Leu Ala Leu Ala Ala Asp Gly Arg Ser Thr Arg Tyr Trp Asp Cys
20 25 30
Cys Lys Pro Ser Cys Gly Trp Ala Lys Lys Ala Pro Val Asn Gln Pro
35 40 45
Val Phe Ser Cys Asn Ala Asn Phe Gln Arg Ile Thr Asp Phe Asp Ala
50 55 60
Lys Ser Gly Cys Glu Pro Gly Gly Val Ala Tyr Ser Cys Ala Asp Gln
65 70 75 80
Thr Pro Trp Ala Val Asn Asp Asp Phe Ala Leu Gly Phe Ala Ala Thr
85 90 95
Ser Ile Ala Gly Ser Asn Glu Ala Gly Trp Cys Cys Ala Cys Tyr Glu
100 105 110
Leu Thr Phe Thr Ser Gly Pro Val Ala Gly Lys Lys Met Val Val Gln
115 120 125
Ser Thr Ser Thr Gly Gly Asp Leu Gly Ser Asn His Phe Asp Leu Asn
130 135 140
Ile Pro Gly Gly Gly Val Gly Ile Phe Asp Gly Cys Thr Pro Gln Phe
145 150 155 160
Gly Gly Leu Pro Gly Gln Arg Tyr Gly Gly Ile Ser Ser Arg Asn Glu
165 170 175
Cys Asp Arg Phe Pro Asp Ala Leu Lys Pro Gly Cys Tyr Trp Arg Phe
180 185 190
Asp Trp Phe Lys Asn Ala Asp Asn Pro Ser Phe Ser Phe Arg Gln Val
195 200 205
Gln Cys Pro Ala Glu Leu Val Ala Arg Thr Gly Cys Arg Arg Asn Asp
210 215 220
Asp Gly Asn Phe Pro Ala Val Gln Ile Pro Met Arg Ser Ser Pro Leu
225 230 235 240
Leu Arg Ser Ala Val Val Ala Ala Leu Pro Val Leu Ala Leu Ala Lys
245 250 255
Asp Asp Leu Ala Tyr Ser Pro Pro Phe Tyr Pro Ser Pro Trp Ala Asp
260 265 270
Gly Gln Gly Glu Trp Ala Glu Val Tyr Lys Arg Ala Val Asp Ile Val
275 280 285
Ser Gln Met Thr Leu Thr Glu Lys Val Asn Leu Thr Thr Gly Thr Gly
290 295 300
Trp Gln Leu Glu Arg Cys Val Gly Gln Thr Gly Ser Val Pro Arg Leu
305 310 315 320
Asn Ile Pro Ser Leu Cys Leu Gln Asp Ser Pro Leu Gly Ile Arg Phe
325 330 335
Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn Val Ala Ala Thr
340 345 350
Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Gln Ala Met Gly Glu Glu
355 360 365
Phe Ser Asp Lys Gly Ile Asp Val Gln Leu Gly Pro Ala Ala Gly Pro
370 375 380
Leu Gly Ala His Pro Asp Gly Gly Arg Asn Trp Glu Gly Phe Ser Pro
385 390 395 400
Asp Pro Ala Leu Thr Gly Val Leu Phe Ala Glu Thr Ile Lys Gly Ile
405 410 415
Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr Ile Met Asn Glu
420 425 430
Gln Glu His Phe Arg Gln Gln Pro Glu Ala Ala Gly Tyr Gly Phe Asn
435 440 445
Val Ser Asp Ser Leu Ser Ser Asn Val Asp Asp Lys Thr Met His Glu
450 455 460
Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala Gly Val Gly Ala
465 470 475 480
Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr Gly Cys Glu Asn
485 490 495
Ser Glu Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu Gly Phe Gln Gly
500 505 510
Phe Val Met Ser Asp Trp Thr Ala His His Ser Gly Val Gly Ala Ala
515 520 525
Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val Thr Phe Asp Ser
530 535 540
Gly Thr Ser Phe Trp Gly Ala Asn Leu Thr Val Gly Val Leu Asn Gly
545 550 555 560
Thr Ile Pro Gln Trp Arg Val Asp Asp Met Ala Val Arg Ile Met Ala
565 570 575
Ala Tyr Tyr Lys Val Gly Arg Asp Thr Lys Tyr Thr Pro Pro Asn Phe
580 585 590
Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Ala His Asn His Val Ser
595 600 605
Glu Gly Ala Tyr Glu Arg Val Asn Glu Phe Val Asp Val Gln Arg Asp
610 615 620
His Ala Asp Leu Ile Arg Arg Ile Gly Ala Gln Ser Thr Val Leu Leu
625 630 635 640
Lys Asn Lys Gly Ala Leu Pro Leu Ser Arg Lys Glu Lys Leu Val Ala
645 650 655
Leu Leu Gly Glu Asp Ala Gly Ser Asn Ser Trp Gly Ala Asn Gly Cys
660 665 670
Asp Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met Ala Trp Gly Ser
675 680 685
Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu Gln Ala Ile Gln
690 695 700
Asn Glu Val Leu Gln Gly Arg Gly Asn Val Phe Ala Val Thr Asp Ser
705 710 715 720
Trp Ala Leu Asp Lys Ile Ala Ala Ala Ala Arg Gln Ala Ser Val Ser
725 730 735
Leu Val Phe Val Asn Ser Asp Ser Gly Glu Gly Tyr Leu Ser Val Asp
740 745 750
Gly Asn Glu Gly Asp Arg Asn Asn Ile Thr Leu Trp Lys Asn Gly Asp
755 760 765
Asn Val Val Lys Thr Ala Ala Asn Asn Cys Asn Asn Thr Val ValIle
770 775 780
Ile His Ser Val Gly Pro Val Leu Ile Asp Glu Trp Tyr Asp His Pro
785 790 795 800
Asn Val Thr Gly Ile Leu Trp Ala Gly Leu Pro Gly Gln Glu Ser Gly
805 810 815
Asn Ser Ile Ala Asp Val Leu Tyr Gly Arg Val Asn Pro Gly Ala Lys
820 825 830
Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr Gly Ser Pro Leu
835 840 845
Val Lys Asp Ala Asn Asn Gly Asn Gly Ala Pro Gln Ser Asp Phe Thr
850 855 860
Gln Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys Phe Asn Glu Thr
865 870 875 880
Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr Thr Phe Glu Leu
885 890 895
Ser Asp Leu His Val Gln Pro Leu Asn Ala Ser Arg Tyr Thr Pro Thr
900 905 910
Ser Gly Met Thr Glu Ala Ala Lys Asn Phe Gly Glu Ile Gly Asp Ala
915 920 925
Ser Glu Tyr Val Tyr Pro Glu Gly Leu Glu Arg Ile His Glu Phe Ile
930 935 940
Tyr Pro Trp Ile Asn Ser Thr Asp Leu Lys Ala Ser Ser Asp Asp Ser
945 950 955 960
Asn Tyr Gly Trp Glu Asp Ser Lys Tyr Ile Pro Glu Gly Ala Thr Asp
965 970 975
Gly Ser Ala Gln Pro Arg Leu Pro Ala Ser Gly Gly Ala Gly Gly Asn
980 985 990
Pro Gly Leu Tyr Glu Asp Leu Phe Arg Val Ser Val Lys Val Lys Asn
995 1000 1005
Thr Gly Asn Val Ala Gly Asp Glu Val Pro Gln Leu Tyr Val Ser
1010 1015 1020
Leu Gly Gly Pro Asn Glu Pro Lys Val Val Leu Arg Lys Phe Glu
1025 1030 1035
Arg Ile His Leu Ala Pro Ser Gln Glu Ala Val Trp Thr Thr Thr
1040 1045 1050
Leu Thr Arg Arg Asp Leu Ala Asn Trp Asp Val Ser Ala Gln Asp
1055 1060 1065
Trp Thr Val Thr Pro Tyr Pro Lys Thr Ile Tyr Val Gly Asn Ser
1070 1075 1080
Ser Arg Lys Leu Pro Leu Gln Ala Ser Leu Pro Lys Ala Gln
1085 1090 1095
<210>49
<211>3294
<212>DNA
<213>米曲霉
<400>49
atgcgttcct cccccctcct ccgctccgcc gttgtggccg ccctgccggt gttggccctt 60
gccgctgatg gcaggtccac ccgctactgg gactgctgca agccttcgtg cggctgggcc 120
aagaaggctc ccgtgaacca gcctgtcttt tcctgcaacg ccaacttcca gcgtatcacg 180
gacttcgacg ccaagtccgg ctgcgagccg ggcggtgtcg cctactcgtg cgccgaccag 240
accccatggg ctgtgaacga cgacttcgcg ctcggttttg ctgccacctc tattgccggc 300
agcaatgagg cgggctggtg ctgcgcctgc tacgagctca ccttcacatc cggtcctgtt 360
gctggcaaga agatggtcgt ccagtccacc agcactggcg gtgatcttgg cagcaaccac 420
ttcgatctca acatccccgg cggcggcgtc ggcatcttcg acggatgcac tccccagttc 480
ggtggtctgc ccggccagcg ctacggcggc atctcgtccc gcaacgagtg cgatcggttc 540
cccgacgccc tcaagcccgg ctgctactgg cgcttcgact ggttcaagaa cgccgacaat 600
ccgagcttca gcttccgtca ggtccagtgc ccagccgagc tcgtcgctcg caccggatgc 660
cgccgcaacg acgacggcaa cttccctgcc gtccagatcc ccatgcgttc ctcccccctc 720
ctccgctccg ccgttgtggc cgccctgccg gtgttggccc ttgccaagga tgatctcgcg 780
tactcccctc ctttctaccc ttccccatgg gcagatggtc agggtgaatg ggcggaagta 840
tacaaacgcg ctgtagacat agtttcccag atgacgttga cagagaaagt caacttaacg 900
actggaacag gatggcaact agagaggtgt gttggacaaa ctggcagtgt tcccagactc 960
aacatcccca gcttgtgttt gcaggatagt cctcttggta ttcgtttctc ggactacaat 1020
tcagctttcc ctgcgggtgt taatgtcgct gccacctggg acaagacgct cgcctacctt 1080
cgtggtcagg caatgggtga ggagttcagt gataagggta ttgacgttca gctgggtcct 1140
gctgctggcc ctctcggtgc tcatccggat ggcggtagaa actgggaaag tttctcacca 1200
gatccagccc tcaccggtgt actttttgcg gagacgatta agggtattca agatgctggt 1260
gtcattgcga cagctaagca ttatatcatg aacgaacaag agcatttccg ccaacaaccc 1320
gaggctgcgg gttacggatt caacgtaagc gacagtttga gttccaacgt tgatgacaag 1380
actatgcatg aattgtacct ctggcccttc gcggatgcag tacgcgctgg agtcggtgct 1440
gttatgtgct cttacaacca aatcaacaac agctacggtt gcgagaatag cgaaactctg 1500
aacaagcttt tgaaggcgga gcttggtttc caaggcttcg tcatgagtga ttggaccgct 1560
caacacagcg gcgtaggcgc tgctttagca ggtctggata tgtcgatgcc cggtgatgtt 1620
accttcgata gtggtacgtc tttctggggt gcaaacttga cggtcggtgt ccttaacggt 1680
acaatccccc aatggcgtgt tgatgacatg gctgtccgta tcatggccgc ttattacaag 1740
gttggccgcg acaccaaata cacccctccc aacttcagct cgtggaccag ggacgaatat 1800
ggtttcgcgc ataaccatgt ttcggaaggt gcttacgaga gggtcaacga attcgtggac 1860
gtgcaacgcg atcatgccga cctaatccgt cgcatcggcg cgcagagcac tgttctgctg 1920
aagaacaagg gtgccttgcc cttgagccgc aaggaaaagc tggtcgccct tctgggagag 1980
gatgcgggtt ccaactcgtg gggcgctaac ggctgtgatg accgtggttg cgataacggt 2040
acccttgcca tggcctgggg tagcggtact gcgaatttcc catacctcgt gacaccagag 2100
caggcgattc agaacgaagt tcttcagggc cgtggtaatg tcttcgccgt gaccgacagt 2160
tgggcgctcg acaagatcgc tgcggctgcc cgccaggcca gcgtatctct cgtgttcgtc 2220
aactccgact caggagaagg ctatcttagt gtggatggaa atgagggcga tcgtaacaac 2280
atcactctgt ggaagaacgg cgacaatgtg gtcaagaccg cagcgaataa ctgtaacaac 2340
accgttgtca tcatccactc cgtcggacca gttttgatcg atgaatggta tgaccacccc 2400
aatgtcactg gtattctctg ggctggtctg ccaggccagg agtctggtaa ctccattgcc 2460
gatgtgctgt acggtcgtgt caaccctggc gccaagtctc ctttcacttg gggcaagacc 2520
cgggagtcgt atggttctcc cttggtcaag gatgccaaca atggcaacgg agcgccccag 2580
tctgatttca cccagggtgt tttcatcgat taccgccatt tcgataagtt caatgagacc 2640
cctatctacg agtttggcta cggcttgagc tacaccacct tcgagctctc cgacctccat 2700
gttcagcccc tgaacgcgtc ccgatacact cccaccagtg gcatgactga agctgcaaag 2760
aactttggtg aaattggcga tgcgtcggag tacgtgtatc cggaggggct ggaaaggatc 2820
catgagttta tctatccctg gatcaactct accgacctga aggcatcgtc tgacgattct 2880
aactacggct gggaagactc caagtatatt cccgaaggcg ccacggatgg gtctgcccag 2940
ccccgtttgc ccgctagtgg tggtgccgga ggaaaccccg gtctgtacga ggatcttttc 3000
cgcgtctctg tgaaggtcaa gaacacgggc aatgtcgccg gtgatgaagt tcctcagctg 3060
tacgtttccc taggcggccc gaatgagccc aaggtggtac tgcgcaagtt tgagcgtatt 3120
cacttggccc cttcgcagga ggccgtgtgg acaacgaccc ttacccgtcg tgaccttgca 3180
aactgggacg tttcggctca ggactggacc gtcactcctt accccaagac gatctacgtt 3240
ggaaactcct cacggaaact gccgctccag gcctcgctgc ctaaggccca gtaa 3294
<210>50
<211>1097
<212>PRT
<213>米曲霉
<400>50
Met Arg Ser Ser Pro Leu Leu Arg Ser Ala Val Val Ala Ala Leu Pro
1 5 10 15
Val Leu Ala Leu Ala Ala Asp Gly Arg Ser Thr Arg Tyr Trp Asp Cys
20 25 30
Cys Lys Pro Ser Cys Gly Trp Ala Lys Lys Ala Pro Val Asn Gln Pro
35 40 45
Val Phe Ser Cys Asn Ala Asn Phe Gln Arg Ile Thr Asp Phe Asp Ala
50 55 60
Lys Ser Gly Cys Glu Pro Gly Gly Val Ala Tyr Ser Cys Ala Asp Gln
65 70 75 80
Thr Pro Trp Ala Val Asn Asp Asp Phe Ala Leu Gly Phe Ala Ala Thr
85 90 95
Ser Ile Ala Gly Ser Asn Glu Ala Gly Trp Cys Cys Ala Cys Tyr Glu
100 105 110
Leu Thr Phe Thr Ser Gly Pro Val Ala Gly Lys Lys Met Val Val Gln
115 120 125
Ser Thr Ser Thr Gly Gly Asp Leu Gly Ser Asn His Phe Asp Leu Asn
130 135 140
Ile Pro Gly Gly Gly Val Gly Ile Phe Asp Gly Cys Thr Pro Gln Phe
145 150 155 160
Gly Gly Leu Pro Gly Gln Arg Tyr Gly Gly Ile Ser Ser Arg Asn Glu
165 170 175
Cys Asp Arg Phe Pro Asp Ala Leu Lys Pro Gly Cys Tyr Trp Arg Phe
180 185 190
Asp Trp Phe Lys Asn Ala Asp Asn Pro Ser Phe Ser Phe Arg Gln Val
195 200 205
Gln Cys Pro Ala Glu Leu Val Ala Arg Thr Gly Cys Arg Arg Asn Asp
210 215 220
Asp Gly Asn Phe Pro Ala Val Gln Ile Pro Met Arg Ser Ser Pro Leu
225 230 235 240
Leu Arg Ser Ala Val Val Ala Ala Leu Pro Val Leu Ala Leu Ala Lys
245 250 255
Asp Asp Leu Ala Tyr Ser Pro Pro Phe Tyr Pro Ser Pro Trp Ala Asp
260 265 270
Gly Gln Gly Glu Trp Ala Glu Val Tyr Lys Arg Ala Val Asp Ile Val
275 280 285
Ser Gln Met Thr Leu Thr Glu Lys Val Asn Leu Thr Thr Gly Thr Gly
290 295 300
Trp Gln Leu Glu Arg Cys Val Gly Gln Thr Gly Ser Val Pro Arg Leu
305 310 315 320
Asn Ile Pro Ser Leu Cys Leu Gln Asp Ser Pro Leu Gly Ile Arg Phe
325 330 335
Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn Val Ala Ala Thr
340 345 350
Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Gln Ala Met Gly Glu Glu
355 360 365
Phe Ser Asp Lys Gly Ile Asp Val Gln Leu Gly Pro Ala Ala Gly Pro
370 375 380
Leu Gly Ala His Pro Asp Gly Gly Arg Asn Trp Glu Ser Phe Ser Pro
385 390 395 400
Asp Pro Ala Leu Thr Gly Val Leu Phe Ala Glu Thr Ile Lys Gly Ile
405 410 415
Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr Ile Met Asn Glu
420 425 430
Gln Glu His Phe Arg Gln Gln Pro Glu Ala Ala Gly Tyr Gly Phe Asn
435 440 445
Val Ser Asp Ser Leu Ser Ser Asn Val Asp Asp Lys Thr Met His Glu
450 455 460
Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala Gly Val Gly Ala
465 470 475 480
Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr Gly Cys Glu Asn
485 490 495
Ser Glu Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu Gly Phe Gln Gly
500 505 510
Phe Val Met Ser Asp Trp Thr Ala Gln His Ser Gly Val Gly Ala Ala
515 520 525
Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val Thr Phe Asp Ser
530 535 540
Gly Thr Ser Phe Trp Gly Ala Asn Leu Thr Val Gly Val Leu Asn Gly
545 550 555 560
Thr Ile Pro Gln Trp Arg Val Asp Asp Met Ala Val Arg Ile Met Ala
565 570 575
Ala Tyr Tyr Lys Val Gly Arg Asp Thr Lys Tyr Thr Pro Pro Asn Phe
580 585 590
Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Ala His Asn His Val Ser
595 600 605
Glu Gly Ala Tyr Glu Arg Val Asn Glu Phe Val Asp Val Gln Arg Asp
610 615 620
His Ala Asp Leu Ile Arg Arg Ile Gly Ala Gln Ser Thr Val Leu Leu
625 630 635 640
Lys Asn Lys Gly Ala Leu Pro Leu Ser Arg Lys Glu Lys Leu Val Ala
645 650 655
Leu Leu Gly Glu Asp Ala Gly Ser Asn Ser Trp Gly Ala Asn Gly Cys
660 665 670
Asp Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met Ala Trp Gly Ser
675 680 685
Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu Gln Ala Ile Gln
690 695 700
Asn Glu Val Leu Gln Gly Arg Gly Asn Val Phe Ala Val Thr Asp Ser
705 710 715 720
Trp Ala Leu Asp Lys Ile Ala Ala Ala Ala Arg Gln Ala Ser Val Ser
725 730 735
Leu Val Phe Val Asn Ser Asp Ser Gly Glu Gly Tyr Leu Ser Val Asp
740 745 750
Gly Asn Glu Gly Asp Arg Asn Asn Ile Thr Leu Trp Lys Asn Gly Asp
755 760 765
Asn Val Val Lys Thr Ala Ala Asn Asn Cys Asn Asn Thr Val Val Ile
770 775 780
Ile His Ser Val Gly Pro Val Leu Ile Asp Glu Trp Tyr Asp His Pro
785 790 795 800
Asn Val Thr Gly Ile Leu Trp Ala Gly Leu Pro Gly Gln Glu Ser Gly
805 810 815
Asn Ser Ile Ala Asp Val Leu Tyr Gly Arg Val Asn Pro Gly Ala Lys
820 825 830
Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr Gly Ser Pro Leu
835 840 845
Val Lys Asp Ala Asn Asn Gly Asn Gly Ala Pro Gln Ser Asp Phe Thr
850 855 860
Gln Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys Phe Asn Glu Thr
865 870 875 880
Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr Thr Phe Glu Leu
885 890 895
Ser Asp Leu His Val Gln Pro Leu Asn Ala Ser Arg Tyr Thr Pro Thr
900 905 910
Ser Gly Met Thr Glu Ala Ala Lys Asn Phe Gly Glu Ile Gly Asp Ala
915 920 925
Ser Glu Tyr Val Tyr Pro Glu Gly Leu Glu Arg Ile His Glu Phe Ile
930 935 940
Tyr Pro Trp Ile Asn Ser Thr Asp Leu Lys Ala Ser Ser Asp Asp Ser
945 950 955 960
Asn Tyr Gly Trp Glu Asp Ser Lys Tyr Ile Pro Glu Gly Ala Thr Asp
965 970 975
Gly Ser Ala Gln Pro Arg Leu Pro Ala Ser Gly Gly Ala Gly Gly Asn
980 985 990
Pro Gly Leu Tyr Glu Asp Leu Phe Arg Val Ser Val Lys Val Lys Asn
995 1000 1005
Thr Gly Asn Val Ala Gly Asp Glu Val Pro Gln Leu Tyr Val Ser
1010 1015 1020
Leu Gly Gly Pro Asn Glu Pro Lys Val Val Leu Arg Lys Phe Glu
1025 1030 1035
Arg Ile His Leu Ala Pro Ser Gln Glu Ala Val Trp Thr Thr Thr
1040 1045 1050
Leu Thr Arg Arg Asp Leu Ala Asn Trp Asp Val Ser Ala Gln Asp
1055 1060 1065
Trp Thr Val Thr Pro Tyr Pro Lys Thr Ile Tyr Val Gly Asn Ser
1070 1075 1080
Ser Arg Lys Leu Pro Leu Gln Ala Ser Leu Pro Lys Ala Gln
1085 1090 1095
<210>51
<211>1846
<212>DNA
<213>土生梭孢壳
<400>51
aattgaagga gggagtggcg gagtggccac caagtcaggc ggctgtcaac taaccaagga 60
tgggaacagt tcggctcgcc ttgcccgagg gcagcgttcc ctgatgggga cgaaccatgg 120
gactggggtc agctgctgta taaaagttca aatcgatgat ctctcagatg gcgctgctgg 180
ggtgttctgc gcttttccat cctcgcaacc tggtatccca ctagtccagc gttcggcacc 240
atgaagtcgt tcaccattgc cgccttggca gccctatggg cccaggaggc cgccgcccac 300
gcgaccttcc aggacctctg gattgatgga gtcgactacg gctcgcaatg tgtccgcctc 360
ccggcgtcca actcccccgt caccaatgtt gcgtccgacg atatccgatg caatgtcggc 420
acctcgaggc ccaccgtcaa gtgcccggtc aaggccggct ccacggtcac gatcgagatg 480
caccaggttc gcacgcctct ctgcgtaggc cccccagcta ctatatggca ctaacacgac 540
ctccagcaac ctggcgaccg gtcttgcgcc aacgaggcta tcggcggcga ccactacggc 600
cccgtaatgg tgtacatgtc caaggtcgat gacgcggtga cagccgacgg ttcatcgggc 660
tggttcaagg tgttccagga cagctgggcc aagaacccgt cgggttcgac gggcgacgac 720
gactactggg gcaccaagga cctcaactcg tgctgcggca agatgaacgt caagatcccc 780
gaagacatcg agccgggcga ctacctgctc cgcgccgagg ttatcgcgct gcacgtggcc 840
gccagctcgg gcggcgcgca gttctacatg tcctgctacc agctgaccgt gacgggctcc 900
ggcagcgcca ccccctcgac cgtgaatttc ccgggcgcct actcggccag cgacccgggc 960
atcctgatca acatccacgc gcccatgtcg acctacgtcg tcccgggccc gaccgtgtac 1020
gcgggcggct cgaccaagtc ggctggcagc tcctgctccg gctgcgaggc gacctgcacg 1080
gttggttccg gccccagcgc gacactgacg cagcccacct ccaccgcgac cgcgacctcc 1140
gcccctggcg gcggcggctc cggctgcacg gcggccaagt accagcagtg cggcggcacc 1200
ggctacactg ggtgcaccac ctgcgctgta agttccctcg tgatatgcag cggaacaccg 1260
tctggactgt tttgctaact cgcgtcgtag tccgggtcta cctgcagcgc cgtctcgcct 1320
ccgtactact cgcagtgcct ctaagccggg agcgcttgct cagcgggctg ctgtgaagga 1380
gctccatgtc cccatgccgc catggccgga gtaccgggct gagcgcccaa ttcttgtata 1440
tagttgagtt ttcccaatca tgaatacata tgcatctgca tggactgttg cgtcgtcagt 1500
ctacatcctt tgctccactg aactgtgaga ccccatgtca tccggaccat tcgatcggtg 1560
ctcgctctac catctcggtt gatgggtctg ggcttgagag tcactggcac gtcctcggcg 1620
gtaatgaaat gtggaggaaa gtgtgagctg tctgacgcac tcggcgctga tgagacgttg 1680
agcgcggccc acactggtgt tctgtaagcc agcacacaaa agaatactcc aggatggccc 1740
atagcggcaa atatacagta tcagggatgc aaaaagtgca aaagtaaggg gctcaatcgg 1800
ggatcgaacc cgagacctcg cacatgactt atttcaagtc aggggt 1846
<210>52
<211>326
<212>PRT
<213>土生梭孢壳
<400>52
Met Lys Ser Phe Thr Ile Ala Ala Leu Ala Ala Leu Trp Ala Gln Glu
1 5 10 15
Ala Ala Ala His Ala Thr Phe Gln Asp Leu Trp Ile Asp Gly Val Asp
20 25 30
Tyr Gly Ser Gln Cys Val Arg Leu Pro Ala Ser Asn Ser Pro Val Thr
35 40 45
Asn Val Ala Ser Asp Asp Ile Arg Cys Asn Val Gly Thr Ser Arg Pro
50 55 60
Thr Val Lys Cys Pro Val Lys Ala Gly Ser Thr Val Thr Ile Glu Met
65 70 75 80
His Gln Gln Pro Gly Asp Arg Ser Cys Ala Asn Glu Ala Ile Gly Gly
85 90 95
Asp His Tyr Gly Pro Val Met Val Tyr Met Ser Lys Val Asp Asp Ala
100 105 110
Val Thr Ala Asp Gly Ser Ser Gly Trp Phe Lys Val Phe Gln Asp Ser
115 120 125
Trp Ala Lys Asn Pro Ser Gly Ser Thr Gly Asp Asp Asp Tyr Trp Gly
130 135 140
Thr Lys Asp Leu Asn Ser Cys Cys Gly Lys Met Asn Val Lys Ile Pro
145 150 155 160
Glu Asp Ile Glu Pro Gly Asp Tyr Leu Leu Arg Ala Glu Val Ile Ala
165 170 175
Leu His Val Ala Ala Ser Ser Gly Gly Ala Gln Phe Tyr Met Ser Cys
180 185 190
Tyr Gln Leu Thr Val Thr Gly Ser Gly Ser Ala Thr Pro Ser Thr Val
195 200 205
Asn Phe Pro Gly Ala Tyr Ser Ala Ser Asp Pro Gly Ile Leu Ile Asn
210 215 220
Ile His Ala Pro Met Ser Thr Tyr Val Val Pro Gly Pro Thr Val Tyr
225 230 235 240
Ala Gly Gly Ser Thr Lys Ser Ala Gly Ser Ser Cys Ser Gly Cys Glu
245 250 255
Ala Thr Cys Thr Val Gly Ser Gly Pro Ser Ala Thr Leu Thr Gln Pro
260 265 270
Thr Ser Thr Ala Thr Ala Thr Ser Ala Pro Gly Gly Gly Gly Ser Gly
275 280 285
Cys Thr Ala Ala Lys Tyr Gln Gln Cys Gly Gly Thr Gly Tyr Thr Gly
290 295 300
Cys Thr Thr Cys Ala Ser Gly Ser Thr Cys Ser Ala Val Ser Pro Pro
305 310 315 320
Tyr Tyr Ser Gln Cys Leu
325
<210>53
<211>880
<212>DNA
<213>土生梭孢壳
<400>53
accccgggat cactgcccct aggaaccagc acacctcggt ccaatcatgc ggttcgacgc 60
cctctccgcc ctcgctcttg cgccgcttgt ggctggccac ggcgccgtga ccagctacat 120
catcggcggc aaaacctatc ccggctacga gggcttctcg cctgcctcga gcccgccgac 180
gatccagtac cagtggcccg actacaaccc gaccctgagc gtgaccgacc cgaagatgcg 240
ctgcaacggc ggcacctcgg cagagctcag cgcgcccgtc caggccggcg agaacgtgac 300
ggccgtctgg aagcagtgga cccaccagca aggccccgtc atggtctgga tgttcaagtg 360
ccccggcgac ttctcgtcgt gccacggcga cggcaagggc tggttcaaga tcgaccagct 420
gggcctgtgg ggcaacaacc tcaactcgaa caactggggc accgcgatcg tctacaagac 480
cctccagtgg agcaacccga tccccaagaa cctcgcgccg ggcaactacc tcatccgcca 540
cgagctgctc gccctgcacc aggccaacac gccgcagttc tacgccgagt gcgcccagct 600
ggtcgtctcc ggcagcggct ccgccctgcc cccgtccgac tacctctaca gcatccccgt 660
ctacgcgccc cagaacgacc ccggcatcac cgtgagtggg cttccgttcc gcggcgagct 720
ctgtggaaat cttgctgacg atgggctagg ttgacatcta caacggcggg cttacctcct 780
acaccccgcc cggcggcccc gtctggtctg gcttcgagtt ttaggcgcat tgagtcgggg 840
gctacgaggg gaaggcatct gttcgcatga gcgtgggtac 880
<210>54
<211>478
<212>PRT
<213>土生梭孢壳
<400>54
Met Arg Phe Asp Ala Leu Ser Ala Leu Ala Leu Ala Pro Leu Val Ala
1 5 10 15
Gly His Gly Ala Val Thr Ser Tyr Ile Ile Gly Gly Lys Thr Tyr Pro
20 25 30
Gly Tyr Glu Gly Phe Ser Pro Ala Ser Ser Pro Pro Thr Ile Gln Tyr
35 40 45
Gln Trp Pro Asp Tyr Asn Pro Thr Leu Ser Val Thr Asp Pro Lys Met
50 55 60
Arg Cys Asn Gly Gly Thr Ser Ala Glu Leu Ser Ala Pro Val Gln Ala
65 70 75 80
Gly Glu Asn Val Thr Ala Val Trp Lys Gln Trp Thr His Gln Gln Gly
85 90 95
Pro Val Met Val Trp Met Phe Lys Cys Pro Gly Asp Phe Ser Ser Ser
100 105 110
His Gly Asp Gly Lys Gly Trp Phe Lys Ile Asp Gln Leu Gly Leu Trp
115 120 125
Gly Asn Asn Leu Asn Ser Asn Asn Trp Gly Thr Ala Ile Val Tyr Lys
130 135 140
Thr Leu Gln Trp Ser Asn Pro Ile Pro Lys Asn Leu Ala Pro Gly Asn
145 150 155 160
Tyr Leu Ile Arg His Glu Leu Leu Ala Leu His Gln Ala Asn Thr Pro
165 170 175
Gln Phe Tyr Ala Glu Cys Ala Gln Leu Val Val Ser Gly Ser Gly Ser
180 185 190
Ala Leu Pro Pro Ser Asp Tyr Leu Tyr Ser Ile Pro Val Tyr Ala Pro
195 200 205
Gln Asn Asp Pro Gly Ile Thr Val Asp Ile Tyr Asn Gly Gly Leu Thr
210 215 220
Ser Tyr Thr Pro Pro Gly Gly Pro Val Trp Ser Gly Phe Glu Phe Met
225 230 235 240
Arg Phe Asp Ala Leu Ser Ala Leu Ala Leu Ala Pro Leu Val Ala Gly
245 250 255
His Gly Ala Val Thr Ser Tyr Ile Ile Gly Gly Lys Thr Tyr Pro Gly
260 265 270
Tyr Glu Gly Phe Ser Pro Ala Ser Ser Pro Pro Thr Ile Gln Tyr Gln
275 280 285
Trp Pro Asp Tyr Asn Pro Thr Leu Ser Val Thr Asp Pro Lys Met Arg
290 295 300
Cys Asn Gly Gly Thr Ser Ala Glu Leu Ser Ala Pro Val Gln Ala Gly
305 310 315 320
Glu Asn Val Thr Ala Val Trp Lys Gln Trp Thr His Gln Gln Gly Pro
325 330 335
Val Met Val Trp Met Phe Lys Cys Pro Gly Asp Phe Ser Ser Ser His
340 345 350
Gly Asp Gly Lys Gly Trp Phe Lys Ile Asp Gln Leu Gly Leu Trp Gly
355 360 365
Asn Asn Leu Asn Ser Asn Asn Trp Gly Thr Ala Ile Val Tyr Lys Thr
370 375 380
Leu Gln Trp Ser Asn Pro Ile Pro Lys Asn Leu Ala Pro Gly Asn Tyr
385 390 395 400
Leu Ile Arg His Glu Leu Leu Ala Leu His Gln Ala Asn Thr Pro Gln
405 410 415
Phe Tyr Ala Glu Cys Ala Gln Leu Val Val Ser Gly Ser Gly Ser Ala
420 425 430
Leu Pro Pro Ser Asp Tyr Leu Tyr Ser Ile Pro Val Tyr Ala Pro Gln
435 440 445
Asn Asp Pro Gly Ile Thr Val Asp Ile Tyr Asn Gly Gly Leu Thr Ser
450 455 460
Tyr Thr Pro Pro Gly Gly Pro Val Trp Ser Gly Phe Glu Phe
465 470 475
<210>55
<211>1000
<212>DNA
<213>土生梭孢壳
<400>55
ctcctgttcc tgggccaccg cttgttgcct gcactattgg tagagttggt ctattgctag 60
agttggccat gcttctcaca tcagtcctcg gctcggctgc cctgcttgct agcggcgctg 120
cggcacacgg cgccgtgacc agctacatca tcgccggcaa gaattacccg gggtgggtag 180
ctgattattg agggcgcatt caaggttcat accggtgtgc atggctgaca accggctggc 240
agataccaag gcttttctcc tgcgaactcg ccgaacgtca tccaatggca atggcatgac 300
tacaaccccg tcttgtcgtg cagcgactcg aagcttcgct gcaacggcgg cacgtcggcc 360
accctgaacg ccacggccgc accgggcgac accatcaccg ccatctgggc gcagtggacg 420
cacagccagg gccccatcct ggtgtggatg tacaagtgcc cgggctcctt cagctcctgt 480
gacggctccg gcgctggctg gttcaagatc gacgaggccg gcttccacgg cgacggcgtc 540
aaggtcttcc tcgacaccga gaacccgtcc ggctgggaca tcgccaagct cgtcggcggc 600
aacaagcagt ggagcagcaa ggtccccgag ggcctcgccc ccggcaacta cctcgtccgc 660
cacgagttga tcgccctgca ccaggccaac aacccgcagt tctacccgga gtgcgcccag 720
gtcgtcatca ccggctccgg caccgcgcag ccggatgcct catacaaggc ggctatcccc 780
ggctactgca accagaatga cccgaacatc aaggtgagat ccaggcgtaa tgcagtctac 840
tgctggaaag aaagtggtcc aagctaaacc gcgctccagg tgcccatcaa cgaccactcc 900
atccctcaga cctacaagat tcccggccct cccgtcttca agggcaccgc cagcaagaag 960
gcccgggact tcaccgcctg aagttgttga atcgatggag 1000
<210>56
<211>516
<212>PRT
<213>土生梭孢壳
<400>56
Met Leu Leu Thr Ser Val Leu Gly Ser Ala Ala Leu Leu Ala Ser Gly
1 5 10 15
Ala Ala Ala His Gly Ala Val Thr Ser Tyr Ile Ile Ala Gly Lys Asn
20 25 30
Tyr Pro Gly Tyr Gln Gly Phe Ser Pro Ala Asn Ser Pro Asn Val Ile
35 40 45
Gln Trp Gln Trp His Asp Tyr Asn Pro Val Leu Ser Cys Ser Asp Ser
50 55 60
Lys Leu Arg Cys Asn Gly Gly Thr Ser Ala Thr Leu Asn Ala Thr Ala
65 70 75 80
Ala Pro Gly Asp Thr Ile Thr Ala Ile Trp Ala Gln Trp Thr His Ser
85 90 95
Gln Gly Pro Ile Leu Val Trp Met Tyr Lys Cys Pro Gly Ser Phe Ser
100 105 110
Ser Cys Asp Gly Ser Gly Ala Gly Trp Phe Lys Ile Asp Glu Ala Gly
115 120 125
Phe His Gly Asp Gly Val Lys Val Phe Leu Asp Thr Glu Asn Pro Ser
130 135 140
Gly Trp Asp Ile Ala Lys Leu Val Gly Gly Asn Lys Gln Trp Ser Ser
145 150 155 160
Lys Val Pro Glu Gly Leu Ala Pro Gly Asn Tyr Leu Val Arg His Glu
165 170 175
Leu Ile Ala Leu His Gln Ala Asn Asn Pro Gln Phe Tyr Pro Glu Cys
180 185 190
Ala Gln Val Val Ile Thr Gly Ser Gly Thr Ala Gln Pro Asp Ala Ser
195 200 205
Tyr Lys Ala Ala Ile Pro Gly Tyr Cys Asn Gln Asn Asp Pro Asn Ile
210 215 220
Lys Val Pro Ile Asn Asp His Ser Ile Pro Gln Thr Tyr Lys Ile Pro
225 230 235 240
Gly Pro Pro Val Phe Lys Gly Thr Ala Ser Lys Lys Ala Arg Asp Phe
245 250 255
Thr Ala Met Leu Leu Thr Ser Val Leu Gly Ser Ala Ala Leu Leu Ala
260 265 270
Ser Gly Ala Ala Ala His Gly Ala Val Thr Ser Tyr Ile Ile Ala Gly
275 280 285
Lys Asn Tyr Pro Gly Tyr Gln Gly Phe Ser Pro Ala Asn Ser Pro Asn
290 295 300
Val Ile Gln Trp Gln Trp His Asp Tyr Asn Pro Val Leu Ser Cys Ser
305 310 315 320
Asp Ser Lys Leu Arg Cys Asn Gly Gly Thr Ser Ala Thr Leu Asn Ala
325 330 335
Thr Ala Ala Pro Gly Asp Thr Ile Thr Ala Ile Trp Ala Gln Trp Thr
340 345 350
His Ser Gln Gly Pro Ile Leu Val Trp Met Tyr Lys Cys Pro Gly Ser
355 360 365
Phe Ser Ser Cys Asp Gly Ser Gly Ala Gly Trp Phe Lys Ile Asp Glu
370 375 380
Ala Gly Phe His Gly Asp Gly Val Lys Val Phe Leu Asp Thr Glu Asn
385 390 395 400
Pro Ser Gly Trp Asp Ile Ala Lys Leu Val Gly Gly Asn Lys Gln Trp
405 410 415
Ser Ser Lys Val Pro Glu Gly Leu Ala Pro Gly Asn Tyr Leu Val Arg
420 425 430
His Glu Leu Ile Ala Leu His Gln Ala Asn Asn Pro Gln Phe Tyr Pro
435 440 445
Glu Cys Ala Gln Val Val Ile Thr Gly Ser Gly Thr Ala Gln Pro Asp
450 455 460
Ala Ser Tyr Lys Ala Ala Ile Pro Gly Tyr Cys Asn Gln Asn Asp Pro
465 470 475 480
Asn Ile Lys Val Pro Ile Asn Asp His Ser Ile Pro Gln Thr Tyr Lys
485 490 495
Ile Pro Gly Pro Pro Val Phe Lys Gly Thr Ala Ser Lys Lys Ala Arg
500 505 510
Asp Phe Thr Ala
515
<210>57
<211>681
<212>DNA
<213>土生梭孢壳
<400>57
atgctcgcaa acggtgccat cgtcttcctg gccgccgccc tcggcgtcag tggccactac 60
acctggccac gggttaacga cggcgccgac tggcaacagg tccgtaaggc ggacaactgg 120
caggacaacg gctacgtcgg ggatgtcacg tcgccacaga tccgctgttt ccaggcgacc 180
ccgtccccgg ccccatccgt cctcaacacc acggccggct cgaccgtgac ctactgggcc 240
aaccccgacg tctaccaccc cgggcctgtg cagttttaca tggcccgcgt gcccgatggc 300
gaggacatca actcgtggaa cggcgacggc gccgtgtggt tcaaggtgta cgaggaccat 360
cctacctttg gcgctcagct cacatggccc agcacgggca agagctcgtt cgcggttccc 420
atccccccgt gcatcaagtc cggctactac ctcctccggg cggagcaaat cggcctgcac 480
gtcgcccaga gcgtaggcgg agcgcagttc tacatctcat gcgcccagct cagcgtcacc 540
ggcggcggca gcaccgagcc gccgaacaag gtggccttcc ccggcgctta cagtgcgacg 600
gacccgggca ttctgatcaa catctactac cctgttccca cgtcctacca gaaccccggc 660
ccggccgtct tcagctgctg a 681
<210>58
<211>452
<212>PRT
<213>土生梭孢壳
<400>58
Met Leu Ala Asn Gly Ala Ile Val Phe Leu Ala Ala Ala Leu Gly Val
1 5 10 15
Ser Gly His Tyr Thr Trp Pro Arg Val Asn Asp Gly Ala Asp Trp Gln
20 25 30
Gln Val Arg Lys Ala Asp Asn Trp Gln Asp Asn Gly Tyr Val Gly Asp
35 40 45
Val Thr Ser Pro Gln Ile Arg Cys Phe Gln Ala Thr Pro Ser Pro Ala
50 55 60
Pro Ser Val Leu Asn Thr Thr Ala Gly Ser Thr Val Thr Tyr Trp Ala
65 70 75 80
Asn Pro Asp Val Tyr His Pro Gly Pro Val Gln Phe Tyr Met Ala Arg
85 90 95
Val Pro Asp Gly Glu Asp Ile Asn Ser Trp Asn Gly Asp Gly Ala Val
100 105 110
Trp Phe Lys Val Tyr Glu Asp His Pro Thr Phe Gly Ala Gln Leu Thr
115 120 125
Trp Pro Ser Thr Gly Lys Ser Ser Phe Ala Val Pro Ile Pro Pro Cys
130 135 140
Ile Lys Ser Gly Tyr Tyr Leu Leu Arg Ala Glu Gln Ile Gly Leu His
145 150 155 160
Val Ala Gln Ser Val Gly Gly Ala Gln Phe Tyr Ile Ser Cys Ala Gln
165 170 175
Leu Ser Val Thr Gly Gly Gly Ser Thr Glu Pro Pro Asn Lys Val Ala
180 185 190
Phe Pro Gly Ala Tyr Ser Ala Thr Asp Pro Gly Ile Leu Ile Asn Ile
195 200 205
Tyr Tyr Pro Val Pro Thr Ser Tyr Gln Asn Pro Gly Pro Ala Val Phe
210 215 220
Ser Cys Met Leu Ala Asn Gly Ala Ile Val Phe Leu Ala Ala Ala Leu
225 230 235 240
Gly Val Ser Gly His Tyr Thr Trp Pro Arg Val Asn Asp Gly Ala Asp
245 250 255
Trp Gln Gln Val Arg Lys Ala Asp Asn Trp Gln Asp Asn Gly Tyr Val
260 265 270
Gly Asp Val Thr Ser Pro Gln Ile Arg Cys Phe Gln Ala Thr Pro Ser
275 280 285
Pro Ala Pro Ser Val Leu Asn Thr Thr Ala Gly Ser Thr Val Thr Tyr
290 295 300
Trp Ala Asn Pro Asp Val Tyr His Pro Gly Pro Val Gln Phe Tyr Met
305 310 315 320
Ala Arg Val Pro Asp Gly Glu Asp Ile Asn Ser Trp Asn Gly Asp Gly
325 330 335
Ala Val Trp Phe Lys Val Tyr Glu Asp His Pro Thr Phe Gly Ala Gln
340 345 350
Leu Thr Trp Pro Ser Thr Gly Lys Ser Ser Phe Ala Val Pro Ile Pro
355 360 365
Pro Cys Ile Lys Ser Gly Tyr Tyr Leu Leu Arg Ala Glu Gln Ile Gly
370 375 380
Leu His Val Ala Gln Ser Val Gly Gly Ala Gln Phe Tyr Ile Ser Cys
385 390 395 400
Ala Gln Leu Ser Val Thr Gly Gly Gly Ser Thr Glu Pro Pro Asn Lys
405 410 415
Val Ala Phe Pro Gly Ala Tyr Ser Ala Thr Asp Pro Gly Ile Leu Ile
420 425 430
Asn Ile Tyr Tyr Pro Val Pro Thr Ser Tyr Gln Asn Pro Gly Pro Ala
435 440 445
Val Phe Ser Cys
450
<210>59
<211>960
<212>DNA
<213>土生梭孢壳
<400>59
atgaagggac ttttcagtgc cgccgccctc tccctggccg tcggccaggc ttcggcccat 60
tacatcttcc agcaactctc catcaacggg aaccagtttc cggtgtacca atatattcgc 120
aagaacacca attataacag tcccgttacc gatctcacgt ccgacgatct tcggtgcaat 180
gtcggcgccc agggtgctgg gacagacacc gtcacggtga aggccggcga ccagttcacc 240
ttcacccttg acacccctgt ttaccaccag gggcccatct ccatctacat gtccaaggcc 300
ccgggcgcgg cgtcagacta cgatggcagc ggcggctggt tcaagatcaa ggactggggc 360
ccgactttca acgccgacgg cacggccacc tgggacatgg ccggctcata cacctacaac 420
atcccgacct gcattcccga cggcgactat ctgctccgca tccagtcgct ggccatccac 480
aacccctggc cggcgggcat cccgcagttc tacatctcct gcgcccagat caccgtgacc 540
ggcggcggca acggcaaccc tggcccgacg gccctcatcc ccggcgcctt caaggacacc 600
gacccgggct acacggtgaa catctacacg aacttccaca actacacggt tcccggcccg 660
gaggtcttca gctgcaacgg cggcggctcg aacccgcccc cgccggtgag tagcagcacg 720
cccgcgacca cgacgctggt cacgtcgacg cgcaccacgt cctccacgtc ctccgcctcg 780
acgccggcct cgaccggcgg ctgcaccgtc gccaagtggg gccagtgcgg cggcaacggg 840
tacaccggct gcacgacctg cgcggccggg tccacctgca gcaagcagaa cgactactac 900
tcgcagtgct tgtaagggag gccgcaaagc atgaggtgtt tgaagaggag gagaggggtc 960
<210>60
<211>608
<212>PRT
<213>土生梭孢壳
<400>60
Met Lys Gly Leu Phe Ser Ala Ala Ala Leu Ser Leu Ala Val Gly Gln
1 5 10 15
Ala Ser Ala His Tyr Ile Phe Gln Gln Leu Ser Ile Asn Gly Asn Gln
20 25 30
Phe Pro Val Tyr Gln Tyr Ile Arg Lys Asn Thr Asn Tyr Asn Ser Pro
35 40 45
Val Thr Asp Leu Thr Ser Asp Asp Leu Arg Cys Asn Val Gly Ala Gln
50 55 60
Gly Ala Gly Thr Asp Thr Val Thr Val Lys Ala Gly Asp Gln Phe Thr
65 70 75 80
Phe Thr Leu Asp Thr Pro Val Tyr His Gln Gly Pro Ile Ser Ile Tyr
85 90 95
Met Ser Lys Ala Pro Gly Ala Ala Ser Asp Tyr Asp Gly Ser Gly Gly
100 105 110
Trp Phe Lys Ile Lys Asp Trp Gly Pro Thr Phe Asn Ala Asp Gly Thr
115 120 125
Ala Thr Trp Asp Met Ala Gly Ser Tyr Thr Tyr Asn Ile Pro Thr Cys
130 135 140
Ile Pro Asp Gly Asp Tyr Leu Leu Arg Ile Gln Ser Leu Ala Ile His
145 150 155 160
Asn Pro Trp Pro Ala Gly Ile Pro Gln Phe Tyr Ile Ser Cys Ala Gln
165 170 175
Ile Thr Val Thr Gly Gly Gly Asn Gly Asn Pro Gly Pro Thr Ala Leu
180 185 190
Ile Pro Gly Ala Phe Lys Asp Thr Asp Pro Gly Tyr Thr Val Asn Ile
195 200 205
Tyr Thr Asn Phe His Asn Tyr Thr Val Pro Gly Pro Glu Val Phe Ser
210 215 220
Cys Asn Gly Gly Gly Ser Asn Pro Pro Pro Pro Val Ser Ser Ser Thr
225 230 235 240
Pro Ala Thr Thr Thr Leu Val Thr Ser Thr Arg Thr Thr Ser Ser Thr
245 250 255
Ser Ser Ala Ser Thr Pro Ala Ser Thr Gly Gly Cys Thr Val Ala Lys
260 265 270
Trp Gly Gln Cys Gly Gly Asn Gly Tyr Thr Gly Cys Thr Thr Cys Ala
275 280 285
Ala Gly Ser Thr Cys Ser Lys Gln Asn Asp Tyr Tyr Ser Gln Cys Leu
290 295 300
Met Lys Gly Leu Phe Ser Ala Ala Ala Leu Ser Leu Ala Val Gly Gln
305 310 315 320
Ala Ser Ala His Tyr Ile Phe Gln Gln Leu Ser Ile Asn Gly Asn Gln
325 330 335
Phe Pro Val Tyr Gln Tyr Ile Arg Lys Asn Thr Asn Tyr Asn Ser Pro
340 345 350
Val Thr Asp Leu Thr Ser Asp Asp Leu Arg Cys Asn Val Gly Ala Gln
355 360 365
Gly Ala Gly Thr Asp Thr Val Thr Val Lys Ala Gly Asp Gln Phe Thr
370 375 380
Phe Thr Leu Asp Thr Pro Val Tyr His Gln Gly Pro Ile Ser Ile Tyr
385 390 395 400
Met Ser Lys Ala Pro Gly Ala Ala Ser Asp Tyr Asp Gly Ser Gly Gly
405 410 415
Trp Phe Lys Ile Lys Asp Trp Gly Pro Thr Phe Asn Ala Asp Gly Thr
420 425 430
Ala Thr Trp Asp Met Ala Gly Ser Tyr Thr Tyr Asn Ile Pro Thr Cys
435 440 445
Ile Pro Asp Gly Asp Tyr Leu Leu Arg Ile Gln Ser Leu Ala Ile His
450 455 460
Asn Pro Trp Pro Ala Gly Ile Pro Gln Phe Tyr Ile Ser Cys Ala Gln
465 470 475 480
Ile Thr Val Thr Gly Gly Gly Asn Gly Asn Pro Gly Pro Thr Ala Leu
485 490 495
Ile Pro Gly Ala Phe Lys Asp Thr Asp Pro Gly Tyr Thr Val Asn Ile
500 505 510
Tyr Thr Asn Phe His Asn Tyr Thr Val Pro Gly Pro Glu Val Phe Ser
515 520 525
Cys Asn Gly Gly Gly Ser Asn Pro Pro Pro Pro Val Ser Ser Ser Thr
530 535 540
Pro Ala Thr Thr Thr Leu Val Thr Ser Thr Arg Thr Thr Ser Ser Thr
545 550 555 560
Ser Ser Ala Ser Thr Pro Ala Ser Thr Gly Gly Cys Thr Val Ala Lys
565 570 575
Trp Gly Gln Cys Gly Gly Asn Gly Tyr Thr Gly Cys Thr Thr Cys Ala
580 585 590
Ala Gly Ser Thr Cys Ser Lys Gln Asn Asp Tyr Tyr Ser Gln Cys Leu
595 600 605
<210>61
<211>954
<212>DNA
<213>土生梭孢壳
<400>61
atgaagggcc tcagcctcct cgccgctgcg tcggcagcga ctgctcatac catcttcgtg 60
cagctcgagt cagggggaac gacctatccg gtatcctacg gcatccggga ccctagctac 120
gacggtccca tcaccgacgt cacctccgac tcactggctt gcaatggtcc cccgaacccc 180
acgacgccgt ccccgtacat catcaacgtc accgccggca ccacggtcgc ggcgatctgg 240
aggcacaccc tcacatccgg ccccgacgat gtcatggacg ccagccacaa ggggccgacc 300
ctggcctacc tcaagaaggt cgatgatgcc ttgaccgaca cgggtatcgg cggcggctgg 360
ttcaagatcc aggaggccgg ttacgacaat ggcaattggg ctaccagcac ggtgatcacc 420
aacggtggct tccaatatat tgacatcccc gcctgcattc ccaacggcca gtatctgctc 480
cgcgccgaga tgatcgcgct ccacgccgcc agcacgcagg gtggtgccca gctctacatg 540
gagtgcgcgc agatcaacgt ggtgggcggc tccggcagcg ccagcccgca gacgtacagc 600
atcccgggca tctaccaggc aaccgacccg ggcctgctga tcaacatcta ctccatgacg 660
ccgtccagcc agtacaccat tccgggtccg cccctgttca cctgcagcgg cagcggcaac 720
aacggcggcg gcagcaaccc gtcgggcggg cagaccacga cggcgaagcc cacgacgacg 780
acggcggcga cgaccacctc ctccgccgct cctaccagca gccagggggg cagcagcggt 840
tgcaccgttc cccagtggca gcagtgcggt ggcatctcgt tcaccggctg caccacctgc 900
gcggcgggct acacctgcaa gtatctgaac gactattact cgcaatgcca gtaa 954
<210>62
<211>317
<212>PRT
<213>土生梭孢壳
<400>62
Met Lys Gly Leu Ser Leu Leu Ala Ala Ala Ser Ala Ala Thr Ala His
1 5 10 15
Thr Ile Phe Val Gln Leu Glu Ser Gly Gly Thr Thr Tyr Pro Val Ser
20 25 30
Tyr Gly Ile Arg Asp Pro Ser Tyr Asp Gly Pro Ile Thr Asp Val Thr
35 40 45
Ser Asp Ser Leu Ala Cys Asn Gly Pro Pro Asn Pro Thr Thr Pro Ser
50 55 60
Pro Tyr Ile Ile Asn Val Thr Ala Gly Thr Thr Val Ala Ala Ile Trp
65 70 75 80
Arg His Thr Leu Thr Ser Gly Pro Asp Asp Val Met Asp Ala Ser His
85 90 95
Lys Gly Pro Thr Leu Ala Tyr Leu Lys Lys Val Asp Asp Ala Leu Thr
100 105 110
Asp Thr Gly Ile Gly Gly Gly Trp Phe Lys Ile Gln Glu Ala Gly Tyr
115 120 125
Asp Asn Gly Asn Trp Ala Thr Ser Thr Val Ile Thr Asn Gly Gly Phe
130 135 140
Gln Tyr Ile Asp Ile Pro Ala Cys Ile Pro Asn Gly Gln Tyr Leu Leu
145 150 155 160
Arg Ala Glu Met Ile Ala Leu His Ala Ala Ser Thr Gln Gly Gly Ala
165 170 175
Gln Leu Tyr Met Glu Cys Ala Gln Ile Asn Val Val Gly Gly Ser Gly
180 185 190
Ser Ala Ser Pro Gln Thr Tyr Ser Ile Pro Gly Ile Tyr Gln Ala Thr
195 200 205
Asp Pro Gly Leu Leu Ile Asn Ile Tyr Ser Met Thr Pro Ser Ser Gln
210 215 220
Tyr Thr Ile Pro Gly Pro Pro Leu Phe Thr Cys Ser Gly Ser Gly Asn
225 230 235 240
Asn Gly Gly Gly Ser Asn Pro Ser Gly Gly Gln Thr Thr Thr Ala Lys
245 250 255
Pro Thr Thr Thr Thr Ala Ala Thr Thr Thr Ser Ser Ala Ala Pro Thr
260 265 270
Ser Ser Gln Gly Gly Ser Ser Gly Cys Thr Val Pro Gln Trp Gln Gln
275 280 285
Cys Gly Gly Ile Ser Phe Thr Gly Cys Thr Thr Cys Ala Ala Gly Tyr
290 295 300
Thr Cys Lys Tyr Leu Asn Asp Tyr Tyr Ser Gln Cys Gln
305 310 315
<210>63
<211>799
<212>DNA
<213>橙色嗜热子囊菌(Thermoascus aurantiacus)
<400>63
atgtcctttt ccaagataat tgctactgcc ggcgttcttg cctctgcttc tctagtggct 60
ggccatggct tcgttcagaa catcgtgatt gatggtaaaa agtatgtcat tgcaagacgc 120
acataagcgg caacagctga caatcgacag ttatggcggg tatctagtga accagtatcc 180
atacatgtcc aatcctccag aggtcatcgc ctggtctact acggcaactg atcttggatt 240
tgtggacggt actggatacc aaaccccaga tatcatctgc cataggggcg ccaagcctgg 300
agccctgact gctccagtct ctccaggagg aactgttgag cttcaatgga ctccatggcc 360
tgattctcac catggcccag ttatcaacta ccttgctccg tgcaatggtg attgttccac 420
tgtggataag acccaattag aattcttcaa aattgccgag agcggtctca tcaatgatga 480
caatcctcct gggatctggg cttcagacaa tctgatagca gccaacaaca gctggactgt 540
caccattcca accacaattg cacctggaaa ctatgttctg aggcatgaga ttattgctct 600
tcactcagct cagaaccagg atggtgccca gaactatccc cagtgcatca atctgcaggt 660
cactggaggt ggttctgata accctgctgg aactcttgga acggcactct accacgatac 720
cgatcctgga attctgatca acatctatca gaaactttcc agctatatca tccctggtcc 780
tcctctgtat actggttaa 799
<210>64
<211>250
<212>PRT
<213>橙色嗜热子囊菌
<400>64
Met Ser Phe Ser Lys Ile Ile Ala Thr Ala Gly Val Leu Ala Ser Ala
1 5 10 15
Ser Leu Val Ala Gly His Gly Phe Val Gln Asn Ile Val Ile Asp Gly
20 25 30
Lys Lys Tyr Tyr Gly Gly Tyr Leu Val Asn Gln Tyr Pro Tyr Met Ser
35 40 45
Asn Pro Pro Glu Val Ile Ala Trp Ser Thr Thr Ala Thr Asp Leu Gly
50 55 60
Phe Val Asp Gly Thr Gly Tyr Gln Thr Pro Asp Ile Ile Cys His Arg
65 70 75 80
Gly Ala Lys Pro Gly Ala Leu Thr Ala Pro Val Ser Pro Gly Gly Thr
85 90 95
Val Glu Leu Gln Trp Thr Pro Trp Pro Asp Ser His His Gly Pro Val
100 105 110
Ile Asn Tyr Leu Ala Pro Cys Asn Gly Asp Cys Ser Thr Val Asp Lys
115 120 125
Thr Gln Leu Glu Phe Phe Lys Ile Ala Glu Ser Gly Leu Ile Asn Asp
130 135 140
Asp Asn Pro Pro Gly Ile Trp Ala Ser Asp Asn Leu Ile Ala Ala Asn
145 150 155 160
Asn Ser Trp Thr Val Thr Ile Pro Thr Thr Ile Ala Pro Gly Asn Tyr
165 170 175
Val Leu Arg His Glu Ile Ile Ala Leu His Ser Ala Gln Asn Gln Asp
180 185 190
Gly Ala Gln Asn Tyr Pro Gln Cys Ile Asn Leu Gln Val Thr Gly Gly
195 200 205
Gly Ser Asp Asn Pro Ala Gly Thr Leu Gly Thr Ala Leu Tyr His Asp
210 215 220
Thr Asp Pro Gly Ile Leu Ile Asn Ile Tyr Gln Lys Leu Ser Ser Tyr
225 230 235 240
Ile Ile Pro Gly Pro Pro Leu Tyr Thr Gly
245 250
<210>65
<211>1172
<212>DNA
<213>里氏木霉
<400>65
ggatctaagc cccatcgata tgaagtcctg cgccattctt gcagcccttg gctgtcttgc 60
cgggagcgtt ctcggccatg gacaagtcca aaacttcacg atcaatggac aatacaatca 120
gggtttcatt ctcgattact actatcagaa gcagaatact ggtcacttcc ccaacgttgc 180
tggctggtac gccgaggacc tagacctggg cttcatctcc cctgaccaat acaccacgcc 240
cgacattgtc tgtcacaaga acgcggcccc aggtgccatt tctgccactg cagcggccgg 300
cagcaacatc gtcttccaat ggggccctgg cgtctggcct cacccctacg gtcccatcgt 360
tacctacgtg gctgagtgca gcggatcgtg cacgaccgtg aacaagaaca acctgcgctg 420
ggtcaagatt caggaggccg gcatcaacta taacacccaa gtctgggcgc agcaggatct 480
gatcaaccag ggcaacaagt ggactgtgaa gatcccgtcg agcctcaggc ccggaaacta 540
tgtcttccgc catgaacttc ttgctgccca tggtgcctct agtgcgaacg gcatgcagaa 600
ctatcctcag tgcgtgaaca tcgccgtcac aggctcgggc acgaaagcgc tccctgccgg 660
aactcctgca actcagctct acaagcccac tgaccctggc atcttgttca acccttacac 720
aacaatcacg agctacacca tccctggccc agccctgtgg caaggctaga tccaggggta 780
cggtgttggc gttcgtgaag tcggagctgt tgacaaggat atctgatgat gaacggagag 840
gactgatggg cgtgactgag tgtatatatt tttgatgacc aaattgtata cgaaatccga 900
acgcatggtg atcattgttt atccctgtag tatattgtct ccaggctgct aagagcccac 960
cgggtgtatt acggcaacaa agtcaggaat ttgggtggca atgaacgcag gtctccatga 1020
atgtatatgt gaagaggcat cggctggcat gggcattacc agatataggc cctgtgaaac 1080
atatagtact tgaacgtgct actggaacgg atcataagca agtcatcaac atgtgaaaaa 1140
acactacatg taaaaaaaaa aaaaaaaaaa aa 1172
<210>66
<211>249
<212>PRT
<213>里氏木霉
<400>66
Met Lys Ser Cys Ala Ile Leu Ala Ala Leu Gly Cys Leu Ala Gly Ser
1 5 10 15
Val Leu Gly His Gly Gln Val Gln Asn Phe Thr Ile Asn Gly Gln Tyr
20 25 30
Asn Gln Gly Phe Ile Leu Asp Tyr Tyr Tyr Gln Lys Gln Asn Thr Gly
35 40 45
His Phe Pro Asn Val Ala Gly Trp Tyr Ala Glu Asp Leu Asp Leu Gly
50 55 60
Phe Ile Ser Pro Asp Gln Tyr Thr Thr Pro Asp Ile Val Cys His Lys
65 70 75 80
Asn Ala Ala Pro Gly Ala Ile Ser Ala Thr Ala Ala Ala Gly Ser Asn
85 90 95
Ile Val Phe Gln Trp Gly Pro Gly Val Trp Pro His Pro Tyr Gly Pro
100 105 110
Ile Val Thr Tyr Val Val Glu Cys Ser Gly Ser Cys Thr Thr Val Asn
115 120 125
Lys Asn Asn Leu Arg Trp Val Lys Ile Gln Glu Ala Gly Ile Asn Tyr
130 135 140
Asn Thr Gln Val Trp Ala Gln Gln Asp Leu Ile Asn Gln Gly Asn Lys
145 150 155 160
Trp Thr Val Lys Ile Pro Ser Ser Leu Arg Pro Gly Asn Tyr Val Phe
165 170 175
Arg His Glu Leu Leu Ala Ala His Gly Ala Ser Ser Ala Asn Gly Met
180 185 190
Gln Asn Tyr Pro Gln Cys Val Asn Ile Ala Val Thr Gly Ser Gly Thr
195 200 205
Lys Ala Leu Pro Ala Gly Thr Pro Ala Thr Gln Leu Tyr Lys Pro Thr
210 215 220
Asp Pro Gly Ile Leu Phe Asn Pro Tyr Thr Thr Ile Thr Ser Tyr Thr
225 230 235 240
Ile Pro Gly Pro Ala Leu Trp Gln Gly
245
<210>67
<211>38
<212>DNA
<213>里氏木霉
<400>67
actggattta ccatgaacaa gtccgtggct ccattgct 38
<210>68
<211>38
<212>DNA
<213>里氏木霉
<400>68
tcacctctag ttaattaact actttcttgc gagacacg 38
<210>69
<211>29
<212>DNA
<213>里氏木霉
<400>69
aacgttaatt aaggaatcgt tttgtgttt 29
<210>70
<211>29
<212>DNA
<213>里氏木霉
<400>70
agtactagta gctccgtggc gaaagcctg 29
<210>71
<211>31
<212>DNA
<213>酿酒酵母(Saccharomyces cerevisiae)
<400>71
ttgaattgaa aatagattga tttaaaactt c 31
<210>72
<211>25
<212>DNA
<213>酿酒酵母
<400>72
ttgcatgcgt aatcatggtc atagc 25
<210>73
<211>26
<212>DNA
<213>酿酒酵母
<400>73
ttgaattcat gggtaataac tgatat 26
<210>74
<211>32
<212>DNA
<213>酿酒酵母
<400>74
aaatcaatct attttcaatt caattcatca tt 32
<210>75
<211>11
<212>DNA
<213>酿酒酵母
<400>75
gtactaaaac c 11
<210>76
<211>11
<212>DNA
<213>酿酒酵母
<400>76
ccgttaaatt t 11
<210>77
<211>45
<212>DNA
<213>酿酒酵母
<400>77
ggatgctgtt gactccggaa atttaacggt ttggtcttgc atccc 45
<210>78
<211>14
<212>DNA
<213>酿酒酵母
<400>78
atgcaattta aact 14
<210>79
<211>14
<212>DNA
<213>酿酒酵母
<400>79
cggcaattta acgg 14
<210>80
<211>44
<212>DNA
<213>酿酒酵母
<400>80
ggtattgtcc tgcagacggc aatttaacgg cttctgcgaa tcgc 44
<210>81
<211>29
<212>DNA
<213>特异腐质霉
<400>81
aagcttaagc atgcgttcct cccccctcc 29
<210>82
<211>32
<212>DNA
<213>特异腐质霉
<400>82
ctgcagaatt ctacaggcac tgatggtacc ag 32
<210>83
<211>32
<212>DNA
<213>里氏木霉
<400>83
ctgcagaatt ctacaggcac tgatggtacc ag 32
<210>84
<211>36
<212>DNA
<213>里氏木霉
<400>84
accgcggact gcgcatcatg cgttcctccc ccctcc 36
<210>85
<211>29
<212>DNA
<213>里氏木霉
<400>85
aaacgtcgac cgaatgtagg attgttatc 29
<210>86
<211>17
<212>DNA
<213>里氏木霉
<400>86
gatgcgcagt ccgcggt 17
<210>87
<211>29
<212>DNA
<213>里氏木霉
<400>87
aaacgtcgac cgaatgtagg attgttatc 29
<210>88
<211>36
<212>DNA
<213>里氏木霉
<400>88
ggagggggga ggaacgcatg atgcgcagtc cgcggt 36
<210>89
<211>29
<212>DNA
<213>里氏木霉
<400>89
aaacgtcgac cgaatgtagg attgttatc 29
<210>90
<211>32
<212>DNA
<213>里氏木霉
<400>90
ctgcagaatt ctacaggcac tgatggtacc ag 32
<210>91
<211>46
<212>DNA
<213>米曲霉
<400>91
atagtcaacc gcggactgcg catcatgaag cttggttgga tcgagg 46
<210>92
<211>26
<212>DNA
<213>米曲霉
<400>92
actagt ttac tgggccttag gcagcg 26
<210>93
<211>26
<212>DNA
<213>里氏木霉
<400>93
gtcgactcga agcccgaatg taggat 26
<210>94
<211>45
<212>DNA
<213>里氏木霉
<400>94
cctcgatcca accaagcttc atgatgcgca gtccgcggtt gacta 45
<210>95
<211>57
<212>DNA
<213>米曲霉
<400>95
atgaagcttg gttggatcga ggtggccgca ttggcggctg cctcagtagt cagtgcc 57
<210>96
<211>19
<212>PRT
<213>米曲霉
<400>96
Met Lys Leu Gly Trp Ile Glu Val Ala Ala Leu Ala Ala Ala Ser Val
1 5 10 15
Val Ser Ala
<210>97
<211>42
<212>DNA
<213>米曲霉
<400>97
tgccggtgtt ggcccttgcc aaggatgatc tcgcgtactc cc 42
<210>98
<211>28
<212>DNA
<213>米曲霉
<400>98
gactagtctt actgggcctt aggcagcg 28
<210>99
<211>63
<212>DNA
<213>特异腐质霉
<400>99
atgcgttcct cccccctcct ccgctccgcc gttgtggccg ccctgccggt gttggccctt 60
gcc 63
<210>100
<211>21
<212>PRT
<213>特异腐质霉
<400>100
Met Arg Ser Ser Pro Leu Leu Arg Ser Ala Val Val Ala Ala Leu Pro
1 5 10 15
Val Leu Ala Leu Ala
20
<210>101
<211>30
<212>DNA
<213>米曲霉
<400>101
acgcgtcgac cgaatgtagg attgttatcc 30
<210>102
<211>42
<212>DNA
<213>米曲霉
<400>102
gggagtacgc gagatcatcc ttggcaaggg ccaacaccgg ca 42
<210>103
<211>2586
<212>DNA
<213>米曲霉
<400>103
atgaagcttg gttggatcga ggtggccgca ttggcggctg cctcagtagt cagtgccaag 60
gatgatctcg cgtactcccc tcctttctac ccttccccat gggcagatgg tcagggtgaa 120
tgggcggaag tatacaaacg cgctgtagac atagtttccc agatgacgtt gacagagaaa 180
gtcaacttaa cgactggaac aggatggcaa ctagagaggt gtgttggaca aactggcagt 240
gttcccagac tcaacatccc cagcttgtgt ttgcaggata gtcctcttgg tattcgtttc 300
tcggactaca attcagcttt ccctgcgggt gttaatgtcg ctgccacctg ggacaagacg 360
ctcgcctacc ttcgtggtca ggcaatgggt gaggagttca gtgataaggg tattgacgtt 420
cagctgggtc ctgctgctgg ccctctcggt gctcatccgg atggcggtag aaactgggaa 480
ggtttctcac cagatccagc cctcaccggt gtactttttg cggagacgat taagggtatt 540
caagatgctg gtgtcattgc gacagctaag cattatatca tgaacgaaca agagcatttc 600
cgccaacaac ccgaggctgc gggttacgga ttcaacgtaa gcgacagttt gagttccaac 660
gttgatgaca agactatgca tgaattgtac ctctggccct tcgcggatgc agtacgcgct 720
ggagtcggtg ctgtcatgtg ctcttacaac caaatcaaca acagctacgg ttgcgagaat 780
agcgaaactc tgaacaagct tttgaaggcg gagcttggtt tccaaggctt cgtcatgagt 840
gattggaccg ctcatcacag cggcgtaggc gctgctttag caggtctgga tatgtcgatg 900
cccggtgatg ttaccttcga tagtggtacg tctttctggg gtgcaaactt gacggtcggt 960
gtccttaacg gtacaatccc ccaatggcgt gttgatgaca tggctgtccg tatcatggcc 1020
gcttattaca aggttggccg cgacaccaaa tacacccctc ccaacttcag ctcgtggacc 1080
agggacgaat atggtttcgc gcataaccat gtttcggaag gtgcttacga gagggtcaac 1140
gaattcgtgg acgtgcaacg cgatcatgcc gacctaatcc gtcgcatcgg cgcgcagagc 1200
actgttctgc tgaagaacaa gggtgccttg cccttgagcc gcaaggaaaa gctggtcgcc 1260
cttctgggag aggatgcggg ttccaactcg tggggcgcta acggctgtga tgaccgtggt 1320
tgcgataacg gtacccttgc catggcctgg ggtagcggta ctgcgaattt cccatacctc 1380
gtgacaccag agcaggcgat tcagaacgaa gttcttcagg gccgtggtaa tgtcttcgcc 1440
gtgaccgaca gttgggcgct cgacaagatc gctgcggctg cccgccaggc cagcgtatct 1500
ctcgtgttcg tcaactccga ctcaggagaa ggctatctta gtgtggatgg aaatgagggc 1560
gatcgtaaca acatcactct gtggaagaac ggcgacaatg tggtcaagac cgcagcgaat 1620
aactgtaaca acaccgttgt catcatccac tccgtcggac cagttttgat cgatgaatgg 1680
tatgaccacc ccaatgtcac tggtattctc tgggctggtc tgccaggcca ggagtctggt 1740
aactccattg ccgatgtgct gtacggtcgt gtcaaccctg gcgccaagtc tcctttcact 1800
tggggcaaga cccgggagtc gtatggttct cccttggtca aggatgccaa caatggcaac 1860
ggagcgcccc agtctgattt cacccagggt gttttcatcg attaccgcca tttcgataag 1920
ttcaatgaga cccctatcta cgagtttggc tacggcttga gctacaccac cttcgagctc 1980
tccgacctcc atgttcagcc cctgaacgcg tcccgataca ctcccaccag tggcatgact 2040
gaagctgcaa agaactttgg tgaaattggc gatgcgtcgg agtacgtgta tccggagggg 2100
ctggaaagga tccatgagtt tatctatccc tggatcaact ctaccgacct gaaggcatcg 2160
tctgacgatt ctaactacgg ctgggaagac tccaagtata ttcccgaagg cgccacggat 2220
gggtctgccc agccccgttt gcccgctagt ggtggtgccg gaggaaaccc cggtctgtac 2280
gaggatcttt tccgcgtctc tgtgaaggtc aagaacacgg gcaatgtcgc cggtgatgaa 2340
gttcctcagc tgtacgtttc cctaggcggc ccgaatgagc ccaaggtggt actgcgcaag 2400
tttgagcgta ttcacttggc cccttcgcag gaggccgtgt ggacaacgac ccttacccgt 2460
cgtgaccttg caaactggga cgtttcggct caggactgga ccgtcactcc ttaccccaag 2520
acgatctacg ttggaaactc ctcacggaaa ctgccgctcc aggcctcgct gcctaaggcc 2580
cagtaa 2586
<210>104
<211>861
<212>PRT
<213>米曲霉
<400>104
Met Lys Leu Gly Trp Ile Glu Val Ala Ala Leu Ala Ala Ala Ser Val
1 5 10 15
Val Ser Ala Lys Asp Asp Leu Ala Tyr Ser Pro Pro Phe Tyr Pro Ser
20 25 30
Pro Trp Ala Asp Gly Gln Gly Glu Trp Ala Glu Val Tyr Lys Arg Ala
35 40 45
Val Asp Ile Val Ser Gln Met Thr Leu Thr Glu Lys Val Asn Leu Thr
50 55 60
Thr Gly Thr Gly Trp Gln Leu Glu Arg Cys Val Gly Gln Thr Gly Ser
65 70 75 80
Val Pro Arg Leu Asn Ile Pro Ser Leu Cys Leu Gln Asp Ser Pro Leu
85 90 95
Gly Ile Arg Phe Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn
100 105 110
Val Ala Ala Thr Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Gln Ala
115 120 125
Met Gly Glu Glu Phe Ser Asp Lys Gly Ile Asp Val Gln Leu Gly Pro
130 135 140
Ala Ala Gly Pro Leu Gly Ala His Pro Asp Gly Gly Arg Asn Trp Glu
145 150 155 160
Gly Phe Ser Pro Asp Pro Ala Leu Thr Gly Val Leu Phe Ala Glu Thr
165 170 175
Ile Lys Gly Ile Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr
180 185 190
Ile Met Asn Glu Gln Glu His Phe Arg Gln Gln Pro Glu Ala Ala Gly
195 200 205
Tyr Gly Phe Asn Val Ser Asp Ser Leu Ser Ser Asn Val Asp Asp Lys
210 215 220
Thr Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala
225 230 235 240
Gly Val Gly Ala Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr
245 250 255
Gly Cys Glu Asn Ser Glu Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu
260 265 270
Gly Phe Gln Gly Phe Val Met Ser Asp Trp Thr Ala His His Ser Gly
275 280 285
Val Gly Ala Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val
290 295 300
Thr Phe Asp Ser Gly Thr Ser Phe Trp Gly Ala Asn Leu Thr Val Gly
305 310 315 320
Val Leu Asn Gly Thr Ile Pro Gln Trp Arg Val Asp Asp Met Ala Val
325 330 335
Arg Ile Met Ala Ala Tyr Tyr Lys Val Gly Arg Asp Thr Lys Tyr Thr
340 345 350
Pro Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Ala His
355 360 365
Asn His Val Ser Glu Gly Ala Tyr Glu Arg Val Asn Glu Phe Val Asp
370 375 380
Val Gln Arg Asp His Ala Asp Leu Ile Arg Arg Ile Gly Ala Gln Ser
385 390 395 400
Thr Val Leu Leu Lys Asn Lys Gly Ala Leu Pro Leu Ser Arg Lys Glu
405 410 415
Lys Leu Val Ala Leu Leu Gly Glu Asp Ala Gly Ser Asn Ser Trp Gly
420 425 430
Ala Asn Gly Cys Asp Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met
435 440 445
Ala Trp Gly Ser Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu
450 455 460
Gln Ala Ile Gln Asn Glu Val Leu Gln Gly Arg Gly Asn Val Phe Ala
465 470 475 480
Val Thr Asp Ser Trp Ala Leu Asp Lys Ile Ala Ala Ala Ala Arg Gln
485 490 495
Ala Ser Val Ser Leu Val Phe Val Asn Ser Asp Ser Gly Glu Gly Tyr
500 505 510
Leu Ser Val Asp Gly Asn Glu Gly Asp Arg Asn AsnIle Thr Leu Trp
515 520 525
Lys Asn Gly Asp Asn Val Val Lys Thr Ala Ala Asn Asn Cys Asn Asn
530 535 540
Thr Val Val Ile Ile His Ser Val Gly Pro Val Leu Ile Asp Glu Trp
545 550 555 560
Tyr Asp His Pro Asn Val Thr Gly Ile Leu Trp Ala Gly Leu Pro Gly
565 570 575
Gln Glu Ser Gly Asn Ser Ile Ala Asp Val Leu Tyr Gly Arg Val Asn
580 585 590
Pro Gly Ala Lys Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr
595 600 605
Gly Ser Pro Leu Val Lys Asp Ala Asn Asn Gly Asn Gly Ala Pro Gln
610 615 620
Ser Asp Phe Thr Gln Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys
625 630 635 640
Phe Asn Glu Thr Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr
645 650 655
Thr Phe Glu Leu Ser Asp Leu His Val Gln Pro Leu Asn Ala Ser Arg
660 665 670
Tyr Thr Pro Thr Ser Gly Met Thr Glu Ala Ala Lys Asn Phe Gly Glu
675 680 685
Ile Gly Asp Ala Ser Glu Tyr Val Tyr Pro Glu Gly Leu Glu Arg Ile
690 695 700
His Glu Phe Ile Tyr Pro Trp Ile Asn Ser Thr Asp Leu Lys Ala Ser
705 710 715 720
Ser Asp Asp Ser Asn Tyr Gly Trp Glu Asp Ser Lys Tyr Ile Pro Glu
725 730 735
Gly Ala Thr Asp Gly Ser Ala Gln Pro Arg Leu Pro Ala Ser Gly Gly
740 745 750
Ala Gly Gly Asn Pro Gly Leu Tyr Glu Asp Leu Phe Arg Val Ser Val
755 760 765
Lys Val Lys Asn Thr Gly Asn Val Ala Gly Asp Glu Val Pro Gln Leu
770 775 780
Tyr Val Ser Leu Gly Gly Pro Asn Glu Pro Lys Val Val Leu Arg Lys
785 790 795 800
Phe Glu Arg Ile His Leu Ala Pro Ser Gln Glu Ala Val Trp Thr Thr
805 810 815
Thr Leu Thr Arg Arg Asp Leu Ala Asn Trp Asp Val Ser Ala Gln Asp
820 825 830
Trp Thr Val Thr Pro Tyr Pro Lys Thr Ile Tyr Val Gly Asn Ser Ser
835 840 845
Arg Lys Leu Pro Leu Gln Ala Ser Leu Pro Lys Ala Gln
850 855 860
<210>105
<211>20
<212>DNA
<213>里氏木霉
<400>105
cccaagctta gccaagaaca 20
<210>106
<211>29
<212>DNA
<213>里氏木霉
<400>106
gggggaggaa cgcatgggat ctggacggc 29
<210>107
<211>30
<212>DNA
<213>米曲霉
<400>107
gccgtccaga tccccatgcg ttcctccccc 30
<210>108
<211>20
<212>DNA
<213>米曲霉
<400>108
ccaagcttgt tcagagtttc 20
<210>109
<211>20
<212>DNA
<213>米曲霉
<400>109
ggactgcgca gcatgcgttc 20
<210>110
<211>30
<212>DNA
<213>米曲霉
<400>110
agttaattaa ttactgggcc ttaggcagcg 30
<210>111
<211>28
<212>DNA
<213>橙色嗜热子囊菌
<400>111
atgtcctttt ccaagataat tgctactg 28
<210>112
<211>26
<212>DNA
<213>橙色嗜热子囊菌
<400>112
gcttaattaa ccagtataca gaggag 26
Claims (47)
1.一种产生氧化还原活性金属阳离子减少的纤维素材料的方法,所述氧化还原活性金属阳离子具有范围为约-0.4到约1.2伏的氧化还原电势(Eo),所述方法包括用有效量的螯合剂处理所述纤维素材料以减少所述氧化还原活性金属阳离子对酶降解或转化所述纤维素材料的抑制作用,并且可选地还在当所述氧化还原活性金属阳离子具有低价状态时用有效量的氧化剂处理所述纤维素材料以将所述氧化还原活性金属阳离子转化为高价状态,以优先螯合所述氧化还原活性金属阳离子。
2.权利要求1所述的方法,其中螯合剂的有效量为每kg干纤维素材料优选约0.01mM到约1M,更优选约0.1mM到约0.1M,并且最优选约1mM到约10mM的范围。
3.权利要求1或2所述的方法,其中用所述螯合剂对所述纤维素材料的处理在优选约1到约11,更优选约3到约9,并且最优选约5到约7的范围内的pH进行。
4.权利要求1-3中任一项所述的方法,其中用所述螯合剂对所述纤维素材料的处理在优选约5℃到约200℃,更优选约20℃到约80℃,并且最优选约40℃到约60℃的范围内的温度进行。
5.权利要求1-4中任一项所述的方法,其中氧化剂的有效量为每kg干纤维素材料优选约0.01到约100g,更优选约0.05到约50g,并且最优选约0.5到约5g的范围。
6.权利要求1-5中任一项所述的方法,其中用所述氧化剂对所述纤维素材料的处理在优选约1到约11,更优选约3到约9,并且最优选约5到约7的范围内的pH进行。
7.权利要求1-6中任一项所述的方法,其中用所述氧化剂对所述纤维素材料的处理在优选约5℃到约200℃,更优选约20℃到约80℃,并且最优选约40℃到约60℃的范围内的温度进行。
8.权利要求1-7中任一项所述的方法,其中在预处理之前、之中和/或之后和/或在糖化过程中和/或在发酵过程中将所述纤维素材料用所述螯合剂、所述氧化剂或其组合处理。
9.权利要求1-8中任一项所述的方法,其中所述螯合剂选自下组:柠檬酸、苹果酸、琥珀酸、草酸、醛糖酸、糖醛酸、乙二胺四乙酸、氨三乙酸、烷基次膦酸、硫代次膦酸、焦磷酸、肌醇六磷酸、植物螯合肽、铁载体、沸石、木质素及其组合。
10.权利要求1-9中任一项所述的方法,其中所述氧化剂选自下组:O2、臭氧(O3)、氯(Cl2)、溴(Br2)、过氧化氢(H2O2)、无机过氧化物、有机过氧化物、过酸、次氯酸钠(NaOCl)、二氧化氯(ClO2)、一氧化氮(NO)、高锰酸钾(KMnO4)、硝酸盐(NO3 -)、亚硝酸盐(NO2 -)及其组合。
11.权利要求1-10中任一项所述的方法,其中将所述纤维素材料在用所述螯合剂处理之前或同时用所述氧化剂处理。
12.权利要求1-11中任一项所述的方法,其中所述氧化还原活性金属阳离子选自下组:Fe(II)、Fe(III)、Cu(II)、Cr(III)和Ru(III)。
13.一种降解或转化纤维素材料的方法,包括:用有效量的纤维素分解酶组合物处理所述纤维素材料,其中将所述纤维素材料用有效量的螯合剂处理以减少具有范围为约-0.4到约1.2伏的氧化还原电势(Eo)的氧化还原活性金属阳离子对用所述纤维素分解酶组合物酶降解或转化所述纤维素材料的抑制作用,并且可选地还在当所述氧化还原活性金属阳离子具有低价状态时用有效量的氧化剂处理所述纤维素材料以将所述氧化还原活性金属阳离子转化为高价状态,以优先螯合所述氧化还原活性金属阳离子。
14.权利要求13所述的方法,其中在预处理之前、之中和/或之后和/或在降解或转化所述纤维素材料过程中将所述纤维素材料用所述螯合剂、所述氧化剂或其组合处理。
15.权利要求13或14所述的方法,其中螯合剂的有效量为每kg干纤维素材料优选约0.01mM到约1M,更优选约0.1mM到约0.1M,并且最优选约1mM到约10mM的范围。
16.权利要求13-15中任一项所述的方法,其中用所述螯合剂对所述纤维素材料的处理在优选约1到约11,更优选约3到约9,并且最优选约5到约7的范围内的pH进行。
17.权利要求13-16中任一项所述的方法,其中用所述螯合剂对所述纤维素材料的处理在优选约5℃到约200℃,更优选约20℃到约80℃,并且最优选约40℃到约60℃的范围内的温度进行。
18.权利要求13-17中任一项所述的方法,其中氧化剂的有效量为每kg干纤维素材料优选约0.01到约100g,更优选约0.05到约50g,并且最优选约0.5到约5g的范围。
19.权利要求13-18中任一项所述的方法,其中用所述氧化剂对所述纤维素材料的处理在优选约1到约11,更优选约3到约9,并且最优选约5到约7的范围内的pH进行。
20.权利要求13-19中任一项所述的方法,其中用所述氧化剂对所述纤维素材料的处理在优选约5℃到约200℃,更优选约20℃到约80℃,并且最优选约40℃到约60℃的范围内的温度进行。
21.权利要求13-20中任一项所述的方法,其中所述纤维素分解酶组合物包含具有内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶活性的多肽。
22.权利要求21所述的方法,其中所述纤维素分解酶组合物进一步包含一种或多种具有纤维素分解增强活性的多肽。
23.权利要求21或22所述的方法,其中所述纤维素分解酶组合物进一步包含一种或多种选自下组的酶:半纤维素酶、酯酶、蛋白酶、漆酶、过氧化物酶或其混合物。
24.权利要求13-23中任一项所述的方法,进一步包括回收降解的纤维素材料。
25.权利要求24所述的方法,其中所述降解的纤维素材料为糖。
26.权利要求13-25中任一项所述的方法,其中所述螯合剂选自下组:柠檬酸、苹果酸、琥珀酸、草酸、醛糖酸、糖醛酸、乙二胺四乙酸、氨三乙酸、烷基次膦酸、硫代次膦酸、焦磷酸、肌醇六磷酸、植物螯合肽、铁载体、沸石、木质素及其组合。
27.权利要求13-26中任一项所述的方法,其中所述氧化剂选自下组:O2、臭氧(O3)、氯(Cl2)、溴(Br2)、过氧化氢(H2O2)、无机过氧化物、有机过氧化物、过酸、次氯酸钠(NaOCl)、二氧化氯(ClO2)、一氧化氮(NO)、高锰酸钾(KMnO4)、硝酸盐(NO3 -)、亚硝酸盐(NO2 -)及其组合。
28.权利要求13-27中任一项所述的方法,其中将所述纤维素材料在用所述螯合剂处理之前或同时用所述氧化剂处理。
29.权利要求13-28中任一项所述的方法,其中所述氧化还原活性金属阳离子选自下组:Fe(II)、Fe(III)、Cu(II)、Cr(III)和Ru(III)。
30.一种产生发酵产物的方法,包括:(a)用有效量的纤维素分解酶组合物糖化纤维素材料;(b)用一种或多种发酵微生物发酵经糖化的步骤(a)的纤维素材料以产生发酵产物;以及(c)回收发酵产物,其中用有效量的螯合剂处理所述纤维素材料以减少具有范围为约-0.4到约1.2伏的氧化还原电势(Eo)的氧化还原活性金属阳离子对酶糖化所述纤维素材料的抑制作用,并且可选地还在当所述氧化还原活性金属阳离子具有低价状态时用有效量的氧化剂处理所述纤维素材料以将所述氧化还原活性金属阳离子转化为高价状态,以优先螯合所述氧化还原活性金属阳离子。
31.权利要求30所述的方法,其中所述纤维素材料在糖化步骤前经预处理。
32.权利要求30或31所述的方法,其中在预处理之前、之中和/或之后和/或在糖化过程中和/或在发酵过程中将所述纤维素材料用所述螯合剂、所述氧化剂或其组合处理。
33.权利要求30-32中任一项所述的方法,其中螯合剂的有效量为每kg干纤维素材料优选约0.01mM到约1M,更优选约0.1mM到约0.1M,并且最优选约1mM到约10mM的范围。
34.权利要求30-33中任一项所述的方法,其中用所述螯合剂对所述纤维素材料的处理在优选约1到约11,更优选约3到约9,并且最优选约5到约7的范围内的pH进行。
35.权利要求30-34中任一项所述的方法,其中用所述螯合剂对所述纤维素材料的处理在优选约5℃到约200℃,更优选约30℃到约70℃,并且最优选约40℃到约60℃的范围内的温度进行。
36.权利要求30-35中任一项所述的方法,其中氧化剂的有效量为每kg干纤维素材料优选约0.01到约100g,更优选约0.05到约50g,并且最优选约0.5到约5g的范围。
37.权利要求30-36中任一项所述的方法,其中用所述氧化剂对所述纤维素材料的处理在优选约1到约11,更优选约3到约9,并且最优选约5到约7的范围内的pH进行。
38.权利要求30-37中任一项所述的方法,其中用所述氧化剂对所述纤维素材料的处理在优选约5℃到约200℃,更优选约20℃到约80℃,并且最优选约40℃到约60℃的范围内的温度进行。
39.权利要求30-38中任一项所述的方法,其中所述纤维素分解酶组合物包含具有内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶活性的多肽。
40.权利要求39所述的方法,其中所述纤维素分解酶组合物进一步包含一种或多种具有纤维素分解增强活性的多肽。
41.权利要求39或40所述的方法,其中所述纤维素分解酶组合物进一步包含一种或多种选自下组的酶:半纤维素酶、酯酶、蛋白酶、漆酶、过氧化物酶或其混合物。
42.权利要求30-41中任一项所述的方法,其中步骤(a)和(b)在同时糖化与发酵过程中是同时进行的。
43.权利要求30-42中任一项所述的方法,其中所述发酵产物为醇、有机酸、酮、氨基酸或气体。
44.权利要求30-43中任一项所述的方法,其中所述螯合剂选自下组:柠檬酸、苹果酸、琥珀酸、草酸、醛糖酸、糖醛酸、乙二胺四乙酸、氨三乙酸、烷基次膦酸、硫代次膦酸、焦磷酸、肌醇六磷酸、植物螯合肽、铁载体、沸石、木质素及其组合。
45.权利要求30-44中任一项所述的方法,其中所述氧化剂选自下组:O2、臭氧(O3)、氯(Cl2)、溴(Br2)、过氧化氢(H2O2)、无机过氧化物、有机过氧化物、过酸、次氯酸钠(NaOCl)、二氧化氯(ClO2)、一氧化氮(NO)、高锰酸钾(KMnO4)、硝酸盐(NO3 -)、亚硝酸盐(NO2 -)及其组合。
46.权利要求30-45中任一项所述的方法,其中将所述纤维素材料在用所述螯合剂处理之前或同时用所述氧化剂处理。
47.权利要求30-46中任一项所述的方法,其中所述氧化还原活性金属阳离子选自下组:Fe(II)、Fe(III)、Cu(II)、Cr(III)和Ru(III)。
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US98466007P | 2007-11-01 | 2007-11-01 | |
| US60/984,660 | 2007-11-01 | ||
| PCT/US2008/082127 WO2009059234A2 (en) | 2007-11-01 | 2008-10-31 | Methods of reducing the inhibitory effect of a redox active metal ion on the enzymatic hydrolysis of cellulosic material |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CN101910406A true CN101910406A (zh) | 2010-12-08 |
Family
ID=40548811
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN2008801237159A Pending CN101910406A (zh) | 2007-11-01 | 2008-10-31 | 减少氧化还原活性金属离子对纤维素材料酶水解抑制作用的方法 |
Country Status (5)
| Country | Link |
|---|---|
| US (1) | US20090130707A1 (zh) |
| EP (1) | EP2235191A2 (zh) |
| CN (1) | CN101910406A (zh) |
| BR (1) | BRPI0818141A2 (zh) |
| WO (1) | WO2009059234A2 (zh) |
Families Citing this family (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CA2689261A1 (en) | 2007-05-31 | 2008-12-11 | Novozymes, Inc. | Methods of increasing the cellulolytic enhancing activity of a polypeptide |
| WO2011057140A1 (en) | 2009-11-06 | 2011-05-12 | Novozymes, Inc. | Compositions for saccharification of cellulosic material |
| FI122937B (fi) | 2009-12-30 | 2012-09-14 | Roal Oy | Menetelmä selluloosamateriaalin käsittelemiseksi sekä tässä käyttökelpoiset CBH II/Cel6A entsyymit |
| EA201300060A1 (ru) * | 2010-06-29 | 2013-05-30 | ДСМ АйПи АССЕТС Б.В. | Полипептид, обладающий или содействующий активности деградации углеводного материала, и его применение |
| DK2622070T3 (en) * | 2010-09-30 | 2016-11-21 | Novozymes Inc | Variants of polypeptides having cellulolytic enhancing ACTIVITY AND POLYNUCLEOTIDES ENCODING THEM |
| JP5589871B2 (ja) * | 2011-01-27 | 2014-09-17 | トヨタ自動車株式会社 | セルロース系バイオマスの処理方法、セルロース系バイオマスからの糖又はアルコール又は有機酸の製造方法 |
| KR20150093190A (ko) | 2012-12-12 | 2015-08-17 | 다니스코 유에스 인크. | 셀로바이오하이드롤라제의 변이체 |
| PL3416740T3 (pl) | 2016-02-19 | 2021-05-17 | Intercontinental Great Brands Llc | Procesy tworzenia wielu strumieni wartości ze źródeł biomasy |
| CA3059588A1 (en) | 2017-04-17 | 2018-10-25 | Board Of Trustees Of Michigan State University | Methods for lignin depolymerization using thiols |
| CN109748403B (zh) * | 2018-12-08 | 2021-10-08 | 上海电力学院 | 一种用于抑止硫酸钙垢形成的高分子阻垢剂及其制备方法 |
Family Cites Families (13)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS6062990A (ja) * | 1983-09-13 | 1985-04-11 | Toray Ind Inc | アミノ酸の製造方法 |
| US4840904A (en) * | 1987-09-18 | 1989-06-20 | The United States Of America As Represented By The United States Department Of Energy | Recovery and reuse of cellulase catalyst in an exzymatic cellulose hydrolysis process |
| US4842877A (en) * | 1988-04-05 | 1989-06-27 | Xylan, Inc. | Delignification of non-woody biomass |
| US5705369A (en) * | 1994-12-27 | 1998-01-06 | Midwest Research Institute | Prehydrolysis of lignocellulose |
| US5932456A (en) * | 1995-06-07 | 1999-08-03 | Ingram-Howell, L.L.C. | Production of ethanol and other fermentation products from biomass |
| US5677154A (en) * | 1995-06-07 | 1997-10-14 | Ingram-Howell, L.L.C. | Production of ethanol from biomass |
| US7396974B2 (en) * | 2002-02-08 | 2008-07-08 | University Of Maine | Oxidation using a non-enzymatic free radical system mediated by redox cycling chelators |
| EP1485495B1 (en) * | 2002-03-15 | 2010-09-15 | Iogen Energy Corporation | Method for glucose production using endoglucanase core protein for improved recovery and reuse of enzyme |
| US20040231060A1 (en) * | 2003-03-07 | 2004-11-25 | Athenix Corporation | Methods to enhance the activity of lignocellulose-degrading enzymes |
| US20070149496A1 (en) * | 2003-10-31 | 2007-06-28 | Jack Tuszynski | Water-soluble compound |
| CN104726431B (zh) * | 2004-01-30 | 2018-06-01 | 诺维信股份有限公司 | 具有分解纤维增强活性的多肽及其编码多核苷酸 |
| EP1614742B1 (en) * | 2004-07-08 | 2007-12-05 | The Procter & Gamble Company | Bleaching composition comprising a cyclic hindered amine |
| US20080096784A1 (en) * | 2006-05-15 | 2008-04-24 | Voco Gmbh | Composition for Cleaning Dental Instruments and Process |
-
2008
- 2008-10-31 WO PCT/US2008/082127 patent/WO2009059234A2/en active Application Filing
- 2008-10-31 CN CN2008801237159A patent/CN101910406A/zh active Pending
- 2008-10-31 US US12/263,268 patent/US20090130707A1/en not_active Abandoned
- 2008-10-31 EP EP08844132A patent/EP2235191A2/en not_active Withdrawn
- 2008-10-31 BR BRPI0818141-1A2A patent/BRPI0818141A2/pt not_active IP Right Cessation
Also Published As
| Publication number | Publication date |
|---|---|
| EP2235191A2 (en) | 2010-10-06 |
| WO2009059234A3 (en) | 2009-06-18 |
| WO2009059234A2 (en) | 2009-05-07 |
| BRPI0818141A2 (pt) | 2014-10-29 |
| US20090130707A1 (en) | 2009-05-21 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN101809150B (zh) | 提高多肽的纤维素分解增强活性的方法 | |
| CN101970651B (zh) | 用于降解纤维素材料的组合物 | |
| DK2069491T3 (en) | COMPOSITIONS AND PROCEDURES FOR IMPROVING THE DECOMPOSITION OR CONVERSION OF CELLULOSE SUBSTANCES | |
| CN101910405A (zh) | 降低鞣质对酶促水解纤维素材料的抑制作用的方法 | |
| CN101910406A (zh) | 减少氧化还原活性金属离子对纤维素材料酶水解抑制作用的方法 | |
| CN107190030A (zh) | 在纤维二糖脱氢酶存在下增加纤维素材料水解的方法 | |
| CN101784659A (zh) | 具有纤维素分解增强活性的多肽和编码它的多核苷酸 | |
| CN110079558A (zh) | 用家族61多肽预处理纤维素材料的方法 | |
| AU2012204055B2 (en) | Methods of increasing the cellulolytic enhancing activity of a polypeptide | |
| BRPI0812276B1 (pt) | Métodos para aumentar a atividade de um polipeptídeo tendo atividade celulolítica intensificadora, para degradar ou converter um material contendo celulose, e para produzir um produto de fermentação, e, composição |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| C06 | Publication | ||
| PB01 | Publication | ||
| C10 | Entry into substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
| WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20101208 |