| 【発明の名称】 |
黒麹菌のフェリクローム生合成に関与するクラスター遺伝子 |
| 【発明者】 |
【氏名】石田 博樹 【住所又は居所】京都市伏見区片原町300 月桂冠株式会社総合研究所内
【氏名】秦 洋二 【住所又は居所】京都市伏見区片原町300 月桂冠株式会社総合研究所内
【氏名】川戸 章嗣 【住所又は居所】京都市伏見区下鳥羽小柳町24 月桂冠株式会社総合研究所内
【氏名】杉並 孝二 【住所又は居所】京都市伏見区片原町300 月桂冠株式会社内
【氏名】安部 康久 【住所又は居所】京都市伏見区片原町300 月桂冠株式会社内
|
| 【要約】 |
【課題】
【解決手段】黒麹菌のフェリクローム生合成クラスターを形成する、オルニチンモノオキシゲナーゼ、ペプチドシンテターゼ蛋白質が明らかにされ、これをコードする遺伝子、すなわち、nsb1、nsb2のクローニングが行われ、そのその塩基配列も決定された。 |
【特許請求の範囲】
【請求項1】 以下の(a)または(b)の蛋白質:(a)配列表の配列番号1で示されるアミノ酸配列を有する蛋白質; (b)アミノ酸配列(a)においてアミノ酸が欠失、置換もしくは付加されたアミノ酸配列を有し、且つフェリクローム生合成クラスターを形成するオルニチンモノオキシゲナーゼ蛋白質。 【請求項2】 以下の(c)または(d)の蛋白質:(c)配列表の配列番号3で示されるアミノ酸配列を有する蛋白質; (d)アミノ酸配列(c)においてアミノ酸が欠失、置換もしくは付加されたアミノ酸配列を有し、且つフェリクローム生合成クラスターを形成するペプチドシンテターゼ蛋白質。 【請求項3】 請求項1又は2に記載の蛋白質をコードする遺伝子、あるいは、該遺伝子とストリンジェントな条件下でハイブリダイズし、且つフェリクローム生合成クラスターを形成するオルニチンモノオキシゲナーゼ遺伝子(配列番号2)、ペプチドシンテターゼ蛋白質遺伝子(配列番号4)からなる群から選ばれる少なくとも1つの遺伝子のDNA。 【請求項4】 請求項3に記載のDNAの内、少なくともコーディング領域を含んでなる組換えベクター。 【請求項5】 組換えベクターpENS1。 【請求項6】 請求項4又は5に記載の組換えベクターを挿入してなる形質転換体。 【請求項7】 形質転換体、エシェリヒア・コリ(Escherichiacoli)NSID1(FERM P−18679)。 【請求項8】 請求項4又は5に記載の組換えベクターを含む組換え麹菌。 【請求項9】 請求項6又は8に記載の形質転換体において、フェリクローム生合成クラスターを形成するオルニチンモノオキシゲナーゼまたはペプチドシンテターゼ蛋白質の少なくともひとつを生成させることによってフェリクローム高生産麹菌を育種すること、を特徴とする育種方法。 【請求項10】 黒麹菌フェリクローム生合成に関与する遺伝子クラスターを、麹菌以外の生物に導入してフェリクロームを生成させる方法。 【請求項11】 黒麹菌ペプチドシンテターゼ蛋白質の各ドメインの少なくともひとつを蛋白質工学的に組換えることにより所望するペプチドを合成する方法。
|
【発明の詳細な説明】【0001】 【発明の属する技術分野】本発明は、黒麹菌のフェリクローム生合成に必要なオルニチンモノオキシゲナーゼとペプチドシンテターゼ蛋白質、該蛋白質をコードする遺伝子、該遺伝子を含有する組み換えベクター、該組み換えベクターを含有する形質転換体、該遺伝子を含有する組み換え麹菌、該形質転換体を用いるオルニチンモノオキシゲナーゼ、ペプチドシンテターゼ蛋白質を生成させることによってフェリクローム高生産麹菌を育種する方法、両フェリクローム生合成遺伝子を麹菌以外の生物に導入して生産させる方法、及び黒麹菌ペプチドシンテターゼ蛋白質を用いて任意のペプチドを合成する方法に関するものである。 【0002】 【従来の技術】鉄イオンは一部の乳酸菌を除く、ほとんどすべての生物にとって必須の原子である。鉄は、生体内ではFe(II)やFe(III)の形態で利用され、主に酸化還元に関与する酵素群の補欠因子として機能する。特に好気性を示す生物群では、多大なエネルギーを生産する電子伝達系の反応に鉄イオンは欠くことができない。しかしながら、一般的に鉄は自然界において鉄鉱石として存在し、可溶化されたイオン状態としてはほとんど存在しない。さらに鉄鉱石から微生物の働きにより可溶化された鉄イオンも、すぐに不溶性の酸化物や水酸化物となるため、生物が利用できる鉄イオンはきわめて微量である。細菌や放線菌、真核微生物はこのような微量な鉄イオンを効率的に獲得するために、シデロフォアと呼ばれる分子量1500以下の低分子の鉄イオンキレート物質を生産する。このシデロフォアに鉄イオンをキレートすることにより、貴重な鉄イオンの不溶化を防ぎ、鉄イオンを優先的に利用することを図っている。また鉄イオンは生物にとって必須のイオンであるが、過剰に存在すると遊離のラジカルの発生を促し、逆に生体に危害を加える。シデロフォアは鉄イオンの獲得と同時に、このような鉄イオンの無害化にも大きく寄与している。シデロフォアは非キレート状態では無色であるが、鉄イオンをキレートすると、赤色を示し、可視光の吸収を示すことが知られている。 【0003】現在までに様々なシデロフォアが同定されているが、糸状菌が生産するシデロフォアはhydroxamates familyと呼ばれ、一般に構成アミノ酸誘導体としてN−ヒドロキシオルニチンを含む。研究用モデル糸状菌、工業用微生物、病原性糸状菌として幅広く研究が進められているアスペルギルス属糸状菌はhydroxamates familyの中でもフェリクローム類とフザリニン類と呼ばれるシデロフォアを生産する。前者は、N−ヒドロキシオルニチンのトリペプチドにグリシン、セリン、アラニンが環状ペプチドを形成している。一方、後者では一部のN−ヒドロキシオルニチンのN位が無水メバロン酸によってアシル化されている特徴を有する。糸状菌はこのような多種多様なシデロフォアを生産することにより、鉄イオンを優先的に獲得し、自然界での生存競争に活用しているものと考えられる。 【0004】一方、清酒醸造では、アスペルギルス・オリゼを蒸米上に生育させて「麹」を作成し、清酒醸造の原料として利用している。この麹造りにおいてアスペルギルス・オリゼが大量のフェリクローム類(中でも主成分はフェリクリシン)を生産し、これが酒造用水の鉄イオンをキレートし、清酒が着色することが知られている。従って、清酒醸造においては、シデロフォアであるフェリクローム類が、品質劣化の原因であり、できるだけフェリクローム類を生産しない菌株の育種が進められてきた。 【0005】このように、黄麹菌(Aspergillus oryzae)はフェリクローム類を大量に生産することが古くから知られているが、黄麹菌と類縁で焼酎、泡盛製造に関わる黒麹菌もまた、麹などの固体培養においてフェリクローム化合物を生産することが知られている。実際の焼酎、泡盛の蒸留酒では商品中でのフェリクロームについては問題視されていないが、黒麹菌もまた黄麹菌と同様にフェリクローム生産が可能な微生物と考えられる。また黒麹菌も長年食品微生物として使用されており、その安全性が高く評価されている。これらの点から、黒麹菌が生産するフェリクロームは貧血症の医薬または機能性食品の利用が期待される。しかしながら黒麹菌のフェリクローム生合成についてはその生合成に関与する遺伝子が未解明のため、生産量を上げるなどの有効利用ができず、いまだに効率的な活用がなされていない。 【0006】もし、フェリクローム類の生合成遺伝子が同定されれば、黒麹菌によるフェリクローム類の生産を自由に調節できる可能性がある。例えば、医薬品製造においては、フェリクローム生合成に関与する遺伝子の発現をより活発に誘導させることにより、大量のフェリクローム生産が可能となる。さらに黒麹菌が生産するフェリクロームは清酒や泡盛その他飲食品として長年摂取されており、極めて安全性の高い物質である。黒麹菌によりフェリクロームが大量に生産できれば、医薬品から食品まで幅広い応用が可能となる。このように、黒麹菌のフェリクローム生産についてはさまざまな分野に応用が期待されるが、その生合成遺伝子が未解明なため、いまだに効率的な活用がなされていない。 【0007】 【発明が解決しようとする課題】本発明は、Aspergillus niger等の黒麹菌のフェリクローム生産を自由に制御するために、黒麹菌のフェリクローム生合成に関与するクラスター遺伝子群を提供することにある。本発明の他の目的は本遺伝子群を含有する組み換えベクターとこの組み換えベクターを含有する形質転換体を提供することにある。 【0008】黄麹菌(Aspergillus oryzae)におけるフェリクロームの生合成経路については、Ustilago maydisやAureobasidium pullulansなどの他の糸状菌におけるフェリクローム類の合成経路の研究をもとにして、我々は、既にその生合成の第一段階を担うオルニチンN5−オキシゲナーゼをコードする遺伝子asb1(特願2001−176264)とフェリクローム生合成におけるペプチド結合の合成に関与するペプチドシンテターゼをコードするasb2(特願2001−324112)を同定するのに成功するとともに、asb1、asb2遺伝子がフェリクローム生合成遺伝子クラスターを形成していることも確認している。 【0009】一方、黒麹菌(例えば、Aspergillus niger、Aspergillus awamori、Aspergillus kawachii、Aspergillus usamii、Aspergillus shirousamii、Aspergillus saitoiなど)もまた、黄麹菌と同様に、長年焼酎、泡盛製造に利用されており、安全性の高い有望なフェリクローム生産菌である。そして各方面から検討の結果、これら黒麹菌の真のフェリクローム高生産を実現するために、フェリクローム生合成遺伝子クラスターを形成する遺伝子の取得が必要である点に本発明者らははじめて着目した。これら黒麹菌のフェリクローム生合成遺伝子クラスターが取得できれば、安全性の高いフェリクロームを工業的に食品、医薬品へ供給することが可能となる。 【0010】したがって本発明の目的は、黒麹菌のフェリクローム生合成を形成するクラスター遺伝子を開発することである。また、本発明の他の目的は、フェリクローム生合成クラスター遺伝子群の発現を遺伝子工学的手法を用いて高めることによって、あらゆる培養条件下でフェリクロームを高生産する麹菌を提供することにある。またこうして生産されたフェリクロームを鉄キレート剤としての試薬、ならびに貧血の改善効果が期待できる機能性食品への添加に提供するのが可能となる。またさらなる目的はこれらの麹菌のフェリクローム生合成に関わる遺伝子クラスターを麹菌以外の生物に導入してフェリクローム類を生産させることにある。 【0011】 【課題を解決するための手段】本発明は、上記目的を達成するためになされたものであって、先ずはじめに黒麹菌(アスペルギルス・ニガー:Aspergillus niger等)について検討を行った。 【0012】黒麹菌(例えば、Aspergillus niger、Aspergillus awamori、Aspergillus kawachii、Aspergillus usamii、Aspergillus shirousamii、Aspergillus saitoiなど)は、焼酎、泡盛などの我が国の伝統的醗酵産業で使用されてきた糸状菌である。本菌株は、上記醗酵産業で有用な蛋白質や低分子を非常に大量に生産することが知られている。本菌株が持つ高い蛋白質生産能と醸造微生物としての安全性から、異種蛋白質生産の宿主として注目されている。(Biotechnology、6、1419(1988)、特開昭62−272988)発明者らの研究から、A.nigerを用いた異種蛋白質生産においては、アスペルギルス属などの近種の遺伝子であれば、その生産能はさらに増大することが認められた。またA.nigerは、上記のような蛋白質、酵素のみならず、クエン酸などの有機酸発酵のように産業的にも非常に貴重な低分子成分の生産も報告されている。黒麹菌が生産する低分子化合物の中でフェリクロームは、近年貧血などの鉄欠乏症用の機能性成分としても非常に注目されている物質である。 【0013】この黒麹菌のフェリクロームを医薬・食品に利用するためには、生産性をさらに向上させる必要があるが、変異法などの既存の菌株育種方法では、工業生産レベルにまで生産性が向上した変異株の取得はできなかった。そこで、フェリクローム生合成に関与する遺伝子を単離し、これらの遺伝子の発現能を強化することによりフェリクロームの大量生産が可能であると考えた。アスペルギルス属菌におけるフェリクロームの生合成遺伝子群については、Ustilago maydisやAureobasidium pullulansなどの他の糸状菌におけるフェリクローム類の合成経路の研究をもとにして、我々は既に黄麹菌A.oryzaeよりフェリクローム生合成の第一段階を担うオルニチンN5−オキシゲナーゼをコードする遺伝子asb1(特願2001−176264)とフェリクローム生合成におけるペプチド結合の合成に関与するペプチドシンテターゼをコードするasb2(特願2001−324112)を同定している。 【0014】本発明者らは、この取得方法に着目し、この取得方法を黒麹菌に適用すれば黒麹菌のasb1、asb2遺伝子も取得できるという可能性について、新規着想を得た。そして、黒麹菌においてもこれらのクラスター遺伝子が取得できれば、フェリクロームの生産を自由に制御できる遺伝子組み換え黒麹菌を育種でき、フェリクロームの工業生産が可能になるとの着想を得、そこで我々は、黒麹菌が生産する鉄イオンキレート低分子フェリクロームを貧血改善用の機能性成分などとして大量生産させるために、そのフェリクローム生合成クラスターの遺伝子クローニングを行い、フェリクロームの工業生産に適した遺伝子組み換え黒麹菌を育種することを、新規技術課題として新たに設定した。 【0015】一方、本発明者らの研究の結果、黄麹菌Aspergillus oryzaeにおいては、フェリクロームの生合成経路に属するオルニチンN5−オキシゲナーゼをコードするasb1(特願2001−83640)とフェリクローム生合成におけるペプチド結合の合成に関与するペプチドシンテターゼをコードするasb2(特願2001−324112)について、他の関連生合成遺伝子群と約36−kbのクラスターを形成していた(特願2001−324181)。他に、Aureobasidiumpullulansのフェリクローム生合成遺伝子においても、オルニチンN5−オキシゲナーゼ遺伝子、フェリクロームのABCトランスポーター遺伝子、フェリクローム生合成におけるペプチド結合の合成に関与するペプチドシンテターゼ遺伝子が約30−kbのクラスターを形成することが報告された。また、Ustilago maydisにおいても、オルニチンN5オキシゲナーゼ遺伝子とペプチドシンテターゼ遺伝子が4.3−kbの塩基を介してクラスターを形成していることが報告された(Walter MY, et al., J. Bacteriol., 183, pp4040-4051, 2001)。 【0016】これらを検討した結果、本発明者らは、黒麹菌においても、フェリクローム生合成は、他の糸状菌のフェリクローム生合成遺伝子群と同様に、染色体上でクラスターを形成する可能性について、はじめて、その着想を得た。そして、鋭意研究を行い、黒麹菌において、フェリクローム生合成クラスターを形成する遺伝子を単離、確認し、遂に本発明の完成に至ったものである。以下、黒麹菌フェリクローム生合成遺伝子群の単離方法を具体的に述べる。 【0017】フェリクローム生合成の第一段階であるL−オルニチンN5−オキシゲナーゼをコードする遺伝子は、Ustilago maydis、Pseudomonas sp. B10、Pseudomonasaeruginosa、Burkholderia cepacia由来のものがクローニングされている。そこで、これらのシデロフォア生合成に関与するL−オルニチンN5−オキシゲナーゼ蛋白質の相同性から、非常に保存性の高い2つの領域を見いだし、この領域それぞれに対応する縮重合成プライマーを設計した。本プライマーを用いてA.nigerの染色体DNAに対してPCRを行った結果、約160bpの遺伝子断片が増幅した。本遺伝子の塩基配列を決定した結果、Aureobasidium pullulansの推定オキシゲナーゼ、Pseudomonas aeruginosaのL-オルニチンN5-オキシゲナーゼをコードする遺伝子と相同性を示した。 【0018】得られた遺伝子断片の塩基配列をプローブとしてA.nigerの染色体DNAライブラリーのスクリーニングを行い、陽性クローンを得た。本クローンの全塩基配列を決定した結果、本遺伝子は、499アミノ酸残基からなる蛋白質をコードしており、1つのイントロンを含んでいた。得られた遺伝子をnsb1と命名した。さらに、本遺伝子のcDNAを大腸菌BL21(DE3)株に導入して、得られた形質転換体は、菌体内に著量のL−オルニチンN5−オキシゲナーゼを生産することを確認した。よって、得られたnsb1遺伝子には黒麹菌のフェリクリシン生合成の律速となるL−オルニチンN5−オキシゲナーゼ蛋白質がコードされていることが明らかとなった。 【0019】次に、ヒドロキシオルニチンを含むシデロフォアの生合成に必須な糸状菌のペプチドシンテターゼをコードする遺伝子は、Ustilago maydis、Aureobasidium pullulans、Trichoderma harzianum由来のものがクローニングされている。そこで、これらのシデロフォア生合成に関与するペプチドシンテターゼ蛋白質の相同性から、非常に保存性の高い2つの領域を見いだし、それぞれに対応する縮重合成プライマーを設計した。本プライマーを用いてA.nigerの染色体DNAに対してPCRを行った結果、約800bpの部分遺伝子断片が増幅した。本遺伝子の塩基配列を決定した結果、Alternaria alternataのペプチドシンテターゼをコードする遺伝子と相同性を示した。 【0020】得られた遺伝子断片をプローブとしてA.nigerのゲノムDNAライブラリーをスクリーニングしたところ、陽性クローンが得られた。その結果、得られた部分遺伝子の全長DNAが取得できた。本クローンの全塩基配列を決定した結果、本遺伝子は7064アミノ酸残基からなる蛋白質をコードしており、イントロンを2つ含んでいた。得られた遺伝子をnsb2と命名した。nsb2遺伝子は、A.niger染色体上でnsb1の上流約2−kbに位置しており、他の生物と同様にクラスターを形成することが明らかとなった。 【0021】単離した遺伝子は単独であるいはmelOやglaB遺伝子プロモーター(特願平11−154271、特開平11−243965)のような高発現プロモーターと共に、A.oryzaeにて発現させて、フェリクロームの生産を制御しうるものである。遺伝子導入方法は、例えば宿主としてniaD変異株を用いる公知方法により、目的遺伝子とマーカー遺伝子であるniaD遺伝子を同時に導入する(E.S.Unkleら、Mol. Gen. Genet.,218, p. 99-104、1989)。この遺伝子導入の際に、ベクター配列などの異種遺伝子を排除することにより、異種遺伝子を全く含まないセルフクローニング株の形質転換体を得ることができる。niaD変異株(硝酸を資化できない麹菌変異株:Nitrate Reductase欠損株)としては、例えば、Aspergillus oryzae 1013-niaD (FERM P-17707)を使用することができる。以下に、本発明の詳細について述べる。 【0022】まず、鉄制限下でヒドロキシオルニチン類を基本構成アミノ酸とするシデロフォア生産が報告されている微生物の中で、L−オルニチンN5−オキシゲナーゼをコードする遺伝子がクローニングされているものを選択した。現在までにUstilago maydis、Pseudomonas sp. B10、Pseudomonas aeruginosa、Burkholderia cepaciaの4つの株でのクローニングが報告されている。これらの遺伝子のアミノ酸レベルでの相同性を比較した結果、少なくとも2つのアミノ酸配列保存領域を見出した。1つは、Ala-Val-Ile-Gly-(Ala or Ser)-Gly-Gln-Ser-(Ser or Ala)-(Thr or Ala)-Glu-(Met or Ile)-Phe-Met-Asn-Leu-(His or Pro)-Ser-(Arg or Gln)-Phe-Pro(配列番号5:図48)、もう1つはAla-Leu-(Val or Arg)-Pro-Ser-Asp-Asp-(Ser or Thr)-(Gly or Pro)-Phe-Val-Asn-(Ser or Glu)-Ala-(Ala orVal)-Phe-Asp-Pro-Glu-Arg-Thr-Asp(配列番号6:図49)である。これら2種類の部分アミノ酸配列をもとに作製した縮重オリゴヌクレオチドプローブを用いて、A.nigerの染色体DNAに対してPCRを行った結果、約160bpの遺伝子断片が増幅した。本遺伝子の塩基配列を決定した結果、Aureobasidium pullulansの推定オキシゲナーゼ遺伝子と高い相同性を示した。 【0023】得られた遺伝子断片の塩基配列をプローブとして、A.nigerの染色体DNAライブラリーに対してスクリーニングを行った。その結果、得られた部分遺伝子の全長クローンが取得できた。本クローンの全塩基配列を決定した結果、本遺伝子は、499アミノ酸残基(配列番号1:図4、5)からなる蛋白質をコードしていた。プロモーター領域は配列番号2の1から1379bp、コーディング領域は配列番号2の1380から2936bp、ターミネーター領域は配列番号2の2937から3482bpまでである。イントロンは、1つ含まれており、配列番号2の2246から2302bpまでである。得られた遺伝子をnsb1(配列番号2:図6、7)と命名した。nsb1の機能を同定するために、本遺伝子の大腸菌での大量発現を試みた。nsb1の全長cDNAをpET23bベクター中のT7プロモーター下流に挿入した。本プラスミドを大腸菌BL21(DE3)株に形質転換した。 【0024】得られた形質転換体のIPTG誘導培養を行った結果、菌体内に著量のL−オルニチンN5−オキシゲナーゼ活性が確認された。よって、得られたnsb1遺伝子には麹菌のフェリクリシン生合成の律速となるL−オルニチンN5−オキシゲナーゼ蛋白質がコードされていることが明らかとなった。本菌株をEscherichia coli NSID1と命名し、独立行政法人産業技術総合研究所特許生物寄託センターに寄託番号FERM P−18679として寄託した。本寄託菌株を用いることによって、1mM IPTG誘導培養条件下でT7プロモーター支配下でnsb1蛋白質を大腸菌で生産提供することが出来る。 【0025】一方、ペプチドシンテターゼをコードする遺伝子は、既にクローニングされているUstilago maydis、Aureobasidium pullulans、Trichoderma harzianum由来のペプチドシンテターゼ蛋白質の相同性から、少なくとも2つのアミノ酸配列保存領域を見出した。1つは、Tyr-(Val or Leu)-Phe-Thr-Ser-Gly-Ser-Thr-Gly-Lys-Pro-Lys-(Gly or Ala)-Val(配列番号9:図52)、もう1つはAsp-(Thr orArg)-Gln-Val-Lys-Val-(Arg or Asn)-Gly-Gln-Arg-(Ile or Met)-Glu-Leu-(Glyor Asp)-Glu(配列番号10:図53)である。これら2種類の部分アミノ酸配列をもとに作製した縮重オリゴヌクレオチドプローブを用いて、A.nigerの染色体DNAに対してPCRを行った結果、約800bpの遺伝子断片が増幅した。本遺伝子の塩基配列を決定した結果、Alternaria alternataのペプチドシンテターゼ遺伝子と高い相同性を示した。 【0026】得られた遺伝子断片をプローブとして、A.nigerのラムダEMBL3ゲノムDNAライブラリーをスクリーニングした。その結果、得られた部分遺伝子の全長遺伝子をコードするクローンが取得できた。本クローンの全塩基配列を決定した結果、本遺伝子は、7064アミノ酸残基(配列番号3:図8〜図35)からなる蛋白質をコードしており、イントロンを2つ含んでいた。プロモーター領域は配列番号4の1から1725bp、コーディング領域は配列番号4の1726から23024bp、ターミネーター領域は配列番号4の23025から23114bpまでである。イントロンは、配列番号4の11191から11240bpと19170から19223bpであった。得られた遺伝子をnsb2(配列番号6:図36〜図47)と命名した。nsb2遺伝子は、A.niger染色体上でnsb1の上流約2−kbに位置しており、他の生物と同様にクラスターを形成することが明らかとなった。 【0027】以上の結果よりクローニングした遺伝子断片nsb1、nsb2は、黒麹菌A.nigerのフェリクローム生合成遺伝子であることが明らかとなり、両遺伝子はクラスターを形成していた。この遺伝子を用いて、黒麹菌のフェリクロームを高生産あるいは非生産させることが可能であり、用途に応じたフェリクローム生産の改変が分子レベルで可能となり、様々な産業分野に応用が可能である。 【0028】 【実施例1】nsb1遺伝子のクローニングと塩基配列の決定黒麹菌A.nigerのフェリクローム生合成の第1段階を触媒するL−オルニチンN5−オキシゲナーゼの遺伝子クローニングを行うために、既にクローニングが報告される他の微生物由来L−オルニチンN5−オキシゲナーゼのアミノ酸配列保存領域を比較した。現在までにUstilago maydis、Pseudomonas sp. B10、Pseudomonas aeruginosa、Burkholderia cepaciaの4つの株でのクローニングが報告されている。これらの遺伝子のアミノ酸レベルでの相同性を比較した結果、少なくとも2つのアミノ酸配列保存領域を見出した。 【0029】一方のアミノ酸配列保存領域(1)は、配列番号5(図48)に示されるアミノ酸配列を有し(配列中、左から1番目のXaaはAla又はSer、2番目のXaaはSer又はAla、3番目のXaaはThr又はAla、4番目のXaaはMet又はIle、5番目のXaaはHis又はPro、6番目のXaaはArg又はGlnをそれぞれ、示す。)、他のアミノ酸配列保存領域(2)は、配列番号6(図49)に示されるアミノ酸配列を有した(配列中、左から1番目のXaaはVal又はArg、2番目のXaaはSer又はThr、3番目のXaaはGly又はPro、4番目のXaaはSer又はGlu、5番目のXaaはAla又はValを、それぞれ、示す。)。 【0030】これら保存配列(1)、(2)をもとに、2本の縮重オリゴヌクレオチドDNA合成プライマーP1、P2をそれぞれ合成した。プライマーP1の塩基配列を配列番号7(図50)に示し、プライマーP2の塩基配列を配列番号8(図51)に示す。これらの配列において、n(図中I)はデオキシイノシン残基、sはG又はC、wはA又はT、rはA又はG、yはT又はC、mはA又はCのIUBコードによる縮重塩基を示す。 【0031】上記した縮重プライマーP1、P2を用いて、Aspergillus niger IFO 4067株より調製したゲノムDNAを鋳型にPCRを行った。反応条件の一例は次のとおりである。 【0032】(PCR条件) ・ 96℃(5分)、1サイクル・ 96℃(20秒)、45℃(1分)、72℃(3分)、30サイクル・ 72℃(7分)、1サイクル【0033】反応液をアガロースゲル電気泳動で解析を行った結果、約160bpのフラグメントの増幅が認められた。本遺伝子増幅産物の塩基配列を決定した結果、Aureobasidium pullulansの推定オキシゲナーゼと相同性を示した。得られた部分遺伝子160−bpをプローブとして黒麹菌A.niger IFO4067株のラムダEMBL3ゲノムDNAライブラリーのスクリーニングを行った。アマシャムファルマシア社製のGene Imageラベリングキットを用いてプローブのフルオレッセンラベルを行い、約5000個のファージクローンをスクリーニングした。得られた陽性クローンに含まれる全塩基配列をジデオキシ法を用いて決定した。 【0034】その結果、本遺伝子は、499アミノ酸残基からなる蛋白質をコードしていた。プロモーター領域は配列番号2の1から1379bp、コーディング領域は配列番号2の1380から2936bp、ターミネーター領域は配列番号2の2937から3482bpまでである。イントロンは、1つ含まれており、配列番号2の2246から2302bpまでである。得られた遺伝子をnsb1と命名した。その塩基配列を配列番号2(図6、図7)に示し、それに対応するアミノ酸配列を配列番号1(図4、図5)に示す。 【0035】 【実施例2】nsb2遺伝子のクローニングと塩基配列の決定黒麹菌A.nigerのフェリクローム生合成におけるペプチド結合の合成に関与するペプチドシンテターゼの遺伝子クローニングを行うために、既にクローニングが報告される他の糸状菌由来シデロフォア生合成に関与するペプチドシンテターゼのアミノ酸配列保存領域を比較した。現在までにヒドロキシオルニチンを含むシデロフォアの生合成に必須な糸状菌のペプチドシンテターゼをコードする遺伝子は、Ustilago maydis、Aureobasidium pullulans、Trichoderma harzianum由来のものがクローニングされている。そこでこれらのシデロフォア生合成に関与するペプチドシンテターゼ蛋白質の相同性から、麹菌におけるペプチドシンテターゼ活性を担う遺伝子が取得できると考えた。これらの遺伝子のアミノ酸レベルでの相同性を比較した結果、少なくとも2つのアミノ酸配列保存領域を見出した。 【0036】一方のアミノ酸配列保存領域(3)は、配列番号9(図52)に示されるアミノ酸配列を有し(配列中、左から1番目のXaaはVal又はLeu、2番目のXaaはGly又はAlaを、それぞれ、示す。)、他のアミノ酸配列保存領域(4)は、配列番号10(図53)に示されるアミノ酸配列を有した(配列中、左から1番目のXaaはThr又はArg、2番目のXaaはArg又はAsn、3番目のXaaはIle又はMet、4番目のXaaはGly又はAspを、それぞれ、示す。)。 【0037】これら保存配列(3)、(4)をもとに、2本の縮重オリゴヌクレオチドプライマーP3、P4をそれぞれ合成した。プライマーP3の塩基配列を配列番号11(図54)に示し、プライマーP4の塩基配列を配列番号12(図55)に示す。これらの配列において、n(図中I)はデオキシイノシン残基、SはG又はC、rはA又はG、yはT又はCのIUBコードによる縮重塩基を示す。 【0038】上記した縮重プライマーP3、P4を用いて、Aspergillus niger IFO 4067株より調製した染色体DNAに対してPCRを行った。反応条件はnsb1と同様に行った。 【0039】反応液をアガロースゲル電気泳動で解析を行った結果、約800bpのフラグメントの増幅が認められた。本遺伝子増幅産物の塩基配列を決定した結果、確かに上記P3、P4配列を含んでおり、相同性を検索した結果、Alternaria alternataのペプチドシンテターゼをコードする遺伝子と相同性を示した。得られた部分遺伝子800−bpをプローブとして黒麹菌A.nigerのラムダEMBL3ゲノムDNAライブラリーのスクリーニングを行った。アマシャムファルマシア社製のGene Imageラベリングキットを用いてプローブのフルオレッセンラベルを行い、約5000個のファージクローンをスクリーニングした。その結果、1つの陽性クローンが得られた。得られたクローンに含まれる全塩基配列をジデオキシ法を用いて決定した。 【0040】その結果、本遺伝子は、7064アミノ酸残基からなる蛋白質をコードしており、イントロンを2つ含んでいた。プロモーター領域は配列番号4の1から1725bp、コーディング領域は配列番号4の1726から23024bp、ターミネーター領域は配列番号4の23025から23114bpまでである。イントロンは、配列番号4の11191から11240bpと19170から19223bpであった。得られた遺伝子をnsb2と命名した。またnsb2遺伝子は、図1に示すようにA.niger染色体上でnsb1の上流約2−kbに位置しており、他の生物と同様にクラスターを形成することが明らかとなった。 【0041】nsb2遺伝子の塩基配列を配列番号4(図36〜図47)に示し、それに対応するアミノ酸配列を配列番号3(図8〜図35)に示す。本遺伝子は、プローブとしてフルオレッセンラベル化した後、アスペルス・ニガー IFO 4067株のラムダEMBL3ファージを用いたゲノム遺伝子ライブラリーをスクリーニングすることにより取得することができた。また、本遺伝子については、A.niger染色体上の位置を特定されているし、その塩基配列及びそれがコードする蛋白質のアミノ酸配列も本発明者らによって明らかにされているので、A.niger染色体から分離することにより、本遺伝子を取得ることができ、本発明の実施は容易である。 【0042】 【実施例3】nsb1遺伝子の大腸菌での大量発現と酵素アッセイnsb1遺伝子の機能を同定するために、本遺伝子の大腸菌での大量発現を行った。nsb1のcDNAの取得をまず試みた。具体的には30℃、4日間鉄制限培地(2%グルコース、0.6%アスパラギン、0.1%リン酸1水素2カリウム、0.1%硫酸マグネシウム、0.04%塩化カルシウム、pH6.0)で液体培養した麹菌A.nigerからニッポンジーン社ISOGENを利用して全RNAを抽出した。その全RNAから宝酒造Oligotex-dT30<Super>mRNA purification kitを用いてmRNAを抽出した。得られたmRNA 0.5μgをもとに全長cDNA領域(配列番号2の1380から2933 bp)をRT−PCRで増幅後、T4ポリヌクレオチドキナーゼとT4 DNAポリメラーゼを用いて平滑末端断片を調製した。本断片をノバジェン社pET−23bベクターのHincII部位へT7プロモーターと正方向にサブクローニングした。 【0043】本プラスミドをnsb1大腸菌高発現プラスミドpENS1(図2)とした。本プラスミドをノバジェン社大腸菌BL21(DE3)へ形質転換後、アンピシリン耐性を示す形質転換体を選択した。得られた形質転換体を37℃でOD0.6までLB培地で培養後、最終1mM IPTGを加えてさらに30℃で3時間培養した。得られた大腸菌の菌体内蛋白質から東洋紡のMag ExtractorHis-Tag kitを用いて精製した(図3)。得られた精製蛋白質を100mMリン酸ナトリウムバッファー(pH6)で抽出後、上清に最終1mMピルビン酸ナトリウム、2mM L−オルニチンを加え、37℃で好気的に約2時間インキュベートした。10%トリクロロ酢酸で反応停止後、遠心上清中のヒドロキシアミンをヨード酸化法(GillamらAnal. Chem. 5:841-844、1981)に従って定量した。比活性は1分当たりに1nmolのヒドロキシアミンを産生する酵素量を1 unitとして、菌体蛋白質mgあたりの生産量を算出し、下記表1に示した。 【0044】 (表1) nsb1遺伝子形質転換体のオルニチンN5−モノオキシゲナーゼ活性────────────────────────────────── プラスミド オルニチンN5−モノオキシゲナーゼ活性 (U/mg) ────────────────────────────────── 対照 ND pENS1無細胞抽出液 5.32 pENS1精製蛋白質 102.1──────────────────────────────────【0045】表1に示したようにL−オルニチンN5−オキシゲナーゼ活性が認められた。よって、nsb1がフェリクローム生合成の第1段階を触媒するL−オルニチンN5−オキシゲナーゼをコードすることが明らかとなった。本菌株をエシェリヒア・コリ(Escherichia coli)NSID1と命名し、独立行政法人産業技術総合研究所特許生物寄託センターに寄託番号FERM P−18679として寄託した。本寄託菌株を用いることによって、1mM IPTG誘導培養条件下でT7プロモーター支配下でnsb1蛋白質を大腸菌で生産提供することが出来る。 【0046】 【発明の効果】本発明により、クローニングした遺伝子断片nsb1には、フェリクローム類生合成の第1段階を触媒するL−オルニチンN5−オキシゲナーゼがコードされていることが確認できた。またクローニングした遺伝子断片nsb2には、フェリクローム生合成におけるペプチド結合の合成に関与するペプチドシンテターゼがコードされていた。nsb1とnsb2はクラスターを形成していた。またこの遺伝子を用いて、フェリクローム類を高生産あるいは非生産させることが可能であり、用途に応じたフェリクローム類生産が可能となった。本発明により大量生産可能となったフェリクローム類は非常に安全性が高く、食品、医薬、研究用試薬など様々な産業分野に利用が可能である。またnsb2にコードされるペプチドシンテターゼ蛋白質の各ドメインを、蛋白質工学的に組み換えることにより任意のペプチドを設計することも可能となる。 【0047】 【配列表】 SEQUENCE LISTING<110> Gekkeikan Inc., Ltd.<120> Ferrichrome Biosynthetic Gene Cluster of Black Koji-mold<130> 6553<141> 2002-2-6<160> 12<210> 1<211> 499<212> PRT<213> Aspergillus niger<400> 1Met Glu Pro Ala Val Arg Lys Pro Glu Val Ser Phe His Ser Gln Arg 1 5 10 15Asn Met Pro Ser Lys Gln Gln Arg Val Pro Ser Lys Leu Lys Ala Thr 20 25 30Pro Lys Asp Glu Leu His Asp Leu Leu Cys Val Gly Phe Gly Pro Ala 35 40 45Ser Leu Ala Ile Ala Ile Ala Leu His Asp Ala Leu Asp Pro Cys Leu 50 55 60Asn Lys Ser Ala Pro Ala Pro Gly Ser Gln Pro Lys Val Cys Phe Val65 70 75 80Glu Arg Gln Lys Gln Phe Ala Trp His Ser Gly Met Leu Val Pro Gly 85 90 95Ser Arg Met Gln Ile Ser Phe Ile Lys Asp Leu Ala Thr Leu Arg Asp 100 105 110Pro Arg Ser Ser Phe Thr Phe Leu Asn Tyr Leu His Gln Lys Asp Arg 115 120 125Leu Ile His Phe Thr Asn Leu Gly Thr Phe Leu Pro Ala Arg Leu Glu 130 135 140Phe Glu Asp Tyr Met Arg Trp Cys Ala Gln Gln Phe Ser Asp Val Val145 150 155 160Ser Tyr Gly Glu Glu Val Val Asp Val Met Pro Gly Lys Thr Asp Pro 165 170 175Thr Ser Ser Val Val Asp Phe Phe Thr Val Arg Ser Arg Asn Val Glu 180 185 190Thr Gly Glu Ile Thr Ala Arg Arg Ala Arg Lys Val Val Thr Ala Leu 195 200 205Gly Gly Ser Ala Lys Met Pro Pro Gly Leu Pro Gln Asp Pro Arg Ile 210 215 220Met His Ser Ser Lys Tyr Cys Thr Asn Leu Pro His Leu Leu Lys Asn225 230 235 240Pro Asn Glu Pro Tyr Asn Ile Ala Val Leu Gly Ser Gly Gln Ser Ala 245 250 255Ala Glu Ile Phe His Asp Leu Gln Lys Arg Tyr Pro Asn Ser Lys Thr 260 265 270Thr Leu Ile Met Arg Asp Ser Ala Met Arg Pro Ser Asp Asp Ser Pro 275 280 285Phe Val Asn Glu Val Phe Asn Pro Glu Arg Val Asp Lys Phe Tyr Asn 290 295 300Leu Ser Ala Glu Glu Arg Gln Arg Ser Leu Lys Ala Asp Lys Ala Thr305 310 315 320Asn Tyr Ser Val Val Arg Leu Glu Leu Ile Glu Glu Ile Tyr His Asp 325 330 335Met Tyr Val Gln Arg Val Lys Asn Pro Asp Glu Lys Gln Trp Gln His 340 345 350Arg Ile Leu Pro Gly Arg Lys Ile Thr Arg Val Glu His His Gly Pro 355 360 365Gln Ser Arg Met Arg Ile His Val Arg Ala Thr Lys Asp Gly Ser Asp 370 375 380Ser Leu Val Gly Asp Gly Lys Glu Ile Leu Glu Val Asp Ala Leu Met385 390 395 400Val Ala Thr Gly Tyr Tyr Arg Asn Ala His Glu Gln Leu Leu Ser Asn 405 410 415Val Gln His Leu Arg Pro Ala Gly Gln Glu Glu Trp Lys Pro Ser Arg 420 425 430Asp Tyr Arg Val Glu Met Asp Ala Ser Lys Val Ser Pro Tyr Ala Gly 435 440 445Ile Trp Leu Gln Gly Cys Asn Glu Lys Thr His Gly Leu Ser Asp Ser 450 455 460Leu Leu Ser Val Leu Ala Ala Arg Gly Gly Glu Met Val Glu Ser Ile465 470 475 480Phe Gly Glu Gln Leu Ala Gly Ala Thr Val Pro Val Thr Lys Leu Arg 485 490 495Ala Met Leu 499<210> 2<211> 3482<212> DNA<213> Aspergillus niger<400> 2ctgtattgat ttcatttgag tgagggaaag cttatcaaga ttggtacctg aacaatccaa 60ccggttacag gaggtaatgt aagttgggcg tcaatacgat acggataccg ccattcagcc 120cagtcttgga aacgttgtga aatttcccga catcgggcga ctgcggatct aatctaagcg 180tccatcatcc cacttttcct ggattaattt gcattgcaca ccggatcatg ctgcggggct 240cctggtcggc tcttcgggct cggagactga gtaggcagct tggcttattg tttgctttct 300ttgctatttt gggttcaatt tttatgaagc aaattgaagt gttcgtgggt acaactggtt 360gatatgcctc gatgaatttt cactggtgct aatggtgatg ggggtggtgg ttgttgtggc 420gtgatcctca acttcccagg atgtgaacgg atctggggcg agcaaaggga agaagggagg 480ggctatggtt agcacttcgt ttacaagttc ataccacaag tgggctcttc tggacctgat 540aaaacatcat cttatctccg aggaaacagc catctatgct tggaatttcg acatatggcg 600ttgggtttcc tcagtcacac aactactaat atgtgaacac ttccctctcc ttcaagccca 660acgttaacgc ggagacgata caaatcctcg cgaaatcgcc tgctagatca agcttcagta 720ttgttaatac ctattctaca taccttgcca accaccaaga gcctcggtgc cccagcatta 780aaccagtacg taaaaaaaga ggagcagcaa ccacgtttct catgggcagg tggtggaacc 840gaggagtgcc tatcaagtag gccattgccg gcccgctgtc agaagaacta cggccggcta 900ctgcttttgc tcggtggcct ggaaaaaaac ccgtccttaa cggatccgct gcttcagaaa 960aaaaaaaaaa aaagaagaag ggttcggcgc tgataccctt ttctttttta tgttacactc 1020gtcataaatt ctgaattttt ttttattatt aatattttag tcgaatttac ctttttggta 1080cctagttttt attttaacat atttttattt ttctctccct cttacggcgc aaaggtctcc 1140agtgtgtact aaagttggaa gaaatggtcc ttccccccat ctgtttatcc accaggggat 1200ataactacga ccatcgctcc caccatttgc cgcggttctc tcccaccttc gttcagaatc 1260ccatcatcat tgcgtcttcc ttccatcttc ctgctcccca aactctgagc acggaatctc 1320tgcctcttct ttcattcaca cactttctac tccttatatt cttctcctag tctgtatcaa 1380tggaacctgc ggtacggaag cccgaagtga gcttccacag ccagcgcaac atgccctcca 1440agcagcagcg ggtgccttcg aagctcaagg ccacccccaa ggatgagctt cacgatttac 1500tttgcgtggg tttcggtcct gcctctttgg cgatcgcaat tgccttgcac gatgctctgg 1560acccttgtct gaacaagtcg gcacctgcgc ctggatcgca gcccaaggtc tgctttgtcg 1620agcgtcagaa gcagtttgct tggcattcgg gcatgttggt ccccggttca aggatgcaga 1680tctccttcat caaggatttg gcgactctcc gggatcctcg cagcagcttc accttcctca 1740actatttgca ccagaaggat cgtttgatcc atttcacaaa cctgggaaca ttccttccgg 1800ctcgcttgga gttcgaggac tatatgcggt ggtgtgcgca acaattctct gatgtcgtgt 1860cttatggaga ggaagtggtc gatgtgatgc ccggaaagac ggatcctacc agctcggtgg 1920tcgacttctt caccgtccgc tcccgcaacg ttgagacggg tgagattact gcgagaagag 1980cgcgcaaggt ggtgactgca ctcggtggct ctgcgaagat gcccccaggc ctgccccagg 2040acccccgcat tatgcactcg tcgaagtact gcaccaatct gcctcacctg ctgaagaacc 2100cgaacgaacc ctacaacatc gccgtgcttg gaagtggcca gagtgctgct gagatcttcc 2160acgacctgca aaagagatac cccaactcaa agacgacact gatcatgaga gattcggcta 2220tgcggcctag tgatgactct cctttgtgag tataataccc cttgcacgcc cgacaggtcg 2280caactaacag caaacaatat agtgttaacg aggtcttcaa ccccgaacgt gtcgacaaat 2340tctataacct ctctgccgaa gagcgccaac gttccctcaa ggctgacaag gccaccaact 2400acagtgtggt ccgtcttgaa ctcattgagg agatttacca cgacatgtac gtccagcggg 2460tcaagaaccc cgacgagaag caatggcagc accgcatcct ccccggacgc aagatcacgc 2520gagtcgaaca ccatggacct cagagtcgga tgcggattca cgtgagggcg accaaggatg 2580gatcggacag ccttgtcggc gacggcaagg agatattgga ggtggatgca ctcatggtgg 2640cgaccggcta ctaccgcaac gcacatgaac agctcttgag caacgtgcag catctgcgac 2700cggcaggcca ggaggaatgg aagccgagtc gggattaccg ggtcgaaatg gatgccagca 2760aggtcagccc ctatgctgga atctggctgc agggctgtaa cgagaagaca cacgggctaa 2820gcgacagtct tctgtcggtg ctggcagcac gcggtggaga gatggtggag tcgatctttg 2880gcgagcagct tgcgggtgca acggtgccgg tcacgaagtt gcgcgctatg ctgtaaaggc 2940ttttcgccgg atcggagacc caggaggggt tccgctttct agacgcgtga aatgatggcg 3000ctagggcgga cattttaatt tccttgggac aaaagaatgc cccggaaaaa tgcatgcata 3060tccccaaaca aattggtagg gggtgatatc ttcttttgcg atcatctact ctactgtatc 3120tgtgttcatt tctgtctcac caccttatac tttgttacta ttgttattac cccatcatct 3180gattccccaa gtacccccat cgcgagttat atagccagcc acattggaat tttataacga 3240atagagatcg gaatgcatcg agtctgtcct tgttgatttt aattccaccg ctcattgtgt 3300taggaagaag gccatgctaa tggcgcacgt ttcttttttt cattcgctgc agatgtaatt 3360cattctcctt aaacttatcc ggcccctgac acgtgcctgt agccgacagg aggacgaaaa 3420taagtgccta ggaaagaaaa agcgagtggc tggtcgcaca accgcagtct agcacggacc 3480cg 3482<210> 3<211> 7064<212> PRT<213> Aspergillus niger<400> 3Met Arg Ser Pro Asn Asp Leu Thr Thr Ser Ala Thr Met Glu Asp Ile 1 5 10 15His Gln Ile Trp Ser Trp Asn Ala Asn Val Pro Glu Ala Gly Glu Thr 20 25 30Cys Val His Thr Leu Ile Thr Asp Lys Ala Leu Gln Gln Pro Asp Ala 35 40 45Leu Ala Val Asp Ala Trp Asp Gly Arg Trp Thr Tyr Gly Glu Leu Glu 50 55 60Thr Thr Ser Thr Lys Leu Ala Leu Arg Leu Leu Asp Leu Gly Val Gly 65 70 75 80Pro Gly Thr Asn Val Val Ile Cys Phe Glu Lys Ser Lys Tyr Thr Pro 85 90 95Leu Ala Met Leu Ala Val Met Lys Ala Gly Gly Ala Ser Ile Ala Leu 100 105 110Asp Thr Ser Gln Pro Gln Thr Arg Leu Gln Ser Ile Ile Asn Gln Val 115 120 125Asp Pro Val Val Ile Leu Cys Ser Ala Ser Lys Ser Gln Leu Ala Lys 130 135 140Ser Ile Ile Thr Glu Ser Ala Val Ala Leu Thr Ile Asp Glu Asn Ser145 150 155 160Leu Ser Glu Met Asn Phe Glu Pro Asp Ser Val Ala Arg Leu Pro Asp 165 170 175Val Ser Leu Asp Asn Asn Leu Tyr Val Val Phe Thr Ser Gly Ser Thr 180 185 190Gly Thr Pro Lys Gly Val Val Val Thr His Leu Asn Tyr Ser Thr Ala 195 200 205Ile Leu His Gln Gln Glu Ala His Gly Phe Lys Ser Thr Ser Arg Val 210 215 220Tyr Asp Phe Ala Ser Tyr Ala Phe Asp Val Ser Trp Ser Asn Leu Ile225 230 235 240His Thr Leu Thr Ile Gly Ala Cys Leu Cys Ile Pro Ser Glu Gln Asp 245 250 255Arg Lys Asp Asn Leu Ile Glu Ser Ile Arg Ser Leu Cys Ala Thr His 260 265 270Ile Asp Val Thr Pro Ser Val Ala Arg Leu Ile Pro Asp Ser Leu Leu 275 280 285Cys Lys Ile Glu Thr Leu Val Leu Gly Gly Glu Lys Leu Pro Ala Glu 290 295 300Leu Ala Arg His Leu Ser Ser Leu Val Thr Leu Lys Asn Pro Tyr Gly305 310 315 320Pro Ser Glu Cys Thr Pro Thr Ser Thr Ile Ala Thr Ile Arg Pro Asp 325 330 335Asp Asp Asp Ser Lys Ile Ser Ser Ile Gly Arg Gly Leu Gly Val Asn 340 345 350Thr Trp Val Val Asp Ser Glu Asn Glu Glu Ile Leu Val Pro Ile Gly 355 360 365Gln Val Gly Glu Leu Leu Leu Glu Gly His Leu Leu Gly Asn Gly Tyr 370 375 380Leu Asn Asp Gln Thr Lys Thr Thr Ala Ala Phe Val Asn Asn Pro Leu385 390 395 400Phe Leu Leu Asn Gly Gly Asp Gly Pro Gly Gln Pro Gly Arg Arg Gly 405 410 415Arg Leu Tyr Lys Thr Gly Asp Leu Val Arg Tyr Glu Lys Asp Gly Ser 420 425 430Leu Thr Ile Ile Gly Arg Lys Asp Thr Gln Ser Arg Leu Arg Pro Arg 435 440 445Val Glu Leu Gly Asp Ile Glu His His Ile Tyr Arg His Ile Pro His 450 455 460Gly Thr Val Ser Val Arg Gln Ile Ala Ala Glu Ile Ile Ser Pro Lys465 470 475 480Thr Gly Ser Asn Ala Val Leu Ala Ala Phe Leu Glu Val Asp Leu Gly 485 490 495Val Glu Asp Thr Gly Ile Ala Glu Gln Leu Phe Ser Lys Thr Glu Lys 500 505 510Met Met Ser Asn Leu Arg Ser Asn Leu Ala Arg Asp Val Pro Ser Tyr 515 520 525Met Val Pro Ala Val Phe Ile Pro Leu Arg Asn Phe Pro Leu Ser Pro 530 535 540Thr Gly Lys Thr Asp Arg Arg Gln Leu Arg Ala Ile Gly Glu Ser Met545 550 555 560Asp Leu Thr Val Leu Ala Gly Phe Gly Ala Ala Pro Asn Glu Ala Arg 565 570 575Ile Pro Leu Thr Leu Arg Glu Lys Gln Leu Arg Arg Leu Trp Gly Ser 580 585 590Ile Leu Arg Ile Asp Glu Asn Leu Ile Ala Leu Asp Asp Asn Phe Leu 595 600 605Gln Arg Ala Gly Asn Pro Asn Ala Ala Met Lys Leu Val Thr Ala Ala 610 615 620Arg Arg Glu Gly Phe Ser Leu Ser Val Ala Asn Val Leu Lys Tyr Pro625 630 635 640Arg Leu Gln Asp Met Ala Gln Val Val Gly Thr Val Glu Gln Glu Gln 645 650 655Ala His Glu Ile Met Pro Phe Glu Leu Leu Ser Asp Asp Ile Asn Leu 660 665 670Asp Leu Ala Leu Arg Glu Ala Ala Ala Ser Cys Asn Val Gln Gly Asn 675 680 685Gln Ile Gln Asp Ile Tyr Pro Cys Thr Pro Leu Gln Glu Gly Met Met 690 695 700Ser Leu Ser Ala Lys Arg Glu Gly Asp Tyr Ile Met Gln Tyr Thr Leu705 710 715 720Glu Leu His His Arg Cys Asp Ile Glu Arg Leu Gly Lys Ala Trp Ala 725 730 735Thr Val Val Ala Thr Thr Pro Ile Leu Arg Thr Arg Ile Val Asp Ile 740 745 750Thr Ser Gln Gly Leu Val Gln Ala Val Leu Asp Glu Gln Trp Ser Ser 755 760 765Ser Ser Ile Gln Arg Arg Thr Leu Ser Gln Ala Arg Asp His Lys His 770 775 780Gln Phe Gly Leu Gly Met Pro Leu Gly Arg Phe Glu Ile Val Thr Gly785 790 795 800Asp Ser Ser Asp Phe Lys His Tyr Phe Val Trp Thr Leu His His Ala 805 810 815Leu Tyr Asp Gly Trp Ser Leu Gln Leu Leu Leu Glu Lys Leu Glu Asn 820 825 830Glu Tyr Ala Gly Lys Ala Asp Ala Gln Ser Asn Ser Pro Asp Phe Lys 835 840 845Arg Phe Ile Lys Tyr Ile Ser Thr Arg Asp Gly Glu Lys Thr His Ser 850 855 860Phe Trp Thr Glu Gln Phe Gln Asp Val Glu Ala Gln Ile Phe Pro Ser865 870 875 880Leu Pro Ser Val Asp Tyr Gln Pro Arg Ser Asp Lys Leu Tyr Thr His 885 890 895Ser Val Gly Gly Ile Gln Trp Pro Lys Asn Gly Ile Thr Pro Ser Thr 900 905 910Thr Ile Arg Ala Ala Tyr Ser Ile Leu Ile Ser Ser Leu Thr Asn Ser 915 920 925Pro Asp Val Val Phe Gly Ser Ile Thr Thr Gly Arg Gln Ala Ala Val 930 935 940Asp Glu Val Glu Glu Leu Ile Ala Pro Thr Ile Ala Thr Val Pro Val945 950 955 960Arg Val Ser Ile Asp Ser Lys Asp Glu Leu Gly Gln Phe Leu Gln Arg 965 970 975Ile Gln Ser Gln Ala Ala Asp Met Ile Glu Phe Glu Gln Thr Gly Leu 980 985 990His Gln Ile Arg His Ile Asn Ala Asp Ala Glu Arg Ala Cys Gln Phe 995 1000 1005Gln Thr Leu Leu Val Val Gln Pro Ala Glu Gly Ser Gly Thr Ala Pro 1010 1015 1020Ser Asp Ile Phe Thr Asn Ile Pro Asp Asp Ile Arg Lys Gly Asp Gly1025 1030 1035 1040Asn Ser Ala Ala Glu Leu Gly Thr Tyr Ala Leu Thr Met Glu Cys Leu 1045 1050 1055Leu Lys Lys Asp Gly Leu Asp Leu His Met Asn Tyr Cys Ser Ala Val 1060 1065 1070Ile Ser Glu His Gln Val Arg Arg Leu Ser Gln Gln Phe Glu His Val 1075 1080 1085Leu Gly Gln Ile Cys His Leu Thr Met Ile Ile His Arg Gln Arg Thr 1090 1095 1100Thr Leu Glu Ser Leu Arg Gln Pro Thr Thr Glu Thr Glu Arg Gln Met1105 1110 1115 1120Gln Arg Ile Trp Ala Gln Val Leu Asn Leu Asn Gln Ala Ser Ile Gly 1125 1130 1135Leu Asp Tyr Ser Phe Phe Gln Leu Gly Gly Asp Ser Ile Ala Ala Met 1140 1145 1150Glu Val Val Thr Glu Ala Arg Lys Leu Gly Leu Lys Leu Ala Val Ser 1155 1160 1165Asp Ile Phe Arg Arg Pro Lys Leu Gln Asp Val Ala Lys Lys Ala Cys 1170 1175 1180Asp Ser Gly Leu Gln Leu Tyr Gly Glu Glu Gln Leu Met Asn Asp Ser1185 1190 1195 1200Glu Val Gln Val Lys Gly Gly Thr Glu His Thr Lys Leu Pro Asn Asp 1205 1210 1215Asp Lys Ala Val Ala Gly His Glu Thr Gln Gln Val Met Val Trp Glu 1220 1225 1230Gly Met Phe Asp Lys Glu Val Tyr Gly Thr Ile Asn Asp Val Gln Leu 1235 1240 1245Glu Lys Ile Gly Arg Asp Phe Ile Gly Trp Thr Ser Met Tyr Asn Gly 1250 1255 1260Asn Gln Ile Asp Asn Val Glu Leu Asn Glu Trp Leu Asp Asp Thr Ile1265 1270 1275 1280 Ala Thr Ile Arg Ser Ser Gly Ser Thr Ala Asn Ile Leu Glu Leu Gly 1285 1290 1295Ser Gly Ser Gly Met Ile Leu Phe Asn Leu Val Asn Gly Leu His Ser 1300 1305 1310Tyr Val Gly Leu Asp Pro Ser Glu Lys Ala Val Asp Phe Val Cys Ser 1315 1320 1325Thr Val Lys Ser Ile Pro Gln Leu Ala Asp Arg Val Tyr Asn Ile Lys 1330 1335 1340Gly Thr Ala Asp Asn Ile Asn Ser Leu Gly Val Pro Ile Ser Ala Asn1345 1350 1355 1360Met Val Ile Val Asn Ser Val Val Gln Tyr Phe Pro Ser Gln Asp Tyr 1365 1370 1375Leu Leu Lys Val Ile Glu Asp Leu Val Gln Leu Glu Thr Val Arg Thr 1380 1385 1390Ile Phe Phe Gly Asp Ile Arg Ser Tyr Ala Leu Phe Arg Glu Phe Gln 1395 1400 1405Val Thr Arg Ala Leu His Ile Ala Gly Asp Thr Ala Thr Glu Asp Glu 1410 1415 1420Ile Arg Gln Met Met Ala Asn Met Glu Gln Val Glu Leu Glu Leu Leu1425 1430 1435 1440Val Asp Pro Ala Phe Phe Thr Ser Leu Val Asp Arg Phe Pro Gly Leu 1445 1450 1455Val Glu His Val Glu Ile Leu Pro Lys Arg Leu Lys Ser Thr Asn Glu 1460 1465 1470Leu Ser Ala Tyr Arg Tyr Ala Ala Val Val His Leu Lys Asp Ser Asn 1475 1480 1485Gln Leu Ala Gln Pro Leu Gln Val His Asp Ile Gln Lys Glu Ser Trp 1490 1495 1500Ile Asn Tyr Ser Gly Arg Gln Leu Asn Arg Gln Ser Leu Leu Gln Leu1505 1510 1515 1520Val Gln Asp Ser Phe Leu Arg Asp Pro Ser Pro Ser Ser Val Val Ala 1525 1530 1535Val Cys Asn Ile Pro Tyr Ser Met Thr Val Tyr Glu Arg His Val Ile 1540 1545 1550Glu Trp Leu Asp Ser Gly Leu Thr Ala Gly Pro Asp Ala Glu Asp Trp 1555 1560 1565Leu Ser Ser Ile Arg Gln Thr Ser Gln Glu Cys Ser Ser Leu Ser Ala 1570 1575 1580Leu Asp Leu Gln Gln Ile Ala His Gln Thr Gly Trp Gln Val Glu Ile1585 1590 1595 1600Ser Trp Ser Arg Gln Phe Ser Gln Arg Gly Gly Leu Asp Ala Ile Phe 1605 1610 1615His Arg His His Ser Arg Gly Asp Arg Thr Ser Arg Ala Leu Phe Asn 1620 1625 1630Phe Pro Thr Asp Tyr Gln Gly Arg Pro Phe Gln Ser Leu Ser Lys Trp 1635 1640 1645Pro Leu Gln Arg Lys Arg Gln Gly Glu Glu Lys Gln Ile Thr Leu Gly 1650 1655 1660Asp Val Ser Thr Val Cys Lys Glu Asp Leu His Asp Ile Trp Thr Trp1665 1670 1675 1680Asn Glu Val Val Pro Asp Ala Leu Glu Ala Cys Val His Asp Leu Ile 1685 1690 1695Ser Asp Thr Val Arg Ala Gln Pro Gln Ser Pro Ala Ile Cys Ala Trp 1700 1705 1710Asp Gly Glu Trp Ser Tyr Ile Glu Leu Asp Asp Leu Ser Ser Arg Leu 1715 1720 1725Ala His Ala Leu Ala Pro Phe Gly Val Ala Asn Thr Val Val Pro Ile 1730 1735 1740Cys Phe Glu Lys Ser Lys Trp Thr Pro Val Ala Thr Leu Ala Val Met1745 1750 1755 1760Lys Ala Gly Ala Ala Ser Val Thr Leu Asp Ala Ser Gln Pro Leu Glu 1765 1770 1775Arg Leu Arg Ser Ile Ile Ser Gln Thr Asp Pro Arg Val Ile Leu Ser 1780 1785 1790Ser Ala Ser Lys Gln Gly Leu Gly Ala Gln Leu Thr Lys Ala Pro Asn 1795 1800 1805Leu Val Val Asp Gln His Ser Ile Ser Thr Met His Ile Thr Ala Glu 1810 1815 1820Pro Leu Pro Thr Val Asp Pro Ser Ser Lys Leu Tyr Ile Val Phe Thr1825 1830 1835 1840Ser Gly Thr Thr Gly Val Pro Lys Gly Val Ile Ile Thr His Ser Asn 1845 1850 1855Phe Ser Ser Ala Ile Arg His Gln Gln Lys Ala His Gly Phe Lys Ser 1860 1865 1870Thr Ser Arg Ile Tyr Asp Phe Ala Ser Tyr Ala Phe Asp Val Ser Trp 1875 1880 1885Ser Asn Phe Ile His Ala Leu Thr Val Gly Ala Cys Leu Cys Ile Pro 1890 1895 1900Ser Asp Glu Asp Arg Arg Asp Asp Leu Ala Gly Ser Leu Glu Arg Phe1905 1910 1915 1920Gly Ala Thr His Val Asp Met Thr Pro Ser Ala Ala Ser Leu Leu Pro 1925 1930 1935Glu Lys Ser Phe Lys Arg Leu Glu Thr Val Val Leu Gly Gly Glu Lys 1940 1945 1950Leu Ser Val Glu Ser Ala Gln Arg Trp Ser Ser Leu Val Ser Leu Lys 1955 1960 1965Asn Pro Tyr Gly Pro Ser Glu Cys Thr Pro Thr Ala Thr Ile Ala Thr 1970 1975 1980Val Thr Pro Thr Asp Glu Tyr Lys Ser Ser Ile Gly Arg Gly Leu Gly1985 1990 1995 2000Leu Asn Thr Trp Ile Val Asn Thr Val Thr Asp Ser Leu Val Pro Val 2005 2010 2015Gly Gly Val Gly Glu Leu Leu Leu Glu Gly Pro Leu Val Gly Ala Gly 2020 2025 2030Tyr Leu Gly Asp Asp Thr Lys Thr Ala Ala Ser Phe Val Glu Asp Pro 2035 2040 2045Gln Phe Leu Leu Gln Ile Cys Pro Gln Gly Gln Ala Arg His Thr Arg 2050 2055 2060Met Tyr Lys Thr Gly Asp Leu Val His Tyr Asn Pro Asp Gly Ser Leu2065 2070 2075 2080Ser Phe Val Gly Arg Lys Asp Ala Gln Val Lys Ile His Gly Gln Arg 2085 2090 2095Val Glu Leu Thr Glu Ile Glu Ser His Ile Arg Arg Thr Ser Lys Thr 2100 2105 2110Ile Gln Val Ala Val Leu Phe Thr Lys Ser Gly Leu Cys Ala Asn Arg 2115 2120 2125Val Val Ala Phe Val Cys Ile Gln Gly Thr Gly Gln Thr Gln Thr Ala 2130 2135 2140Ala Asp Gln Ile Arg Leu Ile Asp Pro Lys Tyr Ser Thr Leu Val Thr2145 2150 2155 2160Ala Tyr Thr Glu Ser Ala Lys Ser Ser Leu Ser Asp Thr Leu Pro Ala 2165 2170 2175Tyr Met Ile Pro Ser Ile Trp Ile Pro Leu Gln His Val Pro Leu Ser 2180 2185 2190Thr Ser Gly Lys Leu Asp Tyr Lys Ala Leu Lys Ser Trp Leu Asp Ser 2195 2200 2205Met Asp Ala Lys Thr Phe Ala Asn Ile Leu Thr Ala Ser Asp Gly Asp 2210 2215 2220Val Lys Leu Arg Lys Ala Glu Thr Glu Leu Glu Gln Val Ile Val Glu2225 2230 2235 2240Ala Cys Ala Lys Ile Leu Asn Ile Thr Ala Ser Lys Val Asn Leu Asp 2245 2250 2255Arg Ser Phe Ile Ala Asn Gly Gly Asp Ser Ile Ser Ala Met Arg Leu 2260 2265 2270Val Ala His Cys Arg Ala Asp Asn Val Val Phe Ser Val Ala Lys Leu 2275 2280 2285Leu Lys Ser Lys Thr Leu Ala Ala Leu Ala Ser Ser Ser Lys Ile Lys 2290 2295 2300Ser Ala Ser Asn Val Leu Gly Phe Tyr Glu Glu Lys Ser Asp Ser Phe2305 2310 2315 2320Ala Leu Ser Pro Ile Gln Gln Trp Phe Phe Glu Gln Gly Leu Tyr Lys 2325 2330 2335Arg Ser Asn Asp Asn Phe Asp Asn Gln Gly Phe Tyr Leu Lys Val Lys 2340 2345 2350Arg Pro Leu Leu Thr Lys Asp Ile Asp Ser Ala Ile Ser Lys Val Val 2355 2360 2365Gln His His Ser Met Leu Arg Ala Arg Phe His Arg Asn Gly Asp Glu 2370 2375 2380Trp Thr Gln Lys Thr Leu Lys Pro Asp Thr Asn Gly Leu Tyr His Phe2385 2390 2395 2400Gly Val His His Thr Cys Leu Pro Ala Asp Ile Glu Arg Leu Ala Leu 2405 2410 2415Ser Arg His Gln Met Ile Asp Ile Glu Lys Gly Pro Val Phe Ser Ala 2420 2425 2430Asp Ile Cys His Asn Ala Phe Gly Glu Gln Tyr Leu Ile Leu Ile Ala 2435 2440 2445His His Leu Val Val Asp Leu Val Ser Trp Arg Val Ile Leu Glu Asp 2450 2455 2460Ile Glu Ser Leu Leu Gly Gly Ser Asn Leu Gln Pro Ser Leu Pro Phe2465 2470 2475 2480Gln Val Trp Asn Asp Met Gln Ile Glu Arg Ala Lys Glu Ser Ser Leu 2485 2490 2495Leu Asp Pro Glu Asn Val Leu Ser Thr Thr Gly Ile Asn Asn Asn Leu 2500 2505 2510Asp Phe Trp Gln Ala Thr Ala Glu Thr Lys Asn Thr Val Glu Asp His 2515 2520 2525Leu Asn Phe Cys Thr Lys Ile Asp Ser Ser Lys Gln Ser Ser Ser Ser 2530 2535 2540Lys Thr Gln Ile Thr Arg Ser Thr Leu Glu Pro Val Asp Leu Leu Leu2545 2550 2555 2560Ala Ala Val Trp His Ala Phe Phe Lys Thr Phe Pro Gln Arg Asp Gly 2565 2570 2575Leu Thr Ile Phe Ile Glu Gly His Gly Arg Glu Pro Trp Ser Ser Asp 2580 2585 2590Ile Asp Leu Ser Arg Thr Val Gly Trp Phe Thr Thr Ile Ser Pro Ile 2595 2600 2605His Val Ser Lys Ser Asp Val His Lys Ser Val Ala Ser Leu Val Arg 2610 2615 2620Val Val Lys Asp Ala Arg Arg Leu Leu Pro Ala Asn Gly Trp Ala Tyr2625 2630 2635 2640Phe Ala Ser Arg Tyr Phe Asn Glu Ser Gly Lys Ser Ala Phe Lys Ser 2645 2650 2655His Asp Ser Ile Met Glu Ile Thr Phe Asn Tyr His Gly Gln Phe Gln 2660 2665 2670Gln Leu Glu Asn Glu Lys Ala Met Phe Glu Asn Val Thr Leu Ser Gly 2675 2680 2685Val Cys Glu Gln Gly Pro Ala Leu Pro Ala Ser Ser Leu Ile Ala Val 2690 2695 2700Glu Val Ser Ile Asp Arg Gly Gln Val Thr Phe Asp Val Ser Ala Asn2705 2710 2715 2720Arg Tyr Ile Asn His Gln Asp Cys Ile Ser Asn Trp Ile Lys Ala Ile 2725 2730 2735Ser Gln Ser Leu Glu Thr Ile Ser Asn Glu Leu Val Ser Thr Glu Ile 2740 2745 2750Ser His Arg Thr Leu Cys Asp Tyr Glu Phe Leu Ser Leu Gly Tyr Thr 2755 2760 2765Glu Leu Asp Arg Leu Gln Glu Ser Val Ile Pro Glu Ile Glu Lys Leu 2770 2775 2780Asn Asn Ser Thr Val Glu Cys Ile Tyr Arg Cys Leu Pro Thr Val Asp2785 2790 2795 2800Gly Ile Leu Ile Ser Gln Phe Lys Asp Pro Glu Ser Tyr Lys Thr Val 2805 2810 2815Gln His Phe Glu Ile Thr Ser His Ile Asp Asp Gln Ile Asp Leu Glu 2820 2825 2830His Leu Ser Leu Ala Trp Gln Lys Val Val Ala Asn Gln Pro Ala Leu 2835 2840 2845Arg Thr Val Phe Ile Pro Gly Met Asp Lys Ala Ala Ala Phe Asn Gln 2850 2855 2860Val Val Leu Ser Gln Tyr His Ala Glu Leu Ile Ile Leu His Thr Ala2865 2870 2875 2880Ser Asp Glu Tyr Thr Glu Ala Leu Glu Met Phe Lys Asn Leu Ile Pro 2885 2890 2895Ile Asn Tyr Gln Ser Phe Lys Pro Pro His Arg Ala Ala Ile Cys Arg 2900 2905 2910Ile Ser Pro Ser Arg Val Leu Cys Gln Val Glu Met Ser His Ala Ile 2915 2920 2925Thr Asp Gly Ala Ser Thr Ser Ile Leu Ala Asn Asp Leu Leu Gln Ala 2930 2935 2940Tyr Asn Gly Asn Ser Met Pro Ile Asn Leu Met Asp Thr Ala Cys Glu2945 2950 2955 2960Phe Ala Arg Ala Gln Leu Thr Ser Ser Phe Gly Glu Lys Leu Ser Tyr 2965 2970 2975Trp Lys Lys Lys Leu Arg Glu Met Asp Pro Cys His Phe Pro Lys Ile 2980 2985 2990Ser Gly Ala Ser Thr Gln Gly Thr Gly Thr Ser Val Cys Lys Ile Arg 2995 3000 3005Gly Ala Leu Phe Ser Lys Ile Gln Asp Tyr Cys Asn Ser Val Glu Val 3010 3015 3020Thr Thr Ala Ser Leu Phe Gln Thr Ile Trp Ala Leu Thr Leu Ala Ala3025 3030 3035 3040Tyr Thr Gly Asn Asp Ser Thr Cys Phe Gly Tyr Leu Ala Ser Gly Arg 3045 3050 3055Asp Leu Pro Ile Ala Gly Ile Asp Lys Ser Ile Gly Ala Phe Thr Asn 3060 3065 3070Met Leu Val Cys Arg Val Asn Ile Asn Arg Glu Thr Glu Ile Leu Gln 3075 3080 3085Phe Val Gln Thr Val His Asp Gln Val Met Gln Asp Leu Glu His Gln 3090 3095 3100His Cys Ser Leu Ala Ser Ile Gln His Glu Leu Gly Ile Asn Ser Asp3105 3110 3115 3120Asn Pro Leu Phe Asn Ser Ile Leu Ser Tyr Gln Lys Gln Asp Asp Glu 3125 3130 3135Pro Ala Gly Asp Glu Gly Leu Val Ile Lys Ala Leu Asp Gly Gln Asp 3140 3145 3150Pro Thr Glu Tyr Asp Ile Val Leu Asn Ile Gly His Ala Thr Asp His 3155 3160 3165Ile Glu Ile Val Phe Asp Tyr Lys His Ala Cys Leu Ser Ser Ile Gln 3170 3175 3180Ala Glu Ser Val Leu Ser Leu Met Gln Ser Thr Ala Ala Ala Leu Val3185 3190 3195 3200Gln His Ala Ser Gly Asp His Gln Thr Leu Arg Ser Val Asn Met Val 3205 3210 3215Ser Thr Glu Asp Ile Ser Asp Ile Trp Gln Trp Asn Ser Asp Val Pro 3220 3225 3230Val Thr Val Asp Asp Cys Val His His Ile Ile Thr Arg Thr Cys His 3235 3240 3245Lys Arg Pro Gln Ala Pro Ala Ile Cys Ala Trp Asp Gly Asp Trp Thr 3250 3255 3260Tyr Ala Glu Val Asn Lys Leu Ser Asp Lys Leu Ala His Leu Leu Val3265 3270 3275 3280Ser Tyr Gly Val Gly Pro Gly Val Val Val Pro Leu Cys Phe Glu Lys 3285 3290 3295Ser Lys Trp Thr Pro Ile Ala Met Met Ala Val Met Lys Ala Gly Gly 3300 3305 3310Ala Ser Val Ala Met Asp Ser Thr Gln Pro Glu Glu Arg Leu Arg Ala 3315 3320 3325Ile Val Asn Gln Val Lys Ser Pro Ile Ile Leu Ser Ser Phe Ala Asn 3330 3335 3340Glu Gln Leu Ala Ser Arg Leu Ile Ser Glu Leu Pro Ala His Gln Gly3345 3350 3355 3360Pro His Asn Lys Arg Gln Arg Ser Gly Lys Phe Glu Cys Ser Glu Trp 3365 3370 3375Lys Pro Leu Pro His Val Asn Pro Ser Asp Thr Leu Tyr Val Val Phe 3380 3385 3390Thr Ser Gly Ser Thr Gly Val Pro Lys Gly Val Ala Val Thr His Ser 3395 3400 3405Asn Ile Ala Ser Ala Ile Lys His Gln Arg His Leu Leu Gly Phe Thr 3410 3415 3420Ser Glu Ser Arg Val Phe Asp Phe Ser Ser Tyr Met Phe Asp Val Val3425 3430 3435 3440Trp Cys Asn Leu Leu Gln Gly Leu Ser Ala Gly Ser Cys Val Cys Ile 3445 3450 3455Pro Ser Asp Asn Glu Arg Lys Thr Asp Phe Met Ala Ala Ile Val Lys 3460 3465 3470Met Arg Ala Asn Leu Val Ile Leu Thr Pro Ser Ala Ile Arg Gly Leu 3475 3480 3485Lys Leu Asp Ala Leu Asn Ser Leu Cys Asn Val His Phe Ile Gly Glu 3490 3495 3500Pro Leu His Val Asp Thr Phe Arg Ser Val Asp Glu Ser Val Thr Ile3505 3510 3515 3520Ser Asn Leu Tyr Gly Pro Thr Glu Cys Thr Thr Phe Ser Thr Val Gln 3525 3530 3535Thr Ile Cys Gly Arg Gln His Gln Ser Ile Thr Ile Gly Lys Gly Ala 3540 3545 3550Gly Leu Asn Thr Trp Val Ala Asp Ile Ala Thr Gly Thr Ala Leu Val 3555 3560 3565Pro Ile Gly Ser Ala Gly Glu Leu Leu Leu Glu Gly Pro Leu Val Ala 3570 3575 3580Ala Gly Tyr Arg Gly Asp Ala Val Lys Thr Ala Ala Ala Phe Val Tyr3585 3590 3595 3600Asp Pro Pro Phe Leu Leu Arg Gly Ser Val Gly His Pro Gly Arg Arg 3605 3610 3615Gly Arg Leu Tyr Lys Thr Gly Asp Ile Val Arg Tyr Asn Ser Asn Gly 3620 3625 3630Thr Leu Thr Phe Leu Gly Arg Lys Asp Ser Gln Val Lys Ile Asn Gly 3635 3640 3645Gln Arg Val Glu Phe Gly Asp Ile Glu Ser His Ile Asn Gly Ala Leu 3650 3655 3660Leu Pro Asp Phe Ser Glu Gly Gln Ala Leu Val Asp Phe Val Thr Pro3665 3670 3675 3680Gln Gly Ser Ser Arg Pro Met Leu Val Ala Phe Val Tyr Phe Gly Pro 3685 3690 3695Thr Val Thr Glu Gly Met Asp Glu Ala Asp Leu Leu Ser Leu Ala Lys 3700 3705 3710Arg Thr Ala Ile Ser Leu Asp Glu Ser Leu Ala Ala Arg Ile Pro Ala 3715 3720 3725Phe Met Ile Pro Ser Ala Tyr Ile Pro Leu Gln Lys Ile Pro Val Thr 3730 3735 3740Ala Thr Gly Lys Thr Asp Arg Arg Arg Leu Arg Glu Met Ala Lys Asp3745 3750 3755 3760Val Thr Trp Asp Gln Leu Ile Lys Ala Asp Ser His Gly Pro Asp Arg 3765 3770 3775Cys Gln Pro Gly Thr Glu Met Glu Ile Gln Leu Gln Ile Leu Trp Gly 3780 3785 3790Thr Val Leu Gly Val Glu Ser Ser Leu Ile Gly Ala His Asp Asn Phe 3795 3800 3805Met Arg Val Gly Gly Asp Ser Val Gly Ala Ile Arg Leu Ala Ser Ser 3810 3815 3820Ala Arg Glu Leu Gly Phe Thr Leu Asn Val Ala Asp Ile Leu Lys Asn3825 3830 3835 3840Pro Lys Leu Ser Asp Met Ala Lys Leu Met Ile Arg Thr Glu Pro Ser 3845 3850 3855Gln Asp Ile Ser Ile Lys Glu Phe Ser Leu Leu Lys Pro Gly Ser Asp 3860 3865 3870Val Asn Trp Ala Val Ala Glu Thr Ser Ala Leu Cys Gly Val Asp Gly 3875 3880 3885Asn Gln Val Glu Asp Leu Tyr Pro Cys Thr Pro Leu Gln Glu Gly Leu 3890 3895 3900Leu Ala Leu Thr Thr Lys Arg Pro Gly Asp Tyr Ile Ile Arg Cys Ile3905 3910 3915 3920Leu Glu Leu Lys Arg Ser Thr Asp Val Lys Lys Phe Cys Ala Ser Trp 3925 3930 3935Glu Ala Val Leu Glu Ser Thr Pro Ile Leu Arg Thr Arg Ile Val Asp 3940 3945 3950Ile Ala Glu Gln Gly Leu Val Gln Ala Val Ile Lys Gln Pro Ala Gln 3955 3960 3965Trp Thr Ser Ala Glu Ala Ser Ser Leu Val Asp Phe Val Ala Ala Asp 3970 3975 3980Asn Glu Lys Thr Thr Gly Leu Gly Met Pro Leu Val Arg Phe Gly Leu3985 3990 3995 4000Val Gln Glu Thr Asn Lys His Phe Phe Val Leu Thr Leu His His Ala 4005 4010 4015Val Tyr Asp Gly Trp Ala Leu Asn Leu Val Phe Glu Lys Leu Glu Asn 4020 4025 4030Phe Tyr Ala Gly Ser Ser Arg His Glu Ser Pro Asp Phe Arg His Phe 4035 4040 4045Val Lys His Ile Ser Ser Leu Asp Asn Asp Ala Ala Ala Lys Phe Trp 4050 4055 4060Lys Asp Gln Leu Gln Gly Ser Glu Ala Pro Thr Phe Pro Ser Leu Pro4065 4070 4075 4080Thr Ala Thr Phe Val Pro Lys Ser Glu Lys Thr Ile Leu His Thr Val 4085 4090 4095Glu Glu Leu Gln Trp Pro Lys Thr Asn Val Thr Ala Phe Thr Leu Val 4100 4105 4110Arg Ala Ala Leu Ser Leu Leu Thr Ala Ala Tyr Thr Asn Ser Glu Asp 4115 4120 4125Val Cys Phe Gly Val Thr Ser Asn Gly Arg Gln Val Gly Leu Pro Gly 4130 4135 4140Val Glu Arg Met Ile Gly Pro Thr Ile Ala Thr Val Pro Val Arg Val4145 4150 4155 4160Arg Ile Asp Arg Glu Gln Arg Leu Gln Ala Phe Leu Thr Gln Met Gln 4165 4170 4175His Gln Ser Ile Asp Met Ile Ala Phe Glu Gln Phe Gly Leu Gln Gln 4180 4185 4190Ile Arg Lys Ser Ser Pro Asp Ala Glu Arg Ala Cys Asn Phe Gln Ser 4195 4200 4205Leu Leu Ile Val Gln Pro Ala Glu Glu Thr Ala Gln Trp Gln Ser Asp 4210 4215 4220Ile Ile Ala Arg Asp Ile Gly Glu Gly Ala Asp Asp Pro Met Gly Ile4225 4230 4235 4240Gln Glu Ile Gly Thr Tyr Ala Leu Thr Leu Glu Cys His Leu Gly Pro 4245 4250 4255Asp Ser Leu Leu Ile Lys Ala Asn Phe Asp Ser Asn Val Ile Asp Glu 4260 4265 4270Leu Gln Val Lys Arg Phe Thr Lys Gln Phe Glu His Val Leu Arg Gln 4275 4280 4285Ile Cys Cys Ser Gly Ser Gly Leu Val Val Ser Asp Ile Asp Thr Thr 4290 4295 4300Ser Arg Gln Asp Met Glu Asp Ile Trp Lys Trp Asn Ala Val Val Pro4305 4310 4315 4320Gln Ser Val Asn Thr Pro Val His Glu Leu Ile Ser Ser Val Ala Arg 4325 4330 4335Arg Leu Pro His Val Gln Ala Val Cys Ala Trp Asp Gly Asn Trp Thr 4340 4345 4350Tyr Arg Gln Leu Asp Asp Leu Ser Asn Tyr Val Ala His His Leu Val 4355 4360 4365Asp Leu Gly Val Gly Ser Gln Asp Ile Val Pro Leu Leu Phe Glu Lys 4370 4375 4380Ser Lys Trp Met Pro Ile Ala Met Leu Gly Val Met Lys Ala Gly Ala4385 4390 4395 4400Ala Ser Val Ala Val Asp Thr Ser Gln Pro Lys Asp Arg Leu Arg Met 4405 4410 4415Ile Ile Asp Gln Ala Asn Pro Thr Val Ala Leu Ser Ser Ala Asp Lys 4420 4425 4430Leu Pro Leu Val Arg Ser Leu Thr Lys Ala Gln Ser Phe Val Val Ser 4435 4440 4445Gly Gln Gly Ile Asp Arg Leu Leu Lys Pro Ser Leu Asn Ala Thr Leu 4450 4455 4460Pro Val Val Asp Pro Ser Ser Arg Leu Tyr Leu Val Phe Thr Ser Gly4465 4470 4475 4480Ser Thr Gly Val Pro Lys Gly Val Ile Ile Arg His Cys Asn Phe Ala 4485 4490 4495Ser Ala Ile Lys His Gln Lys Glu Val Gln Gly Ile Leu Pro Thr Ser 4500 4505 4510Arg Val Tyr Asp Phe Ala Ser Tyr Ala Phe Asp Val Ala Trp Ala Asn 4515 4520 4525Ala Leu Leu Thr Phe Glu Ser Gly Ala Cys Leu Cys Ile Pro Ser Asp 4530 4535 4540Ala Asp Arg Lys Asn Asp Leu Asn Gly Ser Ile Ala Arg Leu Lys Pro4545 4550 4555 4560Thr His Ala Asp Leu Thr Pro Ser Ala Ala Leu Val Leu Ser Lys Glu 4565 4570 4575Ser Leu Gln Gln Leu Asp Thr Leu Thr Leu Gly Gly Glu Arg Leu Leu 4580 4585 4590Ala Glu Tyr Ala Thr Lys Trp Ser Gln Phe Val Thr Val Lys Asn Ser 4595 4600 4605Tyr Gly Pro Ser Glu Cys Thr Pro Thr Ala Thr Phe Thr Glu Ala Ile 4610 4615 4620Gly Arg Gly Tyr Asp Leu Gly Ala Ser Ile Gly Lys Pro Ala Gly Leu4625 4630 4635 4640Asn Thr Trp Val Val Asp Pro Val Thr Gly Gln Ser Leu Val Pro Ile 4645 4650 4655Gly Gly Val Gly Glu Leu Phe Leu Glu Gly Pro Leu Val Gly Ala Gly 4660 4665 4670Tyr Leu Asp Asp Ala Glu Lys Thr Asn Ala Ala Phe Ile His Asp Pro 4675 4680 4685Pro Phe Leu Leu Arg Gly Asn Val Val Ala Gln Pro Gly Arg Arg Gly 4690 4695 4700Thr Leu Tyr Lys Thr Gly Asp Ile Val Arg Tyr Asn Ser Asp Gly Ser4705 4710 4715 4720Leu Thr Phe Val Trp Arg Lys Asp Thr Gln Val Lys Ile Asn Gly Gln 4725 4730 4735Arg Val Glu Leu Ala Glu Ile Glu Ser His Ile Ala Leu Tyr Thr Ala 4740 4745 4750Thr Arg Gln Val Ala Thr Leu Leu Pro Ser Thr Gly Leu Cys Ala Asn 4755 4760 4765Lys Leu Val Ala Met Ile Ser Leu Thr Asp Val Asn Tyr Asp Val Ser 4770 4775 4780Glu Asp Leu Ala Glu Asn Lys Ile Glu Leu Ala Ser Ser Glu His Asp4785 4790 4795 4800Gln Leu Ile Asn Glu His Ile Glu Ala Leu Gln Ser Leu Leu Arg Glu 4805 4810 4815Ser Leu Pro Gln Tyr Met Ile Pro Ser Leu Trp Val Val Leu Tyr Asn 4820 4825 4830Leu Pro Met Thr Ala Ser Gly Lys Gln Asp Asn Lys Ala Leu Lys Ser 4835 4840 4845Trp Leu Glu Asn Met Asp Glu Thr Leu Phe Ser Lys Ile Asn Asn Ala 4850 4855 4860Asn Gly Ser Asp Ile Ile Arg Lys Pro Asp Thr Glu Asp Glu Arg Val4865 4870 4875 4880Leu Ser Gln Lys Cys Ser Ile Val Leu Asn Met Pro Val Asp Lys Ile 4885 4890 4895Asn Leu Asp Lys Ser Phe Ile Ala Asn Gly Gly Asp Ser Ile Ser Ala 4900 4905 4910Met Arg Leu Ala Ser His Tyr Arg Thr Val Gly Ile Ser Ile Ser Val 4915 4920 4925Ser Thr Leu Leu Gln Ser Lys Thr Leu Ala Asp Phe Ala Ala Phe Ser 4930 4935 4940Gly Ala Thr Ala Ile Ser Gly Val Ser Gln Glu Glu His Thr Asp Val4945 4950 4955 4960Pro Phe Glu Leu Ser Pro Ile Gln Gln Trp Phe Phe Asp Gln Ser Pro 4965 4970 4975Phe Met Ser Gln Gln Lys His Asp Arg Phe Tyr Asn Gln Gly Phe Tyr 4980 4985 4990Val Arg Leu Arg Arg Thr Val Arg Ile Asn Asp Leu Glu Ser Ala Phe 4995 5000 5005Leu Ser Leu Val Asn Arg His Ala Met Leu Arg Ser Arg Phe Gln His 5010 5015 5020His Gly Gly Lys Trp Lys Gln Ile Ile Leu Ser His Ser Lys Arg Ala5025 5030 5035 5040Leu His Leu Asn Val Ser Gln His Leu Ser Met Ser Glu Ile Ala Ser 5045 5050 5055Leu Ala Gln Glu Arg His Arg Gln Ile Asp Ile Glu Lys Gly Pro Val 5060 5065 5070Phe Ser Val Asp Ile Cys Leu Leu Gly Gln Gln Gln His Leu Val Met 5075 5080 5085Ile Ala His His Leu Val Thr Asp Leu Val Ser Trp Arg Ile Ile Leu 5090 5095 5100Asp Asp Leu Glu Thr Ile Leu Asn Gly His Ser Leu Thr Ala Ala Leu5105 5110 5115 5120Pro Phe Gln Val Trp Ser Arg Leu Gln Ala Glu Arg Ala Val Ser Ser 5125 5130 5135Thr Leu Lys Pro His Asn Leu Leu Ser Thr Asp Gly Val His Asn Asn 5140 5145 5150Leu Lys Phe Trp Lys Tyr Thr His Asp Thr Pro Asn Cys Leu Ala Asp 5155 5160 5165His Arg Leu Arg Ser Val Thr Ile Asp Arg Glu Thr Thr Ala Val Leu 5170 5175 5180Leu Gly Glu Ala Asn Asn Ala Met Asn Thr Glu Pro Val Glu Ile Leu5185 5190 5195 5200Leu Ser Ala Val Trp Asp Ala Phe Phe Arg Thr Phe Ser Gln Arg Asn 5205 5210 5215Ser Leu Thr Ile Phe Asn Glu Gly His Gly Arg Glu Ala Trp Ser Asp 5220 5225 5230Glu Ile Asp Leu Ser Ser Thr Val Gly Trp Phe Thr Thr Leu Ser Pro 5235 5240 5245Ile Asn Ile Tyr Arg Asn Asn Ala Thr Ser Glu Thr Asp Met Val Arg 5250 5255 5260Leu Val Lys Asp Ala Arg Arg Ser Leu Pro Ala Asn Gly Trp Ser Tyr5265 5270 5275 5280Phe Thr Ser Arg Tyr Leu Asn Pro Asp Gly Gln Arg Ala Phe Glu Ser 5285 5290 5295His Asn Thr Val Ser Glu Val Val Phe Asn Tyr His Gly Gln Phe Gln 5300 5305 5310Gln Leu Glu Ser His Gln Ala Leu Phe Glu Asp Ile Asp Leu Val Gly 5315 5320 5325Val Arg Val Gln Gly Arg Ser Ile Ser Ala Gly Ser Leu Phe Asn Ile 5330 5335 5340Glu Val Ala Ile Glu Ala Met Gln Ala His Phe Glu Phe Ser Val Asn5345 5350 5355 5360Gln Asn Ile Ala His Gln Ser Leu Ile Asn Gln Trp Ile Asp Gln Ile 5365 5370 5375Gln Pro Ser Leu Glu Arg Ile Cys Leu Val Leu Leu Glu Ala Asn Pro 5380 5385 5390Thr His Thr Leu Cys Asp Phe Lys Phe Ile Ser Leu Asp Tyr Gln Arg 5395 5400 5405Leu Asp Asp Leu Thr Ser Arg Leu Leu Pro Glu Ile Glu Ser Ile Asn 5410 5415 5420Gln Ser Thr Val Glu Glu Ile Phe Ser Cys Ser Pro Ile Val Asp Gly5425 5430 5435 5440Met Leu Leu Ser Gln Ile Lys Gln Pro Glu Ser Tyr Lys Thr Leu Gln 5445 5450 5455Arg Tyr Glu Val Leu Ser Ser His Asp His Pro Ile Cys Leu Asp Thr 5460 5465 5470Leu Lys Ile Ala Trp Gln Arg Val Ile Ser Arg Gln Pro Ala Leu Arg 5475 5480 5485Thr Val Phe Ile Ala Gly Leu Asp Gly Ser Thr Ala Phe Tyr Gln Ala 5490 5495 5500Leu Leu Lys Gln Cys Ser Gly Asp Val Ile Val Val Glu Ala Lys Thr5505 5510 5515 5520Glu Glu Glu Ala Leu Lys Ala Phe Ser Ser Leu Pro Lys Val Asp Tyr 5525 5530 5535Gln Gln Ala Lys Pro Pro His Arg Leu Thr Leu Cys Gln Thr Pro Asp 5540 5545 5550Asp Lys Val Phe Cys Gln Ile Glu Met Ser His Ala Ile Thr Asp Gly 5555 5560 5565Ala Ser Ser Thr Ile Leu Ile Lys Asp Leu Ile Asp Ala Tyr Gly Asp 5570 5575 5580Arg Leu Ser Ser Thr Asp Leu Val Lys Thr Thr Arg Glu Phe Ala Ser5585 5590 5595 5600His Leu Leu Ala Lys Pro Gln Ser Gln Lys Ile Ser Tyr Trp Asn Thr 5605 5610 5615Lys Leu Lys Gly Leu Glu Pro Cys Arg Phe Pro Ser Leu Ser Ser Met 5620 5625 5630Ser Arg Glu Lys His Glu Cys Ser Ser Glu Ile Gly Val Phe Val Glu 5635 5640 5645Asp Lys Met Phe Ala Gln Ile Gln Asp Phe Cys Ser Ile Asn Gln Val 5650 5655 5660Thr Pro Ala Ser Leu Leu Lys Ser Ala Trp Ala Leu Thr Leu Ser Thr5665 5670 5675 5680Tyr Val Gln Asn Gln Ser Val Cys Phe Gly Tyr Leu Ala Ser Gly Arg 5685 5690 5695Asp Leu Pro Ile Ala Gly Met Asp Glu Ser Val Gly Ala Tyr Thr Asn 5700 5705 5710Ile Met Val Cys Arg Ala Asp Leu Asp Gly Gln Gln Pro Gly Val Ala 5715 5720 5725Leu Val Arg Gln Leu Gln Asn Gln Leu Met Gln Asp Leu Ser Phe Gln 5730 5735 5740His Ile Ser Leu Ala Ser Ile Gln His Glu Leu Gly Leu Ala Ser Asp5745 5750 5755 5760Gln Gln Leu Phe Asn Ser Ile Val Ser Phe Gln Arg Ser Gly Asp Asp 5765 5770 5775Asn Glu Gln Ser Ala Glu Glu Gly Lys Leu Arg Phe Lys Asn Ile Asp 5780 5785 5790Gly Leu Asp Pro Thr Glu Tyr Asp Ile Val Leu Gly Ile Asn Gln Gly 5795 5800 5805Thr Arg Ser Ile Glu Ile Asp Leu Glu Phe Ser His Ser Cys Leu Thr 5810 5815 5820Ser Asn Gln Ala Lys Arg Ile Leu Glu His Leu Gln Ser Asn Ile Ala5825 5830 5835 5840Ala Ile Leu His Asn Glu Pro Pro Ala Leu Ile Ser Pro Gln Asp Glu 5845 5850 5855Gln Asp Ile Trp Ser Trp Asn Ser Thr Val Pro Asp Met Val Asn Ile 5860 5865 5870Cys Val His Asp Leu Ile Ser Lys Ile Val Phe Arg Gln Pro Asp Ala 5875 5880 5885Pro Ala Val Cys Ser Trp Asp Gly Asp Phe Thr Tyr Ala Glu Leu Asp 5890 5895 5900Asn Leu Ala Thr Arg Leu Ala Asn Ser Leu Ser Lys Met Gly Ile Gly5905 5910 5915 5920Arg Gly Ser Ile Val Pro Leu Cys Phe Glu Lys Ser Lys Trp Thr Pro 5925 5930 5935Val Ala Met Leu Ala Val Met Lys Thr Gly Ala Ala Ser Val Thr Met 5940 5945 5950Asp Thr Ser Gln Pro Glu Glu Arg Leu Gln Ser Ile Val Ala Gln Val 5955 5960 5965Asp Ala Lys Leu Val Ile Ser Ser Thr Leu Lys Val Glu Leu Ala Ala 5970 5975 5980Arg Leu Thr Thr Ala Pro Val Leu Ala Ile Asp Lys Ala Ser Met Lys5985 5990 5995 6000Ala Met Ala Asp Asp Thr Pro Leu Ala Ala Val Asp Pro Ala Asn Ser 6005 6010 6015Ile Tyr Ile Val Phe Thr Ser Gly Ser Thr Gly Thr Pro Lys Gly Val 6020 6025 6030Ile Ile Thr His Thr Asn Tyr Ser Ser Ala Ile Lys His Gln Gln Ser 6035 6040 6045Glu His Gly Phe Lys Pro Thr Ser Arg Val Phe Asp Phe Ala Ser Tyr 6050 6055 6060Ala Phe Asp Val Ser Trp Ser Asn Phe Leu His Thr Leu Thr Ile Gly6065 6070 6075 6080Ala Cys Leu Cys Ile Pro Ser Asp His Asp Arg Lys Asn Asp Pro Ala 6085 6090 6095Gly Ala Ile Asp Arg Leu Arg Cys Thr His Val Asp Met Thr Pro Ser 6100 6105 6110Ala Ala Ser Val Leu Pro Ala Ser Thr Leu Ala Lys Leu Asp Thr Ile 6115 6120 6125Val Leu Gly Gly Glu Lys Leu Ser Leu Glu Tyr Ala Gln Arg Trp Ser 6130 6135 6140Ala Leu Thr Ser Val Arg Asn Pro Tyr Gly Pro Ser Glu Cys Thr Pro6145 6150 6155 6160Thr Ser Thr Ile Thr Glu Ile Asn Ser Ala Glu Ile Ser Lys Gly Lys 6165 6170 6175Val Ser Ile Gly Lys Gly Val Gly Leu Asn Thr Trp Ile Val Asp Pro 6180 6185 6190Ala Thr Ala Gln His Leu Met Pro Ile Gly Ile Pro Gly Glu Leu Leu 6195 6200 6205Leu Glu Gly Pro Leu Val Gly Ala Gly Tyr Leu Gly Asp Pro Val Lys 6210 6215 6220Thr Ala Ser Ala Phe Ile Glu Asp Pro Glu Phe Leu Val Lys Gly Ala6225 6230 6235 6240Ser Pro Gly Ile Pro Gly Arg Arg Gly Arg Leu Tyr Arg Thr Gly Asp 6245 6250 6255Leu Val Thr Tyr Asn Thr Asp Gly Ser Leu Ser Phe Val Gly Arg Arg 6260 6265 6270Asp Ser Gln Ile Lys Ile Asn Gly Gln Arg Val Glu Leu Gly Asp Ile 6275 6280 6285Glu Ser His Val Ser Ala Asn Leu Val Ser His Gly Ser Ala Gln Val 6290 6295 6300Ala Val Glu Val Val Ser Pro Gln Ala Ser Ser Asn Asn Ile Leu Val6305 6310 6315 6320Ala Phe Val Ser Phe Asp Asp Leu Asn Ser Ile Asn Leu Asn Asp Glu 6325 6330 6335Lys Leu Leu Ala Arg Thr Lys Ala Ala Thr Glu Gly Ile Arg Glu Lys 6340 6345 6350Leu Ala Thr Gln Ile Pro Ser Tyr Met Ile Pro Ser Val Tyr Ile Pro 6355 6360 6365Val Thr Val Phe Pro Thr Thr Ala Thr Gly Lys Thr Asp Arg Arg Arg 6370 6375 6380Leu Arg Glu Met Ala Ser Ser Leu Thr Leu Glu Gln Leu Thr Ser Ile6385 6390 6395 6400Asn Gln Ala Gln Gln Gln Tyr Gln Pro Pro Thr Thr Pro Leu Glu Val 6405 6410 6415Ala Leu Arg Glu Leu Trp Ile Ser Val Leu Lys Leu Gly Ser Arg Lys 6420 6425 6430Ile Ser Thr Thr Asn Asn Phe Phe Glu Leu Gly Gly Asp Ser Ile Gly 6435 6440 6445Ala Ile Arg Leu Val Gly Ala Ala Arg Asp His Gly Leu Ser Leu Ser 6450 6455 6460Val Val Asp Ile Phe Lys His Pro Lys Phe Ser Glu Met Ala Ala Leu6465 6470 6475 6480Leu Arg Ser Val Asp Lys Pro Gln Leu Glu Glu Pro Arg Val Phe Gln 6485 6490 6495Pro Thr Ser Leu Leu Ser Lys Asp His Asn Lys Asp Gln Ile Leu Ser 6500 6505 6510Arg Leu Phe Asp Phe Gly Ile Asp Leu Glu Asn Val Glu Asp Ile Leu 6515 6520 6525Pro Val Thr Asp His Gln Ala Arg Ser Ile Ala Met Thr His Ser Ala 6530 6535 6540Ser Arg Asp Leu Leu Leu Tyr Pro Thr Leu Asp Ser Lys Gly Val Pro6545 6550 6555 6560Asn Met Arg Lys Met Arg Ala Val Cys Asn Glu Leu Val Asn Arg Tyr 6565 6570 6575Asp Leu Met Arg Thr Leu Phe Ile Ala His Lys Asp Ser Phe Leu Gln 6580 6585 6590Val Val Leu Lys Ala Phe Pro Val Asp Ile Thr Val Leu Arg Ile Glu 6595 6600 6605Asn Ala Ser Leu Glu Glu Cys Thr Glu Glu Leu Arg Leu Arg Asp Arg 6610 6615 6620Asp Asp Glu Leu Arg Tyr Gly Ser Leu Leu Thr Lys Ile Ala Ile Leu6625 6630 6635 6640His Gln Ile Arg Asp Asn Glu Tyr Arg Leu Val Val Arg Ile Ser His 6645 6650 6655Ala Gln His Asp Gly Met Ser Leu Met Lys Met Trp Asn Ala Phe Glu 6660 6665 6670Glu Met Tyr Gly Asp Gly Ser Asp Asp Ser Phe His Ile Pro Ser Asp 6675 6680 6685Thr Ser Phe Gln Glu Lys Ser Lys Ala Ser Phe Ser Asn Tyr Met His 6690 6695 6700Ala Val Ala Gly Thr Asn Arg Glu Gln Ala Lys Ser His Trp Arg Arg6705 6710 6715 6720Leu Leu Lys Gly Ser Ser Met Thr Asn Leu Lys Pro His Ala Ser Tyr 6725 6730 6735Ala Leu Thr Phe Gly Glu Gly Pro Cys Val Ala Arg His Val Pro Lys 6740 6745 6750Ser Ile Ala Gln Gly Thr Gly Phe Thr Phe His Thr Val Leu Lys Ala 6755 6760 6765Ala Trp Ala Tyr Val Leu Ala Lys His Leu Ala Asn Asp Asp Val Val 6770 6775 6780Phe Cys Ser Leu Thr His Gly Arg Gly Leu Pro Gly Thr Gln Asp Val6785 6790 6795 6800Phe Gly Asp Cys Val Asn Ile Ile Pro Thr Arg Val Ser Phe Thr Asp 6805 6810 6815Gly Trp Thr Val Arg Asp Leu Leu Ser Ala Leu Asn Ala Gln Gln Ile 6820 6825 6830Ala Ser Met Glu His Glu Asn Ile Gly Thr Arg Glu Ile Val Arg Asp 6835 6840 6845Cys Thr Thr Trp Pro Lys Trp Thr Tyr Ala Gly Ser Ile Val Tyr His 6850 6855 6860His Asp Phe Asp Asp Gly Glu His Ile Ala His Asn Arg Ser Met His6865 6870 6875 6880Val Glu Gln Glu Leu Asn Leu Ser His Gly Lys Val Asp Met Thr Asp 6885 6890 6895Val His Ile Thr Ser Lys Pro Asp Asn Asn Met Phe Arg Ile Glu Leu 6900 6905 6910Asp Phe Ala His Gly Val Val Ser Glu Arg Asp Ala Glu Leu Leu Ala 6915 6920 6925Ala Lys Leu Thr Glu Ser Ile Ile Val Phe Cys Asn Val Met Asp Gln 6930 6935 6940Pro Leu Leu Ser Pro Asp Glu Ile Arg Tyr Leu Arg Thr Thr Thr Leu6945 6950 6955 6960Leu Pro Ser Glu Glu Pro Leu Ser Ala Thr Pro Thr Asn Glu Gln Leu 6965 6970 6975Met Val Ala Ser Ile Ser Pro Thr Glu Met Gln Trp Ala Leu Glu Ser 6980 6985 6990Ala Trp Lys Asp Thr Phe Asn Cys Pro Leu Ser Pro Glu Val Lys Ala 6995 7000 7005Gly Lys Thr Ile Phe Asp Leu Gly Gly Asp Leu Ile Ser Ala Ser Leu 7010 7015 7020Ile Ser Ala His Met Glu Arg Gln Gly Tyr Val Leu Ser Val Glu Asp7025 7030 7035 7040Val Leu Gly Asn Pro Thr Trp Phe Ser Gln Leu Thr Leu Leu Thr Lys 7045 7050 7055Arg Thr Leu Arg Asp Val Asp Val 7060 7064<210> 4<211> 23114<212> DNA<213> Aspergillus niger<400> 4aaacccatat ataaagataa tatatattaa taaaataata gtaaataacc taacaaacct 60caccctaacc ggctaattat atgatacttt tatttgatta tcaataattt ttaataacct 120tactactagc ttatataaac cataaatatc tttaatatta gcctcatcac gcacgccctc 180gggcccctat gtaccgcgta agtttgacat ttgagattga attatatata tctctgccaa 240tactcagaac aatcttccta tactttacta gtagattaga aatactatct atactatatg 300cactcaatat catatcctga atggatatgg ttgttgaagt atgaaaatgt aatttatcgc 360atttagtatg atgttttagg gtgaccgaga cggccgggaa tgttacgtta gagccgggta 420tatatgacta agcgctagat gataactagt atcttacgtc ggtagaacgt accaatagca 480atatctttag catgtccatc ttattccgta acatactact ctgacactgc cgcctgttgc 540gctgctacca aggacggcag cagttttcta ataggggcag ttgtcacggc agtagcctat 600agttaactag agccggggtt atatgactaa gcactagtgc agttcccacg ggtccactgg 660tcattcaagc ttgtggattc ggctcggcgc ggcccccaac catagttgga gacagcccta 720aatgtgatgg gaatgatcta cggcttgagc gagagcgatc ctggggtctt gggggctatg 780gagtaagctc aattgcttct ccaaatagta atcaatacgc gcaaccctcg aatttgaaat 840ttcttcgatt tttcagcctt ccaactacct caatgcctca tttccggttt tcattgatct 900tccaaaaatt aaatttatcc taaacccatc caagactctg ataagatttc ctacgtttgc 960tttagagatg atcatcattg taatattcat tagaagcctc ataatcacgt tacgtaccca 1020ctgcacattg cctgatgtgc cacggagaac cagggatcct aagcctccac tcttgtatct 1080gtttgtctca ctcgtaaggc aaccacctgt cggatgcaaa tctaggcttc cgctgaggta 1140gtatcggatt gttgcaagat ccacagtgga gccaaaaaga acacgaaaag cacaaagaaa 1200gggctttgaa agttcatatg ctttgttgtt ttttgcgttt ttagtcttca aatcttcctt 1260gagatgtttc agacatctat gtataatgag atgacggaga gcaactttgg agatatttcg 1320tcagaaacga cgcctcgcac tgacgagcgg ttttagagac aatgaccctg cagatcaggg 1380tcattgtctc taatggattt ggccccttag cacatgtttg ctggggaaaa cttgctttgg 1440cgctgtagga ttcagatgca acagtatact gcatatttgc ttatgtgctt tccgactaag 1500cccaagatga cgacctcgga aattcattgc ccgtcggggg agtctggcct taatggcgtt 1560ttactagcat agttacagtg ttggtactat agctggcaca tcttcatata ttctgctgat 1620gccccgtcca aacatcttaa aatgagaaga gtccacagaa taccatcaat tgcttcataa 1680caatacactc atcaatccct caaacgatca ataaatctta tcaaaatgcg atctcccaat 1740gatcttacaa catcagcaac catggaagat attcatcaaa tatggtcttg gaacgctaac 1800gtgcctgagg cgggtgagac atgcgttcac accctcatca ccgacaaagc tctccagcag 1860ccagatgcac ttgccgtcga cgcttgggac gggaggtgga cgtatggtga gcttgagact 1920acttctacca aactggcatt gcgtttgctt gaccttggag ttggccctgg aaccaatgtt 1980gtcatatgtt ttgaaaagtc gaagtatacg cctctggcta tgctggccgt catgaaggcg 2040ggtggagcct ccattgcgct cgatacaagc caaccacaga cacggttaca gtctatcatc 2100aaccaggtcg accctgtagt gatactatgc tccgcgtcca agagtcagtt ggccaagtca 2160atcatcaccg agtctgcagt agcattgaca attgatgaaa attctctatc cgaaatgaat 2220ttcgagccgg actcagtcgc ccgtctccct gacgtcagtc tggacaacaa tctctacgtg 2280gtctttacct ccggaagtac aggaactccc aagggcgtcg tcgtcacaca tctcaattac 2340tccactgcca ttctccacca acaagaagcg catggcttca agtctacttc aagagtgtat 2400gactttgctt cgtatgcttt tgatgtgagt tggtcaaatc tcatccacac cctcaccatc 2460ggcgcctgtc tgtgtattcc atcagagcag gaccgtaagg acaatctcat cgagtccata 2520cgctcactgt gtgctacaca tatcgatgtg accccgtctg ttgctcgcct tatccctgat 2580tccttgctct gcaagattga aacacttgtt ttaggtggcg aaaagctgcc tgcagagctt 2640gccagacatt tgtcatcgct ggtaacattg aaaaatccgt atggaccgag tgaatgtacg 2700cctacatcaa ctatcgctac aattcgaccg gatgatgatg attcaaaaat tagcagcatt 2760ggccgaggct tgggtgtcaa cacctgggtt gtagacagtg agaatgaaga aattttggtg 2820cctattggac aggttggaga gctattactt gaagggcatc tgcttggcaa tggctacttg 2880aacgaccaga cgaagaccac tgcggccttt gtcaacaatc cgctttttct gctcaatggc 2940ggcgatggac ctgggcagcc tgggaggcgc gggcgtctct acaagaccgg cgacctggtc 3000cgttacgaga aagacggtag cttgaccatt attggccgta aggacacgca gtcaagatta 3060cggccacgag ttgagctggg tgatattgag catcatattt accgccacat cccacatggc 3120accgtgtctg tgcgacaaat tgcagcagaa attatttcac caaagactgg ttccaatgct 3180gtcctggcag catttctcga ggtcgacctt ggtgtagagg atacgggaat agcggaacag 3240ttgttttcaa aaaccgagaa gatgatgtct aacttgagaa gcaatcttgc tcgagatgtc 3300ccttcatata tggttcctgc tgtattcatt ccgttgagga acttcccatt gtctccgaca 3360ggcaagacag accgacgcca actgcgggcc attggtgaat caatggactt gactgtcttg 3420gcaggctttg gcgcagcacc taatgaggct cggatccctc tcactctgcg agagaaacag 3480ttgagaagac tctggggctc tatcctcagg attgacgaaa accttattgc tctcgacgat 3540aactttttgc aaagagccgg caacccaaat gcagccatga aactcgtcac tgcagctcga 3600agagaaggct tctccctgag cgtggccaac gtgctgaagt atccgcgact tcaggacatg 3660gcacaggtgg ttggaacagt ggagcaagag caggcacatg aaattatgcc atttgagctt 3720ctgagcgatg atattaatct tgatctagcc ctcagagagg ctgcagcatc gtgcaacgta 3780caagggaatc aaattcaaga catttatccc tgcacaccgc tacaggaagg catgatgtcc 3840ctatccgcaa aacgcgaggg tgattacatc atgcagtata cgctggagct acaccatcga 3900tgcgacatag agcgcctagg taaagcctgg gcgacagtag ttgctacgac gcccattttg 3960agaacacgaa ttgtcgacat cactagccag gggttggtac aggctgttct agacgagcag 4020tggtcaagtt cgtcgatcca aaggaggacc ttgagccagg cgagagacca caagcatcaa 4080ttcgggctag gcatgccatt aggcagattt gaaattgtca ccggcgactc gtctgatttt 4140aagcactact tcgtctggac actgcaccat gccctgtatg acgggtggtc acttcagctt 4200ttactcgaaa agctcgagaa cgagtacgcc ggaaaggcag acgcgcagtc aaactcaccc 4260gattttaaac gttttatcaa gtatatttca acgagggatg gcgagaagac tcattcgttc 4320tggaccgaac agttccaaga cgtcgaagcc cagatctttc cgagtttgcc atctgtcgac 4380taccagccta gatcggacaa actgtacact cattctgtgg gaggaataca atggccaaaa 4440aatggaatca ccccatcgac gacaattcgt gcggcttact ctatcttgat atccagtctg 4500accaacagcc cagatgttgt cttcggcagc ataacgacgg gcagacaagc cgccgtggat 4560gaggttgaag agcttattgc accaactata gccactgtac ctgtgcgcgt ttcgatcgac 4620agcaaagacg agttgggaca gttcttacag cgaattcaat ctcaggccgc agatatgatt 4680gagtttgagc agactgggct gcatcagatt cgacatatca atgcagatgc ggagcgagca 4740tgccagtttc agacactgct tgttgttcag cccgcggagg gctcgggcac agcaccgagc 4800gacattttta ccaacattcc cgacgacata aggaaaggag atggaaacag cgccgcagag 4860ctggggactt atgccttgac tatggagtgt ctgctcaaga aagatggcct tgacctccat 4920atgaactatt gttccgcagt catatcggag catcaagtgc gccgtttgtc acagcagttt 4980gagcatgtcc ttggtcaaat atgtcatctg acgatgataa ttcacagaca gagaacaaca 5040cttgaatcgc tgcggcagcc aacaacggaa actgagcggc agatgcagcg aatctgggca 5100caggtactca accttaatca agcatcaatt gggctagatt acagcttttt ccaactcggc 5160ggcgactcta ttgctgccat ggaagttgtg acagaagctc gtaagcttgg cttgaaactg 5220gctgtgtcag acatattccg tcgcccgaaa ttgcaagacg ttgcaaagaa ggcttgtgac 5280agtggcctgc agctttatgg agaagagcag ctcatgaacg actcagaagt ccaagttaaa 5340ggaggtaccg agcacactaa gctacccaat gatgacaagg cagttgctgg ccatgaaacg 5400cagcaagtca tggtatggga gggaatgttc gataaggagg tctatggaac tattaatgat 5460gtccaattgg agaagattgg gcgcgacttc atcggatgga cgtccatgta caatggcaac 5520caaatagaca atgtcgaatt gaacgagtgg ctagacgata ctattgccac aatacgcagc 5580agcggatcga cagccaacat actcgagctg gggtccggca gtggaatgat cttgttcaat 5640cttgtcaacg gcctgcacag ttatgttgga cttgacccgt cagaaaaggc cgtggacttc 5700gtttgttcca cagttaaatc cattccccag ttggccgacc gtgtctataa tataaaggga 5760acagcagaca acatcaacag cctaggcgta cccatctctg ctaacatggt catcgtgaac 5820tctgtcgtcc agtactttcc cagtcaagac tatctgctca aagtaattga ggacctagtt 5880cagctggaaa cagtccgcac gatctttttc ggcgacattc gctcctacgc gctgtttcga 5940gagttccagg ttaccagggc gctgcatatt gcaggagata ctgcaaccga ggacgagatc 6000cgacagatga tggccaacat ggagcaagtc gagctggagt tgctggtaga tcccgctttt 6060ttcacatcct tagtcgaccg gttccctgga ctcgtcgaac atgtggagat tcttccaaaa 6120agattgaagt cgacgaatga gctgagtgcc tatcgatacg ctgccgtcgt gcatctcaaa 6180gactcaaacc aactagctca gccattacaa gtccacgata tccagaaaga gagctggatt 6240aactattccg ggcgtcaact caatcgtcag tcgctgttac aacttgtaca ggattctttc 6300ttacgagacc cgtccccctc atcagttgtg gccgtatgca atatacctta tagcatgaca 6360gtctacgaga ggcacgtgat tgaatggctt gatagtggcc tcactgccgg tcccgatgct 6420gaggactggc tctcttctat ccgccaaaca tcacaagaat gctcatcact ctcggctctc 6480gatttgcaac aaatagctca ccagacagga tggcaagtgg agattagctg gagtcggcaa 6540ttttctcagc gcggtggctt ggatgccata ttccaccgac accattcacg aggagaccga 6600accagcaggg ctttgttcaa cttccccaca gattatcaag gacggccatt tcaatcgttg 6660agcaaatggc ctttgcagcg caagcgacag ggagaggaaa agcaaataac tttgggagat 6720gtttctaccg tctgcaaaga ggacttgcat gacatctgga cttggaatga agttgtccca 6780gacgccctcg aggcctgtgt ccacgatctc atctcggaca cagtaagagc tcagcctcaa 6840tcccctgcta tttgtgcttg ggatggtgag tggagttaca tcgagcttga tgatttgtct 6900agccgtcttg cacacgcgct tgctccgttt ggcgttgcca acacagttgt acctatatgc 6960tttgaaaagt caaaatggac accagtggca acgctggctg tgatgaaggc cggggcagcg 7020tcagtcaccc tcgatgcctc tcagcctctg gagagattac ggtcgattat ctcccagact 7080gaccctcgag tgatcttgtc atcggcgtct aagcagggct tgggtgccca actcactaaa 7140gctccaaacc ttgttgttga ccaacattcc atttctacta tgcacatcac cgccgagcct 7200cttcccaccg ttgacccctc cagcaagcta tatattgttt tcacatctgg caccacgggt 7260gttcctaagg gcgttattat cacacactct aactttagca gtgccatccg acaccaacaa 7320aaagctcatg gtttcaaatc gacatctcgg atttatgact ttgcctcata cgcgtttgac 7380gttagctggt ctaacttcat acatgcactt actgttggtg cctgcttgtg tattccgtca 7440gatgaggacc gccgtgatga cttggccggg tcgttggaga ggttcggcgc tacccatgtt 7500gacatgacgc cttccgcagc aagcttgctc ccagagaagt cattcaaaag gcttgagacg 7560gttgtactcg gaggcgagaa gctttctgtc gagagcgcac agcgctggag ctcactagtc 7620agcctcaaga acccatacgg tcccagtgaa tgcacgccca cggctaccat tgcgacggta 7680acacccaccg atgagtacaa atccagtatt ggaagaggac taggtctgaa tacatggatt 7740gtaaatactg ttacagactc tttagttcca gtcggcgggg tcggagagct cctgctcgag 7800gggcctctcg ttggcgcagg gtacctcggc gatgacacga agacggccgc ttcctttgtg 7860gaagatcctc agttcctatt gcaaatatgc cctcaaggtc aagcaagaca taccagaatg 7920tataagactg gcgatctggt tcattacaac ccggacggaa gtcttagttt cgttgggcgc 7980aaggacgctc aggtcaagat tcatggtcag cgtgtcgagt tgaccgagat tgagagccat 8040attcgtcgca cctctaagac tatccaggtg gctgttttgt ttaccaagtc agggctgtgt 8100gcaaataggg tagttgcatt tgtctgcatc cagggaactg gccaaactca gacagccgcc 8160gatcaaattc gactcatcga tcccaagtat tcgacccttg ttacggctta caccgagtcc 8220gcaaagtcta gtctcagcga cactcttcct gcttatatga tcccctcaat ttggattcca 8280ctccagcatg ttccgttgtc aacgtccgga aagctcgatt acaaagcttt gaaatcatgg 8340cttgatagca tggatgccaa gacgtttgcc aatattttaa ctgcgtctga tggcgacgtg 8400aagcttcgca aggctgagac agaattggaa caggtcatag tagaggcttg cgctaaaatt 8460ctcaacatta cagcatcgaa ggtgaacctg gatcggtcgt tcattgcgaa tggtggtgat 8520tccatctccg ccatgaggct cgttgctcat tgtcgcgcgg acaacgtcgt attttcggtg 8580gctaaattgc taaagagcaa aactttggcc gctttggcct catcttcaaa aatcaagtca 8640gcttccaacg tgttgggctt ctatgaggaa aaaagtgact cttttgcgtt gtcgccgatc 8700caacagtggt tctttgaaca aggtctctac aagagatcca atgacaactt cgacaatcaa 8760ggattttatc tcaaggttaa gcgcccatta ttgacaaagg atattgactc ggcgatttcc 8820aaagttgttc agcatcactc tatgttgaga gctcgctttc atcggaacgg cgacgagtgg 8880acccaaaaaa cgcttaagcc tgacaccaat ggtttatatc actttggtgt ccaccacacg 8940tgccttccag ctgatataga gcgactagct ctatcacgcc accagatgat cgacatcgaa 9000aaggggccag tattctctgc tgacatttgc cataatgcgt ttggagaaca gtacctgatc 9060ctgattgctc accatcttgt tgttgattta gtctcgtggc gtgtcatcct ggaggacata 9120gaatctctac tcggtggtag taatttgcaa ccaagtcttc catttcaagt ctggaatgat 9180atgcaaattg agcgggcgaa ggaatcgagc ctacttgatc ctgaaaatgt tctatcaacc 9240actggaatta ataacaacct tgatttctgg caagccacag cagaaaccaa gaacaccgtc 9300gaagatcacc taaatttctg taccaagatc gacagcagca aacagagctc atcctcaaag 9360acgcaaatta cccgttcaac acttgaacct gtggacctcc ttcttgcggc tgtttggcat 9420gcattcttca agacgttccc ccaaagagac ggtctcacta tttttattga aggacatggt 9480cgcgagccgt ggtcctcgga tattgatctt tcccgcactg tcggttggtt tactaccatc 9540agccccattc atgtgtcaaa gagcgacgta cacaagtctg tcgcaagtct agtacgcgtt 9600gtcaaagatg ctcggcggct cctgcctgca aatggctggg cttactttgc ttctcgatat 9660ttcaatgaat cgggaaaatc agcgttcaaa tcgcacgact ctattatgga aataaccttt 9720aactatcacg gccaatttca acagctggag aacgagaagg cgatgtttga aaatgttacg 9780ctcagtggag tctgcgagca aggaccagct cttcccgcct cttccttgat tgctgtcgaa 9840gtctcgatag atcgagggca ggtcaccttc gacgtttctg ccaaccgcta cattaatcac 9900caggattgta tttcaaattg gatcaaagca atttcacagt cattggagac catttccaat 9960gagcttgtgt ctacagaaat ctcacatcgc acgctttgcg actacgaatt tctgagcctc 10020gggtatacgg agctggatcg attacaggaa agtgtcatcc cagaaattga gaagctaaat 10080aattccacag tagaatgcat ttaccgctgt cttcccacag ttgatggtat tctgatcagc 10140cagttcaaag acccagaatc gtataaaaca gtgcaacatt tcgagattac ttcccacatc 10200gacgaccaaa tcgacctaga gcatctttct ctagcatggc aaaaagtggt tgccaatcaa 10260cctgctctac gaaccgtctt tatccctggc atggacaaag ccgctgcatt caatcaagtt 10320gtgctgtctc agtaccacgc cgagctcatc atcctgcata ctgccagcga cgagtacacc 10380gaagccttgg agatgttcaa gaatctaatc ccaatcaatt atcagagctt caagccacct 10440catagagccg cgatctgtcg aatctcacct agtagagtac tctgccaggt tgagatgagt 10500catgccatca cagacggtgc atcgacatct attttggcca atgatcttct ccaggcatac 10560aacggcaact cgatgccaat aaatctcatg gacacagcat gtgagtttgc tcgggcccaa 10620ctcacttcct cttttgggga aaaactgtca tactggaaga aaaagcttcg ggaaatggat 10680ccctgccact tccccaaaat ctcgggtgct tcaacacaag gcaccggtac atccgtctgc 10740aaaattcgtg gcgctctgtt tagcaaaatc caggattatt gcaattcagt agaagtcacg 10800acggccagtt tatttcagac catatgggca cttactctgg ccgcctatac cggcaacgac 10860tcgacatgct ttgggtatct agcatctggc cgcgacttgc ctattgctgg catcgataaa 10920tctatcggtg cattcacaaa catgttggtt tgtcgagtca atattaaccg agaaactgaa 10980atacttcaat ttgttcagac tgttcatgat caagttatgc aagatctgga gcaccagcac 11040tgctcactag caagcatcca gcatgaacta ggcataaatt ccgataaccc tcttttcaac 11100tccatcctat catatcagaa gcaggacgat gagccggcag gagacgaggg tttggtcatc 11160aaggccttgg acggacagga tcccacagag gtacgttgta tcgcatgtca aagttcttta 11220cggaatctga caaatcctag tacgacattg tgttgaatat tgggcacgct accgaccaca 11280tcgaaattgt ttttgactat aaacacgcct gcctttcaag catccaggca gagagcgtac 11340tttcactcat gcaatctaca gctgccgctc tagttcagca tgcttcggga gatcatcaga 11400ctttaagaag cgtcaacatg gttagcactg aagatatatc tgacatatgg caatggaact 11460cagacgttcc agtcactgtc gacgattgtg tgcatcatat cattacgcga acttgtcata 11520aacgccccca agctccggca atctgtgcat gggatggcga ttggacctat gctgaagtca 11580ataagctgtc agataaactt gcccaccttc tagtctccta tggtgttggc cctggagtgg 11640ttgtcccgct ttgcttcgaa aagtcaaagt ggacacccat agcaatgatg gctgtcatga 11700aggcaggagg cgcatctgtt gccatggact caacccaacc agaggaacgc ctacgagcaa 11760tcgtaaacca agtgaagtca cctattatct tgtcatcatt tgccaacgaa cagcttgcaa 11820gccgactaat cagcgagctt ccagcccacc aaggtcctca caataagcga caaagaagtg 11880gaaaatttga atgttccgag tggaagccac ttcctcatgt caaccccagt gatactctct 11940atgtggtatt cacatccggt agtacagggg tgccaaaggg agtggcagtt actcactcca 12000acattgccag tgcgatcaaa caccagcgac acttgcttgg attcacttct gaatctaggg 12060tattcgactt ttcttcctat atgtttgatg ttgtctggtg caacttacta cagggtcttt 12120ctgctggaag ctgcgtttgc atcccgagcg acaatgaaag gaagactgac tttatggccg 12180ctattgttaa gatgagggca aaccttgtca tattgacacc ttctgctatc cgcggcctga 12240agcttgacgc tctgaacagc ctatgcaacg tccacttcat cggcgaacct ttacatgttg 12300acacttttag atcagttgac gaaagtgtca cgatatccaa cctatatggc cccactgaat 12360gtacaacatt cagcacagta caaaccatct gcggcagaca gcatcagtca atcacaattg 12420gcaagggagc gggtctgaat acctgggtcg cggacatagc cactggtacg gctcttgtac 12480caattggcag tgcgggagag cttctacttg aaggcccatt agtcgccgcc ggctaccggg 12540gtgatgctgt caaaaccgct gccgcattcg tatatgaccc gccatttctt ctgcgtggat 12600cggtgggcca ccctggtaga cgtggccgcc tatacaaaac cggagatatt gttcggtata 12660actccaacgg tactttgact ttccttggcc gaaaggattc gcaagtcaag atcaacggac 12720agcgagttga gttcggtgat attgagtctc acataaacgg ggcgctgcta ccggacttca 12780gtgaaggtca agctttagtc gactttgtaa cacctcaagg aagctcacgt ccaatgcttg 12840tagcttttgt ttacttcgga cctactgtca ctgagggcat ggatgaggcc gatctgctaa 12900gcctagccaa gcgcacagcc atatcgctgg atgagagtct tgctgctcga atccctgcat 12960tcatgatacc atctgcttat attccattgc agaaaattcc tgtcacagcg acaggcaaga 13020cagaccgccg tcgtttacgc gagatggcca aagatgttac ctgggaccag ctcattaaag 13080ctgactccca cggtcctgat cgttgtcaac ctggcacaga gatggagata cagctgcaga 13140tcctatgggg gactgtgcta ggagttgaaa gtagtttgat cggtgcacat gacaacttca 13200tgcgcgtcgg tggtgattcc gtgggcgcaa tacgcttagc gagttctgcc cgggaacttg 13260gtttcacgct gaacgtggct gatattctca agaacccgaa actaagtgat atggcaaaac 13320ttatgatacg aacagagccg tcgcaggata tttcaatcaa ggaattctct ctcctcaaac 13380ctggctctga tgtcaactgg gctgttgcag agacatccgc tttatgtggc gtggacggta 13440accaagttga agatttatat ccttgcacac ccctgcaaga gggcttgctg gcgctgacaa 13500caaagcgccc cggcgactat atcatccggt gcattttgga actgaagaga tcaacagacg 13560tcaaaaagtt ctgcgcctct tgggaggcgg tgttggagag caccccaata ctacgaactc 13620ggatcgtaga catcgcggaa caaggtttgg tgcaagctgt catcaagcaa ccagcacagt 13680ggacatcggc agaagcctcc agtttggtcg acttcgtggc tgctgataat gagaagacaa 13740ctggtctggg tatgcccttg gtgcgattcg gactagtaca agagacgaac aaacactttt 13800ttgttttgac tctgcatcat gcagtatatg atggctgggc gctgaatctg gtcttcgaaa 13860agctcgaaaa tttttatgct gggtcttcca ggcatgaaag cccggatttc agacacttcg 13920tcaagcacat ttcaagtctc gacaacgacg cggctgccaa gttttggaaa gaccaactcc 13980aaggctcaga ggcacccact tttccctcct taccaactgc cacgttcgtg cccaagtctg 14040aaaagaccat tttgcacaca gttgaagagt tgcagtggcc caagactaat gtcactgctt 14100ttacgttggt gcgtgcggca ctgtcacttt taacggcggc ctacaccaat tcagaagacg 14160tttgctttgg cgtgacttcc aacggtcggc aggttgggct ccctggagta gaaagaatga 14220taggcccgac tattgcgaca gtgccagttc gtgttcgcat tgaccgcgag cagcgtctcc 14280aagccttcct cacacagatg cagcatcagt ccattgacat gatagcgttt gaacaatttg 14340gtctgcagca aatacggaag tcaagtcctg acgccgaacg ggcctgtaac ttccagtcac 14400ttctcattgt ccagccggca gaagagacag cccagtggca gagcgatata attgcccgtg 14460atatcggaga aggagctgat gatcctatgg gcattcaaga aattggaaca tatgccctta 14520ctctcgaatg ccatctcgga cccgacagtt tgctcataaa ggccaacttt gattccaatg 14580taatcgatga actacaggtc aagcgattta caaagcagtt tgagcacgtg cttcgtcaaa 14640tatgctgctc tggtagtggc cttgtcgttt ctgatattga taccaccagc agacaagaca 14700tggaagatat ttggaagtgg aatgccgtag tcccccagtc agtcaacacg cctgttcatg 14760agctcatctc ctctgtggca cgcagactgc cgcatgtcca agctgtatgc gcatgggacg 14820gcaactggac ttaccgtcaa ctggatgacc tgtcaaatta tgttgcgcac cacctcgtcg 14880accttggtgt tggctctcag gacatcgtac cgctgttgtt cgagaagtcc aagtggatgc 14940cgatcgcgat gcttggtgtc atgaaagcag gggctgcgtc ggtggctgtc gataccagtc 15000agcccaaaga ccgacttcgc atgattatcg accaggcaaa tcccacggtc gcgctaagct 15060cagctgataa gttgcctctt gtccggagtc tgacaaaggc gcaaagcttc gttgtcagtg 15120gccaaggtat tgaccgctta ttaaaaccta gccttaatgc tacacttcca gttgtcgatc 15180cgtccagcag actgtatttg gtcttcacct ctggtagtac gggtgtcccg aagggtgtta 15240taattcgaca ttgcaatttt gccagtgcaa ttaaacacca gaaagaagtt caaggcatcc 15300ttccaacctc gcgtgtctat gattttgctt catatgcatt tgacgtcgca tgggccaatg 15360cgctactgac ctttgagagc ggcgcttgtc tctgtatccc atccgatgct gacagaaaga 15420atgatctaaa cggttcgatt gcgcgactga agccaactca cgctgatctt acgccttcgg 15480cagcactggt cctgtccaaa gagtcacttc agcagcttga taccctcact ttaggtggcg 15540aacgtctcct agcggagtac gcaacaaagt ggtcccagtt tgtgacagtt aaaaactcat 15600acggaccaag cgagtgcact ccaactgcca catttaccga ggcaattggg cgtggatacg 15660atcttggtgc tagcattggt aagcctgctg gtctcaacac ttgggtggtt gatcctgtga 15720cggggcagtc gctcgttccc attggaggcg tcggcgagct gttcttggag gggccgcttg 15780tcggtgctgg ctatcttgat gatgcagaga aaacgaatgc tgcttttatc catgatccac 15840catttttgct ccgcggcaac gttgtcgcgc aacctggacg acgcggcacg ctgtacaaga 15900cgggtgacat tgtgcgatac aactcagatg gcagtctcac ttttgtttgg cggaaagata 15960cacaagtcaa gatcaatggc cagagagtag agcttgctga gattgagagt catatagctc 16020tatacacagc gacccgacaa gtggcgaccc tattgcctag cactggcctc tgtgcaaaca 16080agctggtagc tatgatcagc ctcacagatg tgaactatga tgttagcgag gacctcgccg 16140aaaacaagat tgagctggca tcttcggaac atgaccaact catcaatgag cacatcgagg 16200cccttcaatc gttattgcgc gagtctttgc cgcagtacat gattccatct ctgtgggtgg 16260tcttgtacaa cctccctatg acagcatcgg gaaagcaaga caataaggca ctcaaatcct 16320ggctggaaaa tatggatgaa acgctctttt ctaaaatcaa caatgcgaac ggtagcgaca 16380ttatccgaaa accagacaca gaagacgaaa gagtcctcag ccagaaatgc agtattgtcc 16440ttaatatgcc cgtcgacaag atcaatctcg acaaatcttt tattgcgaat ggtggagatt 16500ccatttccgc catgaggctt gcatcccact acagaactgt gggaatttcc atctcagtct 16560caacactcct tcaaagtaaa accctcgcgg atttcgcagc attttcgggc gcaacagcca 16620ttagcggagt cagtcaggaa gagcatactg acgttccttt cgaactatca cccatccagc 16680agtggttctt tgaccaatcg ccatttatga gccagcagaa gcatgacaga ttctacaacc 16740aaggattcta tgtgagactc aggcgcacag tgagaatcaa tgatctagaa tcagcctttc 16800tttctctggt caatcgccac gcgatgttac gctcgcgatt tcagcatcat gggggcaaat 16860ggaagcaaat aatcctcagt cacagcaaac gagctcttca tttgaacgta tcgcagcacc 16920tgtccatgag cgagattgca tcgttagctc aagagcggca ccgacagatt gacatagaga 16980aaggtcctgt cttctcggtt gatatttgct tactaggcca gcagcagcat ctggtcatga 17040tagcccatca tttggttacc gacttggtct cctggcggat tatcttagat gatctggaga 17100ctattctcaa cggccattcc ctaacggccg ctctaccctt ccaagtgtgg agcaggctgc 17160aagctgagcg ggctgtatct tccactttga agcctcacaa cttgctgtcg actgacggcg 17220tccataacaa tctcaagttt tggaagtata cgcacgacac gcccaactgc ttggcagacc 17280acaggctccg atcggtcact attgatcgag aaactacggc tgtactactg ggcgaggcaa 17340acaatgccat gaatacagag ccagtagaga tccttttatc agctgtttgg gatgcattct 17400ttcggacgtt ttcccagcgc aacagcctga ccatattcaa cgaaggtcat ggtcgcgaag 17460cttggtccga tgaaattgac ttgtcgagca ctgttggatg gtttaccaca ctcagtccca 17520tcaacatcta tagaaataat gccaccagcg agaccgacat ggtgcggctc gtcaaggatg 17580cccgccgcag ccttcccgcg aacggctggt cttactttac ctcccgatat ctgaaccccg 17640acgggcaaag agcttttgaa agccataaca cggtgtctga agttgttttc aattatcatg 17700gccaattcca acaactagaa agtcatcaag ccctttttga agacattgat cttgtcggtg 17760tacgtgtgca aggtcgctca atatctgcag ggtctttgtt taacatcgag gttgccattg 17820aagcaatgca agcgcacttt gaattctccg ttaatcaaaa tatcgctcat cagagcttga 17880ttaaccagtg gattgaccaa attcaaccct ctttggaaag gatttgcctc gtccttctcg 17940aggccaaccc aacgcatacg ctgtgtgact tcaagttcat cagtctcgac taccagcgcc 18000ttgacgatct taccagtcga ctacttccgg agatcgagtc aatcaaccaa tcaactgttg 18060aggagatttt ctcgtgctct ccgattgtcg atggaatgct cctcagtcag ataaagcagc 18120cagaatcata caagacactt cagcgatacg aggtgttgtc atctcatgac catcctatct 18180gtctcgacac cctcaaaatt gcttggcaaa gggtgatttc tcgccagcct gccttgagga 18240cagttttcat cgctggcctt gacggatcta ccgcctttta ccaggccctt ctcaaacagt 18300gctccgggga tgttatcgtt gttgaggcta aaactgaaga ggaagccctg aaagcctttt 18360cctcgcttcc gaaagtcgat taccaacagg ccaaacctcc tcatcgcctc actctttgtc 18420aaacgccgga tgacaaagtc ttttgtcaga ttgaaatgag ccatgctatt actgatggtg 18480cctcttcaac cattttgatt aaggatctga ttgacgctta tggtgatagg ctgtcgtcaa 18540cagaccttgt caaaacaaca cgcgaatttg ctagccactt gctggctaag ccacagtccc 18600aaaagatttc gtattggaac acaaaactca agggccttga accttgccgc tttccatccc 18660tatcgagcat gtctcgggag aagcacgagt gtagctcgga gattggagtt tttgtcgaag 18720acaagatgtt tgcgcagatt caagacttct gtagcataaa ccaggtcacg ccagcaagtc 18780tcctcaaaag cgcctgggct ttgacactct cgacctacgt acaaaatcaa tctgtctgct 18840ttggctatct ggcatctggt cgagacctcc caatcgccgg gatggacgaa tctgtcggcg 18900cttacactaa catcatggtc tgccgtgccg atttggatgg gcaacagcct ggtgtggcac 18960tcgtgcgaca acttcagaat caattaatgc aggacttgag cttccaacat atatcgcttg 19020ctagcattca acatgagctt ggactggcgt ccgatcagca gcttttcaac tctattgtct 19080cttttcagag gtcaggagac gataatgaac aatcagcaga ggagggtaaa cttcgattca 19140agaatattga tggtttggac ccaacagaag tcagtggatt gttgagcatg agagtgtata 19200catctggact aatgttttta tagtacgaca tcgtattggg tatcaaccaa ggaaccaggt 19260ccatcgaaat tgaccttgaa ttctcacaca gctgtctcac tagtaatcag gcaaaacgca 19320ttctcgagca tctgcagtca aacattgccg ctattcttca caatgagcca cctgctctga 19380tcagccccca agatgagcaa gatatttgga gctggaactc cactgttcct gacatggtca 19440acatctgcgt tcacgatctg atctccaaga tagtattccg ccagcctgat gcaccagctg 19500tttgctcatg ggacggcgat ttcacctatg cggagctgga taatcttgca acacgccttg 19560ccaatagcct cagcaagatg ggcatcggaa gaggcagcat cgtcccgcta tgttttgaaa 19620aatccaaatg gacaccagtt gccatgctag cagttatgaa aacaggtgca gcctctgtta 19680cgatggatac tagccagcct gaagaacggc tccagtctat tgttgcacag gtggatgcta 19740agcttgtgat ttcttcgaca ttgaaggttg agctagcagc caggctcaca acggctcccg 19800tcttggctat agacaaagcc agcatgaagg cgatggctga cgatacgccg ctggctgcag 19860tcgatcccgc aaacagtatt tacattgtct tcacatcagg gagcactggc acgccaaaag 19920gtgtcattat cactcatacc aactacagca gcgccatcaa gcatcagcag agtgaacacg 19980gcttcaagcc aacctctagg gtctttgact ttgcctctta tgcgttcgat gtcagctggt 20040ccaatttctt gcacaccttg accattgggg cctgcttatg cattccttct gatcatgatc 20100gtaaaaatga cccggcgggc gcaattgacc gcttacggtg tacacacgtt gatatgaccc 20160cctcggccgc aagcgtctta cctgccagta cgttggctaa attggatacc attgttctgg 20220gaggcgagaa gctctcgctt gaatatgccc aacgctggtc cgccctgaca agcgtgcgta 20280atccgtacgg gccttctgaa tgcacaccga cgtcgacaat tacggagatc aattctgcgg 20340aaataagcaa gggcaaagtg agcatcggca aaggagtggg actcaatact tggattgttg 20400atcctgccac tgcacaacat ttaatgccga ttggcatccc tggggagtta ttactcgaag 20460gtccgcttgt tggtgctggc tatcttggag accctgtcaa aaccgcttca gcatttattg 20520aagacccaga attcctagtc aaaggcgcta gtccaggaat tccaggccgc cgtggtcgtc 20580tgtacaggac gggcgatcta gtcacctata ataccgatgg tagcttgtca tttgtgggcc 20640gaagggactc tcaaatcaaa ataaacgggc aacgcgtcga attaggcgac atcgagtcgc 20700acgtttctgc aaacctggtg agtcatggca gtgctcaggt tgcggtcgag gttgtgtcac 20760cccaagctag ctccaacaac atacttgtcg ccttcgtgag ctttgacgac ctgaattcta 20820tcaacctgaa tgatgaaaag cttcttgccc gcacgaaagc ggcgaccgag ggaattaggg 20880agaaactcgc gacacaaatc ccatcttata tgattccttc ggtctacatc cctgttactg 20940tttttcccac aacagctact gggaagactg atcggcgccg attacgtgaa atggcctcaa 21000gcctcaccct ggagcagctt acctcaatca accaagctca acagcaatat caacccccca 21060ctactccctt ggaagtggca cttcgggagc tctggatctc agtcctcaaa ttaggatcgc 21120gaaaaattag cactacaaac aacttcttcg aacttggtgg agattccatc ggtgctatta 21180ggctggtagg cgcggcccgt gaccacggac tatcgctttc cgttgtagat attttcaagc 21240atcctaagtt cagcgaaatg gctgctttgc ttcgttctgt ggataagccg cagttggaag 21300agccacgggt atttcaaccc acttcgcttc tgtccaaaga tcacaacaaa gaccagatac 21360tctctcgact ctttgacttt ggtattgact tggaaaatgt tgaagacatc ctccctgtca 21420cggatcatca agctcgttcc atcgcgatga ctcactctgc gtcccgcgac ttgctactct 21480atcccacttt agatagcaag ggcgtgccaa atatgcgcaa gatgcgagca gtgtgcaatg 21540agctcgtcaa tagatatgat ctcatgcgaa cccttttcat cgcacataaa gacagcttct 21600tgcaggtcgt gctgaaggcc tttcctgtgg atataaccgt cttgagaatt gagaatgcca 21660gcctagagga atgcacagaa gagctacgat tacgcgacag ggacgatgag ctccgttatg 21720gctcgctcct aacaaagatt gctattttgc atcaaatccg cgacaacgaa taccgtcttg 21780tggtccgcat ttcccatgct caacatgacg gaatgagctt gatgaaaatg tggaacgcat 21840ttgaagaaat gtacggtgac gggagtgacg actcattcca cattccttcg gacactagct 21900tccaagaaaa gtctaaggct agtttctcca actacatgca tgccgtggct ggtacaaacc 21960gggagcaagc taagtctcac tggcgcagac tcctcaaggg ctctagcatg acgaacctca 22020agccccatgc ttcatatgcc ctgacctttg gcgaaggacc atgtgtcgcc agacatgttc 22080ctaagagcat tgctcaaggt actggattta catttcatac tgtactgaag gctgcttggg 22140cgtacgttct ggcaaaacac cttgccaacg acgacgtggt tttctgtagc ctcactcacg 22200gtcggggctt gcccgggaca caagatgtct ttggagactg cgtgaacatc attcctactc 22260gagtatcttt taccgacgga tggactgttc gcgaccttct cagtgcattg aacgcccaac 22320agattgcgag catggagcat gagaatatag gcacacgcga aattgtccgt gactgtacta 22380catggccgaa gtggacatat gcaggatcca tcgtttatca ccatgacttt gacgatggag 22440aacatattgc tcataaccgc agtatgcacg ttgagcagga gctaaatctg tctcacggca 22500aagtggacat gaccgacgtt catatcactt ctaagcctga taacaacatg ttccgaattg 22560agctggactt cgcacatggc gtggtgtctg agcgtgacgc tgaactgcta gctgcgaaac 22620tgacggagtc tatcatcgtt ttctgcaatg tcatggacca gcctttgtta tctcccgacg 22680agatcagata tctgcggaca accacattgc tgccctcaga ggagcctctc agtgcaaccc 22740caacaaatga acagttaatg gttgctagca ttagcccgac tgaaatgcaa tgggcgcttg 22800agagtgcgtg gaaggacact ttcaattgcc cccttagtcc tgaggtgaaa gcgggcaaga 22860caatttttga tcttggtggt gacttgataa gcgctagtct gatatcagct cacatggaga 22920ggcaaggata tgtccttagt gttgaggatg tcttggggaa tccgacgtgg ttctcgcaac 22980tgacgctgtt gacgaagcgc actcttcggg atgttgatgt ctgatgaaca agaatgttta 23040atatttagtc tgtcattcct atttggtatc atcactcagt acttcggcgt ttcttttttt 23100ttttttttcc ccaa 23114<210> 5<211> 21<212> PRT<213> Aspergillus niger<400> 5Ala Val Ile Gly Xaa Gly Gln Ser Xaa Xaa Glu Xaa Phe Met Asn Leu 1 5 10 15Xaa Ser Xaa Phe Pro 20<210> 6<211> 22<212> PRT<213> Aspergillus niger<400> 6Ala Leu Xaa Pro Ser Asp Asp Xaa Xaa Phe Val Asn Xaa Ala Xaa Phe 1 5 10 15Asp Pro Glu Arg Thr Asp 20<210> 7<211> 62<212> DNA<213> Artificial Sequence<400> 7gcngtnatng gnnsnggnca nwsnnnnrcn ganatnttna tgaayntncm nnnncrntty 60cc 62<210> 8<211> 66<212> DNA<213> Artificial Sequence<400> 8rtcngtncgn tcnggrtcra anrcngcnnn rttnacraan ssnnnrtcrt cnnnnggnnn 60narngc 66<210> 9<211> 14<212> PRT<213> Aspergillus niger<400> 9Tyr Xaa Phe Thr Ser Gly Ser Thr Gly Lys Pro Lys Xaa Val 1 5 10<210> 10<211> 15<212> PRT<213> Aspergillus niger<400> 10Asp Xaa Gln Val Lys Val Xaa Gly Gln Arg Xaa Glu Leu Xaa Glu 1 5 10 15<210> 11<211> 44<212> DNA<213> Artificial Sequence<400> 12tayntnytnt tyacnnsngg nnsnacnggn aarccnaarg sngt 44<210> 12<211> 41<212> DNA<213> Artificial Sequence<400> 12tcnycnaryt cnatyctytg nccnytyttn acytgnstrt c 41 |
| 【出願人】 |
【識別番号】000165251 【氏名又は名称】月桂冠株式会社 【住所又は居所】京都府京都市伏見区南浜町247番地
|
| 【出願日】 |
平成14年2月6日(2002.2.6) |
| 【代理人】 |
【識別番号】100075775 【弁理士】 【氏名又は名称】戸田 親男
|
| 【公開番号】 |
特開2003−230381(P2003−230381A) |
| 【公開日】 |
平成15年8月19日(2003.8.19) |
| 【出願番号】 |
特願2002−30145(P2002−30145) |
|