トップ :: C 化学 冶金 :: C07 有機化学

【発明の名称】 化合物の合成経路開発方法および合成経路開発装置
【発明者】 【氏名】堀 憲次

【氏名】山口 徹

【要約】 【課題】合成しようとする目的化合物について提案された複数の合成経路の中から、自動的に最適な合成経路をランキングして絞り込んで提案する合成経路開発方法および合成経路開発装置を提供する。

【解決手段】合成したい目的化合物の複数の合成経路の活性化エネルギーを量子化学計算より得られた化学反応の遷移状態の構造およびエネルギーを含むデータにより活性化エネルギーを計算するとともに、合成したい目的化合物の複数の合成経路の合成経路に対して合成反応に対する収率予測式のデータから合成収率を予測し、前記活性化エネルギーと前記合成収率から合成経路ランキング式を構築し、目的化合物を合成するために最適とされる合成経路をランキングして絞り込んで提案する。
【特許請求の範囲】
【請求項1】
合成しようとする目的化合物について提案されている複数の合成経路について、活性化エネルギーを量子化学計算により計算するとともに、合成反応に対する収率予測式のデータから合成収率を計算し、前記活性化エネルギーと前記合成収率から合成経路ランキング式を構築し、この合成経路ランキング式から目的化合物を合成する合成経路をランキングして絞り込んで最適とされる合成経路を提案することを特徴とする最適合成経路開発方法。
【請求項2】
量子計算より得られた、複数の化学反応に関する活性化エネルギーおよび物質の構造を含む計算結果を蓄積した第1データベースを用いて、計算される類似反応の活性化エネルギーから最適な合成経路を選択することを特徴とする請求項1に記載の合成経路開発方法。
【請求項3】
量子計算より得られた、複数の類似合成反応に関する計算結果および当該化学反応の実際の実験により得られる実験結果、収率予測式を蓄積した第2データベースを用いて、類似化学反応の予測合成収率を計算することを特徴とする請求項1又は2に記載の合成経路開発方法。
【請求項4】
合成しようとする目的化合物について提案されている複数の合成経路について、活性化エネルギーを量子化学計算により計算する活性化エネルギー計算手段、
合成反応に対する収率予測式のデータから合成収率を計算する合成収率計算手段、
活性化エネルギー計算手段で計算された前記活性化エネルギーと、合成収率計算手段で計算された合成収率から合成経路ランキング式を構築し、この合成経路ランキング式から目的化合物を合成する合成経路をランキングして絞り込んで最適とされる合成経路を計算する最適合成経路計算手段を備えたことを特徴とする合成経路開発装置。
【発明の詳細な説明】【技術分野】
【0001】
本発明は、合成しようとする目的化合物の最適合成経路を、実験を行うことなく開発することが可能となる化合物の合成経路開発方法および合成経路開発装置に関する。
【背景技術】
【0002】
新薬などを構成する新規化合物を創るためには、化学プラントや実験室内でその化合物を合成するための合成経路を見つけ出さなければならない。従来、合成経路をコンピュータにより提案するのは非常に難しい問題とされ、例えコンピュータが提案できたとしても、提案された経路で合成できるかどうかの可否は、実際に実験を行ってみないと分からなかった。
【0003】
目的化合物を合成するまでには大きく分けて次の3つの工程が存在する。
(1)目的化合物の合成経路を提案する工程
(2)提案された合成経路から合成可能な経路を選択する工程
(3)選択された合成経路で合成を行う工程
【0004】
これらの工程は試行錯誤の中で繰り返されながら最終的に最適な合成経路が選択されることになる。最適な合成経路が選択できなかった場合、目的化合物の合成に長時間を要してしまったり、コストが嵩んでしまったり、最悪の場合、合成できない場合もありうる。そのため、前記工程(2)で示される最適な経路を選択することは非常に重要である。ここで、前記工程(1)は、情報化学的な手段により提案できることが分かっている。目的化合物の新規合成経路を創成する際に、反応機構解析にコンピュータを利用することが知られている。(特許文献1、2参照)。
【0005】
しかしながら、合成経路は、適切な合成開始物質を選択する→その開始物質に適切な反応をさせる→目的物質までたどり着く、という工程により成り立っており、その反応を多段階で考えた場合、通常何段階から何十段階に及ぶ。例えば、目的化合物を合成するために10段階の反応が必要であり、各段階での反応パターンが2通りあった場合、合成経路は2の10乗、即ち1024通りとなる。この合成経路より最適なものを選択する工程が、前記工程(2)である。しかしながら、これをコンピュータで行う方法は、これまで発明されていない。これは、合成経路で合成できるかの可否は、実際の「実験」を行わなければ調べることができないとされてきたためである。
【0006】
したがって、前記工程(2)は、現在、合成化学者と呼ばれる人の知識と経験に頼っているのが現状である。しかし、先ほどの1024通りの中から最適な経路を選び出すのは、例え経験豊富な化学者であっても、至難の技である。
【特許文献1】特開2002−262869号公報
【特許文献2】特開2004−119742号公報
【発明の開示】
【発明が解決しようとする課題】
【0007】
そこで、本発明は、合成しようとする目的化合物について与えられた複数の合成経路の中から、自動的に最適な合成経路をランキングして絞り込んで提案することができる合成経路開発方法および合成経路開発装置を提供するものである。
【課題を解決するための手段】
【0008】
本発明の合成経路開発方法は、合成しようとする目的化合物の複数の合成経路の活性化エネルギーを量子化学計算より得られた化学反応の遷移状態の構造およびエネルギーを含むデータにより活性化エネルギーを計算するとともに、合成しようとする目的化合物の複数の合成経路に対して合成反応に対する収率予測式のデータから合成収率を予測し、前記活性化エネルギーと前記合成収率から合成経路ランキング式を構築し、目的化合物を合成するために最適とされる合成経路を絞り込んで提案することを特徴とする。
【0009】
また、本発明の最適合成経路開発装置は、合成しようとする目的化合物の複数の合成経路の活性化エネルギーを、第1データベースに蓄積された量子化学計算より得られた化学反応の遷移状態の構造およびエネルギーを含むデータにより計算する活性化エネルギー計算用コンピュータと、合成しようとする目的化合物の複数の合成経路の合成収率を、第2のデータベースに蓄積された複数の類似合成反応に関する計算結果及び当該化学反応の実際の実験により得られる実験結果を含むデータにより計算される収率予測式を用いて計算する合成収率予測用コンピュータと、前記活性化エネルギー計算用コンピュータより得られた活性化エネルギーとおよび前記合成収率予測用コンピュータより得られた合成収率から合成経路ランキング式を構築し、目的化合物を合成するために最適とされる合成経路を絞り込んで提案する最適合成経路計算用コンピュータとを備えたことを特徴とする。
【0010】
本発明では、入力された各合成経路の実現性が判別され、合成経路のランキングが行われ、最適な合成経路が提案される。このランキングは、各合成経路に対して、量子化学計算により量子化学的解析を行い、その合成経路の反応の進行しやすさの目安となる「活性化エネルギー」と、「合成収率」を計算することにより可能となる。
【0011】
活性化エネルギーを計算する工程は、量子化学計算より得られた化学反応の遷移状態の構造およびエネルギーを含むデータを蓄積した第1データベースを利用して行う。
【0012】
合成収率を得る工程は、各合成経路で用いられている化学反応に類似した反応に関する与えられた実験データおよび活性化エネルギーを計算する工程で得られた計算データを蓄積した第2データベースを用いて収率予測式を構築しそれを計算することにより各合成経路の合成収率を得ることができるが、収率予測式が第2データベース内に存在している場合は、構築を行うことなく収率を計算できる。
【0013】
各合成経路に対する活性化エネルギーおよび合成収率、また特に優先したい合成経路が存在する場合にはそれを示した優先経路データを加え、これらを利用して合成経路のランキングおよび絞り込みを行って目的化合物を合成するために最適とされる合成経路を提案することが可能となる。
【発明の効果】
【0014】
本発明は、新規もしくは既知の化合物の合成を行う際にコンピュータを用いて、量子化学的計算結果を用いて、目的化合物に至る合成経路の有無、合成経路の各段階における活性化エネルギーおよび合成収率を予測し、合成経路のランキングを行うことにより、最適な合成経路を提案できるので、最適な合成経路を実験することなしに合成経路の開発が短時間で可能となる。その結果、可能な限り実験を減らし、低価格で、スピーディに、安全で環境に配慮しながら新薬等の新規化合物を合成することが可能となる。
【0015】
本発明により、汎用的な化学物質や医薬品等の新規化合物を合成するために最適な合成経路が自動的に提案されるので、例えば、本発明と合成ロボットなどを結合することにより、目的化合物の自動合成が可能になる。
【発明を実施するための最良の形態】
【0016】
図1は本発明の合成経路開発装置の全体を示す模式図である。
【0017】
図1において、本発明の方法を実施する合成経路開発装置は、入力データ1、出力データ2、活性化エネルギー計算用コンピュータ3、合成収率予測用コンピュータ4、最適合成経路計算用コンピュータ5、第1データベース6、第2データベース7を備えている。
【0018】
入力データ1は、合成経路を開発したい目的化合物の合成経路を蓄積したデータである。具体的には、目的化合物を合成するために提案された合成経路を示す化学反応式を文字情報に変換して、それを保存したファイルである。入力される合成経路は、コンピュータにより提案されたものでも、人により提案されたものでもよい。このデータ1は、コンピュータ3、コンピュータ4に入力される。
【0019】
活性化エネルギー計算用コンピュータ3は、目的化合物を合成するための合成経路の活性化エネルギーを計算するためのコンピュータである。また、合成収率予測用コンピュータ4は、合成経路に対して、収率予測式を適用することにより合成収率を予測するためのコンピュータである。これらの活性化エネルギー計算用コンピュータ3および合成収率予測用コンピュータ4は、どちらが先に利用されてもよく利用される順序は問われない。
【0020】
活性化エネルギー計算用コンピュータ3および合成収率予測用コンピュータ4に付随している第1データベース6は、量子化学計算より得られた化学反応の遷移状態、複数の化学反応に関するエネルギーおよび物質の構造を含む計算結果を含むデータを蓄積したデータベースである。この第1データベース6を利用して活性化エネルギー計算用コンピュータ3にて活性化エネルギーが計算される。
【0021】
第2データベース7は、量子計算より得られた、複数の類似合成反応に関する計算結果および当該化学反応の実際の実験により得られる実験結果、収率予測式を蓄積したデータベースである。この第2データベース7および活性化エネルギー計算用コンピュータ3の計算結果を用いて合成収率予測用コンピュータ4にて収率予測式が構築され、それを用いて合成収率が計算される。なお、第2データベース7内に当該合成経路に対する収率予測式が存在している場合は、それを用いて反応収率を得ることができる。
【0022】
活性化エネルギー計算用コンピュータ3、合成収率予測用コンピュータ4の双方を通過したデータは、最適合成経路計算用コンピュータ5に送られる。
【0023】
最適合成経路計算用コンピュータ5は、活性化エネルギー計算用コンピュータ3より得られた活性化エネルギーおよび合成収率予測用コンピュータ4より得られた合成収率を利用して、合成経路ランキング式を構築し、それを用いて目的化合物を合成するために最適とされる合成経路を絞り込んで選択するコンピュータである。
【0024】
最適合成経路計算用コンピュータ5により提案されたものが出力データ2となる。出力データ2には得られた合成経路すべてのランキングと最適な合成経路を示す化学反応式を文字情報に変換して、それを保存したファイルである。
【0025】
図2は本発明の合成経路開発方法の手順を示すフローチャートである。図2のステップS1〜S6は次のとおりである。
【0026】
ステップS1:複数の合成経路データが蓄積されている入力データ1から活性化エネルギー計算用コンピュータ3および合成収率予測用コンピュータ4に目的化合物Pの合成経路データを入力する工程である。合成経路データは、コンピュータの入力装置より直接入力されるか、合成経路データが保存された媒体より入力されるか、あるいはネットワークを介して受信されるかの方法で入力される。
【0027】
ステップS2:活性化エネルギー計算用コンピュータ3で各合成経路の活性化エネルギーを得る工程である。この中身は後述する図3に示されている。
【0028】
ステップS3:合成収率予測用コンピュータ4で各合成経路の合成収率を得る工程である。この中身は後述する図4のフロ−チャートに示されている。ステップS2およびステップS3の順序は限定されない。
【0029】
ステップS4:ステップS1で入力されたすべての合成経路に対して活性化エネルギーおよび合成収率が求められているかを判別する工程である。すべての合成経路に対してそろっていた場合は、ステップS5に進み、そろっていなかった場合は、ステップS2もしくはステップS3へ戻り足りないデータを得る。
【0030】
ステップS5:合成経路に対する活性化エネルギーおよび合成収率を用いて、最適合成経路計算用コンピュータ5で合成経路のランキングおよび絞込みを行う工程である。この中身は後述する図5に示されている。
【0031】
ステップS6:最適合成経路計算用コンピュータ5からデータの出力を行う工程である。出力されるデータは、目的化合物Pを合成するために最適と選択された合成経路と、各合成経路のランキングであり、出力装置により直接出力されるか、媒体に保存されるか、ネットワークを介して送信されるかの方法で出力される。
【0032】
図3は、図2の活性化エネルギーを求めるステップS2の詳細を示すフローチャートである。図3のステップT1〜T7は次のとおりである。
【0033】
ステップT1:入力データ1から入力された各合成経路に対して、その合成経路について遷移状態データが存在するかをチェックする工程である。遷移状態データは活性化エネルギーの算出に用いられるデータである。各合成経路に対してデータベース1を検索し、遷移状態データがすべてそろっている場合は、ステップT7へ進む。すべて揃っていなかった場合は、足りないデータを計算するために、ステップT2へ進む。
【0034】
ステップT2:遷移状態データが見つからなかった合成経路に対して、データベース1より、類似な合成経路の遷移状態データがあるかを検索する工程である。類似な合成経路の遷移状態データがあった場合は、それを用いてステップT4にて短時間で遷移状態データを求めることができる。このステップT2にて類似な合成経路のデータが見つからなかった場合は、ステップT3へ進む。
【0035】
ステップT3: ステップT2で類似な合成経路の遷移状態データがないと判断された場合に、合成経路に対する遷移状態データを新規に計算する工程である。遷移状態データが計算されたら、ステップT5へ進み保存される。
【0036】
ステップT4:ステップ2で類似な合成経路が存在した場合、遷移状態データを用いて、当該合成経路の遷移状態データを計算する工程である。類似経路のデータを用いることで、短時間で遷移状態データを計算することが出来る。計算が終了し遷移状態データが計算されたら、ステップT5へ進み保存される。
【0037】
ステップT5:遷移状態データをデータベース1に保存する工程である。保存されたデータは次回の検索に使用される。保存が完了したら、ステップT7に進む。
【0038】
ステップT6:ステップT5から遷移状態データ出力される。
【0039】
ステップT7:活性化エネルギーを取得する工程である。活性化エネルギーは合成経路に対する遷移状態データより取得することができる。具体的には、遷移状態データに含まれる、各反応段階の反応物、遷移状態、生成物の全エネルギーを差し引きすることにより得られる。
【0040】
図4は図2の各合成経路の合成収率を得るステップS3の詳細を示すフローチャートである。図4のステップU1〜U14は次のとおりである。
【0041】
ステップU1:各合成経路に対する収率予測式が存在するかを、データベース2を検索しチェックする工程である。すべての合成経路に対する収率予測式が存在する場合は、ステップU13へ進む。存在しない収率予測式がある場合は、ステップU2へ進む
【0042】
ステップU2:収率予測式が存在しない合成経路に対して、合成経路を構成する反応に類似な反応の実験データが存在するかをデータベース2より検索してチェックする工程である。実験データが存在しない場合には、ステップU4を経てステップU5へ進む。実験データが存在する場合には、ステップU5へ進む。
【0043】
ステップU3:ステップU4へ入力される実験データを示す。
【0044】
ステップU4:ステップU3の実験データが入力される工程である。
【0045】
ステップU5:実験データに対する遷移状態データが存在するかをデータベース1よりチェックする工程である。遷移状態データが存在しない場合は、ステップU6を経て遷移状態データを取得し、ステップU7へ進む。存在する場合は、ステップU7へ進む。
【0046】
ステップU6:ステップS2即ち図3に示されるフローチャートの処理を行い、遷移状態データを取得する工程である。ステップS3の処理を行う前にステップS2を行っていれば、本工程は通過しない。データ取得後はステップU7へ進む。
【0047】
ステップU7:収率予測式を構築するために十分なデータ(実験データおよび遷移状態データ)が揃っているかをチェックする工程である。データが揃っていなかった場合は、ステップU2へ戻り再度データを揃える。データが揃ったらステップU8へ進む。
【0048】
ステップU8:得られたすべてのデータを用いて、その反応に対する多変量解析を実行する工程である。多変量解析とは統計的解析の一般的な方法である。多変量解析が終了したらステップU9へ進む。
【0049】
ステップU9:ステップU8の多変量解析による結果を用いて、収率予測式を構築する工程である。収率予測式が構築できたらステップU10へ進む。
【0050】
ステップU10:構築された収率予測式を用いて、実験データ(実験値)と遷移状態データ(計算値)の相関が取れているかをチェックする工程である。相関が取れていた場合、この予測式を用いて合成経路の収率を算出することできるため、ステップU11へ進む。相関が取れていなかった場合は、多変量解析に使用するデータを選別し直し、収率予測式を再構築するためにステップU8へ戻る。
【0051】
ステップU11:構築された収率予測式を出力しデータベース2へ保存する工程である。保存された予測式は、次回の検索時に有効となる。保存が終了したらステップU13へ進む。
【0052】
ステップU12: ステップU11から収率予測式データが出力される。
【0053】
ステップU13:収率予測式を利用し合成経路の合成収率を計算する工程である。計算が終了したらステップU14へ進む。
【0054】
ステップU14:ステップU13による計算結果より合成収率を取得する工程である。
【0055】
図5は図2の合成経路のランキングおよび絞込みを行うステップS5の詳細を示すフローチャートである。図5のステップV1〜V7は次のとおりである。
【0056】
ステップV1:ステップS2より得られた合成経路に対する活性化エネルギーを取得する工程である。
【0057】
ステップV2:ステップS3より得られた合成経路に対する合成収率を取得する工程である。
【0058】
ステップV3:入力された合成経路に対して、特に優先させたい合成経路が存在するかをチェックする工程である。優先させたい合成経路がある場合は、それを優先経路データとして与えることになる。従って、与えたい優先経路データが存在する場合はステップV5へ進み、優先させたい経路が存在しない場合はステップV6へ進む。
【0059】
ステップV4:入力される優先経路データを示す。
【0060】
ステップV5:優先経路データを入力する工程である。データが入力されたらステップV6へ進む。
【0061】
ステップV6:ランキング式を行うために、活性化エネルギーおよび合成収率の規格化を行う工程である。規格化が終了したらステップV7へ進む。
【0062】
ステップV7:規格化された活性化エネルギーおよび合成収率を用いてランキング式を構築する工程である。ランキング式が構築されたらステップV8へ進む。
【0063】
ステップV8:構築されたランキング式を各合成経路に対して適用し、各合成経路のランキングおよび絞りこみを行う工程である。この時点では、優先経路データも加味され入力された全合成経路のランキングが行われる。
【0064】
ステップV9:ステップV8で行われたランキングを基に最適合成経路を取得する工程である。
【実施例】
【0065】
トロピノンを目的化合物として本明細書記載の合成経路開発装置により合成経路の開発を行った実施例を図6〜図8により説明する。
【0066】
トロピノン1に対し4種の合成経路(図6に示すルートA〜D)を合成経路開発装置に入力したところ、経路Aにおいては、図7(a)に示すように反応の活性化エネルギー(Ea)が14.4kcal/mol、経路Bにおいては図7(b)に示すように反応の活性化エネルギー(Ea)が26.9kcal/molと計算された。
【0067】
また、経路Cは、経路Bの反応物である7員環化合物4を生成し、その後は同じ反応経路であるが、化合物6、化合物7とメチルアミンの混合物からは化合物4を生成する反応は、副反応に比べて活性化エネルギー的に不利であると計算された。
【0068】
また、経路Dは経路Bの中間生成物5を経て進行が、化合物8から化合物5を生成する反応は小さな活性化エネルギーで進行すると計算された。なお、図6中の化合物1〜8の名称(IUPAC名)は以下のとおりである。(トロピノンは化合物1の別名である。)
1. 8-methyl-8-aza-bicyclo[3.2.1]octan-3-one
2. ethyl 2,5-(1-methylpyrrolidin-2-yl)acetate
3. ethyl 8-methyl-3-oxo-8-aza-bicyclo[3.2.1]octane-1-carboxylate
4. (2Z,6Z)-cyclohepta-2,6-dienone
5. (Z)-6-(methylamino)cyclohept-2-enone
6. propan-2-one
7. succinaldehyde
8. 4-(methylamino)-6-oxoheptanal
【0069】
合成収率の予測による合成経路開発では、キノロン誘導体1,4-dihydro- quinoline-3-carboxylic acid の合成反応に対して、計算により求められた反応熱、活性化エネルギー、反応温度や反応時間などを説明変数とし、実験収率(Yexp)を目的変数とした多変量解析(GA-PLS) 解析が行われた。R2値およびQ2値はそれぞれ0.988、0.946 と、良好な値が得られ、図8に示すように正しく収率予測が行われている結果が得られた。
【0070】
合成経路開発装置より得られた活性化エネルギー(Ea)と、予測合成収率(Ycalc)を組み合わせた2変数間のランキングにより、経路C<経路A<経路D<経路Bとランキングされ、最適な経路Bが開発された。
【図面の簡単な説明】
【0071】
【図1】本発明の合成経路開発装置の全体を示す模式図である。
【図2】本発明の合成経路開発方法の手順を示すフローチャートである。
【図3】図2のステップステップS2を詳細に示したフローチャートである。
【図4】図2のステップステップS3を詳細に示したフローチャートである。
【図5】図2のステップステップS5を詳細に示したフローチャートである。
【図6】本発明によるトロピノンの合成経路を示す図である。
【図7】(a)経路Aの計算された活性化エネルギーを示す図、(b)は経路Bの計算された活性化エネルギーを示す図である。
【図8】多変量解析による合成収率予測を示す図である。
【符号の説明】
【0072】
1:入力データ
2:出力データ
3:活性化エネルギー計算用コンピュータ
4:合成収率予測用コンピュータ
5:最適合成経路計算用コンピュータ
6:第1データベース
7:第2データベース
【出願人】 【識別番号】304020177
【氏名又は名称】国立大学法人山口大学
【出願日】 平成18年12月19日(2006.12.19)
【代理人】 【識別番号】100082164
【弁理士】
【氏名又は名称】小堀 益

【識別番号】100105577
【弁理士】
【氏名又は名称】堤 隆人


【公開番号】 特開2008−150337(P2008−150337A)
【公開日】 平成20年7月3日(2008.7.3)
【出願番号】 特願2006−341770(P2006−341770)