share_log

应用前景广阔!AI将成药物发现领域“主力军”

応用の可能性が広いです!人工知能は薬剤の発見分野で「ブロックトレードの一角」となるでしょう。

智通財経 ·  05/05 23:26

出典:Zhitongcaijing

人工知能と医療保健分野での仕事に従事する役員によると、まもなくこの分野はすべて人工知能によって薬剤が生成されるようになる。一部の業界関係者は、数年以内に最大限度に達するであろうと述べ、規格になるであろうとしている。

$イーライリリー (LLY.US)$生成型人工知能を使用して薬剤分子を発見し続けています。データによると、人工知能によって5分以内に発見された薬剤分子の数は、礼来が伝統的な実験室で1年間に合成する分子数とほぼ同等であり、医療分野で人工知能をテストすることは意義があるとされています。大量の人工知能によって生成されたデザインが現実世界で機能するかどうかはわかりませんが、疑いを持つ役員がより多く知りたいと考えていることです。

最近、礼来のチーフ情報・デジタル・オフィサーであるDiogo Rau氏は、人工知能によって生成された薬剤分子に関するいくつかの非典型的な実験に参加しました。彼は、これらの人工知能によって生成された生物学的な設計を「奇妙な構造」を持つ分子と表現し、既存の分子データベースと一致しないように思えるものの、潜在的に強力な候補薬剤であるように見えると説明しました。これらの人工知能によって生成された薬剤分子が礼来の研究科学者に渡され、彼らを驚かせました。

人工知能によって生成されたデザインの使用が加速され、新しい薬剤の開発・発見において注目され始めています。これにより、製薬業界だけでなく、数世紀にわたり科学方法に組み込まれていた基本的な考え方も大きく変化することになるでしょう。

Google DeepMindはパイオニアとなりました。

人工知能に関連した進歩は生物学分野で起こっており、これは、エヌビディアの医療保健担当副社長であるKimberly Powellが「前例のないスケールと解像度」として表現するように、ますますデジタル化しています。

この変化は、公衆がChatGPT関連になる前数年にOpenAIのChatGPTで実際に起こりました。2021年、GoogleのDeepMind人工知能部門が、人工知能の大規模言語モデルを最初に生物学に応用しました。Kimberly Powell氏は、「アミノ酸配列からタンパク質構造まで、非常に大きなデータセットでこれらの変形モデルをトレーニングすることができ、それが薬物の開発と設計の核心である」と述べています。

これは医学革命の一部であり、数百万の細胞を3Dスキャンする空間ゲノム学、既にデジタル形式で存在している化学物質目録を利用してAIモデルを構築するプロセス、そしてこれらを実現するための人工知能transformerモデルの生成を許可します。Kimberly Powell氏は、「このトレーニングは自己監督型および無人監視型学習によって実行されることができ、非常にクリエイティブで、人工知能は人間にはできない薬物モデルを‘考え出す’ことができます」と述べています。

ChatGPTのメカニズムは、人工知能による薬物開発を理解するための類推として機能することができます。Kimberly Powell氏は、「基本的には、本の中のすべて、ウェブページのすべて、PDFファイルのすべてでトレーニングを行っており、世界の知識をこのようにエンコードしています。質問することができ、回答を提供することができます」と説明しています。

バージョンの薬物発見

薬物発見は、生物の相互作用と変化を目撃する過程です。しかし、実験室で行うと数ヶ月または数年かかるため、従来の生物の動作をシミュレーションするコンピュータモデルで表現することができます。Kimberly Powell氏は、「彼らの振る舞いをシミュレーションできるとき、彼らがどのように協力し、相互作用するかを予測することができます」と述べています。「私たちは今、人工知能スーパーコンピュータを持っているため、デジタルバイオロジーのすべてのデータを持っているため、このような人工知能やGPTのような方法を使用して、初めてコンピュータ上で薬剤の世界を表現することができます。」

これは前世紀に支配的だった薬剤発見のクラシックな経験的手法とは全く異なります。幅広い実験、その後のデータ収集、人間レベルでのデータ分析、そしてその結果に基づく別のデザインプロセスがあります。社内で実験を行い、いくつかの決定点に到達し、科学者や役員が臨床試験の成功につながると期待しています。Kimberly Powell氏は、「これは非常に手作業的なプロセスです。したがって、これは90%の薬剤発見の失敗率につながります。」

人工知能の支持者たちは、これにより時間の節約、成功率の向上、従来のプロセスをより体系化および再現可能な方法に変えることができ、薬物研究者がより高い成功率を確立できるようになると考えています。Kimberly Powell氏は、「Nature」誌に最近発表された研究結果を引用し、「人工知能の協力のもとでは、数年間にわたる薬剤発見プロセスが、数ヶ月に短縮される可能性がある」と述べています。さらに重要なことは、人工知能をこのプロセスに早期に導入することにより、薬物開発のコスト(1回の実験のコストは3000万から3億ドルの範囲内)が大幅に削減され、成功率が大幅に向上する可能性があることです。従来の開発プロセスに2年間取り組んだ後、成功率は50%であるとされています。人工知能による強化プロセスがより迅速に終了すると、成功率は90%にまで上昇すると考えられています。

キンバリー・パウエルは、「私たちは薬剤発見の進歩が大幅に向上すると予想しています。」と述べており、生成モデルの人工知能のいくつかの注目すべき欠陥、例えば「妄想」の傾向は、薬剤発見に重要な役割を果たす可能性があります。Kimberly Powellは、「過去数十年間、私たちは同じ目標を探し続けていますが、生成モデルを使用して新しい目標を開拓できる場合はどうでしょうか」と補足しています。

「幻覚」によって発見された新薬

人工知能は、モデルに存在しないタンパク質から作業を開始することができ、これは古典的な経験モデルでは立ち上がることができません。数字的には、人工知能はより多くの発見を探索する必要があります。Kimberly Powellは、治療法として使用できるタンパク質の潜在数は基本的に無限である-10の160乗、または10の160乗-既存の自然に与えられたタンパク質の制限が破られるはずです。「これらのモデルを使用して、私たちが必要とするすべての機能と特徴を備えた可能性のある「幻覚的な」タンパク質を生み出すことができます。それは人間の脳ができないことをすることができますが、コンピュータはそれをすることができます。」と述べています。

テキサス大学オースティン校は最近、新しい生成モデルの人工知能センターのために最大のNVIDIAコンピュートクラスターの1つを購入しました。分子生物科学教授のAndy Ellingtonは、「ChatGPTが文字列から学習することができるように、化学物質も文字列で表現でき、そこから学ぶことができます。」と述べ、人工知能は薬物と非薬物を区別し、ChatGPTが文を生成するのと同じように新しい薬物を創造しています。「これらの進歩とタンパク質構造の予測に関する努力を組み合わせることで、キーターゲットに適した類似の薬物化合物を特定できるようになるはずです。」と述べています。

テキサス大学の機械学習基盤研究所のコンピューターサイエンス博士課程のDaniel Diazは、現在、人工知能の薬物分野における大部分の作業は小分子発見に集中していると考えていますが、新しいバイオ医薬品(タンパク質をベースとした薬物)の開発において、より大きな影響があると語っています。彼は、人工知能が最適な設計を発見するのを加速する方法を見てきたと述べています。

Daniel Diazの研究グループは現在、乳がんの治療方法の動物実験を行っています。この治療法は人工による蛋白質工学版であり、乳がんに必要な鍵となる代謝物の分解を行います。従来、科学者が治療に使用する蛋白質を必要とする場合、彼らは安定した難分解性の蛋白質を含め、いくつかの特徴を探します。これには、蛋白質を調整するために遺伝子工学を導入する必要がありますが、これはラボでの作業において手間のかかるプロセスです-構造を描画し、最適な選択をすべての可能性の遺伝子修飾から識別します。

現在、人工知能のモデルが、可能性を狭めるために役立ち、科学者は試す必要のある最良の修正をより速く知ることができるようになりました。Daniel Diazが引用した実験では、より安定した人工知能によるバージョンを使用すると、タンパク質の生産量が約7倍増加し、研究者たちは最終的にテストや使用に役立つより多くのタンパク質を得ることができます。Daniel Diazは、「結果は非常に希望的だ」と述べています。そして、それが人間の蛋白質に基づくものであるため、タンパク質ベースの薬物への反応は大きな問題である薬物アレルギーの可能性が最小限に抑えられます。

NVIDIAは最近、「人工知能医療マイクロサービス」と呼ばれるものを発表しました。これには、薬剤探索が含まれており、医療分野で人工知能を活用する野心的な取り組みの一部です。これにより、研究者は数万兆の薬剤化合物をスクリーニングし、タンパク質構造を予測することができます。計算ソフトウェアデザイン会社のCadenceは、NVIDIA AIを分子設計プラットフォームに統合し、研究者が数千億の化合物からなるデータベースを生成、検索、モデル化することができるようにします。生物学に関するDeepMindのAlphaFold-2蛋白質モデルに関連する研究機能も提供されます。

最終的に、人工知能によって設計された薬物は、薬物開発の従来の最後のステップ-人間の実験のパフォーマンスに依存します。Kimberly Powellは、「あなたはまだ確かな証拠を提示する必要があります。」と述べ、現在の進歩を自動運転車のトレーニングと比較しました。自動運転車はデータを収集してモデルを強化および修正するために継続的に進化しています。Kimberly Powellは、「同じことが薬剤発見の分野で起こっている」と述べ、「これらの方法を使用して、新しいスペースを探索し……それを磨く……よりスマートな実験を実行し、実験データを取得し、モデルにフィードバックし、繰り返します。」と述べています。

ただし、多様な人工知能モデルの分野に比べて、生物学分野の空間はまだ非常に小さいです。多様なモダリティと自然言語処理の分野では、人工知能業界は1兆を超えるパラメータ数を持つモデルを所有しています。生物モデルのパラメーター数は数百億に過ぎません。

これらの内容は、情報提供及び投資家教育のためのものであり、いかなる個別株や投資方法を推奨するものではありません。 更に詳しい情報
    コメントする