AI藥物開發研究員:機器學習與實驗檯相遇之處

把蛋白質與分子基礎模型接進濕實驗室的研究員。將AlphaFold一脈的結構預測、生成模型驅動的分子設計與化學資訊學嵌入實驗閉環,更快地找出候選藥物。

📖 1 分鐘閱讀
📅

一句話概述

把蛋白質與分子基礎模型接進濕實驗室的研究員。將AlphaFold一脈的結構預測、生成模型驅動的分子設計與化學資訊學嵌入實驗閉環,更快地找出候選藥物。

AI藥物開發研究員:機器學習與實驗檯相遇之處

為什麼這個領域重要

一款新藥走到上市,通常要花十年以上,耗資數十億。其中大部分都消耗在最早的一步——找到一個值得推進的分子。數百萬個候選裡,能進入臨床的寥寥無幾,而這少數大多還是以失敗收場。機器學習正在改寫這道算術題。2020年,DeepMind的AlphaFold攻克了懸置五十年的蛋白質摺疊難題,僅憑胺基酸序列就能在幾分鐘內預測出三維結構,「先有結構才能設計藥物」這個瓶頸本身就此消失。

資本隨即湧入。字母表旗下的Isomorphic Labs以AlphaFold 3為基礎,與禮來、諾華簽下約30億美元的合作,並正在準備首批AI設計藥物的臨床試驗。領英共同創辦人里德·霍夫曼與腫瘤學家悉達多·穆克吉於2025年創立Manas AI,憑2460萬美元種子輪,從乳癌、前列腺癌與淋巴瘤切入。Recursion、Xaira、Eikon、Generate Biomedicines——一批把機器學習和生物學放進同一支團隊的公司接連出現。在台灣與香港,從學研機構的計算生物學社群到生技新創,也在朝同一條賽道靠攏。

它們要的都是同一種人:能從實驗和資料兩頭判斷模型吐出的分子是否真在細胞裡有效、有沒有毒性、能不能合成的研究員。既不是純粹的機器學習研究者,也不是純粹的藥物化學家,而是一個能講兩種語言的人。

所需技能

這份工作的核心是雙語能力。你能搭出深度學習模型,同時又能讀懂它的輸出在生物學上是否說得通。只擅長一頭,就只是半個研究員。

  • 分子與蛋白質表示及化學資訊學。 用SMILES或圖來表示分子,用RDKit處理,預測ADMET(吸收、分布、代謝、排泄、毒性)。定量判斷「這個分子能不能合成、有沒有成藥性」是基本功。
  • 結構生物學與分子對接。 理解蛋白質與配體的結合,把AlphaFold一脈的結構預測和分子對接用到真實標靶上。你得能驗證預測出的結合姿態在物理上是否合理。
  • 生成模型。 駕馭能從頭生成分子的擴散與生成模型,以及蛋白質設計模型。以目標性質為條件去搜尋候選空間,正是這個領域的最前沿。
  • 雜亂的實驗資料。 生物資料小、偏、雜訊大。每次試驗的測定條件都不同,陰性資料幾乎從不公開。懂得這些侷限並加以因應,往往比模型架構更重要。
  • 熟悉濕實驗閉環。 要知道設計-合成-測試-分析(DMTA)循環在真實實驗室裡怎麼轉。和實驗檯前的科學家講同一種語言,一起決定下一個實驗跑什麼。

職業路徑

入行有兩條路。生物或化學博士補上機器學習再轉過來,或者從電腦、機器學習一側出發,扎進生物學。無論哪條,目標都是成為「翻譯者」——能在模型的語言和實驗檯的語言之間雙向搬運的人。招聘時最硬的一張牌,是真的在一個專案裡把這兩頭接通過。

需求毫不含糊。從全球大藥廠(禮來、諾華、武田)到AI生技新創,都在大力招聘化學資訊學、結構生物學、AI代理與ADMET建模的人才。在美國,生成式AI製藥職位平均年薪約11萬美元,博士級資深者遠高於此。台灣與香港這邊,傳統藥廠、生技新創與學研機構從兩端開出席位。但要注意,多數真正的研究職位仍然要求博士學位——這與其說是一次快速轉職,不如說是一次賽道的重新設計。

最快的自證方式,是用公開資料親手跑通一整輪。在ChEMBL或Tox21這樣的資料集上搭一個預測分子毒性或活性的模型,用RDKit處理分子,再給一個公開蛋白質結構接上對接。完整跑通這一小輪的經歷,在面試裡勝過履歷上任何一個關鍵詞。

標籤

#researcher #ai-drug-discovery #computational-biology #cheminformatics
🌟
🚀

準備好開始了嗎?

上面的那些人也和你一樣從零開始。今天就選一件事開始做吧!

💪

你可以的!這裡的每個人一開始也什麼都不懂。

🔥

有問題嗎?

Reputo為您連接專業人士。 提問費用 = 1 點數

諮詢行業導師

提問費用 = 1 點數