AI藥物開發研究員:機器學習與實驗檯相遇之處
為什麼這個領域重要
一款新藥走到上市,通常要花十年以上,耗資數十億。其中大部分都消耗在最早的一步——找到一個值得推進的分子。數百萬個候選裡,能進入臨床的寥寥無幾,而這少數大多還是以失敗收場。機器學習正在改寫這道算術題。2020年,DeepMind的AlphaFold攻克了懸置五十年的蛋白質摺疊難題,僅憑胺基酸序列就能在幾分鐘內預測出三維結構,「先有結構才能設計藥物」這個瓶頸本身就此消失。
資本隨即湧入。字母表旗下的Isomorphic Labs以AlphaFold 3為基礎,與禮來、諾華簽下約30億美元的合作,並正在準備首批AI設計藥物的臨床試驗。領英共同創辦人里德·霍夫曼與腫瘤學家悉達多·穆克吉於2025年創立Manas AI,憑2460萬美元種子輪,從乳癌、前列腺癌與淋巴瘤切入。Recursion、Xaira、Eikon、Generate Biomedicines——一批把機器學習和生物學放進同一支團隊的公司接連出現。在台灣與香港,從學研機構的計算生物學社群到生技新創,也在朝同一條賽道靠攏。
它們要的都是同一種人:能從實驗和資料兩頭判斷模型吐出的分子是否真在細胞裡有效、有沒有毒性、能不能合成的研究員。既不是純粹的機器學習研究者,也不是純粹的藥物化學家,而是一個能講兩種語言的人。
所需技能
這份工作的核心是雙語能力。你能搭出深度學習模型,同時又能讀懂它的輸出在生物學上是否說得通。只擅長一頭,就只是半個研究員。
- 分子與蛋白質表示及化學資訊學。 用SMILES或圖來表示分子,用RDKit處理,預測ADMET(吸收、分布、代謝、排泄、毒性)。定量判斷「這個分子能不能合成、有沒有成藥性」是基本功。
- 結構生物學與分子對接。 理解蛋白質與配體的結合,把AlphaFold一脈的結構預測和分子對接用到真實標靶上。你得能驗證預測出的結合姿態在物理上是否合理。
- 生成模型。 駕馭能從頭生成分子的擴散與生成模型,以及蛋白質設計模型。以目標性質為條件去搜尋候選空間,正是這個領域的最前沿。
- 雜亂的實驗資料。 生物資料小、偏、雜訊大。每次試驗的測定條件都不同,陰性資料幾乎從不公開。懂得這些侷限並加以因應,往往比模型架構更重要。
- 熟悉濕實驗閉環。 要知道設計-合成-測試-分析(DMTA)循環在真實實驗室裡怎麼轉。和實驗檯前的科學家講同一種語言,一起決定下一個實驗跑什麼。
職業路徑
入行有兩條路。生物或化學博士補上機器學習再轉過來,或者從電腦、機器學習一側出發,扎進生物學。無論哪條,目標都是成為「翻譯者」——能在模型的語言和實驗檯的語言之間雙向搬運的人。招聘時最硬的一張牌,是真的在一個專案裡把這兩頭接通過。
需求毫不含糊。從全球大藥廠(禮來、諾華、武田)到AI生技新創,都在大力招聘化學資訊學、結構生物學、AI代理與ADMET建模的人才。在美國,生成式AI製藥職位平均年薪約11萬美元,博士級資深者遠高於此。台灣與香港這邊,傳統藥廠、生技新創與學研機構從兩端開出席位。但要注意,多數真正的研究職位仍然要求博士學位——這與其說是一次快速轉職,不如說是一次賽道的重新設計。
最快的自證方式,是用公開資料親手跑通一整輪。在ChEMBL或Tox21這樣的資料集上搭一個預測分子毒性或活性的模型,用RDKit處理分子,再給一個公開蛋白質結構接上對接。完整跑通這一小輪的經歷,在面試裡勝過履歷上任何一個關鍵詞。