必?fù)P醫(yī)藥(Beyang Therapeutics),成立于2021年,是一家既年輕又成熟的Biotech公司?;?em>ExCEED(Experiment + Computation w/ Enhanced Evaluation & DMPK)技術(shù)平臺(tái),必?fù)P專注于計(jì)算模擬技術(shù)和藥物發(fā)現(xiàn)實(shí)驗(yàn)技術(shù)的高度融合,尋找更快、更智能的方法來發(fā)現(xiàn)新的和更好的藥物。
基于多年在行業(yè)深耕的經(jīng)驗(yàn)和獨(dú)特的創(chuàng)新視角,胡齊悅在2021年創(chuàng)立了必?fù)P醫(yī)藥。他的初衷是:“我希望必?fù)P作為創(chuàng)新藥物的‘夢(mèng)工廠’,以另外一種方式,匯聚有各自專長的人組成精煉小團(tuán)隊(duì),研發(fā)出Best in Class的分子,加速藥物研發(fā)進(jìn)程?!睆姆肿釉O(shè)計(jì)、成藥性評(píng)價(jià)與生物學(xué)評(píng)價(jià)三個(gè)核心環(huán)節(jié)入手,必?fù)P期望打造一個(gè)能不斷產(chǎn)出高質(zhì)量分子的創(chuàng)新藥“夢(mèng)工廠”,助力中國創(chuàng)新藥走出國門、邁向海外。

必?fù)P的團(tuán)隊(duì)來自世界各地,精煉且資深。
胡齊悅在Pfizer(輝瑞)La Jolla實(shí)驗(yàn)室工作十多年后,選擇回國加入恒瑞醫(yī)藥。在中國創(chuàng)新藥的發(fā)展萌芽階段,繼續(xù)深耕近十年后,成立了必?fù)P醫(yī)藥。公司創(chuàng)始團(tuán)隊(duì)成員均擁有超過20年新藥研發(fā)與計(jì)算模擬結(jié)合的實(shí)踐經(jīng)驗(yàn),累計(jì)對(duì)20余個(gè)臨床階段候選藥物或已上市新藥的研究與開發(fā)做出過重要貢獻(xiàn),例如Adebrelimab、Axitinib、Crizotinib、Sunitinib、Sylatron等等。
必?fù)P的“夢(mèng)工廠”模式不僅在于小而精的團(tuán)隊(duì)本身,還在其強(qiáng)大的創(chuàng)造能力。
必?fù)P的優(yōu)勢(shì)體現(xiàn)在,具有挑戰(zhàn)性的靶點(diǎn)與適應(yīng)癥選擇,以及臨床前項(xiàng)目管線的推進(jìn)和有明顯差異化的數(shù)據(jù)。
成立不到三年,已經(jīng)有一款以滴眼治療眼底疾病的項(xiàng)目管線正在推進(jìn)臨床注冊(cè)申報(bào)研究,該適應(yīng)癥臨床可用藥物匱乏,且無治療指南推薦藥物,未滿足臨床需求巨大。同時(shí),另一款治療高危型白血病復(fù)發(fā)難治亞型的項(xiàng)目也即將進(jìn)入臨床注冊(cè)申報(bào)研究,該適應(yīng)癥標(biāo)準(zhǔn)療法為化療,尚無針對(duì)性靶向療法獲批,亦存在非常明確的未滿足臨床需求。

無論是眼科項(xiàng)目還是腫瘤項(xiàng)目,均在臨床前研究中,通過與所選適應(yīng)癥/靶點(diǎn)上最好的藥物頭對(duì)頭比較,充分證明其 Best in Class 潛力。
三年前,速石寫過一篇文章,盤點(diǎn)了全球44家頂尖藥企用人工智能輔助新藥研發(fā)的現(xiàn)狀。到今天,依然可以得出這個(gè)結(jié)論:我們離主要靠計(jì)算機(jī)發(fā)現(xiàn)藥物,通過一大堆機(jī)器人完成實(shí)驗(yàn)測(cè)試,然后將它們送給患者的世界還相距甚遠(yuǎn)。
但這并不意味著,我們不能繼續(xù)往前。
正是計(jì)算機(jī)技術(shù)的應(yīng)用讓創(chuàng)新藥研發(fā)這件事情變得扁平化,把中國與世界的距離拉近。
胡齊悅在輝瑞就專注于計(jì)算機(jī)輔助藥物研發(fā)的工作,在恒瑞任職期間,帶領(lǐng)團(tuán)隊(duì)充分發(fā)揮計(jì)算模擬與實(shí)驗(yàn)的協(xié)同作用,并將計(jì)算模擬的應(yīng)用從小分子領(lǐng)域進(jìn)一步拓展到包括抗體、重組蛋白、ADC和RNA等生物大分子形式。

胡齊悅表示,相比Me Too,做Best in Class會(huì)更需要計(jì)算機(jī)技術(shù)的幫助,或者說,借助這樣的技術(shù)可以把這件事做得更好。比如分子設(shè)計(jì),一般靠的是研究人員經(jīng)驗(yàn),他知道什么樣的化學(xué)結(jié)構(gòu)可以跟靶點(diǎn)有很好的結(jié)合。但一個(gè)人即使再有經(jīng)驗(yàn),也不可能窮舉所有可能性,這時(shí)候可以借助計(jì)算機(jī)的力量把已知可能的分子都設(shè)計(jì)出來,通過一個(gè)評(píng)價(jià)體系來排序并選擇。
而一個(gè)奇思妙想的結(jié)構(gòu),有時(shí)能點(diǎn)燃創(chuàng)造的火花。
而像成藥性評(píng)價(jià),如果通過AI機(jī)器學(xué)習(xí)的算法模擬實(shí)驗(yàn)數(shù)據(jù)訓(xùn)練預(yù)測(cè)模型可以節(jié)省人力、物力以及實(shí)驗(yàn)資源,并能更快獲得最終的實(shí)驗(yàn)結(jié)果。
Biotech的主業(yè),始終是前沿靶點(diǎn)和技術(shù),解決未滿足臨床需求。必?fù)P的“夢(mèng)工廠”模式,最重要的就是專注于自己的核心目標(biāo),同時(shí)充分借助外部的力量。
隨著整個(gè)制藥行業(yè)的發(fā)展與成熟,CRO、CMO、第三方研究所等專業(yè)機(jī)構(gòu)的出現(xiàn),為行業(yè)的發(fā)展帶來了全新的商業(yè)模式,很多非核心業(yè)務(wù)都可以被拆分出來,實(shí)現(xiàn)“分布式”分工協(xié)同,讓必?fù)P的發(fā)展更輕松與高效。
比如,做新藥研發(fā)云平臺(tái)的速石科技就是必?fù)P的合作伙伴之一。
過去一年,必?fù)P在速石平臺(tái)的使用趨勢(shì)如下圖:

最高達(dá)到1500+核心并發(fā),最低值是0。
真正做到:需要的時(shí)候就在那。無需預(yù)測(cè),想用就用,用完即走。
給必?fù)P帶來的好處在于:
首先,輕松無負(fù)擔(dān)。無需增加自有資產(chǎn),占用公司現(xiàn)金流;
其次,使用方式靈活。需要的時(shí)候購買,用完即走,不需要培養(yǎng)一個(gè)專門的團(tuán)隊(duì);第三,減少前期摸索時(shí)間與降低試錯(cuò)成本。
還在美國工作的時(shí)候,胡齊悅就已經(jīng)知道云的優(yōu)勢(shì)了。
在恒瑞時(shí)他曾經(jīng)也想上云,但即便在大型藥企,從無到有地搭建一套可用研發(fā)環(huán)境依舊是復(fù)雜的:從爭取公司資源,到招聘專業(yè)人才,包括后續(xù)一系列采購設(shè)備、設(shè)計(jì)底層架構(gòu)、打通網(wǎng)絡(luò)、部署系統(tǒng)、管理維護(hù)集群等工作。
考慮到這些繁瑣耗時(shí)的工作都需要他付出相當(dāng)大的精力,就一直沒往這個(gè)方向投入。
而在本地機(jī)器購買完成的那一刻起,就開始了固定資產(chǎn)的貶值。

創(chuàng)立了必?fù)P后,作為一家企業(yè)的創(chuàng)始人,面臨的問題就更多更現(xiàn)實(shí)了。
專門準(zhǔn)備一個(gè)機(jī)房,招一堆人來搭建整個(gè)環(huán)境和底層架構(gòu),再專門找IT維護(hù)。他直接表示:“這個(gè)對(duì)于多數(shù)Biotech不實(shí)際”。而且每年可以投入到機(jī)房的費(fèi)用是一定的,但是需要做計(jì)算的事其實(shí)是在增長的,這種模式也非常不靈活,很難匹配一家高速增長的企業(yè)需求。
在胡齊悅看來,速石提供的新藥研發(fā)云平臺(tái)是一條捷徑或者說高速路,而這對(duì)藥物研發(fā)企業(yè)具有很重要的價(jià)值。

面對(duì)多樣的藥物研發(fā)場(chǎng)景和BIO/AI工具,如分子對(duì)接、虛擬篩選、蛋白質(zhì)折疊等,速石能為像必?fù)P這樣的用戶提供三大核心價(jià)值:
1. 標(biāo)準(zhǔn)藥物研發(fā)環(huán)境的規(guī)劃與搭建。
速石站在醫(yī)藥公司整個(gè)新藥研發(fā)體系與架構(gòu)視角進(jìn)行標(biāo)準(zhǔn)藥物研發(fā)環(huán)境的規(guī)劃與搭建,為企業(yè)提供一整套即開即用的CADD/AIDD研發(fā)平臺(tái),一體化產(chǎn)品端到端交付到用戶手里。
有效降低用戶的前期投入與摸索成本,任何起步的公司都可以嘗試,沒有使用門檻,且對(duì)企業(yè)的未來擴(kuò)張有極強(qiáng)的兼容性與彈性。
2. 藥物設(shè)計(jì)研發(fā)流程的構(gòu)建與驗(yàn)證,BIO/AI應(yīng)用的適配和銜接。
速石深入藥物研發(fā)業(yè)務(wù)場(chǎng)景,為用戶提供藥物研發(fā)流程自動(dòng)化的構(gòu)建與驗(yàn)證,對(duì)上層BIO/AI應(yīng)用運(yùn)行提供支持與優(yōu)化,同時(shí)與底層資源聯(lián)動(dòng),給用戶更靈活、更高效使用資源的能力。
一方面把用戶原來手動(dòng)做的工作自動(dòng)化,大大提升用戶的工作效率;另一方面為用戶提供應(yīng)用與資源層面的最佳實(shí)踐參考,解決了研發(fā)場(chǎng)景里普遍存在的資源利用率不高、成本難以把控等問題。
3. 處理研發(fā)與IT領(lǐng)域的交叉問題。
做計(jì)算機(jī)輔助藥物研發(fā),遇到的通常是介于藥物研發(fā)與計(jì)算機(jī)IT領(lǐng)域的交叉問題,定位困難,解決復(fù)雜,非常消耗用戶精力。速石能幫用戶預(yù)判部分問題,通過自動(dòng)化減少部分問題發(fā)生,定位并解決部分問題,幫助用戶專注更重要的藥物研發(fā)工作。

此外,速石的新藥研發(fā)平臺(tái)還能支持市面上所有主流新藥研發(fā)應(yīng)用,和AlphaFold、RoseTTAFold等常用AI框架的快速搭建,并提供開源/自有分子庫構(gòu)建與治理,如Zinc、Drugbank、Maybridge、Enamine等等。
速石常見BIO應(yīng)用實(shí)證:
Vina/ Amber/ MOE/ LeDock
我們問了胡齊悅一個(gè)假設(shè)性的問題:
“如果沒有預(yù)算,你會(huì)怎么使用我們平臺(tái)?”
或者換一種表達(dá)方式:“如果沒有資源限制,你會(huì)如何使用計(jì)算機(jī)技術(shù)來輔助藥物研發(fā)?”
他回答:“會(huì)用得更多?!?/p>
多跟少之間的權(quán)衡點(diǎn)具體有哪些?
第一, 研究的全面性。
面對(duì)資源限制,企業(yè)首要考慮的是該研究項(xiàng)目的必要性與重要性,然后計(jì)算需要投入的時(shí)間與資源量。這可能會(huì)嚴(yán)重影響研究的全面性。
以設(shè)計(jì)分子為例,藥物研發(fā)人員會(huì)從現(xiàn)有的資源與認(rèn)知出發(fā),制定研究計(jì)劃,無法考慮超出資源之外及認(rèn)知之外的可能性。
隨著研究邊界的不斷拓展,可能會(huì)因?yàn)橛邢薜馁Y源與認(rèn)知,對(duì)某一個(gè)項(xiàng)目帶來致命的、決定性的負(fù)面影響。而研發(fā)人員永遠(yuǎn)無法知道錯(cuò)過了什么。

第二,應(yīng)用與資源的適配。
資源限制會(huì)對(duì)研發(fā)人員使用應(yīng)用的方式提出要求,他們需要能根據(jù)任務(wù)特性挑選更合適、性價(jià)比更高的機(jī)器。
如果只選用大機(jī)型執(zhí)行任務(wù),將會(huì)浪費(fèi)大量資源,而如果錯(cuò)誤選擇了小機(jī)型,很可能中途會(huì)面臨任務(wù)失敗。
如何找到應(yīng)用與資源類型、資源規(guī)模的最佳適配,需要不斷地學(xué)習(xí)和實(shí)踐。
第三,時(shí)間與金錢的取舍。
從事藥物研發(fā),研發(fā)速度不是唯一的考量。要提升研發(fā)的深度與廣度,實(shí)現(xiàn)整體效率的提升,充足的資源必不可少,但這也意味著企業(yè)需要付出更多的成本。企業(yè)需要在效率與成本間做抉擇,甚至需要根據(jù)外部環(huán)境的變化做動(dòng)態(tài)調(diào)整。這也是大部分企業(yè)都在面臨的難題。
Take Away
蘇州必?fù)P醫(yī)藥科技有限公司是一家創(chuàng)新的制藥公司,利用其專有的ExCEED 平臺(tái)來加速針對(duì)未滿足臨床需求的新藥發(fā)現(xiàn)和開發(fā)進(jìn)程。創(chuàng)始人和管理團(tuán)隊(duì)平均擁有超過20年新藥研發(fā)經(jīng)驗(yàn),曾任職于輝瑞、默克、阿斯利康、先靈葆雅和恒瑞。他們?cè)谒幬锇悬c(diǎn)選擇、CADD、AIDD、生物篩選和優(yōu)化以及DMPK方面具有豐富的經(jīng)驗(yàn)。他們共同參與促成了20 多個(gè)臨床候選分子的開發(fā),其中多個(gè)藥物(Adebrelimab、Axitinib、Crizotinib、Sunitinib、Sylatron等)已獲得 FDA 和 NMPA 的批準(zhǔn),于中美兩地上市。
必?fù)P建立了專有的計(jì)算機(jī)加速藥物發(fā)現(xiàn)整合平臺(tái)ExCEED,該平臺(tái)利用新的分子生成和優(yōu)化方法 MMPT 和計(jì)算機(jī) DMPK 模擬預(yù)測(cè)來指導(dǎo)臨床前候選分子的發(fā)現(xiàn)和開發(fā),能夠大幅拓展可探索化學(xué)空間,打破制藥專家固有思維的桎梏,從而提高藥物研發(fā)效率,獲得更優(yōu)質(zhì)的分子。公司專注于眼科、腫瘤等具備臨床未滿足需求的疾病領(lǐng)域,旨在打造全球新藥研發(fā)界的“DreamWorks”(夢(mèng)工廠),充分發(fā)揮團(tuán)隊(duì)在藥物發(fā)現(xiàn)階段的優(yōu)勢(shì),自建管線與合作授權(quán)開發(fā)(License-out or Co-development) 并行。
關(guān)于fastone云平臺(tái)在各種BIO應(yīng)用上的表現(xiàn),可以點(diǎn)擊以下應(yīng)用名稱查看:
速石科技新藥研發(fā)行業(yè)白皮書,可以戳下方查看:
新藥研發(fā)37問 │ 頂尖藥企AIDD調(diào)研
-END-
我們有個(gè)一站式新藥研發(fā)平臺(tái)
集成行業(yè)應(yīng)用與自編譯軟件
支持AlphaFold、RoseTTAFold等常用AI應(yīng)用
可視化Workflow隨心創(chuàng)建、便捷分享
提供Zinc、Drugbank等開源/自有分子庫
CADD專家團(tuán)隊(duì)全面支持
掃碼免費(fèi)試用,送200元體驗(yàn)金,入股不虧~
P封面-1024x517.png)
更多BIO電子書歡
迎掃碼關(guān)注小F(ID:iamfastone)獲取

你也許想了解具體的落地場(chǎng)景:
王者帶飛LeDock!開箱即用&一鍵定位分子庫+全流程自動(dòng)化3.5小時(shí)完成20萬分子對(duì)接
1分鐘告訴你用MOE模擬200000個(gè)分子要花多少錢
155個(gè)GPU!多云場(chǎng)景下的 Amber自由能計(jì)算
提速2920倍!用AutoDock Vina對(duì)接2800萬個(gè)分子
新藥研發(fā)平臺(tái):
國產(chǎn)調(diào)度器之光——Fsched到底有多能打?
創(chuàng)新藥研發(fā)九死一生,CADD/AIDD是答案嗎?
全球44家頂尖藥企AI輔助藥研行動(dòng)白皮書
近期重大事件:
速石科技入駐粵港澳大灣區(qū)算力調(diào)度平臺(tái),參與建設(shè)數(shù)算用一體化發(fā)展新范式
速石科技成NEXT PARK產(chǎn)業(yè)合伙人,共同打造全球領(lǐng)先的新興產(chǎn)業(yè)集群
速石科技出席ICCAD2023,新一代芯片研發(fā)平臺(tái)助力半導(dǎo)體企業(yè)縮短研發(fā)周期
速石科技與芯啟源開啟戰(zhàn)略合作,聯(lián)手打造軟硬件一體芯片研發(fā)云平臺(tái)
速石科技作為特邀服務(wù)商入駐IC PARK,合力打造集成電路產(chǎn)業(yè)新生態(tài)
速石科技成為國家“芯火”深圳雙創(chuàng)基地(平臺(tái))戰(zhàn)略合作伙伴,推動(dòng)國產(chǎn)EDA公共技術(shù)服務(wù)云平臺(tái)建設(shè)

a16z的Vijay Pande博士在上周寫的文章《AI is Too Dumb… For Now》,同樣認(rèn)為現(xiàn)階段的AI還是太“笨”了。如果人工智能不能變得比現(xiàn)在“聰明”很多,它在生物領(lǐng)域的潛力將是有限的。
Vijay Pande博士,a16z普通合伙人,主要專注于生物制藥和醫(yī)療領(lǐng)域的投資。
此前,Vijay是斯坦福大學(xué)的 Henry Dreyfus 化學(xué)教授,結(jié)構(gòu)生物學(xué)和計(jì)算機(jī)科學(xué)教授,開創(chuàng)并一直在推動(dòng)計(jì)算機(jī)科學(xué)技術(shù)在醫(yī)學(xué)和生物學(xué)領(lǐng)域的應(yīng)用。他擁有300多篇出版物,兩項(xiàng)專利,兩種新型候選藥物。
那么,如果想要讓AI更加“聰明”,數(shù)據(jù)上,算法上,具體應(yīng)該怎么做呢?
用“AI inside”替代“Intel inside”,對(duì)企業(yè)來說又意味著什么?
我們看看他怎么說的:
為了證明AI在生物領(lǐng)域的應(yīng)用價(jià)值,我們走了很長一段路。
2018年,我還在《紐約時(shí)報(bào)》上爭辯:考慮到醫(yī)生的大腦很大程度更是黑匣子的前提下,圍繞醫(yī)學(xué)中人工智能“黑匣子”的恐懼到底有多不合理,以及未來的障礙和機(jī)會(huì)可能在哪里。
(注:這個(gè)爭辯背景是,有人提出沒有人知道那些高級(jí)AI算法到底是怎么學(xué)習(xí)的,過程過于黑箱,令人害怕。而Vijay說其實(shí)人類做決策很多時(shí)候是出于直覺,也不一定能說清背后的邏輯推理過程,本質(zhì)上是個(gè)更大的黑箱。)
今天,已經(jīng)有大量證據(jù)表明AI能掀起醫(yī)療和生命科學(xué)領(lǐng)域的革命(更不用說其他領(lǐng)域),甚至在一度被認(rèn)為過于復(fù)雜而無法通過算法處理的一系列任務(wù)上表現(xiàn)得超越人類。
但是,盡管有了這些證據(jù),現(xiàn)實(shí)中的現(xiàn)實(shí)是:如果人工智能不能變得比現(xiàn)在更智能,它在生物領(lǐng)域的潛力將是有限的。
AI可以被訓(xùn)練(很像狗),但不能真正理解;它可以玩游戲,但僅限于已知規(guī)則;總之,它無法超越訓(xùn)練本身。
拿識(shí)別與致病蛋白質(zhì)結(jié)合的小分子為例,人工智能能夠超出人類能力地加速和擴(kuò)大藥物發(fā)現(xiàn)范圍,它必須從給定的訓(xùn)練數(shù)據(jù)中推斷出物理規(guī)律(比如原子可以堆積多近)、化學(xué)規(guī)律(比如不同化學(xué)鍵的強(qiáng)度)和生物學(xué)規(guī)律(比如蛋白質(zhì)口袋的靈活性)。但如果在任何方向上數(shù)據(jù)量過小,就會(huì)導(dǎo)致毫無意義的結(jié)果。 哈佛大學(xué)醫(yī)學(xué)院使用自研的VirtualFlow云平臺(tái)調(diào)用16萬核CPU對(duì)接10億分子花了15小時(shí):《15小時(shí)虛擬篩選10億分子,《Nature》+HMS驗(yàn)證云端新藥研發(fā)未來 - 速石科技BLOG (m.jf-health.com) 》

需要明確的是:我們所討論的不是一些類似于人類的科幻人工智能概念,也不是只有生物學(xué)才需要面對(duì)的“笨”人工智能挑戰(zhàn)。但是,由于需要大量行業(yè)專業(yè)知識(shí)才能理解問題的根源和提出可能的解決方案,在生物和醫(yī)療領(lǐng)域最能感受到依賴于這些樸素算法帶來的影響。
如果我們想在生物學(xué)和醫(yī)療領(lǐng)域更有意義地應(yīng)用人工智能,并取得真正的進(jìn)步,我們需要能夠創(chuàng)建具備行業(yè)專業(yè)知識(shí)的更“聰明”的AI算法。
那么,怎么才能做到呢?
對(duì)這個(gè)領(lǐng)域的玩家意味著什么?
房地產(chǎn)行業(yè)的至理名言是“l(fā)ocation,location,location”,而在人工智能領(lǐng)域,永遠(yuǎn)是“數(shù)據(jù),數(shù)據(jù),數(shù)據(jù)”。
然而,現(xiàn)在的數(shù)據(jù)不太適合AI在生物學(xué)中的實(shí)際應(yīng)用。探索這些數(shù)據(jù)可以得到一些零散的信息,但沒法得出普適性的生物學(xué)洞察。而且,這些數(shù)據(jù)也缺乏對(duì)AI學(xué)習(xí)內(nèi)容和方向上的控制,無法避免數(shù)據(jù)缺陷。
為了讓人工智能在生物和醫(yī)療領(lǐng)域得到更實(shí)際和更廣泛地應(yīng)用,需要通過自動(dòng)化的方式生成數(shù)據(jù)。自動(dòng)化的好處在于:更系統(tǒng)化,更可重復(fù),不受人類情感約束,比如過于重復(fù)過于無聊。
但更關(guān)鍵的點(diǎn)在于如何設(shè)計(jì)實(shí)驗(yàn),需要在一開始就有針對(duì)性地為AI提供數(shù)據(jù),從而確保更高質(zhì)量的數(shù)據(jù),規(guī)避數(shù)據(jù)缺陷。AI應(yīng)該在開始數(shù)據(jù)收集之前就介入,這樣能更好地進(jìn)行實(shí)驗(yàn)設(shè)計(jì),確定實(shí)驗(yàn)路線。但很多時(shí)候,AI往往是在實(shí)驗(yàn)快要結(jié)束的時(shí)候被硬塞進(jìn)來的。
這跟科學(xué)家們之前受過的訓(xùn)練完全不同,以前的實(shí)驗(yàn)?zāi)繕?biāo)往往是驗(yàn)證一個(gè)特定假設(shè),而現(xiàn)在因?yàn)?strong>AI極大地?cái)U(kuò)展了可能性,為我們開啟了新世界的大門,讓我們可以擁抱那些我們不知道我們不知道的現(xiàn)實(shí)。
還是拿識(shí)別與靶標(biāo)蛋白質(zhì)結(jié)合的小分子為例(在初創(chuàng)公司和制藥企業(yè)中越來越常用的應(yīng)用場(chǎng)景):
一方面,AI可以變得特別強(qiáng)大,尤其是當(dāng)結(jié)果信息可以匯總,加強(qiáng)原來的數(shù)據(jù),開始新一輪學(xué)習(xí);
另一方面,AI可能會(huì)選擇一些違反科學(xué)家直覺的分子。以前,藥物化學(xué)家會(huì)根據(jù)經(jīng)驗(yàn),對(duì)哪些修改會(huì)提高親和力和選擇性下一系列賭注,通常會(huì)排除他們“知道”行不通的選擇。而除了需要在計(jì)算機(jī)上進(jìn)行大量天文數(shù)字模擬計(jì)算之外,AI不需要排除任何可能的修改,從而幫助藥物化學(xué)家擴(kuò)大探索范圍,選擇應(yīng)該制造和測(cè)試的分子。
這里就有一個(gè)虛擬篩選海量分子的案例,我們調(diào)用了10萬核CPU資源,花了15小時(shí)搞定了2800萬個(gè)分子:《生信云實(shí)證Vol. 生信分析上云案例, AutoDock Vina分子對(duì)接虛擬篩選 (m.jf-health.com)

這就是人工智能的力量——超越人類所能做的。當(dāng)然,前提是它是“聰明”的,而不是“笨”的。
除了更高質(zhì)量的數(shù)據(jù),我們顯然還需要更優(yōu)秀的算法。
學(xué)彈吉他是件有挑戰(zhàn)性的事情,但對(duì)于會(huì)彈鋼琴的人來說則要容易得多(因?yàn)樗麄円呀?jīng)會(huì)看樂譜、操作一種樂器以及對(duì)音高和音調(diào)有敏感性)。我們可以將學(xué)鋼琴當(dāng)成學(xué)吉他的“預(yù)訓(xùn)練”。而在生物領(lǐng)域,預(yù)訓(xùn)練看起來像是一種醫(yī)學(xué)轉(zhuǎn)錄算法,在使用醫(yī)學(xué)術(shù)語和分類學(xué)進(jìn)行訓(xùn)練之前,先使用英語語言和語法進(jìn)行訓(xùn)練。預(yù)訓(xùn)練為AI提供了大量練習(xí),教會(huì)它有關(guān)概念之間的關(guān)系,并且具有一些明顯可見的好處,比如加快以更少輸入實(shí)現(xiàn)更高準(zhǔn)確度這個(gè)過程。預(yù)訓(xùn)練的缺點(diǎn)是它仍然依賴于AI根據(jù)已知數(shù)據(jù)發(fā)現(xiàn)和推斷已知規(guī)則。
另一種方案是把行業(yè)專業(yè)知識(shí)直接編進(jìn)算法里。這里的關(guān)鍵是以一種足夠通用的方式表示數(shù)據(jù),讓它可以處理所有不同的排列組合。例如,在自然語言處理中,樸素AI以像素的形式輸入數(shù)據(jù),然后將其翻譯為字母、單詞和句子等。使用更智能的編碼可以將文本顯示為字母,這樣可以大大減少訓(xùn)練數(shù)據(jù)量,為數(shù)據(jù)貧乏的環(huán)境和更可預(yù)測(cè)的算法打開大門。在生物中,這可能意味著不再以體素(3D像素)的格式向AI描述分子,而是從包含了化學(xué)鍵信息的圖形開始,這意味著更大的化學(xué)空間。 讓數(shù)據(jù)表示包含更多目標(biāo)信息是棘手的,必須經(jīng)過深思熟慮,因?yàn)樗赡茏兊梅浅G宄踩菀谆蚍疵?,變得更加?fù)雜難懂。
當(dāng)算法從一開始就面向某個(gè)特定生物應(yīng)用進(jìn)行設(shè)計(jì)時(shí),它們也將變得更智能,同時(shí)能獲得行業(yè)專業(yè)知識(shí)。生物領(lǐng)域使用的很多AI技術(shù)都是直接從非生物應(yīng)用中搬過來的;放射學(xué)中的算法與用于基本圖像識(shí)別的神經(jīng)網(wǎng)絡(luò)類型是一樣的。
現(xiàn)在我們開始看到了針對(duì)生物學(xué)問題設(shè)計(jì)的算法和訓(xùn)練的出現(xiàn),像自監(jiān)督算法的變體,它們從通用對(duì)應(yīng)物開始,但結(jié)合了生物學(xué)見解來幫助學(xué)習(xí)。例如,了解細(xì)胞自然特征(染色質(zhì)、細(xì)胞器等)的細(xì)胞成像算法可以讓我們更自然地使用自監(jiān)督方法。這是因?yàn)閿?shù)據(jù)更加一致(所有類型都相同,全都是細(xì)胞成像),并且圖像中的元素在沒有高級(jí)機(jī)器學(xué)習(xí)的情況下是眾所周知的(因?yàn)槲覀兞私饧?xì)胞的基本生物學(xué))。這也將帶來更好的整體表現(xiàn),并降低訓(xùn)練數(shù)據(jù)量需求。
最終,當(dāng)算法與特定行業(yè)的計(jì)算方法成功融合時(shí),它們將變得更智能,并提高適用性。
以分子動(dòng)力學(xué)模擬為例,這是一種可以對(duì)分子物理和化學(xué)的許多方面進(jìn)行編碼的強(qiáng)大計(jì)算方法,但它仍然依賴于以臨時(shí)、有偏見和依賴于人類判斷的方式完成的參數(shù)和訓(xùn)練。通過將AI融入這些模擬計(jì)算中,可以使參數(shù)選擇更加穩(wěn)健和可重復(fù),帶來方法的整體改進(jìn)。
在《生信云實(shí)證Vol.6:155個(gè)GPU!多云場(chǎng)景下的Amber自由能計(jì)算 - 速石科技BLOG (m.jf-health.com)》中,我們調(diào)用155個(gè)GPU進(jìn)行基于分子動(dòng)力學(xué)模擬的煉金術(shù)自由能計(jì)算。

今天,我們?cè)诘鞍踪|(zhì)、細(xì)胞和器官水平上看到了這樣的組合。
未來,我們將基于AI模擬整個(gè)生物體。
綜上所述,所有這些都導(dǎo)致人工智能的“智能”發(fā)生翻天覆地的變化——從基于任務(wù)的簡單訓(xùn)練(類似于訓(xùn)練狗的特定技巧)轉(zhuǎn)變?yōu)樾枰儆?xùn)練的更通用的智能,更自然地超出訓(xùn)練本身(在科學(xué)范圍內(nèi)),實(shí)現(xiàn)更準(zhǔn)確的預(yù)測(cè)。
把“Intel inside”換成“AI inside”,對(duì)創(chuàng)業(yè)公司和老牌企業(yè)意味著什么?生物領(lǐng)域并不是第一個(gè)正在適應(yīng)這種大轉(zhuǎn)變的行業(yè)。從華爾街到麥迪遜大道再到硅谷,每個(gè)人都在適應(yīng)AI,我們能看到文化障礙與技術(shù)障礙幾乎一樣高。
對(duì)于一家生物公司來說,更實(shí)際和更廣泛地采用AI意味著將人工智能以及懂人工智能技術(shù)的人員將融入每個(gè)團(tuán)隊(duì),而不是一個(gè)通常在最后才被叫過來了解其他人做了些什么的獨(dú)立AI小組。這可能意味著企業(yè)需要配備在人工智能和生物領(lǐng)域“雙語”的人員,以及建立一種重視雙方的文化:渴望計(jì)算能力的生物學(xué)家和深深植根于生物領(lǐng)域的計(jì)算科學(xué)家。
眾所周知,改變根深蒂固的文化非常困難。
初創(chuàng)公司在這方面有明顯優(yōu)勢(shì),可以從0開始構(gòu)建基于AI原生的團(tuán)隊(duì)和思維方式。對(duì)于老牌企業(yè)來說,與其他創(chuàng)新一樣,領(lǐng)先的永遠(yuǎn)是那些能夠調(diào)整傳統(tǒng)模式的公司。當(dāng)然,他們也可以選擇建立全新的以AI為中心的團(tuán)隊(duì),讓這些團(tuán)隊(duì)承擔(dān)越來越多的責(zé)任,從內(nèi)部進(jìn)行瓦解。

一種新的人才即將到來。
過去,“藥物獵人”是藥物化學(xué)家。但是隨著可以幫助完成機(jī)械重復(fù)工作和分子合成的CRO公司的興起,現(xiàn)在誰制造分子遠(yuǎn)不如誰設(shè)計(jì)它們重要。隨著“量化分析師”的出現(xiàn),我們看到金融領(lǐng)域就有類似的轉(zhuǎn)變,這些人更多擁有計(jì)算技能而不是對(duì)該領(lǐng)域?qū)I(yè)知識(shí)。同樣的,這種轉(zhuǎn)變也將發(fā)生在化學(xué)和生物實(shí)驗(yàn)室里。
到目前為止,這些生物“量化分析師”必須依賴大數(shù)據(jù)來支持他們的統(tǒng)計(jì)方法,由于成本和復(fù)雜性,現(xiàn)在還很難落地。但未來的智能算法能將他們的技能應(yīng)用于小數(shù)據(jù)——從而應(yīng)用到公司的所有領(lǐng)域。大數(shù)據(jù)是基礎(chǔ)設(shè)施和管線問題;小數(shù)據(jù)永遠(yuǎn)是個(gè)智力問題,通過智能算法來解決,而不僅僅是靠聰明人。
正是這種能處理小數(shù)據(jù)能力的智能算法,將使AI無處不在。
與之前的其他重大技術(shù)轉(zhuǎn)變一樣,從樸素到智能 AI 的轉(zhuǎn)變將重塑整個(gè)組織結(jié)構(gòu),而不僅僅是與其最接近的功能。
為什么?因?yàn)楦斆鞯娜斯ぶ悄芸梢詭椭卮鹪?jīng)只屬于精明的人類判斷領(lǐng)域的關(guān)鍵業(yè)務(wù)問題。
太多人將人工智能視為生物制藥進(jìn)步歷史長河中的下一個(gè)階段。
人們很容易把AI當(dāng)成又一項(xiàng)技術(shù)進(jìn)步,然而,這是一個(gè)過于狹隘的觀點(diǎn),因?yàn)?strong>與其他技術(shù)不同,人工智能——尤其是這些智能算法——不僅是解決一個(gè)問題的工具,而且是可以應(yīng)用于所有問題的工具。真正的力量不僅在于將其用作單一工具,還在于使用AI放大和整合公司中的所有工具和技術(shù)。
它不僅僅只是擺在桌面上的一個(gè)新盒子,而是我們?cè)诿總€(gè)角色中的學(xué)徒和盟友。隨著人工智能無處不在,它將變得更聰明,我們也是。
我們基于全球44家頂尖藥企(包括3家中國藥企)在利用AI輔助藥物研發(fā)上的行動(dòng)(共涉及55家AI初創(chuàng)企業(yè)、12家IT-云服務(wù)商、7所高校)制作了《【2021年】全球44家頂尖要求AI輔助藥物研發(fā)行動(dòng)白皮書》,有興趣的可掃碼添加小F微信獲取。

我們有個(gè)為應(yīng)用定義的云計(jì)算平臺(tái)
集成多種EDA應(yīng)用,大量任務(wù)多節(jié)點(diǎn)并行
應(yīng)對(duì)短時(shí)間爆發(fā)性需求,連網(wǎng)即用
跑任務(wù)快,原來幾個(gè)月甚至幾年,現(xiàn)在只需幾小時(shí)
5分鐘快速上手,拖拉點(diǎn)選可視化界面,無需代碼
支持高級(jí)用戶直接在云端創(chuàng)建集群
掃碼免費(fèi)試用,送200元體驗(yàn)金,入股不虧~
-blog-1024x516.png)
更多電子書歡迎掃碼關(guān)注小F(ID:imfastone)獲取
-764x1024.jpg)
你也許想了解具體的落地場(chǎng)景:
LS-DYNA求解效率深度測(cè)評(píng) │ 六種規(guī)模,本地VS云端5種不同硬件配置
揭秘20000個(gè)VCS任務(wù)背后的“搬桌子”系列故事
155個(gè)GPU!多云場(chǎng)景下的Amber自由能計(jì)算
怎么把需要45天的突發(fā)性Fluent仿真計(jì)算縮短到4天之內(nèi)?
5000核大規(guī)模OPC上云,效率提升53倍
提速2920倍!用AutoDock Vina對(duì)接2800萬個(gè)分子
從4天到1.75小時(shí),如何讓Bladed仿真效率提升55倍?
從30天到17小時(shí),如何讓HSPICE仿真效率提升42倍?
關(guān)于為應(yīng)用定義的云平臺(tái):
2小時(shí),賬單47萬!「Milkie Way公司破產(chǎn)未遂事件」復(fù)盤分析
高情商:人類世界模擬器是真的!低情商:你是假的……
【2021版】全球44家頂尖藥企AI輔助藥物研發(fā)行動(dòng)白皮書
EDA云平臺(tái)49問
國內(nèi)超算發(fā)展近40年,終于遇到了一個(gè)像樣的對(duì)手
幫助CXO解惑上云成本的迷思,看這篇就夠了
花費(fèi)4小時(shí)5500美元,速石科技躋身全球超算TOP500
