竺立哲教授團(tuán)隊(duì)在著名期刊 J. Chem. Theory Comput. 發(fā)表封面文章
近日,香港中文大學(xué)(深圳)生命與健康科學(xué)學(xué)院、瓦謝爾計(jì)算生物研究院竺立哲教授研究組在知名國(guó)際期刊Journal of Chemical Theory and Computation發(fā)表封面文章 “Assessing the performance of Traveling-salesman based Automated Path Searching (TAPS) on complex biomolecular systems”,展示了自研的自動(dòng)化路徑搜索算法TAPS的易用性及整體效率?;诖?,該方法有望成為研究復(fù)雜生物大分子功能性構(gòu)象變化機(jī)制的通用方法,并在藥物研發(fā)、蛋白質(zhì)工程等領(lǐng)域發(fā)揮重要作用。
香港中文大學(xué)(深圳)生命與健康科學(xué)學(xué)院為第一單位,生命與健康科學(xué)學(xué)院瓦謝爾計(jì)算生物研究院席昆博士為論文的第一作者,竺立哲教授為通訊作者,另有胡禎全博士和三位香港中文大學(xué)(深圳)本科生參與此項(xiàng)工作。
?
點(diǎn)擊圖片,閱讀全文
?
01?研究簡(jiǎn)介
生物大分子的功能實(shí)現(xiàn)往往伴隨著重要的結(jié)構(gòu)轉(zhuǎn)變,但現(xiàn)有的實(shí)驗(yàn)方法很難獲取此轉(zhuǎn)變過(guò)程的完整細(xì)節(jié),需借助分子動(dòng)力學(xué)模擬予以呈現(xiàn)。然而,受生物大分子本身的復(fù)雜性及計(jì)算資源所限,普通分子動(dòng)力學(xué)模擬的長(zhǎng)度只能達(dá)到微秒級(jí)別,遠(yuǎn)低于生物大分子功能性構(gòu)象變化所需毫秒級(jí)以上的時(shí)間尺度,無(wú)法直接被用于觀(guān)測(cè)該過(guò)程。為此,人們研發(fā)了各種算法,期以較小的代價(jià),獲得可準(zhǔn)確描述這些構(gòu)象變化的最大概率(最小自由能)路徑。但這些算法大都非常依賴(lài)于事先對(duì)變化過(guò)程機(jī)制的猜測(cè),自動(dòng)化程度和整體效率較低(見(jiàn)圖1)。
?
這些方法通常先通過(guò)各種增強(qiáng)采樣算法得到一條猜測(cè)的初始路徑,而后基于對(duì)機(jī)理的猜測(cè)來(lái)選定具有物理意義的坐標(biāo)變量(Collective Variable,CV),在此變量空間內(nèi)進(jìn)行路徑搜索,找到初始猜測(cè)路徑附近的最小自由能路徑(圖1B)。上述傳統(tǒng)路徑搜索方法的整體效率主要受限于兩個(gè)因素:(a) 其路徑上節(jié)點(diǎn)周?chē)牟蓸油ǔJ蔷植康模瑢?dǎo)致路徑向最小自由能路徑的演化非常緩慢;(b) 路徑本身定義在先驗(yàn)選擇的低維坐標(biāo)變量 (CV) 空間,嚴(yán)重依賴(lài)于對(duì)系統(tǒng)的先驗(yàn)性知識(shí),而這對(duì)于高維度的復(fù)雜生物大分子系統(tǒng)異常困難。
?

?
TAPS方法則直擊這些痛點(diǎn)。首先,TAPS采用非局部采樣,可進(jìn)行垂直于猜測(cè)路徑的快速搜索,并用旅行商求解器解決因此帶來(lái)的路徑節(jié)點(diǎn)順序重排問(wèn)題,提高了搜索效率(圖1A)。另外,TAPS實(shí)現(xiàn)了高度自動(dòng)化,即無(wú)需進(jìn)行預(yù)選擇的靜態(tài)集體變量空間定義,而是通過(guò)定義描述高維構(gòu)象間的距離(RMSD),來(lái)計(jì)算得到路徑變量 (Path Collective Variable,PCV),進(jìn)而在此高維空間搜索得到最小自由能路徑,而后再依據(jù)所得高維路徑準(zhǔn)確提取與結(jié)構(gòu)變化機(jī)制關(guān)聯(lián)緊密的坐標(biāo)信息(圖1B),從而最大限度地將對(duì)機(jī)制的猜測(cè)和解釋從搜索采樣過(guò)程中剝離出來(lái)。
本研究基于Python3,實(shí)現(xiàn)了TAPS采樣過(guò)程的并行化和GPU加速(https://github.com/xikun2020/TAPS),新增了可快速評(píng)估路徑搜索是否收斂的計(jì)算模塊,增加了方法的通用性與易用性?;诖似脚_(tái),本研究全面揭示了三種蛋白質(zhì)的重要功能性構(gòu)象變化機(jī)制,即T4 Lysozyme L99A由基態(tài)(State G)轉(zhuǎn)變?yōu)榧せ顟B(tài)(State E)、激酶分子MEK1從Loop-Out狀態(tài)到達(dá)Loop-In狀態(tài)以及對(duì)溫度敏感的淋巴趨化因子Lymphotactin(Ltn)由Ltn40到Ltn10的轉(zhuǎn)變機(jī)制。其中,尤以L(fǎng)tn體系涉及大量二級(jí)結(jié)構(gòu)變化最為復(fù)雜,但TAPS只需126ns的采樣總量便獲得了Ltn40至Ltn10的最小自由能路徑,揭示了此轉(zhuǎn)變中結(jié)構(gòu)去折疊與再折疊的具體機(jī)制,獲取了關(guān)鍵中間態(tài)和過(guò)渡態(tài)結(jié)構(gòu)(見(jiàn)圖2)。
鑒于其高效自動(dòng)化的特征,TAPS算法為建立一套研究復(fù)雜生物大分子構(gòu)象變化的通用算法平臺(tái)提供了堅(jiān)實(shí)基礎(chǔ)。完善該平臺(tái)則有賴(lài)于對(duì)TAPS的進(jìn)一步優(yōu)化。首先,由于 TAPS中的路徑定義在高維空間、所含節(jié)點(diǎn)是完整的分子體系,我們還可根據(jù)所得路徑節(jié)點(diǎn)的特征,更新定義RMSD所需的原子集,在路徑搜索過(guò)程中自動(dòng)完成計(jì)算RMSD的原子集的優(yōu)化,進(jìn)一步提升自動(dòng)化程度。此外,由于生物大分子的構(gòu)象變化過(guò)程常存在多條并行路徑,如何以低成本一次性獲得多條最小自由能路徑也將是TAPS平臺(tái)下一步發(fā)展的重要課題。
?
02?項(xiàng)目主持人

竺立哲博士,現(xiàn)為香港中文大學(xué)(深圳)生命與健康科學(xué)學(xué)院與瓦謝爾計(jì)算生物研究院助理教授。竺教授畢業(yè)于阿姆斯特丹大學(xué)化學(xué)系,彼時(shí)作為瑪麗居里青年研究員,通過(guò)分子模擬手段研究蛋白質(zhì)受體異位效應(yīng)的機(jī)理,后于2012年赴香港科技大學(xué)從事博士后研究,致力于增強(qiáng)抽樣算法同馬爾可夫態(tài)模型方法的整合,至今已在國(guó)際主流期刊發(fā)表論文近30篇,總引用近400次(Google Scholar)。竺教授目前的研究興趣包括機(jī)器學(xué)習(xí)與增強(qiáng)采樣算法的融合、核酸與蛋白質(zhì)相互作用、基因編輯工具的動(dòng)力學(xué)機(jī)制、膜蛋白藥物研發(fā)等。
?
文章轉(zhuǎn)自香港中文大學(xué)(深圳)生命健康學(xué)院微信公眾號(hào),鏈接為https://mp.weixin.qq.com/s/9LZTdpQ9bJx5dj8tCs6Apw
