有史以來,計算機第一次不依靠人類的任何幫助,僅僅通過人工智能獨立發(fā)現(xiàn)了一個新的科學理論。
來自塔夫斯大學的計算和生物領域的科學家們編碼了這樣一套程序,它能夠讓計算機在面對一個新的科學問題的時候,獨立地發(fā)展出一套解釋這個問題的理論。他們選擇的是一個在生物領域里困惑科學家們120年之久的現(xiàn)象:渦蟲(Planaria)被切開之后是有能力進行再生,形成一個新的個體的。這個奇怪的現(xiàn)象很久之前就被發(fā)現(xiàn)了,但至于為什么會發(fā)生,目前還沒有明確的答案。
然而,當把這個問題交給計算機的時候,它就能通過逆向工程(reverse engineer)來找出一個能夠解釋這個過程背后機制的理論。具體的細節(jié)以及人工智能的方法被發(fā)表在最近的PLOS Computational Biology上。
研究者們表示,他們真正想要發(fā)現(xiàn)的并非一個新的器官是如何再生的,而是機體如何指導這個新生的器官長成需要的樣子和大小。這些神秘的信息就隱藏在基因之中。
"現(xiàn)在,從遺傳實驗中得到的大部分再生模型都是些充滿了箭頭的圖表,告訴你這個基因調(diào)控那個基因,這當然沒什么問題,但是,它并不能告訴你器官最終會發(fā)育成什么樣子,你也不能從這些遺傳調(diào)控通路模型中去得知這個機體最終是會長成一棵樹呢,還是一只章魚?;蛘呤亲罱K變成人類。"研究者之一的Levin這樣表示。"那些模型只是能夠告訴你再生發(fā)生的時候哪些成分是必不可少的,但它無法展示給你這個再生的過程是如何一步步發(fā)生的。"
所以,研究者想要用算法建立一個新的再生模型,它能夠告訴我們,給予生物體怎樣的刺激就能夠?qū)е乱粋€特定的成分再生。為了解決這一難題,研究者們利用進化計算的思想發(fā)展了一個算法,這個算法能夠?qū)崿F(xiàn)"自我進化",并且能夠精準預測研究人員在渦蟲再生實驗中所獲得的研究數(shù)據(jù)。他們希望通過這個算法找到一個能夠解釋所有已發(fā)表實驗數(shù)據(jù)的調(diào)控網(wǎng)絡。
那么這個調(diào)控網(wǎng)絡具體是怎樣找到的呢?
也許你已經(jīng)想到了,一開始的時候,"未進化"的隨機產(chǎn)生的調(diào)控網(wǎng)絡一般是不會產(chǎn)生任何與真實實驗相同的結果的。新的候選調(diào)控網(wǎng)絡的產(chǎn)生是結合之前已經(jīng)存在的調(diào)控網(wǎng)絡,并在此基礎上做隨機的刪減增加。所有的候選網(wǎng)絡都會在模擬試驗中進行檢測,算法會把那些通過這個候選調(diào)控網(wǎng)絡發(fā)育出來的結果和數(shù)據(jù)庫里真實的實驗數(shù)據(jù)作對比。在這個"進化"過程中,就會逐漸產(chǎn)生新的能夠解釋更多實驗數(shù)據(jù)的候選調(diào)控網(wǎng)絡。
研究者們最終把這個算法應用到由渦蟲再生的16個關鍵實驗數(shù)據(jù)所構成的數(shù)據(jù)庫中,希望找到一個能夠全面解釋渦蟲再生的調(diào)控網(wǎng)絡。42小時之后,這個算法給出了一個能夠精準模擬出16個關鍵實驗全部實驗數(shù)據(jù)的調(diào)控網(wǎng)絡模型,這個新的調(diào)控網(wǎng)絡包含了其中已知的重要調(diào)控分子以及兩個還未發(fā)現(xiàn)的蛋白。
對于這樣一個振奮人心的實驗結果,研究人員們表示:"這個項目最大的意義在于,我們所獲得是并不是一個異常復雜、無法理解的調(diào)控網(wǎng)絡,相反,結果表明人工智能是可以幫助我們來發(fā)現(xiàn)一個簡潔的、易于理解的模型。這意味著人工智能可以滲透到現(xiàn)代研究的任何一個領域,不僅僅是對實驗中產(chǎn)生的大數(shù)據(jù)進行數(shù)據(jù)挖掘,同時還可以幫助我們?nèi)ダ斫膺@些復雜數(shù)據(jù)背后的簡潔原理。"