AI又立功了。
這次一項(xiàng)新的AI機(jī)器學(xué)習(xí)算法「Ikarus」,可破解癌細(xì)胞和正常細(xì)胞的基因特征差別。
這項(xiàng)研究由MDC生物信息學(xué)家Altuna Akalin團(tuán)隊(duì)完成,并發(fā)表在Nature子刊「Genome Biology」上。
另外,負(fù)責(zé)本次研究的機(jī)構(gòu)MDC(Max Delbrück center)還是德國(guó)四大研究機(jī)構(gòu)之一的亥姆霍茲聯(lián)合會(huì)的16個(gè)研究中心之一。
既然這么大來(lái)頭,那這份研究為啥重磅?
從浩如煙海的數(shù)據(jù)集里篩選出一種「共通的特征」,人類肯定比不上AI。
而要將癌細(xì)胞和正常細(xì)胞區(qū)分開(kāi)來(lái),就需要篩選出它們之間的共通特征。
這次MDC的研究團(tuán)隊(duì)開(kāi)發(fā)的Ikarus發(fā)現(xiàn)了腫瘤細(xì)胞中的共通模式(Pattern),它由一系列基因組特征組成,并且常見(jiàn)于各種類型的癌癥。
另外,算法還檢測(cè)到了從未和癌癥掛鉤的基因種類。
于是研究團(tuán)隊(duì)提出了一個(gè)簡(jiǎn)單的問(wèn)題:
是否有可能制作一個(gè)分類器,將腫瘤細(xì)胞與多種癌癥類型的正常細(xì)胞正確區(qū)分開(kāi)來(lái)?
于是就有了Ikarus的誕生。它囊括兩個(gè)步驟:
1、通過(guò)整合多個(gè)經(jīng)過(guò)專業(yè)注釋的單細(xì)胞數(shù)據(jù)集,以基因集的形式發(fā)現(xiàn)全面的腫瘤細(xì)胞特征;
2、訓(xùn)練穩(wěn)健的邏輯回歸分類器以嚴(yán)格區(qū)分腫瘤和正常細(xì)胞,然后使用定制的細(xì)胞-細(xì)胞網(wǎng)絡(luò)進(jìn)行細(xì)胞標(biāo)簽的基于網(wǎng)絡(luò)的傳播。
團(tuán)隊(duì)負(fù)責(zé)人Altuna Akalin說(shuō):
為開(kāi)發(fā)一種強(qiáng)大、靈敏和可重復(fù)的計(jì)算機(jī)腫瘤細(xì)胞分選儀,我們已經(jīng)在使用不同測(cè)序技術(shù)獲得的各種癌癥類型的多個(gè)單細(xì)胞數(shù)據(jù)集上測(cè)試了Ikarus,以確定它適用于不同實(shí)驗(yàn)環(huán)境。
驚人的成功率
該論文的第一作者Jan Dohmen表示,在專家已經(jīng)清楚地區(qū)分健康細(xì)胞和癌細(xì)胞的情況下,獲得合適的訓(xùn)練數(shù)據(jù)是一項(xiàng)重大挑戰(zhàn)。
單細(xì)胞測(cè)序數(shù)據(jù)集通常很冗雜。
這意味著它們包含的關(guān)于單個(gè)細(xì)胞分子特征的信息不是很精確,因?yàn)樵诿總€(gè)細(xì)胞中檢測(cè)到不同數(shù)量的基因,或者因?yàn)闃颖镜奶幚矸绞讲⒉豢偸窍嗤?/p>
Dohmen和該研究的聯(lián)合負(fù)責(zé)人Vedran Franke博士說(shuō),
我們篩選了無(wú)數(shù)出版物并聯(lián)系了相當(dāng)多的研究小組,以獲得足夠的數(shù)據(jù)集。團(tuán)隊(duì)最終選擇來(lái)自肺癌和結(jié)直腸癌細(xì)胞的數(shù)據(jù)來(lái)訓(xùn)練算法,然后再將其應(yīng)用于其他類型腫瘤的數(shù)據(jù)集。
在訓(xùn)練階段,Ikarus需要找到一個(gè)「特征基因列表」,然后將其用于對(duì)細(xì)胞進(jìn)行分類。
我們嘗試并改進(jìn)了各種方法,Ikarus最終使用兩個(gè)列表:一個(gè)用于癌癥基因,另一個(gè)用于來(lái)自其他細(xì)胞的基因,弗蘭克解釋道。
經(jīng)過(guò)訓(xùn)練之后,該算法就能夠區(qū)分其他類型癌癥中的健康細(xì)胞和腫瘤細(xì)胞,比如來(lái)自肝癌或神經(jīng)母細(xì)胞瘤患者的組織樣本。
而在其他樣本中的結(jié)果令人雀躍,成功率出奇地高,最高可達(dá)99%。
「我們沒(méi)想到會(huì)有一個(gè)共同的特征可以如此精確地定義不同類型癌癥的腫瘤細(xì)胞」,Akalin說(shuō)。
「但我們?nèi)匀徊荒苷f(shuō)這種方法是否適用于所有類型的癌癥」,Dohmen補(bǔ)充道。
不只是癌細(xì)胞區(qū)分
為了將Ikarus變成一種可靠的癌癥診斷工具,研究人員現(xiàn)在希望在其他類型的腫瘤上對(duì)其進(jìn)行測(cè)試。
在最初的測(cè)試中,Ikarus已證明該方法還可以將其他類型(和某些亞型)的細(xì)胞與腫瘤細(xì)胞區(qū)分開(kāi)來(lái),不僅限于腫瘤細(xì)胞檢測(cè)。
它可用于檢測(cè)任何細(xì)胞狀態(tài),比如細(xì)胞類型,唯一的要求是細(xì)胞狀態(tài)至少存在于兩個(gè)獨(dú)立的實(shí)驗(yàn)中。
Akalin說(shuō):
我們希望使這種方法更加全面,進(jìn)一步發(fā)展它,以便它可以區(qū)分活檢中所有可能的細(xì)胞類型。
在空間測(cè)序數(shù)據(jù)集上應(yīng)用自動(dòng)腫瘤分類可以直接注釋組織學(xué)樣本,從而促進(jìn)自動(dòng)化數(shù)字病理學(xué)。
在醫(yī)院,病理學(xué)家通常只在顯微鏡下檢查腫瘤的組織樣本,以識(shí)別各種細(xì)胞類型。這是一項(xiàng)費(fèi)時(shí)費(fèi)力的工作。
有了Ikarus,這一步驟有朝一日可能成為一個(gè)完全自動(dòng)化的過(guò)程。
另外,Akalin指出,這些數(shù)據(jù)可用于得出關(guān)于腫瘤直接環(huán)境的結(jié)論。這可以幫助醫(yī)生選擇最好的療法。對(duì)于癌組織和微環(huán)境的構(gòu)成,通常表明某種治療或藥物是否有效。
另外,AI也可能有助于開(kāi)發(fā)新的藥物。
「Ikarus讓我們能夠識(shí)別出可能導(dǎo)致癌癥的基因,然后可以使用新的治療劑來(lái)靶向這些分子結(jié)構(gòu)」Akalin說(shuō)。