亚洲高清一区二区三区-亚洲高清一区二区三区四区-亚洲高清中文字幕一区二区三区-亚洲光棍天堂-成人免费视频一区-成人免费视频一区二区三区

當前滾動:《自然》子刊:中國團隊首創新算法,讓細胞與計算機直接“對話”

2022-09-29 20:50:14

科技日報記者 張佳星

細胞內有數以億計的堿基、表達程序以及運行策略,而且各不相同。單細胞測序技術可解讀單個細胞里的這些信息,但人工干預多、過度依賴人為選定的標記基因使得單細胞測序技術對細胞的注釋穩定性較低。可以理解為,同一類細胞用不同的模型解析,結果不同,對一些特殊細胞“公說公有理婆說婆有理”的分析結果往往難以得到廣泛認可。

解決上述問題的關鍵是減少人工干預。9月27日,《自然》子刊《自然機器智能》刊載了我國團隊首創的單細胞轉錄組細胞類型注釋算法。該算法可以將細胞中的信息轉變為計算機能夠理解和學習的“語言”,讓計算機和細胞直接“對話”,減少人為因素影響。


(資料圖)

細分細胞亞型,準確度提升7%

據算法研發團隊騰訊人工智能實驗室方面介紹,新算法,即scBERT模型,對最難分類的外周血單核細胞進行了分類,結果顯示人工智能能夠做到精準標注、注釋極其難區分的兩類細胞,例如能夠準確區分CD8+細胞毒性T細胞和CD8/CD45RA+T細胞。研發團隊成員告訴科技日報記者,“在極具挑戰的外周血細胞亞型細分任務上,新算法相較現有最優方法的70%準確度再提升了7%。”

此外,團隊還在已有的單細胞數據集中,將新算法的性能與其他算法進行了對比,這些數據集涵蓋17個主要器官或組織、包含50多個細胞類型、超過50萬個細胞。論文中顯示,對于每個數據集,團隊均采用了五倍交叉驗證策略,以避免隨機結果對結論的影響。結果顯示,新算法對大多數數據集的分析結果在精確度和綜合得分方面均表現優異。

研發人員表示,針對不同的單細胞分析任務和數據集解析任務,都會有不同的算法成為最佳算法,也就是說有的算法擅長某幾類任務,有的算法擅長另幾類任務,無法通用,而基于scBERT模型的新算法則表現了很強的通用性,在全部的數據集解析任務中均被列為最佳算法。

跨界使用“工具”,讓機器讀懂細胞語言

那么,新算法為什么能讓機器通過學習讀懂細胞中的復制、翻譯、轉錄的語言呢?

相關研發人員解釋,“我們首次將‘transformer’運用到單細胞轉錄組測序數據分析領域。 transformer這種架構從發明以來一直被用在自然語言處理領域,用于進行諸如機器翻譯類的工作,成為比較通用的一個框架組件,但我們將它運用到了細胞注釋領域。”

得益于對計算機處理人類語言和單細胞信息之間的共性理解,團隊將已經成熟的人工智能架構進行創新性地“跨界”使用,大大提升了細粒度單細胞分子圖譜的構建效率。

“跨界工具”讓新模型賦予計算機讀懂細胞活動的基礎,但要想讀得準、讀得透、讀得精,還需要基于大規模的語言預訓練。

論文顯示,為了解決來自不同項目、測序平臺的數據難以互通有無的難題,“scBERT” 模型在預訓練數據上沒有做任何的降維或篩選處理,最大程度上保留數據本身的特性和信息,并學習了包含不同實驗來源、批次和組織類型的單細胞數據,以保證模型理解“通用”的知識,不僅捕獲單個基因的表達信息還理解基因間的協作。

據介紹,該技術可以給生物體中每個細胞都印上專屬“身份證”,“單細胞身份證”的應用不僅可以助力疾病致病機制分析、藥物靶點發現等基礎研究,也可以在臨床上高精度地“刻畫”腫瘤微環境,推動精準治療的進一步完善。

標簽: 自然子刊

關閉
新聞速遞
主站蜘蛛池模板: 97免费视频免费视频 | 两个人看的www视频中文字幕 | 欧美亚洲欧美区 | 高清欧美日本视频免费观看 | 国内精品久久久久影院蜜芽 | 亚洲地址一地址二地址三 | 欧洲一级做a爱在线观看 | 日本免费全黄一级裸片视频 | freexxxx高清中国hd| 在线免费黄网 | a4yy欧美一区二区三区 | 国内精品免费一区二区观看 | 最近更新2019中文国语字幕 | 无遮挡一级毛片私人影院 | 午夜精品福利影院 | 成人高清毛片a | 国产成人综合在线 | 一级成人 | 99精选视频| 天天干干干 | 蜜臀91精品国产高清在线观看 | 丝袜美腿中文字幕 | 日韩亚洲一区中文字幕 | 日韩dv| 91高清国产经典在线观看 | 欧美第一页草草影院 | 一级做a爰片性色毛片黄书 一级做a爰片性色毛片16美国 | 欧美白人黑人xxxx猛交 | 成人精品免费网站 | 免费黄色大片视频 | 国产乱人免费视频 | 免费麻豆国产黄网站在线观看 | 日本午夜精品 | 欧美中文字幕一区二区三区 | 午夜精品亚洲 | 亚洲一区二区三区四区在线 | 日韩三级黄 | 欧美高清在线精品一区二区不卡 | 日本不卡视频一区二区 | 在线视频一区二区日韩国产 | 日韩亚洲视频 |