資訊分類導航:
微信掃一掃分享
一個安靜的下午,王阿姨走進客廳,要拿什么東西。這時,突然來了一通房產推銷電話。阿姨性子直,三下兩下就把電話掐了??墒顷H上電話以后,她卻茫然地站在客廳里,忘記了自己本來要干的事情。從那以后,王阿姨一直害怕自己得了老年癡呆(即阿爾茲海默?。?,焦慮攪得她心神不寧。她一邊相信自己不是,一邊又暗暗懷疑。那么,王阿姨究竟有沒有得老年癡呆?
想要獲得一個準確答案并沒有想象中那么簡單。目前,對老年癡呆的診斷方法有以下幾種:一、使用生物標志物進行評估。常見的生物標志物有斑塊和神經原纖維纏結。二、通過磁共振成像評估神經退行性變的發展情況。這些方法雖然有利于大腦病變的早期診斷,但它們同時也要求患者具備充分的醫療資源。三、也是人們最常見到的檢查方式,是通過面對面訪談的形式進行的神經心理學檢查。在這樣的檢查中,醫生會讓患者完成一系列測試并予以評估。
然而,19年發表于《柳葉刀-神經元》的報告顯示,我國城鄉地區、各級醫院的診斷資源和水平存在明顯差異。目前僅有約10%的三級醫院設立了記憶門診和癡呆癥中心。而在沒有相應資源的醫院,認知障礙則由缺乏癡呆癥專業培訓的神經科醫生基于個人的臨床經驗進行診斷。在資源匱乏的縣級醫院里,老年癡呆的診斷更是由相關經驗更加缺乏的內科醫生診斷。上述因素都容易導致大量誤診漏診,使患者陷入不必要的困境中。
21年中國老齡協會發布的報告顯示,與醫療資源匱乏相對應的,則是中國近6%的老年癡呆患病率以及將近1510萬的老年癡呆患者[3]。中國目前亟需一個可靠且有效的診療輔助工具,從而實現對老年癡呆的早篩查、早診斷、早干預。
好消息是,一個便利的診斷方法已經出現。本月,來自波士頓大學工程學院的薩馬德·阿米尼(Samad Amini)與他的研究團隊發表了一篇文章。他們開發了一種自然語言處理(NLP)模型,能通過將訪談錄音轉換為文本的方式,有效診斷出老年癡呆的不同階段。
論文題目:
Automated detection of mild cognitive impairment and dementia from voice recordings: A natural language processing approach
DOI:https://doi.org/10.1002/alz.12721
此前,已有機器學習算法能夠從錄音里提取聲音和詞匯特征來建立診斷模型,但是,大多數的研究依賴于人工轉錄以及手動制作的聲音數據特征,耗時較長且成本高昂。阿米尼的團隊利用語音識別、聲紋分割聚類、句子編碼器等NLP技術,實現了全診斷流程的自動化,收獲了良好的診斷表現。
團隊收集了來自一項大型慢性病研究的大量醫療數據,這些數據包含了133條神經心理學檢查的錄音文件,囊括了多達1084名患者的測試信息。測評總共涵蓋8個子任務,針對語言能力、視感知技能、病前智力、抽象推理、注意力、視覺與語言短期記憶、聯想學習能力等認知功能進行測量。在預處理中,研究員首先使用谷歌語音工具(Google Speech tool)將錄音轉成文字。他們隨后微調了谷歌ALBERT-xlarge自然語言處理模型,利用一種類似命名實體識別(Named Entity Recognition)類型的方法將患者和醫師的句子進行標簽和區分。在這之后,研究者將錄音數據分成訓練集與測試集,然后使用轉錄數據以及真值標簽(ground truth label)對BERT模型進行調整和訓練,用以預測每句話所對應的測評類型。
由于訓練數據的不足,研究者利用遷移學習來捕捉句子中出現的重要特征。在預處理之后,他們使用通用句子編碼器(Universal Sentence Encoder)(一個基于Transformer架構和注意力機制的神經網絡)將患者所說的句子編碼成嵌入向量。這些嵌入向量會經過特征選擇,生成認知能力分數。隨后,認知分數和人口統計的信息會一起用來訓練分類器。一旦生成了定量數據(也就是這些編碼的句子),診斷模型系統就會使用多層感知器(Multilayer Perceptron)和邏輯回歸等機器學習技術來計算個人存在認知障礙的可能性。
將錄音數據轉化為認知評估的流程示意圖。箭頭上方和下方分別總結了每個步驟的目標及其對應的方法
在機器學習中,曲線下面積(AUC)代表了分類器區分不同類別的能力。AUC越高,模型能夠區分不同類別的能力就越強。在診斷老年癡呆上,該模型的AUC高達92.6%,而此前已有診斷模型的AUC約在80%左右。除此以外,在區分普通人與輕度認知障礙(MCI),以及MCI與老年癡呆上,該模型也分別得到了74.4%與88%的AUC。
顯然,這個基于人工智能的診斷系統暫時還不能獨當一面。首先,它對MCI的識別能力仍有待加強。由于MCI經常是老年癡呆的早期表現,對MCI的早期篩查和干預才是人們更為關注的重點。其次,它在診斷過程中仍然只能起到輔助作用,其診斷結果仍然需要醫生進行進一步的驗證和確認。不過,研究人員也認為,收集更多的縱向數據能幫助機器學習模型更敏感地捕捉到認知能力的變化,自動化工具本身也能有效減輕醫療人員操作負擔。因此,我們有理由相信,這個研究代表了一個前景良好的積極開端,而非一錘定聲的測試結果。
該研究的合著者揚尼斯·帕沙里德斯(Ioannis Paschalidis)表示,這樣的診斷工具對發展大規模自動化醫療評估至關重要。在未來,它可以發展成一個多語言、低成本、大范圍的網頁診斷工具,從而讓患者在家輕松完成遠程醫療診斷。原作者也認為,認知測評的可及性是一個全球性問題,發展出這樣的工具能夠造福千萬缺乏醫療資源的認知障礙患者。
最后,我們來回答開頭王阿姨的問題。如果在看到某個相關的物品后,你能想起來自己原來要做的事情,那么有很大幾率你還沒有癡呆。之所以會發生這樣的情況,是因為大腦的臨時內存(工作記憶容量)不夠,使這個信息暫時從思維的河流中消失了。然而,這樣的小觀察還遠不能被稱為診斷標準。希望有朝一日,我們可以等到升級版的癡呆診斷系統,讓王阿姨所屬的風險人群能夠簡單、快捷地觀測和記錄自己的認知狀況,從日復一日的焦慮和懷疑中得到解脫。
作者:童寧聰 | 封面:freepik
編輯:光影 | 排版:Sheryl
2022-07-29
2022-11-12
2020-08-17
2020-02-28
2020-04-17
2021-02-25
2021-11-22
2020-02-06
2020-02-05
2020-02-06
2020-01-10
2020-02-12
2020-02-08
2020-02-28
2022-11-16
2020-09-19
2020-07-17
2023-01-12
2020-03-06
2023-02-08
2020-05-08
2020-05-26
2020-11-22