百度開放的大數(shù)據(jù)引擎將如何改變醫(yī)療行業(yè)
百度正式開放了其名為“大數(shù)據(jù)引擎”的技術體系。簡單來說,“大數(shù)據(jù)引擎”指的是對大規(guī)模的數(shù)據(jù)進行收集、存儲、計算、挖掘和管理的一套系統(tǒng)。通過百度的深度學習技術和數(shù)據(jù)建模技術,能夠讓數(shù)據(jù)分析變得更實時和精準。此前,百度已經(jīng)將這些技術用在了自己的一些產(chǎn)品中,而這次對外開放的,主要包括數(shù)據(jù)中心的硬件、數(shù)據(jù)分析技術和深度學習技術。
百度把這個“大數(shù)據(jù)引擎”分為三個層次:開放云、數(shù)據(jù)工廠和百度大腦。
開放云指的是這套引擎的基礎架構——分布式的低能耗數(shù)據(jù)中心,也就是前文提到的硬件部分。其中包括數(shù)據(jù)中心的服務器設計、數(shù)據(jù)中心規(guī)劃和設計、分布式系統(tǒng)、超大規(guī)模集群自動化運維、大規(guī)模GPU并行化平臺等。其次是數(shù)據(jù)工廠,它可以支持超大規(guī)模的異構數(shù)據(jù)查詢和大數(shù)據(jù)分析,也就是調(diào)用硬件,來完成數(shù)據(jù)的挖掘和分析。而百度大腦,其實是對單集群規(guī)模數(shù)據(jù)能力的擴展——基于深度學習技術,讓機器模擬人類大腦多層神經(jīng)元的思維模式做出預測模型。
所以,我們可以一句話概括“大數(shù)據(jù)引擎”是如何運轉的:百度對自己以及各行各業(yè)的數(shù)據(jù)進行挖掘,利用“數(shù)據(jù)工廠”和“百度大腦”分析它們,輸出數(shù)據(jù)分析結果,為自己和合作伙伴提供解決方案。
先來看看百度是如何在自己的產(chǎn)品上使用大數(shù)據(jù)引擎的。
最常見的是一些百度產(chǎn)品功能上的應用。比如,百度圖片搜索的“以圖搜圖”功能。當用戶上傳一張圖片到圖片搜索之后,系統(tǒng)將會自動將這張圖片與百度服務器上數(shù)億計的圖片比對,并查找出相似的圖片,然后實時展示出來。而百度輸入法中中文語音轉換成中文文字的功能也是利用了相似的原理——將語音數(shù)據(jù)進行收集、分析、比對,然后找出準確的文字進行對應。
還有數(shù)據(jù)模型的建立。比如,百度會對人們在網(wǎng)上對某個旅游景點進行搜索的行為和實際旅游人數(shù)的數(shù)據(jù)進行比對分析,依此繪制出某個景點在兩個星期內(nèi)的“熱力圖”,以顯示這個景點的擁擠程度?,F(xiàn)在,百度的旅游預測模型已經(jīng)可以精準到兩個星期。你或許記得今年春節(jié)時百度發(fā)布的“百度遷徙”——一張全國范圍內(nèi)的春運熱力圖,就是基于相似的模型實現(xiàn)的。這些數(shù)據(jù)分析技術同樣地被應用在了百度的廣告系統(tǒng)中。
那么,在百度的這一套“大數(shù)據(jù)引擎”開放之后,它會首先被應用在哪些場景上?百度深度學習研究院常務副院長余凱稱,醫(yī)療將會是首個被大數(shù)據(jù)技術改變的行業(yè)。
如今,隨著可穿戴計算設備的興起,人們可以記錄下大量的生活方式,比如每天的運動量和運動時間、睡眠量、久坐時間、身高、血壓等,這些被量化的數(shù)據(jù)涵蓋了我們身體狀況的方方面面,將會成為病情分析的重要依據(jù)。而對于醫(yī)院來說,這些數(shù)據(jù)無時無刻不在產(chǎn)生、零散分布在各個平臺上,已經(jīng)超出了醫(yī)院IT系統(tǒng)的數(shù)據(jù)存儲和分析能力。所以,余凱認為“大數(shù)據(jù)引擎”將可以幫醫(yī)院解決這樣的問題。
相關閱讀
- 確認!一批大醫(yī)院,耗材“一票制”2021-11-19
- 醫(yī)療行業(yè)突破重構 六大趨勢你把握住了嗎?2016-05-20
- 到2019年,醫(yī)療器械行業(yè)面臨的6項大概率事件2016-02-24
- 醫(yī)療行業(yè)最浪漫的情書 暴強!2016-02-14
- DR行業(yè)的復活戰(zhàn)!2016-01-13