亚洲综合伊人,成人欧美一区二区三区视频不卡,欧美日韩在线高清,日韩国产午夜一区二区三区,大胆美女艺术,一级毛片毛片**毛片毛片,你瞅啥图片

<option id="sqw6a"></option>

首頁|新聞|商城|黃頁|技術|行業(yè)|會展|訪談|人才|供求|社區(qū)|周刊|呼叫中心|企業(yè)通信|通信業(yè)務

首頁 > 新聞 > 國內(nèi) >

醫(yī)療大數(shù)據(jù)專家：淺談醫(yī)學大數(shù)據(jù)

2015-03-26 10:06:29 作者：來源：36氪評論：0 　點擊：

　　圖六

　　圖五和圖六都顯示了最流行的平臺和數(shù)據(jù)處理方式為開源免費的 Hadoop 和 MapReduce。伴隨著他們的潛在成長和承諾程度，可以預見，Hadoop 和 MapReduce 正在并會繼續(xù)推動和促進大數(shù)據(jù)的處理和應用。

　　在此，我們簡單介紹一下 Hadoop 和 MapReduce 的概念。Hadoop 是一種基于 Java 的分散式數(shù)據(jù)處理框架。它可以提供對儲存在多個硬件設備上的數(shù)據(jù)進行高吞吐率的讀寫。更重要的是，它對大數(shù)據(jù)具有高容錯性和對并行應用程序的高可用性。Hadoop 框架結(jié)構(gòu)由若干名字節(jié)點（NameNode）和數(shù)據(jù)節(jié)點（DataNode）組成。一份數(shù)以萬計，百萬計的大數(shù)據(jù)文件會被分割成更小的文件信息塊儲存在多個數(shù)據(jù)節(jié)點里，可以是任何計算機硬件設備。

　　有關這些文件的數(shù)據(jù)屬性資料信息稱作 metadata 則被存儲在名字節(jié)點里（NameNode）。 NameNode 主要管理文件系統(tǒng)的命名空間和客戶端對文件的訪問操作記錄。Hadoop 的框架結(jié)構(gòu)如圖七：

　　圖七

　　當訪問和操作數(shù)據(jù)文件時，客戶端會聯(lián)系名字節(jié)點提取文件信息塊的屬性信息比如位置，文件名等。然后根據(jù)這些屬性信息，客戶端直接從相應的數(shù)據(jù)節(jié)點同時讀取數(shù)據(jù)塊。Hadoop 本身具有冗余和復制功能，保證在單個硬件儲存設備出現(xiàn)故障時數(shù)據(jù)仍舊能被恢復而沒有任何損失，比如每個數(shù)據(jù)節(jié)點默認擁有3個備份之類。

　　此外，在有新數(shù)據(jù)節(jié)點添加到框架中時，Hadoop 還可以自動平衡每個數(shù)據(jù)節(jié)點的數(shù)據(jù)載有量。同樣，名字節(jié)點也可以擁有冗余和復制功能，用于在單個儲存數(shù)據(jù)屬性信息的名字節(jié)點出現(xiàn)故障時可以恢復相應的數(shù)據(jù)屬性信息。

　　MapReduce 則是一種可以用來并行處理大數(shù)據(jù)的編程模型。同一程序在 Hadoop 的框架下可以用各種不同的語言（Java,Ruby,Python 等）按 MapReduce 的編程模型進行編寫和運行。其關鍵就在于三個詞： map,reduce, 和并行處理。我們通過一個例子來理解 MapReduce 的大致工作原理。比如我們有一30個字的字符串“開落花纏落花繞纏開繞笑瓜夜村村舍舍瓜夜藤繞下下藤繞嬉嬉笑娃娃”，任務是計算每個字出現(xiàn)的次數(shù)。

　　最簡單的方法是按序讀取每一個字建立標識索引并計算出現(xiàn)的次數(shù)值存入內(nèi)存，如果是新字，值為1，如果是出現(xiàn)過的字則次數(shù)值累加上去。此種方式是按串行的方式進行的，所花的時間會隨著字符串的長度和復雜度程線性增長。當字符串是以萬計百萬計時，比如基因組數(shù)據(jù)，所花的時間將是相當驚人的。并行處理則能節(jié)約相當多的時間。

　　我們先把原文件分割到幾個小文件塊，然后對每個小文件塊進行字的標識索引和附加數(shù)值（這兒不進行累計，只是簡單的單次點數(shù)），然后再排序重組把相同字放在一起，然后我們再用縮減法計算出字及其相應的出現(xiàn)次數(shù)值。圖八顯示了具體的例子步驟：

　　圖八

上一頁 1 2 3 4 5 6 下一頁

相關熱詞搜索：醫(yī)學大數(shù)據(jù) 大數(shù)據(jù)

上一篇:M-ICT時代“不等待”，中興14年凈利翻番

下一篇:最后一頁

相關閱讀：

·大數(shù)據(jù)看趨勢：中國智能手機新格局洞察2015-03-25 09:44:10
·物聯(lián)網(wǎng)與大數(shù)據(jù)結(jié)合給應用提供網(wǎng)絡數(shù)據(jù)兩不誤的服務2015-03-23 11:23:36
·科達為廣西建全國首個圖偵與大數(shù)據(jù)云平臺2015-03-20 09:52:36
·孫丕�。汗I(yè)4.0大有可為云計算、大數(shù)據(jù)是關鍵2015-03-19 11:29:05
·思科與領先數(shù)據(jù)管理合作伙伴簽署經(jīng)銷協(xié)議2015-03-16 14:06:34
·2015年云計算新趨勢：大數(shù)據(jù)與云將結(jié)合2015-03-12 11:34:12
·第三屆中國國際云計算技術和應用展覽會將舉行2015-03-11 14:12:29
·神州數(shù)碼董事長郭為：政府數(shù)據(jù)應開放激發(fā)創(chuàng)新活力2015-03-10 13:39:03
·攜程旅行網(wǎng)以大數(shù)據(jù)理念提升綜合服務能力2015-03-10 10:09:37
·大數(shù)據(jù)與網(wǎng)絡黑產(chǎn)2015-03-09 15:30:43

分享到：

分享到騰訊微博

收藏

評論排行

推薦閱讀

專題

2015CeBIT: 　　德國漢諾威舉行的CeBIT展覽會是全球數(shù)碼行業(yè)領先的...[詳細]

《云計算服務—運...: 　　《云計算服務——運營管理與技術架構(gòu)》一書是由創(chuàng)想...[詳細]

2015年世界移動通...: 2015年世界移動通信大會將于3月2日至3月5日，在西班牙巴...[詳細]

CES 2015國際消費...: 　　美國國際消費類電子產(chǎn)品展覽會（CES）由美國電子消...[詳細]

點擊排行
周排行
月排行

網(wǎng)站首頁 | 公司簡介 | 聯(lián)系方式 | 工作機會 | 廣告服務 | 會員服務 | 服務項目 | 專家團隊 | 版權聲明 | 投稿方法

Copyright(C) 1999-2014 CTI論壇 All Rights Reserved CTI論壇版權所有

電話：+86-10-82012787，+86-10-82079677 傳真：+86-10-62041062 投稿：ctiforum@ctiforum.com 地址：北京市西城區(qū)新德街20號513室（100088）

經(jīng)營性網(wǎng)站備案信息

京ICP證030771號

網(wǎng)絡110報警服務

京公網(wǎng)安備110102000104-1號

<tfoot id="2s4yk"></tfoot>