Hadoop--HDFS特點

2022-12-31 20:23:59 來源:51CTO博客


【資料圖】

1,分布式存儲團葉槲蕨,支持海量數據存儲。(GB、TB、PB級別數據)

2,高容錯性,數據擁有多個副本(副本冗余機制)。副本丟失后,自動恢復。

3,低成本部署,hadoop可在廉價的服務器上

4,能夠檢測和快速應對硬件故障,通過RPC心跳機制來實現

5,簡化的一致性模型,這里指的是用戶在使用HDFS時,所有關于文件相關的操作,如文件切塊、塊的復制、塊的存儲等細節并不需要去關注,所有的工作都已被框架封裝完畢。用戶所需要折僅僅是將數據上傳到HDFS。這大大簡化了分布式文件存儲工作的難度和管理的復雜度。

6,HDFS不能做到低延遲的數據訪問(毫秒級內給出響應)。介是Hadoop的優勢在它的高吞吐率(吞吐率批的是:單位時間內產生的數據流)。可以說HDFS的設計是犧牲了低延遲的數據訪問,而獲取的是數據的高吞吐率,如果要想獲取低延遲的數據訪問,可以通過Hbase框架來實現

7,HDFS不許修改數據,所以適用場景是:一次寫入,多次讀取(once write,many read)。注意:HDFS允許追加數據,但不允許修改數據。追加和修改的意義是不同的。

8,HDFS不支持并發寫入,一個文件同一個時間只能有一個寫入者

9,HDFS不適合存儲海量小文件,因為會浪費 namenode服務節點的內存空間。

標簽: 數據訪問 服務器上 文件存儲

上一篇:Docker可視化管理工具 - Portainer
下一篇:全球新消息丨mysql數據恢復