`

初始HDFS(hadoop distributed file system)

阅读更多
初次接触HDFS(Hadoop Distributed File System),主动或者被动地了解一些相关知识,也有同事给我们分享过,但是大多是一些概念把我们唬住了,很难有个清晰的认识和进一步了解的前提,借此论坛的机会,整理一点,我想可以轻松愉快的快速认识一下HDFS。”





影片名称:HDFS分布式文件系统

上映时间:2004年X月,至今翻拍多版

主要演员:client、namenode、datanode

编剧导演:Doug Cutting等

发行方式:Open开源

发行机构:Apache

影片语言:Java

影片类型:科技教育动漫

影迷评分:7.9分/

相关影片:GFS、HBASE、MAPREDUCE、HIVE、PIG、ZOOKEEPER等

影片简介:HDFS是Hadoop生态系统的一员,意思如同名称分布式文件系统……

◆影片开始,都会列出主要演员(The Cast)





客户端:对HDFS的操作都要通过我,你们别指望越过我,其他人不会搭理你;

元数据节点:我是独一无二的,当然除了我的备胎(我要是死了,备胎就是我,等我复活以后,我就变成备胎了),这里的事情都要协调,看出来了吧,我是主角;

数据节点:我们,我们是存储数据用的,我们是群众演员,一般都是有很多的,我们可以死,但是也不能死太多;

◆正式故事(第一节),向HDFS里面写数据(Writing Data In HDFS Cluster)

○用户请求(Request From User)





○数据块和拷贝(Block And Replaction)





○切割文件成块(Divide File Into BLocks)





○询问元数据节点(Ask NameNode)





○元数据节点选用数据节点(NameNode Assigns DataNodes)





○客户端开始写数据(Client Starts Writing Data)





○通知元数据节点操作完成(Infrom NameNode When Done)







○全部数据块写完(When All Blocks Are Written)





○正式故事(上)扼要重述(Rcap)





◆正式故事(第二节),从HDFS中读取数据(Reading Data From HDFS Cluster)

○用户请求(Request From User)





○首先联系元数据节点(Contact NameNode First)





○下载数据(DownLoad Data)





◆正式故事(第三节),HDFS容错性能

○错误类型和检错(Types Of Faults And Their Detection)

错误一:节点错误





错误二:通讯错误





错误三:数据错误





检错一:节点错误





检错二:网络错误





检错三:数据错误







○处理数据读写错误(Handling Reading And Writing Failures)

处理写数据错误







处理读数据错误







○处理节点错误









◆正式故事(第四节),拷贝的位置策略(Replica Placement Strategy)





○机架和数据节点(Racks and DataNode)





○选择第一个拷贝位置(Selecting First Replica Location)





○剩下两个拷贝位置(Next Two Replica Location)





○后来的拷贝所放位置(Subsquent Replica Locations)




 



◆后记(Where to go From here?)





HDFS分布式文件系统介绍完了,是不是感觉像放电影一样,我想看完后,你对HDFS一定有一个大概认识,貌似也不是很困难,不过这只是个开始,我也是在网上找到这幅漫画的,分享给大家,希望可以让你对学习Hadoop提供一点信心吧,愉快的学习,我们知道公司和客户都在推进各个系统的云化工作,我想这些东西以后也是我们必备的知识吧。

                       


  • 大小: 7.6 KB
  • 大小: 55.1 KB
  • 大小: 25.9 KB
  • 大小: 50.4 KB
  • 大小: 21.7 KB
  • 大小: 23 KB
  • 大小: 134 KB
  • 大小: 148.8 KB
  • 大小: 145.3 KB
  • 大小: 73.5 KB
  • 大小: 89.9 KB
  • 大小: 77 KB
  • 大小: 173.3 KB
  • 大小: 139.9 KB
  • 大小: 59.9 KB
  • 大小: 80.6 KB
  • 大小: 65.4 KB
  • 大小: 206.4 KB
  • 大小: 91.2 KB
  • 大小: 160.6 KB
  • 大小: 244.3 KB
  • 大小: 187.2 KB
  • 大小: 52.2 KB
  • 大小: 102.4 KB
  • 大小: 70.6 KB
  • 大小: 109.6 KB
  • 大小: 87.3 KB
  • 大小: 43.5 KB
分享到:
评论

相关推荐

    hdfs_design, hadoop file system design

    hdfs_design, hadoop file system design hdfs_design, hadoop file system design

    HDFS Design

    The Hadoop Distributed File System (HDFS) is a distributed file system designed to run on commodity hardware. It has many similarities with existing distributed file systems. However, the differences ...

    HDFS design

    The Hadoop Distributed File System (HDFS) is a distributed file system designed to run on commodity hardware. It has many similarities with existing distributed file systems. However, the differences ...

    大数据 培训 课程 入门 HDFS hadoop

    大数据 培训 课程 入门 HDFS hadoop

    Google GFS架构分析.docx

    Google GFS架构分析.docx

    大数据与云计算技术 Hadoop概论和快速入门 共40页.ppt

    HDFS (Hadoop Distributed File System),Hadoop 分布式文件系统。 NameNode,HDFS命名服务器,负责与DataNode文件元信息保存。 DataNode,HDFS数据节点,负责存储数据存储并汇报给NameNode。 SecondaryNamenode,...

    使用Hadoop构建云计算平台

    资源名称:使用Hadoop构建云计算平台内容简介:• 核心框架: HDFS和MapReduce• MapReduce — 任务的分解与结果的汇总• HDFS — Hadoop Distributed File System• — 分布式计算的基石Hadoop是一个Apache的开源...

    【Hadoop】HDFS的运行原理1

    简介HDFS(Hadoop Distributed File System )Hadoop分布式文件系统。是根据google发表的论文翻版的。论文为GFS(Go

    hadoop-3.4.0.tar.gz

    Hadoop实现了一个分布式文件系统( Distributed File System),其中一个组件是HDFS(Hadoop Distributed File System)。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量...

    Hadoop下载 hadoop-3.3.3.tar.gz

    Hadoop实现了一个分布式文件系统( Distributed File System),其中一个组件是HDFS(Hadoop Distributed File System)。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量...

    大数据 hdfs hadoop hbase jmeter

    源码hdfs hbase hadoop 连接jmeter

    hadoop-3.0.1.tar.gz

    Hadoop实现了一个分布式文件系统( Distributed File System),其中一个组件是HDFS(Hadoop Distributed File System)。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量...

    hadoop的简单安装.pdf

    Hadoop实现了一个分布式文件系统( Distributed File System),其中一个组件是HDFS(Hadoop Distributed File System)。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量...

    HDFS详解和配置文件

    HDFS(Hadoop Distributed File System,Hadoop分布式文件系统)是Hadoop中提供的一套用于进行分布式存储的文件系统。 HDFS本身是Doug Cutting根据Google的论文<The Google File System>(简称为GFS)来实现的,因此...

    浪潮简介HDFS

    HDFS是Hadoop Distributed File System的简称,既然是分布式文件系统,首先它必须是一个文件系统,那么在hadoop上面的文件系统会不会也像一般的文件系统一样由目录结构和一组文件构成呢?!分布式是不是就是将文件...

    3-大数据处理架构Hadoop.ppt

    Hadoop的核心是分布式文件系统HDFS(Hadoop Distributed File System)和MapReduce Hadoop被公认为行业大数据标准开源软件,在分布式环境下提供了海量数据的处理能力 几乎所有主流厂商都围绕Hadoop提供开发工具、...

    hadoop-3.4.0-aarch64.tar.gz

    Hadoop实现了一个分布式文件系统( Distributed File System),其中一个组件是HDFS(Hadoop Distributed File System)。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量...

    hadoop-3.1.3安装包

    Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)来访问应用程序的数据,适合...

    HDFS文件系统.pdf

    HDFS(Hadoop Distributed File System)是一种运行在商用硬件上的分 布式文件系统。它与其它现有的文件系统有许多相似之处,但是其差 异才是 HDFS 的重要之处。HDFS 是被设计成运行在廉价硬件上并具有 高容错率的...

    基于HDFS的煤炭企业云存储平台设计

    为提高现代煤炭企业海量数据存储的效率,设计了一种基于HDFS(Hadoop Distributed File System)的煤炭企业云存储平台。该平台在分布式文件存储系统中增加小文件处理模块,可实现小文件的判断以及合并处理,并将其应用...

Global site tag (gtag.js) - Google Analytics