hadoop 安装和运维 -

eric_weitm

浏览: 235492 次
性别:
来自: 北京

最近访客更多访客>>

cooperay

asyuanbo

雨落千木

adapterofcoms

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

hadoop 安装和运维

博客分类：

hadoop
java

一、基本概念

namenode：dfs的目录、数据块等元数据

datanode：具体的数据

journalnode namenodez 之间元数据的同步

dfs:distributed file system

mapred:map reduce

ResourceManager:总入口和总调度（针对一个app）

ApplicationMaster：具体的作业调度（支持非map reduce）

NodeManager：一个节点的管理daemon

container：节点内执行的环境(资源)

Job History Server（api +RPC）：收集和展现log信息

WebAppProxy：内部与外部访问间的一个中转

yarn.nodemanager.health-checker.script.path:监控node

Rack Awareness：机架感知，提高调度的性能

二、安装：配置+start

1、配置：

etc/hadoop/core-site.xml:

<name>fs.defaultFS</name>

<value>hdfs://localhost:9000</value>

</property>

</configuration>

etc/hadoop/hdfs-site.xml:

<name>dfs.replication</name>

</property>

</configuration>

etc/hadoop/mapred-site.xml:

<name>mapreduce.framework.name</name>

</property>

</configuration>

etc/hadoop/yarn-site.xml:

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

</configuration>

2、保证可以ssh localhost

3、start：

bin/hdfs namenode -format

sbin/start-dfs.sh

sbin/start-yarn.sh

4、url

http://localhost:50070/ # dfs

http://localhost:8088/ # yarn

$ bin/hdfs dfs -mkdir /user

$ bin/hdfs dfs -mkdir /user/root # 创建用户

$ bin/hdfs dfs -put etc/hadoop input

# 执行jar

bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.3.jar grep input output 'dfs[a-z.]+'

bin/hdfs dfs -get output output

cat output/*

5、停止

$ sbin/stop-yarn.sh

$ sbin/stop-dfs.sh

三、命令

hadoop archive -archiveName zoo.har -p /foo/bar -r 3 /outputdir

hadoop classpath --glob

hadoop jar *.jar # 执行jar

hadoop fs -appendToFile localfile /user/hadoop/hadoopfile # fs命令

四、文件系统常用命令

bin/hadoop fs -cat /user/root/output/*

hdfs dfsadmin -disallowSnapshot <path>

hdfs dfs -createSnapshot <path> [<snapshotName>]

hadoop dfs -df /user/hadoop/dir1

bin/hadoop fs -ls /user/root/output/*

五、其他

1、CLI MiniCluster:避免配置，参数化启动一个cluster

bin/hadoop jar ./share/hadoop/mapreduce/hadoop-mapreduce-client-jobclient-2.7.3-tests.jar minicluster -rmport RM_PORT -jhsport JHS_PORT

2、Rack Awareness 机架感知需要用脚本扩展来输出 /myrack/myhost

分享到：

hadoop spark hive storm的发展过程 | spring4 系列五 security 和sso

2017-07-25 16:51
浏览 366
评论(0)
分类:互联网
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

hadoop 安装和运维

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

hadoop 安装和运维

评论

发表评论

相关推荐

将博客搬至CSDN

spring session 原理

几种分布式事务技术的比较

camunda 源代码解析（一）

spring cloud gateway 分析一 主流程和层次

Kubernetes与spring cloud的结合使用

maven相关

mybatis-plus-3.0 通用crud实现原理

消息队列mq的3个使用场景

Webmagic 内部实现

ElasticSearch 一 基本概念

java spi机制

mysql事物隔离与死锁

关于java log框架

后端技术的演化

java并发二 api 抽象

java并发 一 概念和原理

java invokedynamic和GC

自己动手写Java虚拟机 笔记

java多线程的几个层次

最近访客更多访客>>

spring cloud gateway 分析一主流程和层次

ElasticSearch 一基本概念

java并发一概念和原理

自己动手写Java虚拟机笔记