21. mapred.job.tracker命令的作用? 可以让你知道哪个节点是Job Tracker。 22. /etc /init.d命令的作用是? /etc /init.d说明了守护进程(服务)的位置或状态,其实是LINUX特性,和Hadoop关系不大。 23. 如何在浏览器中查找Namenode? 如果你确实需要在浏览器中查找Namenode,你不再需要localhost:8021,Namenode的端口号是50070。 24. 如何从SU转到Cloudera? 从SU转到Cloudera只需要键入exit。 25. 启动和关闭命令会用到哪些文件? Slaves及Masters。 26. Slaves由什么组成? Slaves由主机的列表组成,每台1行,用于说明数据节点。 27. Masters由什么组成? Masters同样是主机的列表组成,每台一行,用于说明第二Namenode服务器。 28. hadoop-env.sh是用于做什么的? hadoop-env.sh提供了Hadoop中. JAVA_HOME的运行环境。 29. Master文件是否提供了多个入口? 是的你可以拥有多个Master文件接口。 30. hadoop-env.sh文件当下的位置? hadoop-env.sh现在位于conf。 31. 在Hadoop_PID_DIR中,PID代表了什么? PID代表了“Process ID”。 32. /var/hadoop/pids用于做什么? /var/hadoop/pids用来存储PID。 33. hadoop-metrics.properties文件的作用是? hadoop-metrics.properties被用做“Reporting”,控制Hadoop报告,初始状态是“not to report”。 34. Hadoop需求什么样的网络? Hadoop核心使用Shell(SSH)来驱动从节点上的服务器进程,并在主节点和从节点之间使用password-less SSH连接。 35. 全分布式环境下为什么需求password-less SSH? 这主要因为集群中通信过于频繁,Job Tracker需要尽可能快的给Task Tracker发布任务。 36. 这会导致安全问题吗? 完全不用担心。Hadoop集群是完全隔离的,通常情况下无法从互联网进行操作。与众不同的配置,因此我们完全不需要在意这种级别的安全漏洞,比如说通过互联网侵入等等。Hadoop为机器之间的连接提供了一个相对安全的方式。 37. SSH工作的端口号是? SSH工作的端口号是NO.22,当然可以通过它来配置,22是默认的端口号。 38. SSH中的注意点还包括? SSH只是个安全的shell通信,可以把它当做NO.22上的一种协议,只需要配置一个密码就可以安全的访问。 39. 为什么SSH本地主机需要密码? 在SSH中使用密码主要是增加安全性,在某些情况下也根本不会设置密码通信。 40. 如果在SSH中添加key,是否还需要设置密码? 是的,即使在SSH中添加了key,还是需要设置密码。 41. 假如Namenode中没有数据会怎么样? 没有数据的Namenode就不能称之为Namenode,通常情况下,Namenode肯定会有数据。 42. 当Job Tracker宕掉时,Namenode会发生什么? 当Job Tracker失败时,集群仍然可以正常工作,只要Namenode没问题。 43. 是客户端还是Namenode决定输入的分片? 这并不是客户端决定的,在配置文件中以及决定分片细则。 44. 是否可以自行搭建Hadoop集群? 是的,只要对Hadoop环境足够熟悉,你完全可以这么做。 45. 是否可以在Windows上运行Hadoop? 你最好不要这么做,Red Hat Linux或者是Ubuntu才是Hadoop的最佳操作系统。在Hadoop安装中,Windows通常不会被使用,因为会出现各种各样的问题。因此,Windows绝对不是Hadoop的推荐系统。 |