<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>-Flyぁ梦- &#187; hadoop</title>
	<atom:link href="http://blog.11034.org/tag/hadoop/feed" rel="self" type="application/rss+xml" />
	<link>http://blog.11034.org</link>
	<description></description>
	<lastBuildDate>Sun, 22 Jun 2025 08:59:05 +0000</lastBuildDate>
	<language>zh-CN</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>https://wordpress.org/?v=4.2.38</generator>
	<item>
		<title>配置Hadoop集群的几个问题</title>
		<link>http://blog.11034.org/2011-12/hadoop_cluster_setting.html</link>
		<comments>http://blog.11034.org/2011-12/hadoop_cluster_setting.html#comments</comments>
		<pubDate>Thu, 15 Dec 2011 13:54:41 +0000</pubDate>
		<dc:creator><![CDATA[-Flyぁ梦-]]></dc:creator>
				<category><![CDATA[Java]]></category>
		<category><![CDATA[hadoop]]></category>

		<guid isPermaLink="false">http://blog.stariy.org/?p=1033</guid>
		<description><![CDATA[实验室的调研项目，负责调研HBase，在用单机模式和本地文件系统测试之后，需要搭建HBase集群来测试，当然就 [&#8230;]]]></description>
				<content:encoded><![CDATA[<p>实验室的调研项目，负责调研HBase，在用单机模式和本地文件系统测试之后，需要搭建HBase集群来测试，当然就要先搭建起来Hadoop集群。花了一天时间，碰到问题若干，并且都一定程度地坑爹，最后终于顺利跑起，泪流满面。</p>
<p>环境：CentOS、hadoop-0.20.203.0rc1.tar.gz、3台虚拟机构建的集群</p>
<h3>问题一：手动mkdir相关目录</h3>
<p><span id="more-1033"></span><br />
比如hdfs-site.xml中的dfs.name.dir项、dfs.data.dir项，mapred-site.xml中的mapred.system.dir项，这些配置的目录都需要事先mkdir好并保证应有的权限。</p>
<h3>问题二：root用户导致的-jvm问题</h3>
<p>使用root用户启动hadoop，会报“无法识别的 -jvm 参数，Java虚拟机启动失败”这样的错误。原因在于$HADOOP_HOME/bin/hadoop文件中的一行，搜索-jvm就能发现，当用户ID为0（即root用户），则会多带一个-jvm项。</p>
<p>为hadoop和mapreduce专门建立账号是官方推荐的做法，懒人可以直接修改上面提到的地方绕过-jvm的问题。</p>
<p>坑爹指数：★★★     评论：虽然用root账户不是推荐的方法，那直接报个Warning好了嘛，直接报错导致启动失败总不是应该的结果吧&#8230;</p>
<h3>问题三：使用start-all.sh导致jobtracker.info写入问题</h3>
<p>LZ在搭建集群过程中，执行start-all.sh后，遇到namenode机器mapred写入jobtracker.info文件失败的问题，具体异常信息为“java.io.IOException : File ***/jobtracker.info could only be replicated to 0 nodes, instead of 1”。</p>
<p>问题在于执行start-all.sh，在启动namenode之后会立即启动mapred，而这时namenode处于30秒的安全状态中，datanode还没有连接上来，于是执行mapred就出错了。解决方法是：不要执行start-all.sh，先执行start-dfs.sh，通过http://yoururl:50070观看hdfs的状态，有明确倒计时说明安全状态，在安全状态结束后，再执行start-mapred.sh，即可。</p>
<p>坑爹指数：★★？     评论：那bin目录下给一个start-all.sh到底是为什么呢？难道是由于哪里配置的问题或是什么的问题？</p>
<p>虽然在百度实习时有搭建过Hadoop集群，不过貌似那时用的Hadoop不像是Apache发布的包而大概是经过百度内部改良的吧，反正和这次下载的包结构有差别。所以基本也算是第一次搭建了，不过万事靠Google、百度基本还是能找到解决，各种求罩求指导！</p>
<h4  class="related_post_title">随便看一看</h4><ul class="related_post"><li>2014-07-28 -- <a target="_blank" href="http://blog.11034.org/2014-07/active_support_235.html" title="简析Rails：active_support 2.3.5">简析Rails：active_support 2.3.5</a></li><li>2011-05-15 -- <a target="_blank" href="http://blog.11034.org/2011-05/walking_in_shanghai.html" title="周末上海大暴走">周末上海大暴走</a></li><li>2018-06-09 -- <a target="_blank" href="http://blog.11034.org/2018-06/bed.html" title="选择床和床垫的一些经验">选择床和床垫的一些经验</a></li><li>2025-05-07 -- <a target="_blank" href="http://blog.11034.org/2025-05/sanya_sg_my.html" title="25年三亚&#038;新马游">25年三亚&#038;新马游</a></li><li>2010-07-26 -- <a target="_blank" href="http://blog.11034.org/2010-07/hongkong_travel.html" title="香港10日行，纪念第一次出境">香港10日行，纪念第一次出境</a></li></ul><h4 class="related_post_title">看看 Java </h4><ul class="related_post"><li>2016-09-09 -- <a target="_blank" href="http://blog.11034.org/2016-09/64bits_linux_arena_memory.html" title="64位Linux下Java进程堆外内存迷之64M问题">64位Linux下Java进程堆外内存迷之64M问题</a></li><li>2016-08-18 -- <a target="_blank" href="http://blog.11034.org/2016-08/java_concurrency_in_practice.html" title="读java concurrency in practice">读java concurrency in practice</a></li><li>2016-08-05 -- <a target="_blank" href="http://blog.11034.org/2016-08/thread_stop.html" title="线程清理">线程清理</a></li><li>2016-06-21 -- <a target="_blank" href="http://blog.11034.org/2016-06/futuretask.html" title="FutureTask简单分析和用法">FutureTask简单分析和用法</a></li><li>2016-06-21 -- <a target="_blank" href="http://blog.11034.org/2016-06/semaphore.html" title="Semaphore简单分析">Semaphore简单分析</a></li>]]></content:encoded>
			<wfw:commentRss>http://blog.11034.org/2011-12/hadoop_cluster_setting.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
