【深入浅出 Yarn 架构与实现】1-2 搭建 Hadoop 源码阅读环境
本文将介绍如何使用 idea 搭建 源码阅读环境。(默认已安装好 Java、Maven 环境)
一、搭建源码阅读环境 一)idea 导入 工程
从 上拉取代码。
可以选择对应的分支
# 如拉取 2.8.5 分支
git clone -b branch-2.8.5 git@github.com:apache/hadoop.git
在 idea 中点击 File - Open 选择对应的文件夹目录,进行导入。之后会进入漫长的程序加载过程(看机器配置和网速,可能几十分钟到几小时不等)。
二)配置注释环境
为了更方便的在阅读源码过程中记笔记,可在源码基础上创建新的分支用于记录。
1、创建新分支
# 如在 branch-2.8.5 基础上创建
git checkout -b branch-2.8.5-comment
2、在 上创建个新的项目
3、将本地分支 -2.8.5- 推送到远端。之后可以在自己 上看到这个项目分支了。
# 删除原来的远端项目
git remote remove origin
# 添加新的项目地址
git remote add origin <你的项目地址>
# 推送新的分支
git push -u origin branch-2.8.5-comment
二、源码组织架构 一)根目录结构
导入工程后,可以看到如下图的目录结构。其中,比较重要的目录有:--、-- 、-hdfs- 和 -yarn- 等。
二)yarn 目录结构
YARN 主要关注五个部分:API、、、 和 。
三、远程调试
配置与远程部署的 服务连接。
1、idea 中选择 Run -> Edit
# 在 yarn-env.sh 中添加
export YARN_NODEMANAGER_OPTS="-Xdebug -Xrunjdwp:transport=dt_socket,server=y,suspend=n,address=5006"
export YARN_RESOURCEMANAGER_OPTS="-Xdebug -Xrunjdwp:transport=dt_socket,server=y,suspend=n,address=5005"# 如果想要启动时先连接 debug,则设置 suspend=y
4、可以用 idea 进行远程连接调试了