이 튜토리얼에서, 우리는 리눅스 상자 (우분투)에 아파치 하두프를 설치하는 단계별 과정을 통해 당신을 데려 갈 것이다. 이것은 2 부분 프로세스 hadoop-env.sh Java 홈 경로 등처럼 Hadoop을 실행하는 데 스크립트에 사용되는 환경 변수를 포함합니다. 그림: 하두프 설치 – `jps` 도구/명령을 사용하여 하두롭 파일 추출, 모든 Hadoop 관련 프로세스가 실행되고 있는지 여부를 확인합니다. 이 단계별 자습서 Windows에서 리눅스 가상 컴퓨터에 Hadoop를 설치 하는 방법을 통해 당신을 걸을 것 이다 10. 당신은 윈도우에 직접 Hadoop을 설치할 수 있지만, 나는 Hadoop리눅스에서 만들어졌고 그 루틴은 리눅스 플랫폼에 네이티브 이기 때문에 리눅스에 Hadoop을 설치하도록 선택하고 있습니다. 이 문서에서는 Hadoop MapReduce 및 Hadoop 분산 파일 시스템(HDFS)을 사용하여 간단한 작업을 신속하게 수행할 수 있도록 단일 노드 Hadoop 설치를 설정하고 구성하는 방법을 설명합니다. 다운로드 및 오라클 JDK를 설치하는 jdk-8u202-리눅스-x64.rpm 공식 패키지를 설치합니다. 많은 제3자가 아파치 하두프(Apache Hadoop)와 관련 도구를 포함한 제품을 배포합니다. 이들 중 일부는 배포 위키 페이지에 나열됩니다. 이 출력을 복사하여 Hadoop의 Java 홈을 이 특정 버전으로 설정할 수 있으며, 기본 Java가 변경되면 이 값이 변경되지 않도록 합니다. 또는 파일에서 읽기 링크 명령을 동적으로 사용하여 Hadoop이 시스템 기본값으로 설정된 Java 버전을 자동으로 사용할 수 있습니다. YARN 리소스 관리자(RM) 웹 인터페이스는 현재 Hadoop 클러스터에서 실행 중인 모든 작업을 표시합니다.

우리가 볼 것이다 첫 번째 모드는 로컬 (독립 실행 형) 모드입니다. 이 방법을 사용하면 로컬 인스턴스에서 분산되지 않은 모드에서 단일 JAVA 프로세스를 실행할 수 있습니다. 그것은 어떤 Hadoop 데몬 또는 서비스에 의해 실행되지 않습니다. 4) 우리가 처음으로 Hadoop을 시작하기 전에, 모든 Hadoop 서비스 / 데몬이 성공적으로 시작되었는지 확인하기 위해 아래 명령을 사용하여 HDFS 형식은 jps 명령을 사용할 수 있습니다. 클러스터에서 노드를 관리하려면 Hadoop은 SSH 액세스 1이 필요합니다. `hadoop.tmp.dir`- 데이터 파일을 저장하기 위해 Hadoop에 의해 사용되는 디렉토리를 지정하는 데 사용됩니다. Hadoop이 성공적으로 시작한 경우 jps의 출력에는 네임 노드, 노드 관리자, 리소스 관리자, 보조 네임 노드, DataNode가 표시됩니다.

Comments are closed, but trackbacks and pingbacks are open.