전체교육일정
교육개요
CDP Public Cloud 관리자 교육은 CDP Public Cloud 인스턴스를 구성, 운영 및 유지 관리하는 데 필요한 모든 단계를 포괄적으로 이해할 수 있도록 합니다.
이 4 일간의 강사 주도 과정은 Cloudera Management Console을 사용하여 모든 주요 클라우드 제공 업체의 클라우드에서 워크로드를 실행하기 위해 다양한 데이터 서비스 설정부터 구성에 이르기까지 모든 것을 다룹니다.
또한 웹 인터페이스를 사용하는 다양한 구성 옵션과 Ansible을 사용하는 자동화 시나리오도 다룹니다. 최적화 측면에서는 로드 밸런싱 및 CDP PC 인스턴스 튜닝을 다룹니다.
이 Cloudera 교육 과정은 CDP Public Cloud를 실행하는 관리자가 직면하는 실제 문제에 대한 최상의 준비 과정입니다.
교육목표
- 적절한 배포 옵션을 평가하고 선택
- Cloudera 관리 콘솔을 사용하여 CDP 퍼블릭 클라우드 설정
- 다양한 데이터 서비스 설정 및 구성
- Cloudera Manager를 사용하여 인스턴스 구성 및 모니터링
- 클러스터 성능 및 보안 최적화
- 클러스터 문제를 감지, 해결 및 복구
- 데이터 허브 클러스터 및 데이터 서비스 자동 확장
수강대상
- 클라우드 시스템 관리자 및 운영자
- 기본적인 Linux 및 AWS/Azure/GCP 지식보유자
선수과목
선수과목 학습사이트
https://kr.cloudera.com/about/training.html
- Introducing AWS for CDP Public Cloud (FREE)
- Cloudera Essentials for CDP (FREE)
- Introducing - CDP Public Cloud Administration (FREE)
- Quickstart: Azure for CDP (FREE)
- Quickstart: AWS for CDP (FREE)
강의내용
설치 개요(빠른 시작)
- Cloudera 관리 콘솔
- CDP 자격 증명
- CDP 컨트롤 플레인 지역
- CDP 환경 등록
- Cloudera 데이터 플랫폼
- 빅데이터 산업 동향
- 데이터 중심이 되기 위한 과제
- 엔터프라이즈 데이터 클라우드
- CDP 개요
- CDP 폼 팩터
CDP 아키텍처
- 개요
- 주요 개념 및 구성 요소
- CDP 런타임 개요
- 최소 하드웨어
- 아웃바운드 연결
제어 평면 개요
- 환경 액세스 및 관리
- 데이터 관리 개요
- 관리 콘솔
- 대시보드
- 환경
- 데이터 레이크
- 사용자 관리
- 클래식 클러스터
- 데이터 허브
- 데이터 카탈로그
- 복제 관리자
- 관찰 가능성
CDP CLI(명령줄 인터페이스)
- CDP CLI 명령줄 인터페이스
- CDP CLI 설치/CLI 클라이언트 설정
- CLI 모듈
- API 액세스 키 생성 / CDP 클라이언트 구성
- CDP CLI/SDK에 로그인
- CLI 자동완성 구성 / CLI 참조 / CLI 도움말 액세스
- CDP API 개요 / CDP SDK for Java 개요 / CDP curl overview
CDP 액세스 관리
- 관리 콘솔
- 사용자 관리
- 컴퓨터 사용자 생성
- 사용자 권한
- 사용자 동기화
- 그룹 구성
- ID 제공업체
- 역할 및 자원 역할
- 전역 설정
- 감사 데이터 저장 자격 증명
데이터 허브 개요
- 데이터 허브
- 데이터 허브 클러스터 계획/생성
- 일반 계획 고려 사항
- 노드 구성
- 데이터 허브 관리
- 올바른 하드웨어 선택
- 고급 클러스터 구성
- 데이터 허브 유형
- 데이터 흐름
- 데이터 엔지니어링
- 문제 해결
데이터 허브 관리
- 데이터 허브 모범 사례
- 데이터 허브 규모 조정
- 클라우데라 관리자
- 데이터 허브 서비스
- 자동 확장/데이터 허브 정보
- 클러스터 상태 확인/이벤트 및 경고
- 호스트 유지 관리
- 데이터 허브 클러스터 업그레이드
- 모니터링/모니터링 기능
데이터 서비스 개요
- 데이터 서비스 개요
- 데이터 서비스
- 데이터 서비스 클러스터 계획
- 올바른 하드웨어 선택/네트워크 고려 사항
- 데이터 서비스 생성
- 데이터 흐름
- 데이터 엔지니어링
- 데이터웨어 하우스
- 운영 데이터베이스
- 머신러닝
- 문제 해결
데이터 흐름
- DataFlow 서비스 개요
- 데이터 수집 개요
- 파일 전송 또는 REST 인터페이스를 사용하여 데이터 수집
- NiFi를 사용하여 데이터 수집
- 자동 확장
데이터 엔지니어링
- 데이터 엔지니어링 서비스 개요
- Apache Spark/Flink/Kafka 스트림 개요
- 자동 확장
데이터웨어 하우스
- 데이터 웨어하우스 서비스 개요
- 데이터베이스 카탈로그 추가 및 관리
- 가상 창고 추가 및 조정
- 데이터 웨어하우스 쿼리
- 데이터 시각화
- 모니터링 및 문제 해결
운영 데이터베이스
- 운영 데이터베이스 서비스 개요
- Apache HBase/검색 개요
- 자동 확장
기계 학습
- 머신러닝 서비스 개요
- CML 엔진
- CML 작업공간 요구사항
- CML 작업공간 프로비저닝
- CML 자동 확장
- 모니터링
모니터링 및 관리
- CDP 퍼블릭 클라우드의 모니터링 및 관리
- 데이터 레이크 클러스터 모니터링 및 CDP 감사
- CDP에서 모니터링 시작하기
- Cloudera Manager를 통한 모니터링: 상태 테스트 및 대시보드
- 클러스터, 서비스, 호스트, 역할 및 활동 모니터링
- 클러스터 구성 및 운영 문제 해결
데이터 관리
- SDX - 보안 및 거버넌스
- 보안 개념
- 클라우드 스토리지에 액세스
- 데이터 레이크 보안: SDX
- 아파치 레인저
- CDP 승인/인증
- 데이터 거버넌스
- 아파치 아틀라스
- 데이터 카탈로그
관찰 가능성
- 개요
- 지원하다
- 관찰성 배포 아키텍처
- 모니터링 기능
- 알림, 비용, 보고서 작업