大數(shù)據(jù)架構(gòu)與數(shù)據(jù)挖掘

    •  課程目標(biāo)

      本課程將為大家全面而又深入的介紹Hadoop和Spark平臺的構(gòu)建流程,涉及Hadoop和Spark系統(tǒng)基礎(chǔ)知識,概念及架構(gòu), Hadoop和Spark實(shí)戰(zhàn)技巧(數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)),Hadoop和Spark經(jīng)典案例等。

    •  師資團(tuán)隊(duì)

      華清創(chuàng)客企業(yè)內(nèi)訓(xùn)講師,均是來自各個(gè)領(lǐng)域的資深專家,均擁有6年以上大型項(xiàng)目經(jīng)驗(yàn)。

    •  培養(yǎng)對象

      1、學(xué)員學(xué)習(xí)本課程應(yīng)具備基礎(chǔ)知識:1) 了解Java語言; 2) 了解Linux系統(tǒng);3) 數(shù)據(jù)挖掘基礎(chǔ);
      2、適合人群:各類 IT/軟件企業(yè)和研發(fā)機(jī)構(gòu)的軟件架構(gòu)師、軟件設(shè)計(jì)師、程序員。對于懷有設(shè)計(jì)疑問和問題,需要梳理解答的團(tuán)隊(duì)和個(gè)人,效果最佳。

    •  培訓(xùn)方式

      • 第一種:華清創(chuàng)客講師面授
        課時(shí):共3天,每天6學(xué)時(shí),總計(jì)18學(xué)時(shí)
        ◆費(fèi)用:3600元
        ◆外地學(xué)員:代理安排食宿(需提前預(yù)定)

        第二種:線上直播授課
        直播課時(shí):共6天,每天3學(xué)時(shí),總計(jì)18學(xué)時(shí);
        輔導(dǎo):授課期間,輔導(dǎo)老師每天有1小時(shí)的輔導(dǎo)直播
        ◆費(fèi)用:3600元

        第三種:企業(yè)訂制培訓(xùn)
        課時(shí):根據(jù)定制的大綱確定課時(shí)
        費(fèi)用:根據(jù)課程難度,每課時(shí)1500~3000元


         質(zhì)量保證

      • 1、培訓(xùn)過程中,如有部分內(nèi)容理解不透或消化不好,可免費(fèi)在下期培訓(xùn)班中重聽;

        2、培訓(xùn)結(jié)束后免費(fèi)提供一個(gè)月的技術(shù)支持,充分保證培訓(xùn)后出效果;

        3、培訓(xùn)合格學(xué)員可享受免費(fèi)推薦就業(yè)機(jī)會。

      •  課程大綱

        主題 內(nèi)容

         

        大數(shù)據(jù)架構(gòu)概述 "1. 大數(shù)據(jù)層級結(jié)構(gòu)

        介紹大數(shù)據(jù)系統(tǒng)基本架構(gòu)與流程

        2. Hadoop生態(tài)系統(tǒng)概述以及版本演化

        概要介紹Hadoop生態(tài)系統(tǒng)及其版本演化歷史,并給出hadoop版本選擇建議。

        3. Spark生態(tài)系統(tǒng)概述

         

        概要介紹Spark生態(tài)系統(tǒng)及其特點(diǎn),并與Hadoop對比"

        數(shù)據(jù)收集系統(tǒng)FlumeSqoop 介紹如何使用flumesqoop兩個(gè)系統(tǒng)將外部流式數(shù)據(jù)(比如網(wǎng)站日志,用戶行為數(shù)據(jù)等)、關(guān)系型數(shù)據(jù)庫(比如MySQLOracle等)中的數(shù)據(jù)導(dǎo)入Hadoop中進(jìn)行分析和挖掘

         

        大數(shù)據(jù)存儲系統(tǒng)HDFSHbase "1. 1. HDFS 2.0 原理、特性與基本架構(gòu)

        2. 理論:介紹HDFS 2.0原理與架構(gòu),以及使用方式

        3.

        4. 2. HBase原理,基本架構(gòu)與案例分析

        5. 理論:介紹HBase應(yīng)用場景、原理和架構(gòu),介紹幾個(gè)HBase典型應(yīng)用案例,包括互聯(lián)網(wǎng)應(yīng)用案例和銀行應(yīng)用案例。"

         

        分布式計(jì)算技術(shù)MapReduceHive "1. 介紹計(jì)算框架MapReduce基本原理,架構(gòu)及程序設(shè)計(jì)方式

        2. 動(dòng)手編寫第一個(gè)MapReduce程序

        3. Hive基本原理及使用方式"

         

        分布式計(jì)算技術(shù)Spark "1. 介紹計(jì)算框架Spark基本原理,架構(gòu)及程序設(shè)計(jì)方式

        2. Spark程序設(shè)計(jì)"

         

        數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí) "1. 常見的數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)算法

        2. Hadoop數(shù)據(jù)挖掘庫mahout

        3. Spark數(shù)據(jù)挖掘庫mllib"

         

        應(yīng)用案例1:基于Hadoop的構(gòu)建數(shù)據(jù)倉庫 "1. 數(shù)據(jù)倉庫基礎(chǔ)介紹

        2. 如何利用大數(shù)據(jù)系統(tǒng)構(gòu)建數(shù)據(jù)倉庫

        使用Flume+HDFS+MapReduce+Hive構(gòu)建數(shù)據(jù)倉庫

        3. 數(shù)據(jù)倉庫基本架構(gòu)

        4. 數(shù)據(jù)倉庫應(yīng)用

        如報(bào)表生成"

         

        應(yīng)用案例2:用戶畫像系統(tǒng) "1. 什么是用戶畫像系統(tǒng)

        2. 如何構(gòu)建用戶畫像系統(tǒng)

        使用Flume/sqoop+HDFS+HBase+MapReduce/Spark+redis構(gòu)建用戶標(biāo)簽系統(tǒng)

        3. 用數(shù)據(jù)挖掘方式構(gòu)建用戶標(biāo)簽 

        應(yīng)用邏輯回歸、聚類、分類等機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘算法構(gòu)建用戶標(biāo)簽

        4. 用戶畫像系統(tǒng)應(yīng)用

        用戶畫像系統(tǒng)在用戶信用等級分級、大數(shù)據(jù)營銷中、用戶流失預(yù)警、潛在用戶分析、異常檢測與分析等方面的應(yīng)用"

         

        應(yīng)用案例3:商品推薦系統(tǒng) "1. 什么是商品推薦系統(tǒng)

        2. 商品推薦系統(tǒng)基本架構(gòu)

        使用Flume+HDFS +Spark+Redis構(gòu)建推薦系統(tǒng)

        3. 推薦算法

        推薦算法詳解"

         

        應(yīng)用案例4:數(shù)據(jù)挖掘系統(tǒng) "1. 什么是數(shù)據(jù)挖掘系統(tǒng)

        2. 數(shù)據(jù)挖掘算法的使用

        Spark為主,如何設(shè)計(jì)和實(shí)現(xiàn)邏輯回歸、聚類、分類等機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘算法

        3. 數(shù)據(jù)挖掘的典型應(yīng)用"

         

the end

評論(0)