大数据工程师2023版(升级版35周,源码+课件+电子手册)
当前课程目录 (点击可折叠)
-
课程源码课件及试看
- 【0】源码+PDF课件+电子手册+软件下载地址+接口数据集.rar
- 试看(随机抽取6节,普通播放器打开).rar
-
【阶段1:走进大数据】第1周、学好大数据先攻克Linux
-
1-1 第1章笑傲大数据成长体系课【必看】
- 1-1-1 笑傲大数据:总体介绍.mp4
-
1-2 第2章Linux虚拟机安装配置
- 1-2-1 如何安装Linux虚拟机.mp4
- 1-2-2 使用Vmware安装Linux虚拟机.mp4
- 1-2-3 使用克隆的方式创建Linux虚拟机.mp4
- 1-2-4 使用SecureCRT连接Linux虚拟机之方式一.mp4
- 1-2-5 使用SecureCRT连接Linux虚拟机之方式二.mp4
- 1-2-6 SecureCRT配置修改.mp4
-
1-3 第3章Linux极速上手
- 1-3-1 Linux常见高级命令之vi的使用.mp4
- 1-3-10 Linux常见高级命令之三剑客(sed).mp4
- 1-3-11 Linux常见高级命令之三剑客(awk).mp4
- 1-3-2 Linux常见高级命令之wc的使用.mp4
- 1-3-3 Linux常见高级命令之sort的使用.mp4
- 1-3-4 Linux常见高级命令之uniq的使用.mp4
- 1-3-5 Linux常见高级命令之head的使用.mp4
- 1-3-6 Linux常见高级命令之date的使用.mp4
- 1-3-7 Linux常见高级命令之ps和netstat的使用.mp4
- 1-3-8 Linux常见高级命令之jps+top+kill的使用.mp4
- 1-3-9 Linux常见高级命令之三剑客(grep).mp4
-
1-4 第4章Linux试炼之配置与shell实战
- 1-4-1 Linux高级配置之静态ip设置.mp4
- 1-4-10 shell扩展.mp4
- 1-4-11 Linux中的定时器crontab.mp4
- 1-4-2 Linux高级配置之hostname设置.mp4
- 1-4-3 Linux高级配置之防火墙设置.mp4
- 1-4-4 开发执行第一个shell脚本.mp4
- 1-4-5 shell中变量的定义.mp4
- 1-4-6 shell中四种变量的使用.mp4
- 1-4-7 shell中的循环和判断之for循环.mp4
- 1-4-8 shell中的循环和判断之while循环.mp4
- 1-4-9 shell中的循环和判断之if判断.mp4
-
1-5 第5章Linux总结与走进大数据
- 1-5-1 实战:在Linux上安装配置JDK.mp4
- 1-5-2 Linux总结.mp4
- 1-5-3 什么是大数据.mp4
- 1-5-4 大数据产生的背景.mp4
- 1-5-5 大数据的4V特征.mp4
- 1-5-6 大数据的行业应用.mp4
-
【阶段1:走进大数据】第2周、大数据起源之初识Hadoop
-
2-1 第1章初识Hadoop
- 2-1-1 什么是Hadoop.mp4
- 2-1-2 Hadoop发行版及核心组件介绍.mp4
-
2-2 第2章Hadoop的两种安装方式
- 2-2-1 Hadoop伪分布集群安装部署.mp4
- 2-2-2 Hadoop伪分布集群安装部署.mp4
- 2-2-3 Hadoop分布式集群安装部署.mp4
- 2-2-4 Hadoop分布式集群安装部署.mp4
- 2-2-5 Hadoop的客户端节点.mp4
-
【阶段1:走进大数据】第3周、Hadoop之HDFS的使用
-
3-1 第1章HDFS介绍
- 3-1-1 HDFS介绍.mp4
- 3-1-2 HDFS的Shell介绍.mp4
-
3-2 第2章HDFS基础操作
- 3-2-1 HDFS的常见Shell操作.mp4
- 3-2-2 HDFS案例实操.mp4
- 3-2-3 【扩展内容】HDFS的高级Shell命令.pdf
-
3-3 第3章Java操作HDFS
- 3-3-1 Java代码操作HDFS.mp4
- 3-3-2 Java代码操作HDFS.mp4
- 3-3-3【扩展内容】HDFS读数据过程分析.pdf
- 3-3-4【扩展内容】HDFS写数据过程分析.pdf
-
【阶段1:走进大数据】第4周、Hadoop之HDFS核心进程剖析
-
4-1 第1章初识NameNode
- 4-1-1 NameNode介绍.mp4
- 4-1-2 NameNode深入.mp4
-
4-2 第2章NameNode进阶
- 4-2-1 SecondaryNameNode介绍.mp4
- 4-2-2 DataNode介绍.mp4
- 4-2-3 NameNode总结.mp4
-
4-3 第3章HDFS高级
- 4-3-1 HDFS的回收站.mp4
- 4-3-2 HDFS的安全模式.mp4
- 4-3-3 实战:定时上传数据至HDFS.mp4
- 4-3-4 HDFS的高可用和高扩展.mp4
- 4-3-5 本周总结+寄语.mp4
-
4-4 第4章【扩展内容】HDFS写数据源码剖析
- 4-4-1 RPC原理分析及案例应用.mp4
- 4-4-2 HDFS写数据基础代码开发.mp4
- 4-4-3 源码概览及源码基础环境配置.mp4
- 4-4-4 create方法源码调用过程分析(上).mp4
- 4-4-5 create方法源码调用过程分析(下).mp4
- 4-4-6 write方法源码调用过程分析(上).mp4
- 4-4-7 write方法源码调用过程分析(下).mp4
- 4-4-8 HDFS写数据源码分析过程总结.pdf
-
【阶段1:走进大数据】第5周、Hadoop之初识MR
-
5-1 第1章初识MapReduce
- 5-1-1 MapReduce介绍.mp4
- 5-1-2 MapReduce执行原理.mp4
-
5-2 第2章实战:WordCount
- 5-2-1 WordCount案例图解.mp4
- 5-2-2 实战:WordCount案例开发.mp4
- 5-2-3 实战:WordCount案例开发.mp4
-
5-3 第3章深入MapReduce
- 5-3-1 MapReduce任务日志查看.mp4
- 5-3-2 停止Hadoop集群中的任务.mp4
- 5-3-3 MapReduce程序扩展.mp4
-
5-4 第4章精讲Shuffle执行过程及源码分析输入输出
- 5-4-1 Shuffle执行过程分析.mp4
- 5-4-2 Hadoop中的序列化机制.mp4
- 5-4-3 InputFormat层级分析.mp4
- 5-4-4 InputFormat之getSplits源码剖析.mp4
- 5-4-5 InputFormat之getSplits源码剖析.mp4
- 5-4-6 InputFormat之RecordReader源码剖析.mp4
- 5-4-7 OutputFormat源码剖析.mp4
-
【阶段2:PB级离线数据计算分析存储方案】第10周、快速上手NoSQL数据库HBase
-
10-1 第1章快速了解HBase
- 10-1-1 HBase逻辑存储模型.mp4
- 10-1-2 HBase简介.pdf
- 10-1-3 列式存储简介.pdf
- 10-1-4 列式存储的优点.pdf
- 10-1-5 HBase典型应用场景.pdf
- 10-1-6 HBase应用案例.pdf
- 10-1-7 HBase的优缺点总结.pdf
-
10-2 第2章快速上手使用HBase
- 10-2-1 HBase集群安装部署.mp4
- 10-2-2 HBase常用命令之基础命令和DDL命令.mp4
- 10-2-3 HBase常用命令之增删改查命令和命名空间的操作.mp4
- 10-2-4 HBaseJavaAPI开发环境配置.mp4
- 10-2-5 HBaseJavaAPI之增加和查询操作.mp4
- 10-2-6 HBaseJavaAPI之查询多版本数据和删除操作.mp4
- 10-2-7 HBaseJavaAPI之创建表和删除表.mp4
-
10-3 第3章深入HBase架构原理
- 10-3-1 Region概念详解.mp4
- 10-3-2 HBase物理架构.pdf
- 10-3-3 HBase架构详解.mp4
- 10-3-4 WAL预写日志系统.mp4
- 10-3-5 HFile文件及布隆过滤器介绍.mp4
- 10-3-6 HFile的合并机制.mp4
- 10-3-7 Region的分裂机制.mp4
- 10-3-8 Region的负载均衡策略.mp4
-
10-4 第4章HBase高级用法
- 10-4-1 列族高级设置.pdf
- 10-4-2 Scan全表扫描功能介绍.mp4
- 10-4-3 Scan+Filter案例实战.mp4
- 10-4-4 HBase批量导入之MapReduce.mp4
- 10-4-5 HBase批量导入之BulkLoad.mp4
- 10-4-6 HBase的两种批量导出.mp4
- 10-4-7 HBase连接池.pdf
-
10-5 第5章HBase调优策略和扩展内容
- 10-5-1 预分区、RowKey、列族的设计原则.mp4
- 10-5-2 HBase核心参数优化.pdf
- 10-5-3【扩展】Hive与HBase整合.pdf
- 10-5-4【扩展】Phoenix(凤凰).pdf
- 10-5-5【扩展】协处理器coprocessor.pdf
- 10-5-6【扩展】Elasticsearch+HBase.pdf
- 10-5-7【扩展】HBase实现分页功能.pdf
- 10-5-8【扩展】封装HBaseUtils工具类.pdf
- 10-5-9 HBase常见问题总结.pdf
-
【阶段2:PB级离线数据计算分析存储方案】第11周、数据分析引擎之Impala
-
11-1 第1章快速了解Impala
- 11-1-1 什么是Impala.mp4
- 11-1-2 Impala的核心组件及整体架构.mp4
-
11-2 第2章快速上手使用Impala
- 11-2-1 Impala的安装部署.mp4
- 11-2-2 Impala-shell客户端命令行的使用.mp4
- 11-2-3 Impala-shell中的高级参数命令.mp4
- 11-2-4 JDBC代码操作Impala.mp4
- 11-2-5 Hue页面工具操作Impala.mp4
- 11-2-6 Impala中内部表的使用.mp4
- 11-2-7 Impala中外部表的使用.mp4
- 11-2-8 Impala中分区表的使用.mp4
-
11-3 第3章Impala高级内容
- 11-3-1 refresh的第一种情况.mp4
- 11-3-2 refresh的第二种情况.mp4
- 11-3-3 refresh的第三种情况.mp4
- 11-3-4 invalidatemetadata的使用.mp4
- 11-3-5 Impala的数据存储和数据压缩.mp4
- 11-3-6 ImpalaSQL和HiveSQL的区别.mp4
- 11-3-7 Impala和Hive的典型应用场景.mp4
- 11-3-8 Impala集成HBase.mp4
-
【阶段2:PB级离线数据计算分析存储方案】第6周、拿来就用的企业级解决方案
-
6-1 第1章剖析小文件问题与企业级解决方案
- 6-1-1 小文件问题之SequenceFile.mp4
- 6-1-2 小文件问题之SequenceFile.mp4
- 6-1-3 小文件问题之MapFile.mp4
- 6-1-4 案例:小文件存储和计算.mp4
-
6-2 第2章剖析数据倾斜问题与企业级解决方案
- 6-2-1 数据倾斜问题分析.mp4
- 6-2-2 数据倾斜案例实战.mp4
- 6-2-3 数据倾斜案例实战.mp4
-
6-3 第3章YARN实战
- 6-3-1 YARN的基本情况介绍.mp4
- 6-3-2 YARN中的调度器分析.mp4
- 6-3-3 案例:YARN多资源队列配置和使用.mp4
-
6-4 第4章Hadoop官方文档使用指北【授人以鱼不如授人以渔】
- 6-4-1 Hadoop官方文档使用指南.mp4
- 6-4-2 Hadoop在CDH中的使用.mp4
- 6-4-3 Hadoop在HDP中的使用.mp4
-
6-5 第5章Hadoop核心复盘
- 6-5-1 本周总结+寄语.mp4
-
6-6 第6章【福利加油站】
- 6-6-1【加餐】大数据技术揭开抖音推荐的真相.mp4
- 6-6-2【加餐】大厂资深HR教你如何准备简历和面试.mp4
- 6-6-3【加餐】扩展知识-Hadoop3.0新特性之纠删码技术.pdf
- 6-6-4【加餐】疑难问题-课程内容典型疑难问题整理【第一弹】.pdf
- 6-6-5【加餐】面试题-课程内容常见面试题整理【第一弹】.pdf
-
【阶段2:PB级离线数据计算分析存储方案】第7周、Flume从0到高手一站式养成记
-
7-1 第1章极速入门Flume
- 7-1-1 快速了解Flume.mp4
- 7-1-2 Flume的三大核心组件.mp4
- 7-1-3 Flume安装部署.mp4
-
7-2 第2章极速上手Flume使用
- 7-2-1 Flume的HelloWorld.mp4
- 7-2-2 案例:采集文件内容上传至HDFS.mp4
- 7-2-3 案例:采集网站日志上传至HDFS.mp4
-
7-3 第3章精讲Flume高级组件
- 7-3-1 Flume高级组件之SourceInterceptors.mp4
- 7-3-2 Flume高级组件之ChannelSelectors.mp4
- 7-3-3 Flume高级组件之SinkProcessors.mp4
-
7-4 第4章Flume出神入化篇
- 7-4-1 各种自定义组件.mp4
- 7-4-2 Flume优化.mp4
- 7-4-3 Flume进程监控.mp4
-
7-5 第5章Flume核心复盘
- 7-5-1 本周总结+寄语.mp4
-
【阶段2:PB级离线数据计算分析存储方案】第8周、数据仓库Hive从入门到小牛
-
8-1 第1章快速了解Hive
- 8-1-1 快速了解Hive.mp4
-
8-2 第2章数据库与数据仓库区别
- 8-2-1 数据库和数据仓库的区别.mp4
- 8-2-2 Hive安装部署.mp4
-
8-3 第3章Hive基础使用
- 8-3-1 Hive使用方式之命令行方式.mp4
- 8-3-2 Hive使用方式之JDBC方式.mp4
- 8-3-3 Set命令的使用.mp4
- 8-3-4 Hive的日志配置.mp4
-
8-4 第4章Hive核心实战
- 8-4-1 Hive中数据库的操作.mp4
- 8-4-10 Hive数据处理综合案例(下).mp4
- 8-4-2 Hive中表的操作.mp4
- 8-4-3 Hive中数据类型的应用.mp4
- 8-4-4 Hive中数据类型的应用.mp4
- 8-4-5 Hive表类型之内部表+外部表.mp4
- 8-4-6 Hive表类型之内部分区表.mp4
- 8-4-7 Hive表类型之外部分区表.mp4
- 8-4-8 Hive表类型之桶表+视图.mp4
- 8-4-9 Hive数据处理综合案例(上).mp4
-
8-5 第5章Hive高级函数实战
- 8-5-1 Hive高级函数之分组排序取TopN.mp4
- 8-5-2 Hive高级函数之行转列.mp4
- 8-5-3 Hive高级函数之列转行.mp4
- 8-5-4 Hive的排序函数.mp4
- 8-5-5 Hive的分组和去重函数.mp4
-
8-6 第6章Hive技巧与核心复盘
- 8-6-1 一个SQL语句分析.mp4
- 8-6-2 Hive的Web工具-HUE.mp4
- 8-6-3 本周总结+寄语.mp4
-
【阶段2:PB级离线数据计算分析存储方案】第9周、Hive扩展内容
-
9-1 第1章常见数据压缩格式的使用
- 9-1-1 常见的数据压缩格式介绍.mp4
- 9-1-2 数据压缩格式选择建议和压缩位置.mp4
- 9-1-3 数据压缩格式案例实战分析.mp4
- 9-1-4 未压缩+Deflate压缩格式演示.mp4
- 9-1-5 Gzip+Bzip2压缩格式演示.mp4
- 9-1-6 Lz4+Snappy压缩格式演示.mp4
- 9-1-7 Lzo压缩格式演示.mp4
-
9-2 第2章常见数据存储格式的使用
- 9-2-1 数据存储格式之TextFile的原理及使用.mp4
- 9-2-2 数据存储格式之SequenceFile的原理及使用.mp4
- 9-2-3 数据存储格式之RCFile的原理及使用.mp4
- 9-2-4 数据存储格式之ORC的原理及使用.mp4
- 9-2-5 数据存储格式之Parquet的原理及使用.mp4
- 9-2-6 数据存储格式总结.mp4
-
【阶段3:Spark+综合项目:电商数据仓库设计与实战】第12周、7天极速掌握Scala语言
-
12-1 第1章Scala极速入门
- 12-1-1 快速了解Scala.mp4
- 12-1-2 Scala环境安装配置.mp4
-
12-2 第2章Scala基础语法
- 12-2-1 Scala中的变量和数据类型.mp4
- 12-2-2 Scala中的表达式和循环.mp4
- 12-2-3 Scala集合体系之Set.mp4
- 12-2-4 Scala集合体系之List.mp4
- 12-2-5 Scala集合体系之Map.mp4
- 12-2-6 Scala中的Array和Tuple.mp4
- 12-2-7 Scala集合总结.mp4
- 12-2-8 Scala中函数的使用.mp4
-
12-3 第3章Scala面向对象
- 12-3-1 Scala面向对象之类的使用.mp4
- 12-3-2 Scala面向对象之对象和伴生对象.mp4
- 12-3-3 Scala面向对象之apply方法.mp4
- 12-3-4 Scala面向对象之main方法的使用.mp4
- 12-3-5 Scala面向对象之接口的使用.mp4
-
12-4 第4章Scala函数式编程
- 12-4-1 Scala函数式编程介绍.mp4
- 12-4-2 Scala函数式编程之匿名函数和高阶函数.mp4
- 12-4-3 Scala函数式编程之常用高阶函数的使用.mp4
-
12-5 第5章Scala高级特性
- 12-5-1 Scala高级特性之模式匹配.mp4
- 12-5-2 Scala高级特性之隐式转换.mp4
-
12-6 第6章Scala核心复盘
- 12-6-1 本周总结+寄语.mp4
-
【阶段3:Spark+综合项目:电商数据仓库设计与实战】第13周、Spark快速上手
-
13-1 第1章初识Spark
- 13-1-1 快速了解Spark.mp4
- 13-1-2 SparkStandalone集群安装部署.mp4
- 13-1-3 SparkONYARN集群安装部署.mp4
-
13-2 第2章解读Spark工作与架构原理
- 13-2-1 Spark工作原理分析.mp4
- 13-2-2 什么是RDD.mp4
- 13-2-3 Spark架构原理.mp4
-
13-3 第3章Spark实战:单词统计
- 13-3-1 Spark项目开发环境配置.mp4
- 13-3-2 WordCount之Scala代码.mp4
- 13-3-3 WordCount之Java代码.mp4
- 13-3-4 Spark任务的三种提交方式.mp4
- 13-3-5 Spark开启historyServer服务.mp4
-
13-4 第4章Transformation与Action开发实战
- 13-4-1 创建RDD的三种方式.mp4
- 13-4-2 Transformation和Action介绍.mp4
- 13-4-3 Transformation操作开发实战之Scala代码(.mp4
- 13-4-4 Transformation操作开发实战之Scala代码(.mp4
- 13-4-5 Transformation操作开发实战之Java代码(上.mp4
- 13-4-6 Transformation操作开发实战之Java代码(下.mp4
- 13-4-7 Action操作开发实战之Scala代码.mp4
- 13-4-8 Action操作开发实战之Java代码.mp4
-
13-5 第5章RDD持久化
- 13-5-1 RDD持久化原理.mp4
- 13-5-2 RDD持久化开发实战之Scala代码.mp4
- 13-5-3 RDD持久化开发实战之Java代码.mp4
- 13-5-4 共享变量之BroadcastVariable的使用.mp4
- 13-5-5 共享变量之Accumulator的使用.mp4
-
13-6 第6章TopN主播统计
- 13-6-1 TopN主播统计需求分析.mp4
- 13-6-2 TopN主播统计代码实现之Scala代码.mp4
- 13-6-3 TopN主播统计代码实现之Java代码.mp4
-
13-7 第7章面试与核心复盘
- 13-7-1 面试题.mp4
- 13-7-2 本周总结+寄语.mp4
-
【阶段3:Spark+综合项目:电商数据仓库设计与实战】第14周、Spark性能优化的道与术
-
14-1 第1章Spark三种任务提交模式
- 14-1-1 宽依赖和窄依赖.mp4
- 14-1-2 Stage.mp4
- 14-1-3 Spark任务的三种提交模式.mp4
-
14-2 第2章Shuffle机制分析
- 14-2-1 Shuffle介绍.mp4
- 14-2-2 三种Shuffle机制分析.mp4
-
14-3 第3章Spark之checkpoint
- 14-3-1 checkpoint概述.mp4
- 14-3-2 checkpoint和持久化的区别.mp4
- 14-3-3 checkpoint代码开发(Scala+Java).mp4
- 14-3-4 checkpoint代码执行分析.mp4
- 14-3-5 checkpoint源码分析之写操作.mp4
- 14-3-6 checkpoint源码分析之读操作.mp4
-
14-4 第4章Spark程序性能优化企业级最佳实践
- 14-4-1 Spark程序性能优化分析.mp4
- 14-4-2 高性能序列化类库Kryo的使用.mp4
- 14-4-3 持久化或者checkpoint.mp4
- 14-4-4 JVM垃圾回收调忧.mp4
- 14-4-5 提高并行度.pdf
- 14-4-6 数据本地化.mp4
-
14-5 第5章Spark性能优化之算子优化
- 14-5-1 算子优化之mapPartitions.mp4
- 14-5-2 算子优化之foreachPartition.mp4
- 14-5-3 算子优化之repartition的使用.mp4
- 14-5-4 算子优化之reduceByKey和groupByKey.mp4
-
14-6 第6章极速上手SparkSql
- 14-6-1 SparkSql快速上手使用.mp4
- 14-6-2 DataFrame常见算子操作.mp4
- 14-6-3 DataFrame的sql操作.mp4
- 14-6-4 RDD转换为DataFrame之反射方式.mp4
- 14-6-5 RDD转换为DataFrame之编程方式.mp4
- 14-6-6 load和save操作.mp4
- 14-6-7 SaveMode的使用.mp4
- 14-6-8 内置函数介绍.mp4
-
14-7 第7章Spark实战与核心复盘
- 14-7-1 实战:TopN主播统计-1.mp4
- 14-7-2 实战:TopN主播统计-2.mp4
- 14-7-3 本周总结+寄语.mp4
-
【阶段3:Spark+综合项目:电商数据仓库设计与实战】第15周、Spark3.x扩展内容
-
15-1 第1章快速上手使用Spark3.x
- 15-1-1 Spark3.x版本介绍.mp4
- 15-1-2 基于Spark3.x版本开发代码.mp4
- 15-1-3 在大数据集群中集成Spark3.x环境.mp4
- 15-1-4 向YARN集群中提交Spark3.x代码.mp4
- 15-1-5 向YARN集群中提交Spark2.x代码.mp4
-
15-2 第2章Spark3.x版本中新特性的原理及应用
- 15-2-1 Spark1.x~3.x的演变历史.mp4
- 15-2-10 动态分区裁剪DPP(原理).mp4
- 15-2-11 动态分区裁剪DPP(应用)-1.mp4
- 15-2-12 动态分区裁剪DPP(应用)-2.mp4
- 15-2-13 Spark3.x其他新特性分析.mp4
- 15-2-2 Spark3.x新特性概述.mp4
- 15-2-3 AQE之自适应调整Shuffle分区数量(原理).mp4
- 15-2-4 AQE之自适应调整Shuffle分区数量(应用)-1.mp4
- 15-2-5 AQE之自适应调整Shuffle分区数量(应用)-2.mp4
- 15-2-6 AQE之动态调整Join策略(原理).mp4
- 15-2-7 AQE之动态调整Join策略(应用).mp4
- 15-2-8 AQE之动态优化倾斜的Join(原理).mp4
- 15-2-9 AQE之动态优化倾斜的Join(应用).mp4
-
15-3 第3章SparkSQL集成Hive
- 15-3-1 在SparkSQL命令行中集成Hive.mp4
- 15-3-2 在SparkSQL代码中集成Hive.mp4
- 15-3-3 使用insertInto向Hive表中写入数据.mp4
- 15-3-4 使用saveAsTable向Hive表中写入数据-1.mp4
- 15-3-5 使用saveAsTable向Hive表中写入数据-2.mp4
- 15-3-6 使用SparkSQL向Hive表中写入数据.mp4
- 15-3-7 向集群中提交代码.mp4
-
【阶段3:Spark+综合项目:电商数据仓库设计与实战】第16周、综合项目:电商数据仓库之用户行为数仓
-
16-1 第1章电商数据仓库效果展示
- 16-1-1 项目效果展示.mp4
- 16-1-2 项目的由来.mp4
-
16-2 第2章数据仓库前置技术
- 16-2-1 什么是数据仓库.mp4
- 16-2-2 数据仓库基础知识.mp4
- 16-2-3 数据仓库分层.mp4
- 16-2-4 典型数仓系统架构分析.mp4
-
16-3 第3章电商数仓技术选型
- 16-3-1 技术选型.mp4
- 16-3-2 整体架构设计.mp4
- 16-3-3 服务器资源规划.mp4
-
16-4 第4章数据生成与采集
- 16-4-1 生成用户行为数据【客户端数据】.mp4
- 16-4-2 生成商品订单相关数据【服务端数据】.mp4
- 16-4-3 采集用户行为数据【客户端数据】.mp4
- 16-4-4 Sqoop安装部署.mp4
- 16-4-5 Sqoop之数据导入功能.mp4
- 16-4-6 Sqoop之数据导出功能.mp4
- 16-4-7 采集商品订单相关数据【服务端数据】.mp4
- 16-4-8 采集商品订单相关数据【服务端数据】.mp4
-
16-5 第5章用户行为数仓设计与实现
- 16-5-1 用户行为数据数仓开发之ods层开发.mp4
- 16-5-10 需求二之需求分析.mp4
- 16-5-11 需求二之app层开发.mp4
- 16-5-12 需求二之开发脚本.mp4
- 16-5-13 需求三之需求分析.mp4
- 16-5-14 需求三之dws层和app层开发.mp4
- 16-5-15 需求三之开发脚本.mp4
- 16-5-16 需求四之需求分析.mp4
- 16-5-17 需求四之app层开发.mp4
- 16-5-18 需求四之开发脚本.mp4
- 16-5-19 需求五之需求分析.mp4
- 16-5-2 用户行为数据数仓开发之ods层脚本抽取.mp4
- 16-5-20 需求五之dws层开发.mp4
- 16-5-21 需求五之app层开发.mp4
- 16-5-22 需求五之结果验证.mp4
- 16-5-23 需求六之需求分析.mp4
- 16-5-24 需求六之dws层和app层开发.mp4
- 16-5-25 需求六之开发脚本.mp4
- 16-5-26 用户行为数据数仓表和任务脚本总结.mp4
- 16-5-3 用户行为数据数仓开发之dwd层开发.mp4
- 16-5-4 用户行为数据数仓开发之dwd层脚本抽取.mp4
- 16-5-5 用户行为数据数仓需求分析.mp4
- 16-5-6 需求一之需求分析.mp4
- 16-5-7 需求一之dws层开发.mp4
- 16-5-8 需求一之app层开发.mp4
- 16-5-9 需求一之开发脚本.mp4
-
16-6 第6章项目核心复盘
- 16-6-1 本周总结.mp4
-
【阶段3:Spark+综合项目:电商数据仓库设计与实战】第17周、综合项目:电商数据仓库之商品订单数仓
-
17-1 第1章商品订单数仓需求分析
- 17-1-1 商品订单数据数仓开发之ods层和dwd层.mp4
- 17-1-2 商品订单数据数仓需求分析.mp4
-
17-2 第2章需求设计与实现
- 17-2-1 需求一之需求分析.mp4
- 17-2-10 需求四之需求分析.mp4
- 17-2-11 需求四之app层开发.mp4
- 17-2-12 需求四之开发脚本.mp4
- 17-2-2 需求一之dws层开发.mp4
- 17-2-3 需求一之开发脚本.mp4
- 17-2-4 需求二之需求分析.mp4
- 17-2-5 需求二之app层开发.mp4
- 17-2-6 需求二之开发脚本.mp4
- 17-2-7 需求三之需求分析.mp4
- 17-2-8 需求三之dws层和app层开发.mp4
- 17-2-9 需求三之开发脚本.mp4
-
17-3 第3章订单拉链表实战
- 17-3-1 什么是拉链表.mp4
- 17-3-2 如何制作拉链表.mp4
- 17-3-3【实战】基于订单表的拉链表实现-1.mp4
- 17-3-4【实战】基于订单表的拉链表实现-2.mp4
- 17-3-5【实战】基于订单表的拉链表实现-3.mp4
- 17-3-6 拉链表的性能问题分析.mp4
- 17-3-7 商品订单数据数仓表和任务脚本总结.mp4
-
17-4 第4章数据可视化和任务调度实现
- 17-4-1 数据可视化之Zepplin的安装部署和参数配置.mp4
- 17-4-2 数据可视化之Zepplin的使用.mp4
- 17-4-3 任务调度之Crontab调度器的使用.mp4
- 17-4-4 任务调度之Azkaban的安装部署.mp4
- 17-4-5 任务调度之Azkaban提交独立任务.mp4
- 17-4-6 任务调度之Azkaban提交依赖任务.mp4
- 17-4-7 任务调度之在数仓中使用Azkaban.mp4
- 17-4-8 项目优化.mp4
-
17-5 第5章项目核心复盘
- 17-5-1 本周总结.mp4
-
17-6 第6章数据压缩格式和存储格式在数仓中的应用
- 17-6-1 数据存储格式和压缩格式在数仓中的应用.mp4
-
【阶段4:高频实时数据处理+海量数据全文检索方案】第18周、消息队列之Kafka从入门到小牛
-
18-1 第1章初识Kafka
- 18-1-1 什么是消息队列.mp4
- 18-1-2 什么是Kafka.mp4
-
18-2 第2章Kafka集群安装部署
- 18-2-1 Zookeeper安装部署之单机模式.mp4
- 18-2-2 Zookeeper安装部署之集群模式.mp4
- 18-2-3 Kafka安装部署之单机模式.mp4
- 18-2-4 Kafka安装部署之集群模式.mp4
-
18-3 第3章Kafka使用初体验
- 18-3-1 Kafka中Topic的操作.mp4
- 18-3-2 Kafka中的生产者和消费者.mp4
- 18-3-3 案例:QQ群聊天.mp4
-
18-4 第4章Kafka核心扩展内容
- 18-4-1 Broker扩展内容.mp4
- 18-4-2 Producer扩展内容.mp4
- 18-4-3 Consumer扩展内容.mp4
-
18-5 第5章Kafka核心之存储和容错机制
- 18-5-1 Topic+Partition+Message扩展内容.mp4
- 18-5-2 存储策略.mp4
- 18-5-3 容错机制.mp4
-
18-6 第6章Kafka生产消费者实战
- 18-6-1 Java代码实现生产者代码.mp4
- 18-6-2 Java代码实现消费者代码.mp4
- 18-6-3 消费者代码扩展.mp4
- 18-6-4 Consumer消费Offset查询.mp4
- 18-6-5 Consumer消费顺序.mp4
- 18-6-6 Kafka的三种语义.mp4
-
18-7 第7章Kafka技巧篇
- 18-7-1 JVM参数调忧.mp4
- 18-7-2 Replication参数调忧.mp4
- 18-7-3 Log参数调忧.mp4
- 18-7-4 KafkaTopic命名小技巧.mp4
- 18-7-5 Kafka集群监控管理工具(CMAK).mp4
-
18-8 第8章Kafka小试牛刀实战篇
- 18-8-1 实战:Flume集成Kafka-1.mp4
- 18-8-2 实战:Flume集成Kafka-2.mp4
- 18-8-3 实战:Kafka集群平滑升级.mp4
-
18-9 第9章Kafka核心复盘
-
【阶段4:高频实时数据处理+海量数据全文检索方案】第19周、极速上手内存数据库Redis
-
19-1 第1章快速了解Redis
- 18-9-1 本周总结+寄语.mp4
- 19-1-1 快速了解Redis.mp4
- 19-1-2 Redis的安装部署.mp4
- 19-1-3 Redis基础命令.mp4
- 19-1-4 Redis多数据库特性.mp4
-
19-2 第2章Redis核心实践
- 19-2-1 Redis常用数据类型之String.mp4
- 19-2-2 Redis常用数据类型之Hash.mp4
- 19-2-3 Redis常用数据类型之List.mp4
- 19-2-4 Redis常用数据类型之Set.mp4
- 19-2-5 Redis常用数据类型之SortedSet.mp4
- 19-2-6 案例:存储高一班的学员信息.mp4
-
19-3 第3章Redis封装工具类技巧
- 19-3-1 Java代码操作Redis之单连接.mp4
- 19-3-2 Java代码操作Redis之连接池.mp4
- 19-3-3 提取RedisUtils工具类.mp4
-
19-4 第4章Redis高级特性
- 19-4-1 Redis高级特性之expire.mp4
- 19-4-2 Redis高级特性之pipeline和info.mp4
- 19-4-3 Redis持久化之RDB.mp4
- 19-4-4 Redis持久化之AOF.mp4
- 19-4-5 Redis的安全策略.mp4
- 19-4-6 Redis监控命令-monitor.mp4
-
19-5 第5章Redis核心复盘
- 19-5-1 Redis架构演进过程.mp4
- 19-5-2 本周总结+寄语.mp4
-
【阶段4:高频实时数据处理+海量数据全文检索方案】第20周、Flink快速上手篇
-
20-1 第1章初识Flink
- 20-1-1 快速了解Flink.mp4
-
20-2 第2章实战:流处理和批处理程序开发
- 20-2-1 FlinkStreaming程序开发-Scala.mp4
- 20-2-2 FlinkStreaming程序开发-Java.mp4
- 20-2-3 FlinkBatch程序开发-Scala.mp4
- 20-2-4 FlinkBatch程序开发-Java.mp4
-
20-3 第3章Flink集群安装部署
- 20-3-1 FlinkStandalone集群安装部署.mp4
- 20-3-2 FlinkONYARN的两种方式.mp4
- 20-3-3 向集群中提交Flink任务.mp4
-
20-4 第4章Flink核心API之DataStreamAPI
- 20-4-1 Flink核心API介绍.mp4
- 20-4-2 DataStreamAPI之DataSource.mp4
- 20-4-3 DataStream API之Transformation-union.mp4
- 20-4-4 DataStream API之Transformation-connect.mp4
- 20-4-5 DataStream API之Transformation-split.mp4
- 20-4-6 DataStream API之Transformation-sideoutput.mp4
- 20-4-7 DataStream API之Transformation-分区规则介绍.mp4
- 20-4-8 DataStream API之Transformation-分区规则的使用.mp4
- 20-4-9 DataStreamAPI之DataSink.mp4
-
20-5 第5章Flink核心API之DataSetAPI
- 20-5-1 DataSet API之Transformation-mapPartition.mp4
- 20-5-2 DataSet API之Transformation-join.mp4
- 20-5-3 DataSet API之Transformation-outerJoin.mp4
- 20-5-4 DataSet API之Transformation-cross.mp4
- 20-5-5 DataSet API之Transformation-firstN.mp4
-
20-6 第6章Flink核心API之TableAPI和SQL
- 20-6-1 TableAPI和SQL介绍.mp4
- 20-6-2 创建TableEnvironment对象.mp4
- 20-6-3 TableAPI和SQL的使用.mp4
- 20-6-4 使用DataStream创建表.mp4
- 20-6-5 使用DataSet创建表.mp4
- 20-6-6 将表转换成DataStream.mp4
- 20-6-7 将表转换成DataSet.mp4
-
20-7 第7章Flink核心复盘
- 20-7-1 本周总结+寄语.mp4
-
【阶段4:高频实时数据处理+海量数据全文检索方案】第21周、Flink高级进阶之路
-
21-1 第1章Flink中的Window和Time详解
- 21-1-1 Window的概念和类型.mp4
- 21-1-2 TimeWindow的使用.mp4
- 21-1-3 CountWindow的使用.mp4
- 21-1-4 自定义Window的使用.mp4
- 21-1-5 Window中的增量聚合和全量聚合.mp4
- 21-1-6 Flink中的Time.mp4
-
21-2 第2章Flink中的Watermark深入剖析
- 21-2-1 Watermark的分析.mp4
- 21-2-2 开发Watermark代码.mp4
- 21-2-3 开发Watermark代码.mp4
- 21-2-4 通过数据跟踪观察Watermark.mp4
- 21-2-5 Watermark+EventTime处理乱序数据.mp4
- 21-2-6 延迟数据的三种处理方式.mp4
- 21-2-7 在多并行度下的Watermark应用.mp4
- 21-2-8 Watermark案例总结.mp4
-
21-3 第3章Flink中的并行度详解
- 21-3-1 并行度介绍及四种设置方式.mp4
- 21-3-2 并行度案例分析.mp4
-
21-4 第4章Flink之KafkaConnector专题
- 21-4-1 KafkaConsumer的使用.mp4
- 21-4-2 KafkaConsumer消费策略设置.mp4
- 21-4-3 KafkaConsumer的容错.mp4
- 21-4-4 KafkaProducer的使用.mp4
- 21-4-5 KafkaProducer的容错.mp4
-
21-5 第5章SparkStreaming快速上手
- 21-5-1 SparkStreaming的WordCount程序开发.mp4
- 21-5-2 SparkStreaming整合Kafka.mp4
-
21-6 第6章Flink核心复盘
- 21-6-1 本周总结+寄语.mp4
-
21-7 第7章【福利加油站】
- 21-7-1【加餐】天猫双11大屏的由来.mp4
- 21-7-2【加餐】双11大屏需求分析及架构设计.mp4
- 21-7-3【加餐】双11大屏指标核心代码开发-1.mp4
- 21-7-4【加餐】双11大屏指标核心代码开发-2.mp4
- 21-7-5【加餐】双11大屏从0~1全流程跑通.mp4
- 21-7-6【加餐】疑难问题-课程内容典型疑难问题整理【第二弹】.pdf
- 21-7-7【加餐】面试题-课程内容常见面试题整理【第二弹】.pdf
-
【阶段4:高频实时数据处理+海量数据全文检索方案】第22周、Flink1.15新特性及状态的使用
-
22-1 第1章Flink新版本新特性介绍
- 22-1-1 Flink最近几个版本的新特性介绍.pdf
-
22-2 第2章快速上手使用Flink1.15
- 22-2-1 开发Flink1.15版本批流一体化代码.mp4
- 22-2-2 在已有的大数据集群中集成Flink1.15版本的环境.mp4
- 22-2-3 向YARN中同时提交多个Flink版本的代码.mp4
-
22-3 第3章State(状态)的使用与管理
- 22-3-1 什么是State(状态).mp4
- 22-3-10 KeyedState的使用形式总结.mp4
- 22-3-11 OperatorState原理分析.mp4
- 22-3-12 OperatorState案例之ListState的使用.mp4
- 22-3-13 OperatorState案例之UnionListSta.mp4
- 22-3-14 OperatorState案例之BroadcastSta.mp4
- 22-3-15 OperatorState案例之BroadcastSta.mp4
- 22-3-2 State相关概念整体概览.mp4
- 22-3-3 State(状态)的类型介绍.mp4
- 22-3-4 KeyedState原理分析.mp4
- 22-3-5 KeyedState案例之温度告警(ValueState).mp4
- 22-3-6 KeyedState案例之温度告警(ValueState).mp4
- 22-3-7 KeyedState案例之直播间数据统计(MapState.mp4
- 22-3-8 KeyedState案例之订单数据补全(ListState.mp4
- 22-3-9 KeyedState案例之订单数据补全(ListState.mp4
-
【阶段4:高频实时数据处理+海量数据全文检索方案】第23周、Flink1.15之状态的容错与一致性
-
23-1 第1章State(状态)的容错与一致性
- 23-1-1 State的容错与一致性介绍.mp4
- 23-1-10 从Savepoint进行恢复之正常恢复.mp4
- 23-1-11 从Savepoint进行恢复之异常恢复(上).mp4
- 23-1-12 从Savepoint进行恢复之异常恢复(下).mp4
- 23-1-13 StateBackend的原理及配置.mp4
- 23-1-14 State的生存时间的原理及使用.mp4
- 23-1-15 Window中的数据存在哪里.mp4
- 23-1-2 如何实现Flink任务的端到端一致性.mp4
- 23-1-3 Checkpoint机制的原理及核心配置.mp4
- 23-1-4 保存多个Checkpoint.mp4
- 23-1-5 从Checkpoint进行恢复-手动恢复.mp4
- 23-1-6 从Checkpoint进行恢复-自动恢复.mp4
- 23-1-7 Savepoint详解之算子唯一标识.mp4
- 23-1-8 Savepoint详解之算子最大并行度.mp4
- 23-1-9 手工触发Savepoint.mp4
-
23-2 第2章Checkpoint与State底层原理深度剖析
- 23-2-1 Checkpoint的生成和恢复过程.mp4
- 23-2-2 CheckpointBarrier原理分析.mp4
- 23-2-3 Kafka+Flink+Kafka实现端到端一致性.mp4
- 23-2-4 Flink+Kafka相关源码分析.mp4
-
23-3 第3章Kafka-connector新API的使用
- 23-3-1 KafkaSource源码分析.mp4
- 23-3-2 KafkaSource实战应用.mp4
- 23-3-3 KafkaSink源码分析.mp4
- 23-3-4 KafkaSink实战应用.mp4
- 23-3-5 KafkaSink开启Checkpoint时的数据延迟问题.mp4
-
【阶段4:高频实时数据处理+海量数据全文检索方案】第24周、FlinkSQL(1.15)快速上手
-
24-1 第1章FlinkSQL快速理解
- 24-1-1 FlinkSQL快速理解(离线计算+实时计算).mp4
- 24-1-2 FlinkSQL解析引擎之Calcite分析.mp4
- 24-1-3 Flink SQL之DDL案例(FileSystem+Print).mp4
- 24-1-4 FlinkSQL之DDL案例(Kafka+Kafka).mp4
-
24-2 第2章FlinkSQL中的表类型详解
- 24-2-1 FlinkSQL中的静态表和动态表.mp4
- 24-2-2 FlinkSQL中的连续查询概念解释.mp4
- 24-2-3 FlinkSQL动态表转换为Append-only流.mp4
- 24-2-4 FlinkSQL动态表转换为Retract流.mp4
- 24-2-5 FlinkSQL动态表转换为Upsert流.mp4
- 24-2-6 FlinkSQL中的版本表和时态表函数.mp4
-
24-3 第3章FlinkSQL常见的数据类型
- 24-3-1 FlinkSQL常见的数据类型(1).mp4
- 24-3-2 FlinkSQL常见的数据类型(2).mp4
-
24-4 第4章FlinkSQL中的列类型详解
- 24-4-1 FlinkSQL中常规列和元数据列介绍.mp4
- 24-4-2 FlinkSQL中元数据列的使用.mp4
- 24-4-3 FlinkSQL中计算列介绍.mp4
-
24-5 第5章FlinkSQL中的DML语句详解
- 24-5-1 FlinkSQL中的DML语句介绍.mp4
- 24-5-2 FlinkSQL滚动窗口的使用.mp4
- 24-5-3 FlinkSQL滑动窗口的使用.mp4
- 24-5-4 FlinkSQL滚动窗口+Watermark的使用.mp4
-
24-6 第6章FlinkSQL中的Catalog
- 24-6-1 FlinkSQL中的Catalog介绍.mp4
- 24-6-2 FlinkSQL中Catalog的使用(1).mp4
- 24-6-3 FlinkSQL中Catalog的使用(2).mp4
- 24-6-4 FlinkSQL中Catalog的使用(3).mp4
-
24-7 第7章FlinkSQL如何兼容Hive
- 24-7-1 FlinkSQL如何兼容HiveSQL函数.mp4
- 24-7-2 FlinkSQL如何兼容HiveSQL语法.mp4
- 24-8-1 FlinkSQLClient客户端工具的使用.mp4
- 24-8-2 FlinkSQLClient直接执行SQL脚本文件.mp4
-
24-8 第8章FlinkSQLClient客户端工具
-
【阶段4:高频实时数据处理+海量数据全文检索方案】第25周、FlinkSQL双流JOIN详解
-
25-1 第1章FlinkSQL双流Join概述
- 25-1-1 HiveSQL离线JoinVSFlinkSQL双流Join.mp4
- 25-1-2 FlinkSQL双流Join底层原理.mp4
-
25-10 第10章FlinkSQL扩展内容
- 25-10-1 FlinkSQL之StateTTL.mp4
- 25-10-2 FlinkSQL之Checkpoint.mp4
-
25-2 第2章FlinkSQL双流Join之普通Join
- 25-2-1 FlinkSQL之普通Join(Regular Join)介绍.mp4
- 25-2-10 upsert-kafka的原理介绍.mp4
- 25-2-11 upsert-kafka案例分析.mp4
- 25-2-12 验证upsert-kafka的效果-group by.mp4
- 25-2-13 验证upsert-kafka的效果-join.mp4
- 25-2-14 Join执行流程源码分析.mp4
- 25-2-15 Group By执行流程源码分析.mp4
- 25-2-16 upsert-kafka作为Source使用.mp4
- 25-2-17 SQL92与SQL99中Join的语法区别.mp4
- 25-2-2 普通Join(Regular Join)之Inner Join执行流程分析.mp4
- 25-2-3 普通Join(Regular Join)之Left Join执行流程分析.mp4
- 25-2-4 普通Join(Regular Join)之Right Join执行流程分析.mp4
- 25-2-5 普通Join(Regular Join)之Full Join执行流程分析.mp4
- 25-2-6 普通Join(Regular Join)案例实战之Inner Join.mp4
- 25-2-7 普通Join(Regular Join)案例实战之Left Join.mp4
- 25-2-8 普通Join(Regular Join)案例实战之Right Join.mp4
- 25-2-9 普通Join(Regular Join)案例实战之Full Join.mp4
-
25-3 第3章FlinkSQL双流Join之时间区间Join
- 25-3-1 FlinkSQL之时间区间Join(Interval Join)介绍.mp4
- 25-3-2 时间区间Join(Interval Join)执行流程.mp4
- 25-3-3 时间区间Join(Interval Join)底层源码剖析.mp4
- 25-3-4 时间区间Join(Interval Join)左边界+右边界.mp4
- 25-3-5 时间区间Join(Interval Join)案例实战之Inner Join.mp4
- 25-3-6 时间区间Join(Interval Join)案例实战之Left Join(上).mp4
- 25-3-7 时间区间Join(Interval Join)案例实战之Left Join(下).mp4
- 25-3-8 时间区间Join(Interval Join)案例实战之Right Join.mp4
- 25-3-9 时间区间Join(Interval Join)案例实战之Full Join.mp4
-
25-4 第4章FlinkSQL双流Join之快照Join
- 25-4-1 FlinkSQL之快照Join(TemporalJoin).mp4
- 25-4-2 快照Join(TemporalJoin)案例实战之Inne.mp4
- 25-4-3 快照Join(TemporalJoin)案例实战之Left.mp4
- 25-4-4 两个普通动态表(仅追加)如何实现快照Join.mp4
- 25-4-5 快照Join(TemporalJoin)核心源码分析.mp4
-
25-5 第5章FlinkSQL双流Join之维表Join
- 25-5-1 FlinkSQL之维表Join(LookupJoin)介绍.mp4
- 25-5-2 维表Join(Lookup Join)案例实战之Inner Join.mp4
- 25-5-3 维表Join(Lookup Join)案例实战之Left Join.mp4
-
25-6 第6章FlinkSQL双流Join之数组炸裂
- 25-6-1 FlinkSQL之数组炸裂(ArrayExpansion).mp4
-
25-7 第7章FlinkSQL双流Join之表函数Join
- 25-7-1 FlinkSQL之表函数Join(Table Function Join)介绍.mp4
- 25-7-2 表函数Join(Table Function Join)案例实战.mp4
- 25-7-3 时态表函数Join(Temporal Table Function Join)案例实战.mp4
-
25-8 第8章FlinkSQL双流Join之窗口Join
- 25-8-1 FlinkSQL之窗口Join(WindowJoin)介绍.mp4
- 25-8-2 窗口JoinVS时间区间Join.mp4
- 25-8-3 窗口Join(WindowJoin)案例实战.mp4
-
25-9 第9章FlinkSQL双流JOIN总结
- 25-9-1 FlinkSQL双流Join总结.mp4
-
【阶段4:高频实时数据处理+海量数据全文检索方案】第26周、实时OLAP引擎之ClickHouse
-
26-1 第1章OLAP数据分析引擎整体概述
- 26-1-1 OLAP引擎的起源.mp4
- 26-1-2 OLAP引擎的分类.mp4
- 26-1-3 大数据领域OLAP引擎典型应用场景及选型依据.mp4
-
26-2 第2章快速了解ClickHouse
- 26-2-1 ClickHouse的由来及概述.mp4
- 26-2-2 ClickHouse的优缺点.mp4
-
26-3 第3章快速上手使用ClickHouse
- 26-3-1 ClickHouse单机安装部署.mp4
- 26-3-2 ClickHouse节点基础环境修改及核心目录介绍.mp4
- 26-3-3 ClickHouse客户端之Cli.mp4
- 26-3-4 ClickHouse客户端之JDBC.mp4
- 26-3-5 ClickHouse客户端之第三方工具.mp4
-
【阶段4:高频实时数据处理+海量数据全文检索方案】第27周、全文检索引擎Elasticsearch
-
27-1 第1章快速了解Elasticsearch
- 27-1-1 Elasticsearch简介.mp4
- 27-1-2 MySQLVSElasticsearch.mp4
- 27-1-3 Elasticsearch核心概念.mp4
-
27-2 第2章快速上手使用Elasticsearch
- 27-2-1 Elasticsearch安装包配置文件分析.mp4
- 27-2-2 Elasticsearch单机安装步骤.mp4
- 27-2-3 Elasticsearch集群安装步骤.mp4
- 27-2-4 Elasticsearch集群监控管理工具-cerebro.mp4
- 27-2-5 使用RestAPI的方式操作ES的索引库.mp4
- 27-2-6 使用RestAPI的方式操作ES的索引.mp4
- 27-2-7 使用JavaAPI的方式操作ES的索引库.mp4
- 27-2-8 使用JavaAPI的方式操作ES的索引.mp4
-
27-3 第3章Elasticsearch分词详解
- 27-3-1 Elasticsearch分词及倒排索引介绍.mp4
- 27-3-2 分词器的作用.pdf
- 27-3-3 分词器的工作流程.pdf
- 27-3-4 停用词.pdf
- 27-3-5 中文分词方式.pdf
- 27-3-6 常见的中文分词器.pdf
- 27-3-7 Elasticsearch集成中文分词插件(es-ik).mp4
- 27-3-8 Elasticsearch添加自定义词库.mp4
- 27-3-9 Elasticsearch添加热更新词库.mp4
-
27-4 第4章Elasticsearch查询详解
- 27-4-1 ElasticsearchSearch查询.mp4
- 27-4-10 Elasticsearch聚合案例-2.mp4
- 27-4-11 Elasticsearch获取所有分组数据.mp4
- 27-4-2 searchType详解.pdf
- 27-4-3 Elasticsearchquery过滤功能-1.mp4
- 27-4-4 Elasticsearchquery过滤功能-2.mp4
- 27-4-5 Elasticsearch分页+排序功能.mp4
- 27-4-6 Elasticsearch高亮功能.mp4
- 27-4-7 评分依据(了解).pdf
- 27-4-8 ES中分页的性能问题.pdf
- 27-4-9 Elasticsearch聚合案例-1.mp4
-
27-5 第5章Elasticsearch的高级特性
- 27-5-1 Elasticsearch中的settings.mp4
- 27-5-2 Elasticsearch中的mapping.mp4
- 27-5-3 Elasticsearch的偏好查询.mp4
- 27-5-4 Elasticsearch的routing路由功能.mp4
- 27-5-5 ES的索引库模板(了解).pdf
- 27-5-6 ES的索引库别名(了解).pdf
- 27-5-7 ElasticsearchSQL的使用.mp4
- 27-5-8 ES优化策略.pdf
-
【阶段4:高频实时数据处理+海量数据全文检索方案】第28周、Es+HBase仿百度搜索引擎项目
-
28-1 第1章企业中快速复杂查询痛点分析
- 28-1-1 企业中快速复杂查询痛点分析.mp4
-
28-2 第2章仿百度搜索引擎项目架构设计
- 28-2-1 仿百度搜索引擎项目架构设计.mp4
-
28-3 第3章ES高级特性扩展
- 28-3-1 ES高级特性原理分析.mp4
- 28-3-2 ES高级特性案例实操.mp4
-
28-4 第4章开发仿百度搜索引擎项目
- 28-4-1 项目需求和开发步骤分析.mp4
- 28-4-2 获取接口数据导入HBase和Redis-1.mp4
- 28-4-3 获取接口数据导入HBase和Redis-2.mp4
- 28-4-4 通过ES对HBase中的数据建立索引-1.mp4
- 28-4-5 通过ES对HBase中的数据建立索引-2.mp4
- 28-4-6 对接Web项目实现核心检索代码.mp4
- 28-4-7 从0~1运行项目.mp4
-
28-5 第5章项目中遇到的典型问题
- 28-5-1 项目中遇到的典型问题.pdf
-
【阶段5:综合项目:三度关系推荐系统+数据中台】第29周、实时数仓-Kafka Eagle+DS
-
29-1 第1章 Kafka Eagle快速理解
- 29-1-1 Kafka Eagle(EFAK)简介.mp4
- 29-1-2 Kafka Eagle(EFAK)安装部署.mp4
-
29-2 第2章 Kafka Eagle常见功能的使用
- 29-2-1 Kafka Eagle(EFAK)常见功能的使用-1.mp4
- 29-2-2 Kafka Eagle(EFAK)常见功能的使用-2.mp4
-
29-3 第3章 DolphinScheduler快速理解
- 29-3-1 DolphinScheduler简介.mp4
- 29-3-2 DolphinScheduler基础环境配置.mp4
- 29-3-3 DolphinScheduler伪分布安装.mp4
-
29-4 第4章 DolphinScheduler常见功能介绍
- 29-4-1 DolphinScheduler常见功能介绍-1.mp4
- 29-4-2 DolphinScheduler常见功能介绍-2.mp4
-
29-5 第5章 DolphinScheduler案例实战
- 29-5-1 单个Shell任务调度-1.mp4
- 29-5-10 使用Shell插件调度Flink.mp4
- 29-5-2 单个Shell任务调度-2.mp4
- 29-5-3 调度已开发好的Shell脚本任务.mp4
- 29-5-4 带依赖的Shell任务.mp4
- 29-5-5 使用Shell插件调度HiveSQL.mp4
- 29-5-5-11 使用Flink插件调度Flink.mp4
- 29-5-6 使用HiveCli插件调度HiveSQL.mp4
- 29-5-7 使用SQL插件调度HiveSQL.mp4
- 29-5-8 使用Shell插件调度Spark.mp4
- 29-5-9 使用Spark插件调度Spark.mp4
-
【阶段5:综合项目:三度关系推荐系统+数据中台】第30周、实时数仓-Flink CDC数据采集
-
30-1 第1章 Flink CDC快速理解
- 30-1-1 Flink CDC简介.mp4
- 30-1-2 Flink CDC生态概览.mp4
-
30-2 第2章 Flink CDC之MySQL CDC
- 30-2-1 MySQL CDC 介绍.mp4
- 30-2-2 在Linux中安装MySQL.mp4
- 30-2-3 MySQL开启Binlog功能.mp4
- 30-2-4 基于DataStreamAPI采集MySQL数据输出到控.mp4
- 30-2-5 基于DataStreamAPI采集MySQL数据输出到控.mp4
- 30-2-6 基于DataStreamAPI采集MySQL数据输出到K.mp4
- 30-2-7 基于Flink SQL采集MySQL数据输出到控制台.mp4
- 30-2-8 基于Flink SQL采集MySQL数据输出到Kafka.mp4
- 30-2-9 MySQL CDC自定义反序列化类.mp4
-
30-3 第3章 MySQL CDC支持的高级特性
- 30-3-1 MySQL CDC支持的高级特性介绍.mp4
- 30-3-10 采集没有主键的表-使用DataStream API.mp4
- 30-3-11 高级特性之Exactly-Once语义的介绍及验证-1.mp4
- 30-3-12 高级特性之Exactly-Once语义的介绍及验证-2.mp4
- 30-3-13 高级特性之动态加表介绍.mp4
- 30-3-14 动态加表特性验证.mp4
- 30-3-15 高级特性之分库分表介绍及验证.mp4
- 30-3-16 高级特性之元数据列介绍及验证.mp4
- 30-3-2 高级特性之启动模式介绍.mp4
- 30-3-3 启动模式在DataStream API下的配置.mp4
- 30-3-4 启动模式在Flink SQL API下的配置.mp4
- 30-3-5 高级特性之DataStream Source+全增量一体.mp4
- 30-3-6 高级特性之增量快照数据读取算法介绍.mp4
- 30-3-7 增量快照数据读取算法在DataStream API下的验.mp4
- 30-3-8 增量快照数据读取算法在Flink SQL API下的验证.mp4
- 30-3-9 采集没有主键的表-使用Flink SQL API.mp4
-
30-4 第4章 MySQL CDC扩展内容
- 30-4-1 MySQL CDC可能遇到的问题及数据类型映射关系.mp4
-
【阶段5:综合项目:三度关系推荐系统+数据中台】第31周、实时数仓-Paimon数据湖
-
31-1 第1章 Paimon快速理解
- 31-1-1 Paimon简介及整体架构分析.mp4
- 31-1-2 Paimon的核心特点及生态圈介绍.mp4
-
31-2 第2章 快速上手使用Paimon
- 31-2-1 快速上手使用Paimon原理介绍.mp4
- 31-2-2 在Flink sql-client.sh中操作Paimon.mp4
- 31-2-3 在Flink SQL代码中操作Paimon.mp4
- 31-2-4 基于Flink DataStream API向Paimon写入数据.mp4
- 31-2-5 基于Flink DataStream API从Paimon读取数据.mp4
-
31-3 第3章 Paimon中的表类型-全局维度
- 31-3-1 Paimon内部表和外部表介绍.mp4
- 31-3-2 Flink SQL从Paimon外部表读取数据.mp4
- 31-3-3 Flink SQL向Paimon外部表写入数据.mp4
- 31-3-4 Flink SQL读写Paimon分区表.mp4
- 31-3-5 Paimon临时表的原理及应用分析.mp4
-
31-4 第4章 Paimon中的表类型-存储维度
- 31-4-1 主键表之Bucket特性介绍.mp4
- 31-4-10 Changelog Producers之Full Compaction原理分析.mp4
- 31-4-11 Changelog Producers之Full Compaction案例实战+总结.mp4
- 31-4-12 Merge Engines之Deduplicate原理分析.mp4
- 31-4-13 Merge Engines之Deduplicate案例实战.mp4
- 31-4-14 Merge Engines之Partial Update原理分析.mp4
- 31-4-15 Merge Engines之Partial Update案例实战.mp4
- 31-4-16 Merge Engines之Aggregation原理分析.mp4
- 31-4-17 Merge Engines之Aggregation案例实战.mp4
- 31-4-18 主键表之Sequence Field特性介绍.mp4
- 31-4-19 主键表之Sequence Field特性验证.mp4
- 31-4-2 主键表之Bucket特性验证.mp4
- 31-4-20 仅追加表特性分析.mp4
- 31-4-21 仅追加表案例实战.mp4
- 31-4-22 表的核心参数和支持的数据类型.mp4
- 31-4-3 主键表之Changelog Producers特性介绍.mp4
- 31-4-4 Changelog Producers之None原理分析.mp4
- 31-4-5 Changelog Producers之None案例实战.mp4
- 31-4-6 Changelog Producers之Input原理分析.mp4
- 31-4-7 Changelog Producers之Input案例实战.mp4
- 31-4-8 Changelog Producers之Lookup原理分析.mp4
- 31-4-9 Changelog Producers之Lookup案例实战.mp4
-
【阶段5:综合项目:三度关系推荐系统+数据中台】第32周、实时数仓-Paimon(数据湖)高级进阶
-
32-1 Paimon的核心操作
- 32-1-1 Hive Catalog的使用最近学习.mp4
- 32-1-2 Hive Catalog同步Paimon分区表的分区信息.mp4
- 32-1-3 动态修改Paimon表的属性信息.mp4
- 32-1-4 查询数据功能总体分析.mp4
- 32-1-5 查询系统表.mp4
- 32-1-6 批量读取-时间旅行的用法-1.mp4
- 32-1-7 批量读取-时间旅行的用法-2.mp4
- 32-1-8 流式读取-时间旅行的用法.mp4
- 32-1-9 流式读取-Consumer ID的使用.mp4
-
32-2 CDC数据摄取
- 32-2-1 Paimon CDC数据摄取功能介绍.mp4
- 32-2-10 高级特性之计算列介绍+案例.mp4
- 32-2-11 高级特性之特殊的数据类型映射介绍.mp4
- 32-2-12 高级特性之特殊的数据类型映射案例.mp4
- 32-2-13 高级特性之中文乱码介绍+案例.mp4
- 32-2-2 MySQL数据同步到Paimon介绍.mp4
- 32-2-3 MySQL同步表功能开发.mp4
- 32-2-4 MySQL同步数据库功能开发.mp4
- 32-2-5 Kafka数据同步到Paimon介绍.mp4
- 32-2-6 Kafka同步表功能开发.mp4
- 32-2-7 Kafka同步数据库功能开发.mp4
- 32-2-8 高级特性之Schema模式演变介绍.mp4
- 32-2-9 高级特性之Schema模式演变案例.mp4
-
32-3 Hive引擎集成Paimon
- 32-3-1 Hive引擎集成Paimon介绍.mp4
- 32-3-2 在Hive中配置Paimon依赖.mp4
- 32-3-3 在Hive中读写Paimon表.mp4
- 32-3-4 在Hive中创建Paimon表.mp4
- 32-3-5 Hive和Paimon数据类型映射关系.mp4
-
【阶段5:综合项目:三度关系推荐系统+数据中台】第33周、直播平台三度关系推荐V1.0
-
33-1 第1章项目介绍及演示
- 33-1-1 项目介绍.mp4
-
33-2 第2章项目技术选型
- 33-2-1 技术选型之数据采集.mp4
- 33-2-2 技术选型之数据存储.mp4
- 33-2-3 技术选型之数据计算+数据展现.mp4
- 33-2-4 项目整体架构设计.mp4
-
33-3 第3章Neo4j图数据库快速上手使用
- 33-3-1 Neo4j介绍及安装部署.mp4
- 33-3-2 Neo4j之添加数据.mp4
- 33-3-3 Neo4j之查询数据.mp4
- 33-3-4 Neo4j之更新数据.mp4
- 33-3-5 Neo4j之建立索引+批量导入数据.mp4
-
33-4 第4章数据采集模块分析
- 33-4-1 数据采集架构详细设计.mp4
- 33-4-2 数据来源分析.mp4
- 33-4-3 模拟产生数据.mp4
-
33-5 第5章数据采集+聚合+分发+落盘
- 33-5-1 数据采集聚合.mp4
- 33-5-2 数据分发.mp4
- 33-5-3 数据落盘.mp4
- 33-5-4 采集服务端数据库数据.mp4
-
33-6 第6章数据计算核心指标分析
- 33-6-1 数据计算核心指标详细分析.mp4
-
33-7 第7章数据核心指标计算
- 33-7-1 数据计算之历史粉丝关注数据初始化.mp4
- 33-7-10 数据计算之每周一计算三度关系推荐列表数据-2.mp4
- 33-7-11 三度关系数据导出到MySQL.mp4
- 33-7-2 数据计算之实时维护粉丝关注数据-1.mp4
- 33-7-3 数据计算之实时维护粉丝关注数据-2.mp4
- 33-7-4 数据计算之实时维护粉丝关注数据-3.mp4
- 33-7-5 数据计算之每天定时更新主播等级.mp4
- 33-7-6 数据计算之每天定时更新用户活跃时间.mp4
- 33-7-7 数据计算之每周一计算最近一个月主播视频评级-1.mp4
- 33-7-8 数据计算之每周一计算最近一个月主播视频评级-2.mp4
- 33-7-9 数据计算之每周一计算三度关系推荐列表数据-1.mp4
-
33-8 第8章项目核心复盘
- 33-8-1 总结(三度关系推荐系统V1.0).mp4
-
【阶段5:综合项目:三度关系推荐系统+数据中台】第34周、直播平台三度关系推荐V2.0
-
34-1 第1章V1.0架构方案分析及V2.0架构设计
- 34-1-1 V1.0架构问题分析及V2.0架构设计.mp4
-
34-2 第2章V2.0架构之数据核心指标计算
- 34-2-1 数据计算之历史粉丝关注数据初始化.mp4
- 34-2-10 数据计算之每周一计算三度关系列表-3.mp4
- 34-2-11 数据计算之三度关系列表数据导出到Redis.mp4
- 34-2-2 数据计算之实时维护粉丝关注数据-1.mp4
- 34-2-3 数据计算之实时维护粉丝关注数据-2.mp4
- 34-2-4 数据计算之每天定时更新主播等级.mp4
- 34-2-5 数据计算之每天更新用户活跃时间.mp4
- 34-2-6 数据计算之每周一计算最近一个月主播视频评级-1.mp4
- 34-2-7 数据计算之每周一计算最近一个月主播视频评级-2.mp4
- 34-2-8 数据计算之每周一计算三度关系列表-1.mp4
- 34-2-9 数据计算之每周一计算三度关系列表-2.mp4
-
34-3 第3章数据接口定义及开发
- 34-3-1 数据接口定义及开发.mp4
-
34-4 第4章数据展示
- 34-4-1 数据展示.mp4
-
34-5 第5章项目扩展优化
- 34-5-1 项目中遇到的问题及优化.mp4
- 34-5-2 项目数据规模及集群规模相关指标分析.mp4
-
34-6 第6章项目核心复盘
- 34-6-1 总结(三度关系推荐系统V2.0).mp4
-
【阶段5:综合项目:三度关系推荐系统+数据中台】第35周、数据中台大屏
-
35-1 第1章数据中台的前世今生
- 35-1-1 什么是中台.mp4
-
35-2 第2章数据中台架构
- 35-2-1 什么是数据中台.mp4
- 35-2-2 数据中台架构.mp4
-
35-3 第3章什么样的企业适合建设数据中台
- 35-3-1 什么样的企业适合建设数据中台.mp4
-
35-4 第4章数据中台企业级解决方案
- 35-4-1 企业级数据中台架构分析.mp4
-
35-5 第5章项目总结
- 35-5-1 总结.mp4
-
35-6 第6章数据中台之数据加工总线
- 35-6-1 快速了解数据加工总线.mp4
-
35-7 第7章数据加工总线之SparkSQL计算引擎开发
- 35-7-1 核心功能点梳理.mp4
- 35-7-10 支持自定义函数返回多列字段.mp4
- 35-7-11 使用RestAPI向YARN集群提交任务(1).mp4
- 35-7-12 使用RestAPI向YARN集群提交任务(2).mp4
- 35-7-13 使用RestAPI向YARN集群提交任务(3).mp4
- 35-7-14 使用RestAPI向YARN集群提交任务(4).mp4
- 35-7-2 开发基于SparkSQL的通用计算引擎(1).mp4
- 35-7-3 开发基于SparkSQL的通用计算引擎(2).mp4
- 35-7-4 开发基于SparkSQL的通用计算引擎(3).mp4
- 35-7-5 开发基于SparkSQL的通用计算引擎(4).mp4
- 35-7-6 验证SparkSQL计算引擎代码.mp4
- 35-7-7 封装正式的SparkSQL计算引擎代码.mp4
- 35-7-8 支持复杂字段类型:数组.mp4
- 35-7-9 支持在SQL中调用HTTP接口.mp4
-
35-8 第8章数据加工总线之FlinkSQL计算引擎开发
- 35-8-1 增加底层计算引擎FlinkSQL.mp4
-
35-9 第9章后期展望
- 35-9-1 后期展望.mp4
-
课程目录截图
- 课程目录截图1.png
- 课程目录截图2.png
- 课程目录截图3.png
- 课程目录截图4.png
- 课程目录截图5.png
- 课程目录截图6.png
- 课程目录截图7.png
- 课程目录截图8.png
课程总大小: 22034782821 字节
主题授权提示:请在后台主题设置-主题授权-激活主题的正版授权,授权购买:RiTheme官网
本站所有资料均来源与网络以及用户发布,如对资源有争议请联系微信客服我们可以安排下架!