您现在的位置是:课程
27天大数据基础班教程(理论+实践+作业)
2023-06-29 21:14课程 人已围观
课程咨询和资料获取请加老师QQ 1011800132 大数据的4V特征: 数据量大,TB->PB 数据类型繁多,结构化、非结构化文本、日志、视频、图片、地理位置等; 商业价值高,但是这种价值需要在海量数据之上,通过数据分析与机器学习更快速的挖掘出来; 处理时效性高,海量数据的处理需求不再局限在离线计算当中。
为了应对大数据的这几个特点,开源的大数据框架越来越多,功能也越来越强大,先列举一些常见的:
-
文件存储:Hadoop HDFS
-
离线计算:Hadoop MapReduce
-
流式、实时计算:Storm、Spark Streaming、Flink
-
K-V、NOSQL数据库:HBase、Redis、MongoDB、Kudu
-
资源管理:YARN
-
日志收集:Flume
-
消息系统:Kafka、RabbitMQ
-
查询分析:Hive、Impala、Pig、Presto、Phoenix、SparkSQL、Flink、Kylin
-
分布式协调服务:Zookeeper
-
集群管理与监控:Ambari、Ganglia等
-
数据挖掘、机器学习:Spark MLLib
-
数据同步:Sqoop
-
任务调度:Oozie、Azkaban
学员评价: 1.这是我学过的第三个Java基础教程,这个确实在基础这块,讲的太好了,一句话,学了这个,我感觉前面两个有点小儿科!只是教了相关API怎么用,这个教程你只要可以用心花1-2个月,啃下来,过面试小case!
2.这是我见过的最强Java教程 不但讲了Java语言本身还穿插了设计模式 最后还讲了jvm的知识等等 真的内容十分的充实,很好的教程。学了Java的人再看这个视频也有很大收获!!
3.讲得很好,很仔细,很深入,老师功底深厚。
上一篇:快速入门Unity机器学习