数据处理
【学习 Flink】
Flink Apache Flink是由Apache软件基金会开发的开源流处理框架,其核心是用Java和Sc...
【学习 Flume】
Flume 是一种分布式,可靠且可用的服务,用于有效地收集,聚合和移动大量日志数据。它具有基于流数据流的简单...
【学习 Hadoop】
Hadoop Hadoop是一个开放源代码框架,允许使用简单的编程模型在跨计算机集群的分布式环境中存储和处理大...
【学习 Hbase】
Hbase HBase是一个开源的非关系型分布式数据库(NoSQL),它参考了谷歌的BigTable建模,实...
【学习 Hive】
Hive Apache Hive是一个建立在Hadoop架构之上的数据仓库。它能够提供数据的精炼,查询和分...
【学习 Kafka】
Kafka Kafka是由Apache软件基金会开发的一个开源流处理平台,由Scala和Java编写。Kaf...
【学习 Kibana】
Kibana Kibana是一个开源的基于浏览器的可视化工具,主要用于分析大量日志,以折线图、条形图、饼图、热...
【学习 MapReduce】
MapReduce MapReduce是Google提出的一个软件架构,用于大规模数据集(大于1TB)的并行运算。概...
【学习 MATLAB】
MATLAB MATLAB 用于算法开发、数据可视化、数据分析以及数值计算的高级技术计算语言和交互式环境。
【学习 MyBatis】
MyBatis MyBatis是一个Java持久化框架,它通过XML描述符或注解把对象与存储过程或SQL语句关联...
【学习 Pig】
Pig Apache Pig是一个用于分析大型数据集的平台,该平台包含用于表达数据分析程序的高级语言,以...
【学习 R语言】
R语言 R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它...
【学习 Solr】
Solr Solr 是一个可扩展、可部署的搜索/存储引擎,经过优化,可搜索大量以文本为中心的数据。Solr...
【学习 Spark】
Spark Apache Spark是用于大规模数据处理的统一分析引擎。它提供Java,Scala,Pyth...
【学习 Storm】
Storm Storm 最初是由Nathan Marz和BackType的团队创建的。BackType 是一...
【学习 Zookeeper】
Zookeeper Apache ZooKeeper是Apache软件基金会的一个软件项目,它为大型分布式计算提供开...
【学习 大数据分析】
大数据分析 在过去的十年里,一个人必须处理的数据量已经爆炸到难以想象的水平,与此同时,数据存储的价格也系统性...
【学习 数据仓库】
数据仓库 通过集成来自多个异构源的数据来构建数据仓库。它支持分析报告、结构化和/或临时查询以及决策。本教程...
【学习 数据挖掘】
数据挖掘 数据挖掘是对数据的探索和分析,以发现有意义的模式或规则。 它被归类为数据科学领域的一门学科。 数...