原创
自己构建Hadoop大数据环境?请小心这三大陷阱

自己构建自己构建Hadoop大数据环境似乎是一个很经济实惠的选择,但是如果不注意以下三大陷阱,你可能会栽一个大跟头。

2017-03-09 16:28:18.000
转帖
解析流式大数据处理的三种框架:Storm,Spark和Samza

许多分布式计算系统都可以实时或接近实时地处理大数据流。本文将对三种Apache框架分别进行简单介绍,然后尝试快速、高度概述其异同。

2016-06-15 11:11:59.000
转帖
简述实时流处理系统的用例

本文阐述了为什么比起Hadoop之类的知名技术,类似Apache Storm这样的系统更加有用。

2016-06-15 10:47:32.000
转帖
Storm VS Spark,谁是你的最佳实时大数据处理器?

实时大数据处理已经逐步迈入主流,而Storm与Spark项目的支持无疑在其中起到了显著的推动作用。那么问题来了:实时大数据处理到底该选谁?

2016-01-14 10:56:10.000
转帖
从信用卡账单刷卡数据中,我们可以分析出什么?

对于刷卡消费类的数据分析,如果能够拿到所有人的信用卡消费数据(一个人可能有多张信用卡),那么拿到这些信用卡消费数据应该如何展开分析。

2016-01-13 11:10:16.000
转帖
2016年最值得关注的大数据领域33大预测

2016年大数据领域会发生什么情况?考虑到如今在深层神经网络和规范性分析方面取得的进展,你可能觉得这个问题很好回答。而实际上,来自业界的大数据预测大不相同,本文精选出了最值得关注的33个预测,为您开启未知的2016!

2016-01-06 10:16:08.000
转帖
为什么Spark Streaming越来越流行?

Databricks最近对1400多家Spark用户进行了一次调查,结果显示这些用户对Spark Streaming的使用率与2014年相比增长了56%,另外,有48%的受访者将Spark Streaming标记为最常用的Spark组件。Uber、Netflix和Pinterest等家喻户晓的公司赫然在列,那么为什么使用Spark Streaming加速业务发展的公司越来越多呢?我们一起来看看。

2016-01-05 09:49:27.000
转帖
有点意思!圣诞老人利用大数据派送礼物居然是这样的……

如果圣诞老人拥有物联网、大数据和智能设备,他会这样发放礼物。

2015-12-25 09:56:40.000
转帖
解析Spark大数据分析框架的核心部件

Spark大数据分析框架的核心部件包含RDD内存数据结构、Streaming流计算框架、GraphX图计算与网状数据挖掘、MLlib机器学习支持框架、Spark SQL数据检索语言、Tachyon文件系统、SparkR计算引擎等主要部件,这里做一个简单的介绍。

2015-12-23 13:33:53.000
转帖
2016年, 商业智能和数据分析领域的新趋势

在2016年,我们依然将看到商业世界会发生巨大的变化。新的数据分析工具将出现,给公司提供更多的业务情报、业务指导和市场操作策略。具体说来,我们在这一年将会看到什么呢?

2015-12-21 10:17:06.000
扫码咨询


添加微信 立即咨询

电话咨询

客服热线
023-68661681

TOP