原创 解析IBM SQL-on-Hadoop的优化思路

IBM Big SQL 是SQL on Hadoop 的方案,它的核心引擎沿用了DB2的技术,因此,Big SQL的优化与DB2类似。由于Big SQL本身不拥有数据(数据在HDFS),所以它自身的优化选项要比DB2少,但同时要注意优化Hadoop/HDFS。

2016-05-30 10:32:17.000
转帖 大数据时代:搭建自己的大数据平台可以很容易!

随着大数据技术的蓬勃发展,越来越多的客户逐渐构建起自己的大数据平台,并实现了原有技术难以实现的业务场景。在国内,IBM作为主要的大数据产品和解决方案提供商之一,通过可靠的产品和可信赖的服务赢得越来越多客户的信任,下面就让我们一起通过几个应用案例,来看看国内的客户如何使用IBM的大数据产品吧

2016-05-17 09:53:12.000
转帖 运营商 PK BAT,谁的数据更有价值?

谈起大数据,必然要提到BAT等互联网公司,它们在大数据领域是先发者,不过这也很正常,因为它本身是有数据基因的,但从全面性、完整性等角度讲,运营商的数据也许更有代表性和竞争力,为什么呢?

2016-02-29 09:51:34.000
转帖 Storm VS Spark,谁是你的最佳实时大数据处理器?

实时大数据处理已经逐步迈入主流,而Storm与Spark项目的支持无疑在其中起到了显著的推动作用。那么问题来了:实时大数据处理到底该选谁?

2016-01-14 10:56:10.000
原创 HBase基础知识,面向列的实时分布式数据库

Hbase是运行在Hadoop上的NoSQL数据库,它是一个分布式的和可扩展的大数据仓库,也就是说HBase能够利用HDFS的分布式处理模式,并从Hadoop的MapReduce程序模型中获益。

2015-11-17 10:11:18.000
原创 Hadoop开发人员基础课程之初识MapReduce

随着Hadoop在国内的迅速崛起,MapReduce也逐渐引起开发人员的重视,作为Hadoop的核心,让我们一起来看看它是怎样运作的。

2015-11-13 11:38:03.000
原创 分布式文件系统HDFS解析

HDFS是Hadoop项目的核心子项目,是分布式计算中数据存储管理的基础,是基于流数据模式访问和处理超大文件的需求而开发的,它所具有的高容错、高可靠性、高可扩展性、高获得性、高吞吐率等特征为海量数据提供了不怕故障的存储,为超大数据集的应用处理带来了很多便利。

2015-11-11 11:05:12.000
转帖 美国电商是如何用大数据玩转“双十一”的

年底购物季,大洋彼岸的美国,不少电商网站开始通过分析用户在社交平台上的非结构化数据来分析和定义用户个性和特征,从而实现更精准的营销,同时,通过最新的数据分析工具,许多并非“财大气粗”的中小企业也可以享受到这样的福利。

2015-11-10 10:36:46.000
原创 什么是Hadoop,怎样学习Hadoop

Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。

2015-11-09 10:48:26.000
原创 深度解析如何挑选适合自己的Hadoop平台

IBM、Oracle、SAP、甚至Microsoft等几乎所有的大型软件提供商都采用了Hadoop。然而,当你已经决定要使用Hadoop来处理大数据时,首先碰到的问题就是如何开始以及选择哪一种产品。本文讨论了不同的选择,并推荐了每种选择的适用场合。

2015-11-06 10:49:06.000
扫码咨询


添加微信 立即咨询

电话咨询

客服热线
023-68661681

TOP