原创 干货 | 数据挖掘入门必看10个问题

硬要去区分Data Mining和Statistics的差异其实是没有太大意义的。一般将之定义为Data Mining技术的CART、CHAID或模糊计算等等理论方法,也都是由统计学者根据统计理论所发展衍生,换另一个角度看,Data Mining有相当大的比重是由高等统计学中的多变量分析所支撑。但是为什么Data Mining的出现会引发各领域的广泛注意呢?

2016-10-12 09:50:15.000
原创 【干货】数据控使用Hadoop的三种常用方式

Apache Hadoop 2.0正式发布,这是Hadoop领域巨大的里程碑,因为它开启了史无前例的数据存储方式革命。Hadoop保留它典型的“大数据”基础技术,但它是否适合当下数据库及数据仓库的使用方式?又是否有一种通用模式可以切实降低固有的使用复杂性呢?

2016-10-11 10:04:01.000
原创 Apache Hadoop 3.0新版本介绍及未来发展方向(内附PDF)

过去十年,Apache Hadoop从无到有,从理论概念演变到如今支撑起若干全球最大的生产集群。接下来的十年,Hadoop将继续壮大,并发展支撑新一轮的更大规模、高效和稳定的集群。 我们此次将向大家全面介绍即将到来的Apache Hadoop 3.0新版本——从版本发布状态、背后的故事,到如HDFS erasure coding、YARN federation、NN k-safety等全新的功能。

2016-10-11 09:43:11.000
原创 10大天然大数据公司,看他们如何挖掘数据价值

10大天然大数据公司,看他们如何挖掘数据价值

2016-10-10 11:34:16.000
原创 大数据在医疗领域的七大应用

大数据的意义在于提供“大见解”:从不同来源收集信息,然后分析信息,以揭示用其他方法发现不了的趋势。在利用大数据发掘价值的所有行业中,医疗行业有可能实现最大的回报。凭借大数据,医疗服务提供商不仅可以知道如何提高盈利水平和经营效率,还能找到直接增进人类福祉的趋势。

2016-10-10 11:15:12.000
原创 带您了解大数据

大数据,或称巨量数据、海量数据;是由数量巨大、结构复杂、类型众多数据构成的数据集合,是基于云计算的数据处理与应用模式,通过数据的集成共享,交叉复用形成的智力资源和知识服务能力。

2016-10-09 10:33:54.000
原创 SPSS干货分享:区分T检验与F检验

一般而言,为了确定从样本 (sample) 统计结果推论至总体时所犯错的概率,我们会利用统计学家所开发的一些统计方法,进行统计检定。

2016-10-09 09:38:47.000
原创 拥抱开源 - 云上元数据管理

上期我们讲述的是实现数据工程师梦想的一个小目标《梦想成真,只差一步》,里面提到了要实现数据超市的管理,数据工程师需要使用合适的工具将数据进行整理、组合、分类后上架,然后业务分析师和数据科学家就可以使用了。

2016-09-30 10:04:46.000
原创 BigInsights -- 基于 Hadoop 的大数据分析平台

本文针对 IBM 最新开发的数据分析平台进行概要介绍并对其应用进行指导说明。随着信息技术应用范围的不断扩展,对数据进行挖掘分析的需求日益增加,但是信息量的不断增大及其应用构建的复杂性日益却成为了传统数据分析的一个瓶颈。IBM 构建的数据分析平台针对上述问题,基于 Hadoop 技术,对数据查询语言,数据分析软件,数据库,作业调度模块进行了有效整合,实现了对数据的有效、高效处理,保证了高度的扩展性和兼容性。

2016-09-29 10:20:22.000
原创 IBM SPSS Modeler数据库内建模

IBM SPSS Modeler的分析功能和易用性将与数据库的功能和性能相结合,同时还兼备数据库供应商提供的数据库自有算法。模型在数据库创建,然后可以借助IBM SPSS Modeler界面以正常方式浏览模型并为之评分。

2016-09-29 09:50:10.000
扫码咨询


添加微信 立即咨询

电话咨询

客服热线
023-68661681

TOP