没有找到合适的产品?
联系客服协助选型:023-68661681
提供3000多款全球软件/控件产品
针对软件研发的各个阶段提供专业培训与技术咨询
根据客户需求提供定制化的软件开发服务
全球知名设计软件,显著提升设计质量
打造以经营为中心,实现生产过程透明化管理
帮助企业合理产能分配,提高资源利用率
快速打造数字化生产线,实现全流程追溯
生产过程精准追溯,满足企业合规要求
以六西格玛为理论基础,实现产品质量全数字化管理
通过大屏电子看板,实现车间透明化管理
对设备进行全生命周期管理,提高设备综合利用率
实现设备数据的实时采集与监控
利用数字化技术提升油气勘探的效率和成功率
钻井计划优化、实时监控和风险评估
提供业务洞察与决策支持实现数据驱动决策
转帖|行业资讯|编辑:陈俊吉|2016-06-03 11:00:44.000|阅读 1196 次
概述:InfoSphere DataStage 是 IBM 统一数据集成平台InfoSphere Information Server的重要组件,是业界主流的ETL(Extract, Transform, Load)软件。
# 界面/图表报表/文档/IDE等千款热门软控件火热销售中 >>
相关链接:
在上期发布的文章《分分钟让你学会使用DataStage连通企业级数据库》中,给大家详细介绍过DataStage广泛支持各种异构平台的数据库,提供多种功能强大、类型丰富的数据库连接器,满足企业数据集成所需:
DataStage不仅可以全面支持结构化数据,同样也支持对非结构化数据的访问,例如TXT、CSV、XML、COBOL和Excel文件。今天与大家分享的最佳实践,就是如何通过DataStage的Unstructured Data组件来访问和读取Excel文件。
1. Excel文件名为Employee1.xls,包括3个sheet(sheet1, sheet2, sheet3),其中sheet1存放的是员工及部门信息,sheet2和sheet3都为空,数据样本如下:
2. 设计DataStage作业,从Employee1.xls文件的sheet1表单中抽取属于部门DEPT_B01的员工信息,并输出到文本文件。
3. 编译并运行作业,结果数据如下:
1、Excel文件名为Employee2.xls,包括4个sheet,分别存放DEPT A00,DEPT B01,DEPT C01,DEPT D01这四个部门的员工信息;并且,这4个sheet的数据结构一致,每个sheet的第3行都表示字段名。数据样本如下:
2. 设计DataStage作业,从Employee2.xls文件的所有表单中抽取属于各个部门的员工信息,并统一输出到文本文件。
3. 编译并运行作业,结果数据如下:
1. Excel文件名为Employee3.xls,包括2个sheet(Departments,Employees),分别存放部门信息和员工信息;并且,这2个sheet的数据结构不一致。数据样本如下:
2. 设计DataStage作业,从Employee3.xls文件的多个表单中分别抽取部门信息和员工信息,输出到不同的文本文件。
3. 编译并运行作业,结果数据如下
InfoSphere DataStage不仅能灵活解析并读取Excel多表单文件,而且还能实现创建或写入Excel文件,更能支持多种类型的非结构化数据,
想要了解更多有关DataStage的功能和数据集成场景吗,请访问下面链接:http://bigdata.evget.com/products-16-1.html
via:华南IBM大数据支持团队
更多大数据与分析相关行业资讯、解决方案、案例、教程等请点击查看>>>
详情请咨询“在线客服”!
客服热线:023-66090381
本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至chenjj@evget.com
HOOPS Visualize提供了一套灵活、专业、可扩展的3D可视化开发框架,特别适用于工业级工程软件。
为了解决大家获取Aspose试用版延时、示例教程翻译费劲、授权问题不清楚等问题,小编整理了本篇Aspose资源合集,欢迎收藏!
企业级软件测试方案Parasoft C/C++test凭借其智能技术、模块化用例框架以及多维度覆盖率热力图等先进功能,实现了测试用例的“自动生长”,解决了用例维护难题,并精准定位未覆盖区域,为Stellantis的软件测试工作带来了革命性的变革。
QA是保障软件质量的关键防线,效率至关重要。Parasoft CTP的这一新功能,通过提升自动化测试和剩余手动测试的代码覆盖率,可以与开发节奏保持同步,并获得更快的反馈,这使企业能够充满自信地修复所有漏洞,从而稳步推进项目发展。
使用动态内存中列式技术加速分析数据
InfoSphere DataStage助您发现、充实、集成和管理数据的整个生命周期
InfoSphere Data Replication在异构数据存储之间复制数据
Content Manager Enterprise Edition帮助组织管理数字信息,以获取最佳灵活性和影响力
服务电话
重庆/ 023-68661681
华东/ 13452821722
华南/ 18100878085
华北/ 17347785263
客户支持
技术支持咨询服务
服务热线:400-700-1020
邮箱:sales@evget.com
关注我们
地址 : 重庆市九龙坡区火炬大道69号6幢
慧都科技 版权所有 Copyright 2003-
2025 渝ICP备12000582号-13 渝公网安备
50010702500608号