hyperion数据发掘_数据发掘方向

2024-07-24 10:34:03

hyperion数据发掘_数据发掘方向

在接下来的时间里，我将尽力回答大家关于hyperion数据发掘的问题，希望我的解答能够给大家带来一些思考。关于hyperion数据发掘的话题，我们开始讲解吧。

1.大数据分析技术生态圈一览

2.谁对国内bi工具比较了解的，bi产品对比该看重哪些点

3.BI软件有哪些？

4.DB2的历史

5.什么是 BI工程师

6.文献引用的标准格式是什么？

hyperion数据发掘_数据发掘方向

大数据分析技术生态圈一览

大数据领域让人晕头转向。为了帮助你，我们决定制作这份厂商图标和目录。它并不是全面列出了这个领域的每家厂商，而是深入探讨大数据分析技术领域。我们希望这份资料新颖、实用。

这是一款面向Hadoop的自助服务式、无数据库模式的大数据分析应用软件。

Platfora

这是一款大数据发现和分析平台。

Qlikview

这是一款引导分析平台。

Sisense

这是一款商业智能软件，专门处理复杂数据的商业智能解决方案。

Sqream

这是一款快速、可扩展的大数据分析SQL数据库。

Splunk

这是一款运维智能平台。

Sumologic

这是一项安全的、专门定制的、基于云的机器数据分析服务。

Actian

这是一款大数据分析平台。

亚马逊Redshift

这是一项PB级云端数据仓库服务。

CitusData

可扩展PostgreSQL。

Exasol

这是一种用于分析数据的大规模并行处理(MPP)内存数据库。

惠普Vertica

这是一款SQL on Hadoop大数据分析平台。

Mammothdb

这是一款与SQL兼容的MPP分析数据库。

微软SQL Server

这是一款关系数据库管理系统。

甲骨文Exadata

这是一款计算和存储综合系统，针对甲骨文数据库软件进行了优化。

SAP HANA

这是一款内存计算平台。

Snowflake

这是一款云数据仓库。

Teradata

这是企业级大数据分析和服务。

数据探查

Apache Drill

这是一款无数据库模式的SQL查询引擎，面向Hadoop、NoSQL和云存储。

Cloudera Impala

这是一款开源大规模并行处理SQL查询引擎。

谷歌BigQuery

这是一项全面托管的NoOps数据分析服务。

Presto

这是一款面向大数据的分布式SQL查询引擎。

Spark

这是一款用于处理大数据的快速通用引擎。

平台/基础设施

亚马逊网络服务(AWS)

提供云计算服务

思科云

提供基础设施即服务

Heroku

为云端应用程序提供平台即服务

Infochimps

提供云服务的大数据解决方案

微软Azure

这是一款企业级云计算平台。

Rackspace

托管专业服务和云计算服务

Softlayer(IBM)

提供云基础设施即服务

数据基础设施

Cask

这是一款面向Hadoop解决方案的开源应用程序平台。

Cloudera

提供基于Hadoop的软件、支持和服务。

Hortonworks

管理HDP――这是一款开源企业Apache Hadoop数据平台。

MAPR

这是面向大数据部署环境的Apache Hadoop技术。

垂直领域应用/数据挖掘

Alpine Data Labs

这是一种高级分析平台，可处理Apache Hadoop和大数据。

这是一种免费软件环境，可处理统计计算和图形。

Rapidminer

这是一款开源预测分析平台

SAS

这是一款软件套件，可以挖掘、改动、管理和检索来自众多数据源的数据。

提取、转换和加载(ETL)

IBM Datastage

使用一种高性能并行框架，整合多个系统上的数据。

Informatica

这是一款企业数据整合和管理软件。

Kettle-Pentaho Data Integration

提供了强大的提取、转换和加载(ETL)功能。

微软SSIS

这是一款用于构建企业级数据整合和数据转换解决方案的平台。

甲骨文Data Integrator

这是一款全面的数据整合平台。

SAP

NetWeaver为整合来自各个数据源的数据提供了灵活方式。

Talend

提供了开源整合软件产品

Cassandra

这是键值数据库和列式数据库的混合解决方案。

CouchBase

这是一款开源分布式NoSQL文档型数据库。

Databricks

这是使用Spark的基于云的大数据处理解决方案。

Datastax

为企业版的Cassandra数据库提供商业支持。

IBM DB2

这是一款可扩展的企业数据库服务器软件。

MemSQL

这是一款分布式内存数据库。

MongoDB

这是一款跨平台的文档型数据库。

MySQL

这是一款流行的开源数据库。

甲骨文

这是一款企业数据库软件套件。

PostgresSQL

这是一款对象关系数据库管理系统。

Riak

这是一款分布式NoSQL数据库。

Splice Machine

这是一款Hadoop关系数据库管理系统。

VoltDB

这是一款内存NewSQL数据库。

Actuate

这是一款嵌入式分析和报表解决方案。

BiBoard

这是一款交互式商业智能仪表板和可视化工具。

Chart.IO

这是面向数据库的企业级分析工具。

IBM Cognos

这是一款商业智能和绩效管理软件。

D3.JS

这是一种使用HTML、SVG和CSS可视化显示数据的JavaScript库。

Highcharts

这是面向互联网的交互式JavaScirpt图表。

Logi Analytics

这是自助服务式、基于Web的商业智能和分析应用软件。

微软Power BI

这是交互式数据探查、可视化和演示工具。

Microstrategy

这是一款企业商业智能和分析软件。

甲骨文Hyperion

这是企业绩效管理和商业智能系统。

Pentaho

这是大数据整合和分析解决方案。

SAP Business Objects

这是商业智能解决方案。

Tableau

这是专注于商业智能的交互式数据可视化产品系列。

Tibco Jaspersoft

这是商业智能套件。

谁对国内bi工具比较了解的，bi产品对比该看重哪些点

（本报记者杨霞清）在软件巨头纷纷发力商业智能市场、软件业并购整合风起云涌的大趋势下，独立的商业智能（BI）厂商生存状态备受关注。　软件业的?并购风?越刮越烈。两周前，甲骨文以85亿美元吞下了BEA、Sun购买了My SQL，软件业的整合趋势越来越明显。而在商业智能领域，这种趋势早已经呈现，在过去的2007年，甲骨文收购了海波龙、SAP收购了Business Objects、IBM收购了Cognos，全球前六大BI厂商中，仅SAS硕果仅存，成为独立商业智能厂商。

　在软件业并购整合的大趋势下，独立的商业智能的厂商该何去何从？众多的软件巨头纷纷发力商业智能市场，这个市场是否已经足够成熟？

　不被并购是祸是福

　有分析师认为，商业智能领域并购的加剧，对独立BI厂商而言，短期内或许是好事。计世资讯副总经理、资深分析师曹开彬认为，独立的软件厂商在合作伙伴，比如数据库、应用软件等方面可以有更多选择。有国外分析师认为，在2008年，Business Objects、Cognos和 Hyperion将会专注于技术(文化)的挑战，将一系列复杂的预置型套件集成到更复杂的SAP、IBM和Oracle 的基础产品上，而不是侧重于创新。这些被收购的公司新的BI或许将定义为?臃肿的集成?。

　但有分析师认为，长期来看，独立的BI厂商将面临着压力，随着整合的完成，软件业趋向于提供?端到端的解决方案?，而且在系统的整合方面，IBM、甲骨文自身的BI软件跟自己的数据库、中间件等软件会比跟别的厂商融合得更好，而且在向用户推介时，不排除捆绑销售的可能。

　SAS公司大中华区总裁黄永恒接受采访时否认了后者的说法，他认为这些并购对SAS来讲没有什么影响。SAS与BO、海波龙等是不同的商业智能厂商。BO、海波龙从报表起家，侧重于财务智能; 而SAS除了报表方面外，更强调和客户的业务结合，以业务需求为导向，为客户提供端到端的整体解决方案，比如说银行的信用评分、分析型的CRM等等。

　黄永恒认为，SAS与BO、海波龙在技术上的差异性，决定了这几家的产品的替代性不大。这也是为什么IBM有自己的商业智能软件，但是IBM中国研究院却是SAS的用户。

　这两年来，软件的租赁模式（SaaS）逐渐被业界所追捧，很多软件公司最近尝试用租赁模式给客户销售产品，但占主流的还是软件许可模式。

　对于SAS公司而言，租赁模式是其公司一直使用的商业模式。 ?很多客户希望工期投入短，投入能给企业带来价值，能马上赚钱，租赁方式对客户是有好处的。比如说，一年到期后，认为软件没用就放弃，有用就继续续约。在国外，98%的用户都选择了续约。? 黄永恒接受采访时说，租赁模式使SAS保持了连续31年的增长。

　而有分析师认为，SAS之所以没有被购买，原因之一是它为一家私人的公司。SAS成立于1976年，总部位于美国北卡罗莱纳州，经过30年的稳定收入增长，2006年SAS全球营业额达到19亿美元，为全球第五大独立软件供应商，也是全球最大的未上市软件公司。

　黄永恒也承认，在并购狂潮中SAS之所以能独善其身，在于与甲骨文、IBM、BEA不一样的经营模式。?没有公众股东的压力，不需要面对华尔街的股票指数，只需要考虑员工和客户的利益。? 也因为如此，SAS每年将25%的收入投入R&D，投入于新的应用开发，是目前很多IT公司的两倍。这也保证了SAS每年都能持续地带给老客户新的应用、新的价值。

　在全球软件整合的趋势下，技术的壁垒和没有资本的压力，是独立的BI厂商避免被收购的重要原因。

　BI市场潜力巨大

　IDC曾预计，到2010年亚太（不包括日本）商业智能软件和企业绩效管理与财务分析软件市场合起来将至少达到6.7亿美元。甲骨文、IBM、SAP等软件巨头都对这一领域表现出浓厚的兴趣并分别采取了行动。

　计世资讯副总经理、资深分析师曹开彬认为，随着大企业对海量数据挖掘和分析的需求的提高，商业智能的应用更广泛和深入。而且，商业智能是信息化的制高点。广泛的应用前景，使得各大厂商纷纷在这个市场?布局圈地?。

　?很多企业都认识到挖掘数据的重要性，有效信息能帮助用户解决问题，能够帮助决策层做出正确决策。? 黄永恒给记者举了几个例子。奥运会足球、棒球选手如何踢点球、如何击球等都是有分析的，不能凭着选手的感觉走；国外的**，5个色子和6个色子，对**的盈利贡献不一样。美国的快递公司DHL，可以通过数据分析对投递所走的路线进行设计。?很多人认为，最短的路径对快递公司的赢利水平最好，但分析后不是，应该是?不左拐+最短路径?，因为这样不仅快，而且保险性也好了。这就是用了商业智能的软件，分析出不左拐后，能减低事故率。?

　黄永恒认为，虽然目前很多用户不是很清楚什么是商业智能，但他很关心如何去减少客户流失率，如何提高企业效率，降低成本及企业的风险。这就要求，商业智能软件要切实和业务结合得非常紧密。

　另一方面，随着企业对绿色节能等方面意识的增强，可以通过商业智能分析技术积极帮助企业推进绿色成本计算与控制，以及绿色经营，全面促进企业的高效运营和发展。

BI软件有哪些？

大家知道一句话，“没有最好的，只有最合适的”。什么是最合适？抛开上面提到的幕后因素，

其实也就是三点需要考虑——产品成本、开发人员对这个产品的熟悉程度、有没有类似案例。

要选型，首先要了解目前市场上主流的BI产品：

ETL工具上，像Datastage、Powercenter都是比较主流的

OLAP工具上，则还可以细分为MOLAP（MuiltDimension OLAP，多维度型在线分析系统）和ROLAP（Relational OLAP，关系型在线分析系统），

前者可以选择Hyperion、Cognos、Microsoft公司的产品，而后者可供选择的余地就不多

数据挖掘产品领域，有SAS、SPSS等两大厂家

从这些主流产品来看，大多是舶来品。国内也有研发BI产品的，比较完整的BI解决方案不多，但是最近了解的亿信BI，相对国内其他软件比较完整。

DB2的历史

Pentaho

简介

Pentaho是一个以工作流为核心的、强调面向解决方案而非工具组件的BI套件，整合了多个开源项目，目标是和商业BI相抗衡。它偏向于与业务流程相结合的BI解决方案，侧重于大中型企业应用。它允许商业分析人员或开发人员创建报表，仪表盘，分析模型，商业规则和 BI 流程。[1]

pentaho是世界上最流行的开源商务智能软件，以工作流为核心的、强调面向解决方案而非工具组件的BI套件，整合了多个开源项目，目标是和商业BI相抗衡。它是一个基于java平台的商业智能(Business Intelligence,BI)套件，之所以说是套件是因为它包括一个web server平台和几个工具软件：报表，分析，图表，数据集成，数据挖掘等，可以说包括了商务智能的方方面面。

Pentaho是一个它偏向于与业务流程相结合的BI解决方案，侧重于大中型企业应用。它允许商业分析人员或开发人员创建报表，仪表盘，分析模型，商业规则和 BI 流程。

一个专门的pentaho社区：/

BIEE

Oracle BIEE（简称BIEE）作为Oracle的新的商业智能平台企业版，起源于Oracle所收购的Siebel公司，BIEE原来叫做Siebel Analytic。Oracle BIEE是一个非常有创造力的工具，它对于物理层，逻辑层，展现层的理解和定义创造了一个非常简洁而清晰的数据模型，使用这个数据模型可以完整地连接企业内各个异构数据源，从而使商业智能真正能够在企业范围内得到大规模部署和使用。

BIEE：Oracle Business Intelligence Enterprise Edition Oracle在05年底收购Siebel，取其前端开发工具Siebel Analytics作为Oracle BI的新平台。区别原Discoverer起见，称为Enterprise Edition,而原来的Discoverer就变成了Standard Edition了。二者各取部分结合，加个xe，于是又有所谓的Standards Edition One.这就是OBIEE、OBISE和OBISE ONE的简单缘起。 07年Oracle收了Hyperion，于是取Hyperion BI的部分组件，合并升级为现在的OBI EE Plus。

BIEE的数据模型分为3层：

1、物理层Physical，用于定义和连接各类异构数据源，如关系型数据库、符合XML规范的源数据、OLAP服务、Essbase、Excel等，具体定义数据源物理表结构、字段数据类型、主外键。可简单理解为“物理表定义”。值得一提的是，BIEE只是保存定义，并没有存储数据本身。物理层通过“连接池”、“缓存查询结果”等技术来提高性能。

2、逻辑层Business Model and Mapping，基于物理层构建的DW多维数据模型如星型模型或雪花模型，以及定义逻辑模型与物理模型间的映射关系。需要定义事实表和维度表的主外键关系，可以定义维度表的层次和事实表的度量。这里是整个BIEE的设计核心，需要“整合”开发人员和业务人员两种视觉。一个逻辑层的表，可能来自多个物理层的表；一个逻辑层的字段，可以来自多个物理层的多个表。

3、展现层Presentation，该层隐藏掉任何技术术语和模型，去掉任何业务不关心的字段如ID列，以最终用户的视角和术语行描述。最常见的做法是面对不同的用户组——业务部门，来设计不同的展现层分析项。这样做的好处是：可以把报表开发更加完善，符合最终用户的需求。

BO为Business Object的缩写，Business Object是业务对象层，表示应用程序领域内“事物”的所有实体类。这些实体类驻留在服务器上，并利用服务类来协助完成它们的职责。Business Objects，也简称BO，是全球领先的商务智能(BI)软件公司。公司主要业务是帮助企业更加深入地跟踪和了解其业务，改善决策水平，优化企业绩效。

Cognos

Cognos是在BI核心平台之上，以服务为导向进行架构，是唯一可以通过单一产品和在单一可靠架构上提供完整业务智能功能的解决方案。它可以提供无缝密合的报表、分析、记分卡、仪表盘等解决方案，通过提供所有的系统和资料资源，以简化公司各员工处理资讯的方法。作为一个全面、灵活的产品，Cognos业务智能解决方案可以容易地整合到现有的多系统和数据源架构中。

　Cognos展现的报表基于统一的元数据模型。统一的元数据模型为应用提供了统一、一致的视图。用户可以在浏览器中自定义报表，格式灵活，元素丰富，而且可以通过Query Studio进行即席的开放式查询。Cognos还具有独特的穿透钻取（Drill Through）、切片（slice）和切块（dice）、以及旋转（pivot）等功能，使分析人员、管理人员或执行人员能够从多角度对信息进行快速、一致、交互地存取，从而获得对数据的更深入了解，有效地将各种相关的信息关联起来，使用户在分析汇总数据的同时能够深入到自己感兴趣的细节数据中，以便更全面地了解情况，做出正确决策。[1]

Cognos强大的报表制作和展示功能能够制作/展示任何形式的报表，其纯粹的Web界面使用方式又使得部署成本和管理成本降到最低。同时Cognos还可以同数据挖掘工具、统计分析工具配合使用，增强决策分析功能。

2007年11月美国波士顿当地时间本周一，IBM宣布将以50亿美元现金收购Cognos。故又称IBM Cognos

什么是 BI工程师

DB2拥有悠久的历史并且被很多人认为是最早使用SQL（同样最早被IBM开发）的数据库产品。

1968:IBM 在 IBM 360 计算机上研制成功了 IMS V1，这是第一个也是最著名的和最为典型的层次型数据库管理系统。至今仍然还有企业在使用呢。

1970:这是数据库历史上划时代的一年，IBM公司的研究员E.F.Codd 发表了业界第一篇关于关系数据库理论的论文A Relational Model of Data for Large Shared Data Banks，首次提出了关系模型的概念。这篇论文是计算机科学史上最重要的论文之一，奠定了Codd博士关系数据库之父的地位。

1973:IBM研究中心启动了 System R 项目，研究多用户与大量数据下关系型数据库的可行性，它为 DB2 的诞生打下了良好基础。由此取得了一大批对数据库技术发展具有关键性作用的成果，该项目于1988年被授予ACM软件系统奖。

1974:IBM研究员Don Chamberlin 和 Ray Boyce 通过 System R 项目的实践，发表了论文SEQUEL：A Structured English Query Language，提出了 SEQUEL 语言，此即 SQL 语言的原型。

1975:IBM研究员Don Chamberlin 和 Morton Astrahan的论文 Implentation of a Structured English Query Language，在 SEQUEL 的基础上描述了 SQL 语言的第一个实现方案。这也是 System R 项目得出的重大成果之一。

1976:IBM System R 项目组发表了论文A System R: Relational Approach to Database Management，描述了一个关系型数据库的原型。IBM 的研究员Jim Gray 发表了名为Granularity of Locks and Degrees of Consistency in a Shared DataBase的论文，正式定义了数据库事务的概念和数据一致性的机制。

1977:System R 原型在3个客户处进行了安装，这 3 个客户分别是：波音公司、Pratt & Whitney 公司和 Upjohn 药业。这标志着 System R 从技术上已经是一个比较成熟的数据库系统，能够支撑重要的商业应用了。

1979:IBM研究员Pat Selinger在她的论文Access Path Selection in a Relational Database Management System中描述了业界第一个关系查询优化器。

1980:IBM发布了 S/38 系统，该系统中集成了一个以 System R 为原型的数据库服务器。为了方便应用程序的移植，它的 API 与 S/3、S/32 的 API 一致。

1981:由于发明了关系型数据库模型，IBM 的研究员E.F.Codd 接受了ACM 图灵奖，这是计算机科学界的最高荣誉。Codd 博士也是继查尔斯.巴赫曼（Charles W. Bachman）之后，又一位由于在数据库领域做出巨大贡献而获此殊荣的计算机科学家。

1982:IBMPC 的出现标志着 PC 产业开始孕育发展。在以后相当长的一段时间内，在各种品牌的个人电脑上标记着的IBM PC Compatible字样都见证着 IBM 在这个领域的辉煌。

1982:IBM发布了 SQL/DS for VSE and VM 。这是业界第一个以 SQL 作为接口的商用数据库管理系统。该系统也是基于 System R 原型所设计的。

1983:IBM发布了DATABASE 2（DB2）for MVS（内部代号为Eagle）。

1986:System/38 V7 发布，该系统首次配置了查询优化器，能够对应用程序的存取计划进行优化。

1987:IBM发布带有关系型数据库能力的 OS/2 V1.0扩展版，这是IBM第一次把关系型数据库处理能力扩展到微机系统。这也是 DB2 for OS/2、Unix and Window 的雏形。

1988:IBM发布了SQL/400，为集成了关系型数据库管理系统的AS/400服务器提供了SQL支持。IDUG（国际DB2用户组织）组织成立。

1989:IBM定义了 Common SQL 和 IBM 分布式关系数据库架构（DRDA），并在 IBM 所有的关系数据库管理系统上加以实现。第一届 IDUG北美大会在美国芝加哥召开。 1992:第一届 IDUG欧洲大会在瑞士日内瓦召开。这标志着 DB2 应用的全球化。

1993:

1.IBM发布了DB2 for OS/2 V1（DB2 for OS/2 可以被简写为DB2/2）和 DB2 forRS/6000V1（DB2 for RS/6000 可以被简写为DB2/6000），这是 DB2 第一次在Intel 和Unix 平台上出现。

2.Louis V. Gerstner 入主 IBM。

1994:

1.DB2 For MVS V4 通过并行 Sysplex 技术的实现在主机上引入了分布式计算（数据共享）。

2.IBM发布了运行在 RS/6000 SP2 上的 DB2 并行版 V1，DB2 从此有了能够适应大型数据仓库和复杂查询任务的可扩展架构。IBM 将 DB2 Common Server 扩展到 HP-UX 和 Sun Solaris 上。DB2 开始支持其他公司开发的 UNIX 平台。 DB2/400 集成在 OS/400 V3.1中发布，并且引入了并行机制、存储过程和参照完整性等机制。同时，IBM 宣布在 OS/2 和 AIX 平台上的 DB2 产品能够对多媒体数据和面向对象应用程序提供支持。

1995:

1.IBM发布了 DB2 Common Server V2，这是第一个能够在多个平台上运行的对象-关系型数据库(ORDB)产品，并能够对 Web 提供充分支持。DataJoiner for AIX 也诞生在这一年，该产品赋予了 DB2 对异构数据库的支持能力。DB2 在 Windows NT 和 SINIX平台上的第一个版本（DB2 V2）发布。

2.IBM发布了在 AIX 和 MVS 平台上的数据挖掘技术，用于管理大文本、图像、音频、视频和指纹信息的扩展器（Extender）以及可以对数据仓库进行可视化构造和管理的Visual Warehouse。

3.IBM发布了 DB2 WWW Connection V1 for OS/2 and AIX（该产品后来被更名为Net.Data）。该产品可以将数据库中的数据快速发布到 Web。第一届 IDUG 亚太区大会在澳大利亚悉尼召开。这年IBM 并购了 Lotus Development Corp。

1996:

1.IBM发布 DB2 V2.1.2 ，这是第一个真正支持 JAVA 和 JDBC 的数据库产品。

2.DataJoiner 开始支持对非关系型数据库（比如 IMS 和 VSAM）的存取。

3.IBM发布了 Intelligent Miner，该产品可以对基于 DB2 的数据源实施数据挖掘。

4.IBM并购 Tivoli。 IBM 将 DB2 更名为 DB2 Universal Database，这是第一个能够对多媒体和 Web 进行支持的RDBMS。该系统具有很好的伸缩性，可以从桌面系统扩展到大型企业，适应单处理器、 SMP 和 MPP 计算环境，并可以运行在所有主流操作系统和硬件平台上。 DB2 V5 是以前的两个产品的合并：DB2 Common Server V 2.1.2 和 DB2 并行版 1.2。

5.IBM发布了数字图书馆产品，这是一个多媒体资产管理产品，也是 IBM Content Manager 的前身。

6.DB2 Magzine 第一期发布，DB2 有了自己专门的技术刊物。

1997:

1.IBM发布了可以支持 Web 的 DB2 for OS/390 V5，这是当时唯一能够支持64, 000个并发用户和百 TB 级别的数据库产品。

2.IBM发布了DB2 UDB for UNIX、Windows and OS/2，该产品支持 ROLLUP 和 CUBE 函数，对联机分析处理（OLAP）具有重要意义。

3.IDUG 第一次技术论坛在加拿大多伦多召开。

4.IBM发布了用于企业级内容管理的 EDMSuite，该产品包含了用于管理计算机生成报表的 OnDemand 和管理图像的 ImagePlus VisualInfo。

5.IBM基于 RS/6000 SP 架构的超级计算机深蓝在国际象棋的 6 番棋对抗中战胜了世界棋王卡斯帕罗夫。

1998:

1.IBM发布了 DB2 OLAP Server，这是一个基于 DB2 的完整的 OLAP Solution。这个产品是和 Arbor Software（Hyperion的前身）合作开发的。

2.IBM发布了 DB2 Data Links 技术，该技术可使 DB2 对外部文件进行管理。

3.DB2的 shared-nothing集群技术扩展到 Windows 和 Solaris 平台。

4.IBM发布了 DB2 Spatial Extender，这是与ESRI公司在DataJoiner基础上联合开发的，该产品赋予了DB2 对地理信息数据的存取能力。

5.IBM发布了 ContentConnect，该产品是 Enterprise Information Portal（EIP）的前身。

6.DB2 对 SCO UnixWare 平台提供支持。

7.DB2 UDB V5.2 增加了对 SQLJ、Java 存储过程和用户自定义函数的支持。

8.IBM发布 DB2 UDB for AS/400，使 AS/400 成为充分支持电子商务的机型。

1999:

1/IBM为了对移动计算提供支持，发布了DB2 UDB 卫星版和DB2 Everywhere（这是一个适用于手持设备的微型关系数据库管理系统，后称为DB2 Everyplace）。

2/IBM发布了 Enterprise Information Portal，该产品可以跨数字图书馆和 EDMSuite 提供一个统一的联合检索功能。

3/DB2增加了能够识别 XML 语言的文本检索功能，从而引入了 XML 支持，并启动了DB2 XML Extender 的 beta 计划。

4/IBM发布了 Intel 平台上的 DB2 UDB for Linux。

5/IBM 研究机构将 DB2 的联邦（federation）功能和 Garlic 技术（Garlic的目标是使能大规模多媒体信息系统，集成到生命科学解决方案DiscoveryLink 中

2000:

1/IBM发布了 DB2 XML Extender，成为在业界第一个为数据库提供内置 XML 支持的厂商。

2/IBM将 Visual Warehouse 集成到 DB2 中，为DB2 提供了内置的数据仓库管理功能。

3/DB2对Linux 的支持进一步增强，能够支持基于 Intel 的 Linux集群、发布了可以运行在主机上的 DB2 UDB for Linux和可以运行在嵌入式Linux上的 DB2 Everyplace。

4/DB2开始支持 NUMA-Q 平台，可以运行在该平台上的类 UNIX操作系统DYNIX/PTX 上。

5/DB2通过 Net.Search Extender 提供了 in-memory 高速文本检索功能。

6/IBM启动了数据库管理工具业务，起初着重于为主机上的 IMS 和 DB2 提供高效管理工具，最终这项业务扩展到 UNIX、Linux 和 Windows 平台。 Informix数据库产品也在支持之列。

7/IBM开始通过在DB2中集成 DataJoiner 来提供数据联邦（federation）功能。

8/IBM发布了用于管理数字资产的Content Manager。IBM 数字图书馆和 EDMSuite 产品都被包含在一个单一的架构中来提供多媒体资产管理和企业内容管理。荷兰国家图书馆、梵蒂冈图书馆都是最早的用户。

9/DB2在主机上销售出了它的第10000个许可证。

2001:

1/IBM以 10 亿美金收购了 Informix 的数据库业务，这次收购扩大了IBM 的分布式数据库业务。

2/DB2 OLAP Server中增添了数据挖掘功能。

3/IBM发布了第一个能够支持多种平台的 DB2 工具。

4/DB2提供了基于 SOAP 的 Web 服务的支持。DB2 XML Extender和存储过程可以使DB2成为 Web 服务的提供者。

5/IBM科学家在纳米碳管晶体管技术领域取得突破。IBM 用纳米碳管制造出了世界上第一批纳米晶体管--由直径 10 个原子大小的碳原子组成的小圆柱结构，比当今基于硅的晶体管小 500 倍。

6/DB2拓宽了其数据联邦（federation）的能力，可以对WebSphere MQ消息队列和生命科学领域特定格式的文件提供支持。

7/IBM发布了 DB2 UDB for OS/390。

2002:

1/IBM发布了 Xperanto，这是一个基于标准的信息集成中间件的演示版，可以用来优化对分散数据源的存取。这个演示版本使用了XML、Xquery、Web 服务、数据联邦（federation）和全文检索等先进技术。

2/IBM宣布计划收购 Rational Software Corp，从而使得 IBM软件能够支持从设计、开发、部署到管理和维护的完整过程。

3/DB2通过基于 SOAP 的 Web 服务扩展了数据联邦（federation）的能力。并可以作为 Web 服务的使用者出现在 Web 服务架构中。

4/DB2 OLAP Server中添加了hybrid（多维和关系）分析能力。

5/作为IBM 自主运算策略的一部分，SMART（自我管理和资源调节）技术在 DB2 UDB V8.1 中首次正式应用。

6/IBM并购 Tarian Sotware，从而加强了Content Manager 中记录管理组件的功能。

2003:

1/IBM将数据管理产品统一更名为信息管理产品，旨在改变很多用户对于 DB2 家族产品只能完成单一的数据管理的印象，强调了 DB2 家族在信息的处理与集成方面的能力。

2/DYNIX/ptxDB2 发布了 DB2 Information Integrator（该产品由以前的 DB2 DataJoiner和 Enterprise Information Portal演化而来），该款软件旨在帮助客户即时访问、集成、管理和分析存储于企业内外任何平台上的各类信息。

2004:IBM DB2 在TPC 的两项测试中屡次刷新该测试的新纪录，在计算领域的历史上树立了新的里程碑。其中在TPC-C 的测试中，它创造了计算速度领域新的世界记录，彻底粉碎了在该测试中每分钟三百万次交易的极限。

2005:经过长达5年的开发，IBM DB2 9将传统的高性能、易用性与自描述、灵活的XML相结合，转变成为交互式、充满活力的数据服务器。

2006:IBM发布DB2 9，将数据库领域带入XML时代。IT建设业已进入SOA（Service-Oriented Architecture）时代。实现SOA，其核心难点是顺畅解决不同应用间的数据交换问题。XML以其可扩展性、与平台无关性和层次结构等特性，成为构建SOA时不同应用间进行数据交换的主流语言。而如何存储和管理几何量级的XML数据、直接支持原生XML文档成为SOA构建效率和质量的关键。在这这种情况下，IBM推出了全面支持Original XML的DB2 9，使XML数据的存储问题迎刃而解，开创了一个新的XML数据库时代。同年1月30日，IBM发布了一个DB2免费版本DB2Express-C。

文献引用的标准格式是什么？

BI工程师，主要是做数据分析，数据仓库，以及相关报表，对一些数据进行处理，对数据库要有比较深入的了解。

BI工程师需要有一定的数据库经验,掌握SQL查询优化方法,精通Oracle、SQL Server、MySQL等主流数据库的应用设计、性能调优及存储过程的开发.掌握BI相关工具,如ETL工具(如SSIS)、OLAP工具(如SSAS)和前端展示工具.熟悉ETL逻辑、OLAP设计和数据挖掘相关算法.

工作职责:

负责ETL设计、模型设计、开发、技术支持等工作；

2. 负责ETL应用开发，数据库性能进行调优；?

3. 参与数据抽取、加载、转换和脚本开发；?

4. 负责BI展现的开发；

5、使用Hadoop, Hive等对海量日志进行统计分析。

文献引用的标准格式如下：

（1）学术期刊文献

［序号］作者．文献题名［J]．刊名，出版年份，卷号（期号）：起－止页码。