很难想象,现在还有什么应用跟数据库无关。就连微软的下一代操作系统Vista,也要用其数据库来组织其新式的文件系统。可以说,经过多年的发展,数据已经成为整个信息化进程和下一阶段发展的最可宝贵的资源,而保存和管理数据资源的数据库,其技术的发展和进步,就成为了最值得关心和重视的问题。从层次型数据库到管理关系型数据库,乃至目前的同时支持关系型和XML的混合型数据库DB2 9,数据库管理技术在其发展的将近40年的历程中,大致经历了以上3个阶段。
IMS:早期的层次数据库
数据库管理系统出现以前的数据管理非常原始简陋,数据处理依靠穿孔卡片来进行时,彼时的数据管理,只是对卡片进行物理的存储和处理。数据的存储和管理极其麻烦和复杂,根本无法体现出高效性。在1956年IBM生产出第一个磁盘驱动器(Model 305 RAMAC)之后,引发了数据管理的革命,并且因此得以随机存储数据。此后,出现了最早版本的数据库,即网状数据库管理系统(DBMS),由通用电气公司1961年开发成功,其IDS(Integrated DataStore,集成数据存储)是世界上第一个网状DBMS,也是第一个DBMS。但是它只能运行于通用电气的主机上,且数据库只有一个文件,所有的表必须通过手工编码生成,有着极大的局限性。为此,IBM开发的层次数据库IMS(Information Management System,信息管理系统)受到了极大的欢迎,成为了最著名也是最典型的层次型数据库管理系统。
1966年,IBM与其客户(北美洛克维尔公司和卡特彼勒公司)合作,共同开发新型数据库,用于帮助NASA管理宏大的阿波罗计划中的繁琐资料,并且在1968年由IBM的工程师完成。1969年,该数据库作为IBM的产品发布时被更名为“IMS(Information Management System,信息管理系统)。在1969年,NASA成功发射了阿波罗11号实现了人类首次登月之后,NASA继续在其航天飞机计划中使用着该产品。直至今日,该数据库一直有着用武之地,在如今的互联网应用连接、商务智能等应用中找到了全新的角色。
RDBMS:关系数据库的出现
虽然层次数据库已经可以很好地解决数据集中和共享的问题,但是其在数据独立性和抽象级别上依然有着欠缺。还好,就在1970年,IBM研究员E.F.Codd提出了关系模型的概念,由此奠定了关系模型的理论基矗他所发表的论文“A Relational Model of Data for Large Shared Data Banks”也被认为是数据库系统历史上具备划时代意义的里程碑。在经过不断的发展和论证之后,最终使得更具备优势的关系型数据库成为了市场的主流。随后,在1974年,IBM公司的Ray Boyce和Don Chamberlin提出了SQL语言,它实现了数据库生命周期中的全部操作,为关系数据库奠定了另一块里程碑。
在1979年,IBM完成了第一个实现SQL的DBMS。在20世纪的80年代早期,IBM利用了RDBMS和SQL的第二阶段的技术,创建了新型的数据库产品,并将其命名为DB2,也就是拥有第二代技术的数据库产品。而在过去的岁月中,DB2已经从重要的大型机产品发展成为可在各种服务器平台上运行的产品。尤其是在System 390(即目前所称的System z)中,DB2已经成为分布式计算的核心。
尽管不断地有同时期厂商的数据库产品的竞争,但是DB2依然在高端企业应用市场受到了广泛的应用及好评。经过多年的发展和进步,在System z和安装了Linux系统的英特尔平台上,已经运行有近50万台的DB2数据服务器。
IBM DB2 9:首款混合型的数据服务器
随着信息化进程的发展和企业间、企业内部信息交换的需要,XML作为标准化的数据存储格式,其数据量正面临着巨大的增长。而事实上,每个行业都在实施着XML数据标准,新版的微软Office软件也将以XML格式存储文档。此外,正有越来越多的公司开始转向使用XML技术,以便在不同的系统和应用程序之间交换数据并适应快速变化的环境,从而帮助他们逐步实现SOA。结合了关系型数据库和层次型数据库二者特点的DB2 9(代号Viper)引入了另外一种可能-混合型数据库,该数据库可以非常好地支持XML数据,同时也对其他技术包括SQL、表格数据结构和各种DBMS特性的支持依然存在。
在此之前,文件系统可以应付简单的任务,但是在需要处理大量文档时它们就表现不佳。并发性、恢复、安全和可用性等问题变得难以管理。尽管商业关系数据库管理系统(DBMS)解决了这些问题,但是在其他方面有所欠缺。DBMS通常只是提供两种基本的数据库设计选项――将每个 XML 文档完整地存储为一个大型对象,或者将它“撕开”,分散存储在多个表的多个列中。这样不仅无法完整体现XML的层次结构,而且效率低下、不够灵活。
此外,纯粹的XML DBMS 在IT基础设施中引入了一种新型的环境,但是这样的环境还没有经过考验,其集成能力、所需要的人员技能以及未来的生命力也都不确定。因此,必须找寻可以高效共享、搜索和管理公司大量XML文档和消息的系统,以便帮助企业减少存储和使用XML数据所需要的时间及工作量,以期减少应用开发费用且提高业务灵活性。混合型数据库DB2 9正好适应了这样的需要。通过DB2 9,用户可以使用同一个数据库对象同时管理“传统的”SQL数据和XML文档,甚至,还可以编写一个查询同时搜索和处理这两种数据形式。
具有如此特点的DB2,是业界第一款也是惟一一款可以使用行业标准接口的关系数据来管理pureXML的数据库,它在三个领域具备了独到的创新:XML数据管理、数据压缩和SAP优化。其中,最重要的功能即XML数据管理,它使用了IBM的“pureXML”解决方案来管理以XML格式存储的数据。
这意味着DB2 9可以提供XML数据的“原生态”存储,而无需将数据转化成行列格式,更无需将其作为大型对象来存储。为实现这样的功能,IBM对DB2进行了扩展,使DB2 9包含了如下的新技术:
新的存储技术,可以高效地管理 XML 文档中固有的层次结构。新的索引技术,可以提高在 XML 文档之间和内部进行搜索的速度。
新的查询语言支持(对于 XQuery)、
新的图形化查询构建器(对于 XQuery)和新的查询优化技术。
根据用户提供的模式检验 XML 数据的能力。
新的管理功能,包括对关键数据库工具的扩展。
与流行的应用程序编程接口(API)的集成。
而通过应用压缩技术,DB2 9在客户的实际测试中,可以为客户节约40~80%的存储需求,同时能够维护甚至改善应用程序的性能。基于DB2 9的革命性的创新与性能,SAP也为使用mySAP商业应用程序的中小型客户选用了DB2 9作为数据服务器。