知识管理的前沿技术(连载一)
作者:李志刚
一、XML
eXtensible Markup Language(可扩展标记语言),简称XML,是通用标记语言标准(cStandard for General Markup Language,SGML)的一个子集。它是一项针对网络应用的面内容的新技术,集SGML和HTML的优势于一身,具有更多的结构和语义,良好的可扩性、自描述性,简单而易于掌握等特点。XML的设计目标是使SGML像HTML一样能够通过Web发送、接收与处理。
XML是Internet环境中跨平台的、依赖于内容的技术,是当前处理结构化文档信息的有力工具。扩展标记语言XML是一种简单的数据存储语言,使用一系列简单的标记描述数据,而这些标记可以用方便的方式建立,虽然XML占用的空间比二进制数据占用得更多,但XML极其简单,易于掌握和使用。XML与Access、Oracle和SQL Server等数据库不同,数据库提供了更强有力的数据存储和分析能力,例如,数据索引、排序、查找、相关一致性等,XML仅仅是展示数据。事实上,XML与其他数据表现形式最大的不同是:它极其简单。正是这点使XML与众不同。
XML的简单使其易于在任何应用程序中读/写数据,这使XML很快成为数据交换的唯一公共语言,虽然不同的应用软件也支持其他的数据交换格式,但不久之后它们都将支持XML,这意味着程序可以更容易地与Windows、Mac OS、Linux以及其他平台下产生的信息结合,然后可以很容易地将XML数据加载到程序中,并以XML格式输出结果。
同HTML一样,XML是SGML的一个子集,它是描述网络上的数据内容和结构的标准。尽管如此,XML不像HTML,HTML仅仅提供了在页面上显示信息的通用方法(没有上下文相关和动态功能),XML则对数据赋予上下文相关功能,它继承了SGML的大部分功能,却使用了不太复杂的技术。
为了使得SGML显得用户友好,XML重新定义了SGML的一些内部值和参数,去掉了大量的很少用到的功能,这些繁杂的功能使得SGML在设计网站时显得复杂化。XML保留了SGML的结构化功能,这样就使得网站设计者可以定义自己的文档类型,XML同时也推出一种新型文档类型,使得开发者也可以不必定义文档类型。
XML包含三个元素:DTD(Document Type Definition)/Schema(模式)、XSL(eXtensible Stylesheet Language,可扩展样式语言)和Xlink(eXtensible Link Language,可扩展链接语言)。DTD规定了XML文件的逻辑结构,定义了XML文件中的元素、元素的属性以及元素和元素属性之间的关系,XMLSchema给XML加入了描述数据类型的能力;XSL定义了XdML的表现形式,使得数据内容与数据表示方式相互独立;Xlink进一步扩展了Web上的简单链。XML的优点在于将用户接口和结构资料相分离,允许不同来源的资料无缝集成,并可对同一资料进行多种处理,既可满足不同用户的需求,又保证了资料的安全性,基于xML的特点,将XML技术应用于知识管理系统中。