Darwin Information Typing Architecture (DITA) 是一种基于 XML 的、端到端的编辑、生产和交付技术信息的体系结构。该体系结构由一组在主题层创建 “information-typed” 模块和在交付模式中使用这些内容(比如在线帮助和 Web 上的产品支持门户)和设计原则组成。
DITA 的核心是一个称为 “主题 DTD” 的 XML 文档类型定义(DTD),代表面向主题的信息体系结构的一般构造块。不过,这种可扩展的体系结构是此技术信息设计的定义部分,主题 DTD 或者任何以此为基础的模式,仅仅是这种体系结构设计原则的一个实例。
本文是 Darwin Information Typing Architecture 的路线图:它是什么以及如何将其应用于技术文档。它也是这种体系结果的一个产物,完全用 XML 编写并采用这里描述的基本原则。
背景
这种体系结构和 DTD 是由代表不同 IBM 子公司用户支持部门的跨部门联合工作组设计的。在 1999 年末经过初步调研后,2000 年通过使用数据库记录和每周一次的电话会议,工作组共同开发了这种体系结构。这种体系结构作为一种可选的基于 XML 的文档系统放在 IBM developerWorks 网站上,利用 XML 作为编码格式。随着这些重要更新的发布,其中包括对一致性和灵活性的改进,我们认为 DITA 设计已经完成了原型阶段。
信息交换、工具管理和可扩展性
IBM 的产品文档有数百万页,拥有自己非常复杂的 SGML DTD、IBMIDDoc,从 20 世纪 90 年代起开始支持这些文档。工作组在一开始必须考虑,“为何不简单地修改一下 IBMIDDoc,或者使用现有的 XML DTD 如 DocBook、TEI 或 XHTML?” 答案要从技术信息的特点中寻找。
首先,SGML 和 XML 都是按照元语言组织的,允许数据所有者团体以反映其信息开发、存储和处理的方式描述信息资产。因为知识表示与企业文化以及社区行话密切相关,多数定义定义 DTD 的尝试结果都毫无用处或者无疾而终。信息交换的理想 是与其他数据拥有团体分享这些信息的语义和转换规则。
其次,多数企业依赖于很多交付系统,或者以各不相同的方式处理信息。因此试图建立一套通用工具集 的任何尝试都被证明是无效的。工具管理的目标 是根据标准化的处理体系结构,利用其他很多人的经验,解决较大范围内的公共问题。
第三,形式化文档描述词汇表(DTD 或模式)的多数努力已经作为捕捉数据所有者当前业务实践 的信息建模活动而完成。这种方法倾向于在最终的 DTD 或词汇表中编码 遗留的 实践。技术信息(或者先进技术不断利用的任何信息)DTD 中未来可扩展的目标 是在 DTD 设计中对自顶向下的处理系统作尽可能少的假设。
一开始,工作组试图理解 XML 在这种信息技术进步中的作用。随着工作的进展,工作组认识到任何 DTD 设计工作都必须考虑到词汇表的多样性、工具不确定性处理范型和摆脱过去对信息结构的观点。目前很多 DTD 包含了解决其中一些问题的方法,但问题的广度决定了不仅仅是一个 DTD 能解决的。为了支持多种产品、品牌、企业、风格和交付方法,我们必须考虑整个编辑到交付的过程。最终我们得到了大量的建议,要求我们不能仅仅把设计表示成一个 DTD 而是一种信息体系结构。
1
2
3
4
5
6
7
下一页>>