【编者注】 办公软件已经成为装机必备的工具,不过当微软的DOC、XLS、PPT等文档格式逐步成为人们无法割舍的默认标准,当软件厂商开足马力以兼容微软讨得生存之本时,我们除了失去一个公平竞争的软件环境,每一个桌面用户也正失去自己文档主人的身份。国际开放文档格式标准ODF及国内标准UOF为解决这一难题带来了曙光,而8月18日双方的高峰会议更为两者互通融合,为中国软件的又一次腾飞埋下了伏笔。为了让读者对ODF及UOF有更多了解,IT168软件频道特把本次研讨会的精彩内容呈现给大家,欢迎广大读者对此发表评论。
![]() |
| 点击进入专题 |
【IT168 ODF专题报道】继2006年5月ODF正式被国际标准化组织审核通过成为国际标准文档格式之后,一份由国家电子政务总体组所属的中文办公软件基础标准工作组组织制定的《中文办公软件文档格式规范》国家标准(即UOF--Unified Office document Format,中文简称“标文通”)也开始进入为期一个月的公示期——这意味着“标文通”将作为国家标准正式颁布,中文文档开始有了自主格式标准。以下是吴志刚的现场录音整理:
中国电子技术标准化研究所信息研究中心副主任吴志刚:
有了这个机会大家共同探讨开放标准的话题,尤其是办公文档的格式问题。
我想在中国来说一直在积极努力的制定相关的国家标准。也就是说像刚才姜处长和胡主任谈到的,在目前办公软件之间缺乏互操作的主要原因是导致困扰国产软件无法普及和应用的一个关键原因。在国产软件中由于存在多种版面格式的问题,导致无法进行信息的交换,只能采用某种软件的困境限制了其他办公软件的普及,同时基于标准指导办公软件采购方式是提升我国软件公开的重要途径。
为此我们积极推动开放的标准应用,促进办公软件正版化的采用。刚才已经谈到许多,基于私有软件格式的一些缺陷我们在这里不用多提。基于开放的办公文档格式的优势在于可以保证文档进行方便的处理和共享,促进更多的厂商采用,并提供更多的软件产品,减少用户的成本。文档格式可以被开源的格式进行实现,来进一步降低相关的软件开发成本。
为此,这项工作始终得到了相关主管部门的高度重视。国家标准化管理委员会专门立项批准制定相关的中文办公软件文档格式规范。国务院信息化工作办公室也非常重视这项工作,将这项工作纳入国家的电子政务信息工程中。信息产业部、科技部、发改委从项目上进行支持,来组建相关的工作组,来共同促进相关标准的研究。
我们现在已经在开展的中文办公软件文档格式规范和基于XML的电子公文格式规范都在2003年纳入到国家标准制订计划中。这项工作应该说政府给予了高度重视。
在这个过程中,我们实际上在中文办公软件工作组于2002年正式成立,开展有关中文办公软件基础标准的研究。这里不仅包括了文档格式规范,同时还包括了中文办公软件文档的用户界面,二次开发接口等相关的内容。在这项工作中最为核心的就是我们的中文办公文档格式规范。这个文档格式规范主要是来解决各个软件之间互通的问题。这个工作组成立由多个国内相关办公软件生产商共同参与,这里面包括我们的红旗中文2000、金山、永中、中标普华等国内知名的办公软件,同时在项目工作组成立过程中,我们也积极保持着和国外相关公司的合作和沟通。在项目工作组的一些会议上,我们也邀请了微软公司和SUN公司的有关同仁,一起共同探讨、研究相关格式规范。
我们知道标准主要的问题不是在于确定一个规范,而是在于标准如何让更多的人应用和普及。所以工作组在启动这项工作的过程中,更为关注是后续标准的推广和应用。我们把这个标准文档格式给它起来了一个大家容易记的名字,就是UOF,统一的文档格式规范。同时我们给它起了一个非常好听的中文名字,非常便于大家记忆的,就是标文通。标准促进文档格式的沟通,希望通过文档格式来规范办公软件文档格式化的描述形式,加强中文办公软件间的兼容性,奠定办公软件文档信息交换的基础,它的制定将对于保障各类政府电子公文和办公文档的长期有效,促进电子政务各项应用于中文办公软件的集成具有重要意义。
我们这个UOF它的主要工作方式是采用一种开放式的方式,希望采纳打开门,让所有致力于文档格式交换的相关公司、企业,高效共同参与,通过这个方式建立一个开放的标准。通过公开的投票流程,面向大家通过协商的方式达成共识。在整个标准的过程中,没有任何一方作为控制方,而是大家集体智慧的结晶。我们的文档格式也可以在我们的网站上公开的获得,也可以自由的获取相关的文件,我们也建立了相应的注册维护形式,来进一步的通过这种动态的维护方式来使更多感兴趣的各方来有效的获得。
开放是建立推广标准的一个基础,没有开放的方式也就不能够得到大家的共识和共享。为此,我们的UOF是希望致力于整体的开放。同时开放又不能代表完全的统一,所以说我们认为大家都开放各自的私有格式,如何将这些私有格式进行有效的统一是我们未来发展的一个目标。所以我们把我们办公文档的格式叫做UOF。大家就奇怪,你们是不是想报一个不明飞行物呀,和UFO是不是有什么关系?我们这里面并不是一个UFO,我们是希望做到一个统一的文档格式规范。
我们在这里的统一目标就是从技术体系架构来看,首先是一个独立的、完整的、开放的、可拓展的机制,同时它不仅是基于中国本身的,也是基于世界的。我们是支持以ISO10646为基础,支持国际字符集。只有是民族的才能是国际的,同时才能够和国际相融合。在这个过程中我们考虑到了和国际的融合。
同时在设计的方式上,我们保证内容和式样分离,便于未来的数据的交换。通过式样的引用,来简化描述,通过对象的引用来方便对用户对象的管理,通过区域的引用,方便内容模块的统一管理。通过模块的重用,尽量减少文档的大小。通过压缩文档数据格式,提供专用的格式,降低由于压缩文档的格式化的文件过于庞大,来降低系统的开销。通过统一的二次开发接口来便于后续的应用程序的集成。
在我们的整个体系架构中包括这样几个部分。文档格式规范文本和存储结构的文本,还有有关域代码和文字格式域和数字格式以及相关一系列的内容支持。总体来说,我们建立于未来的即使是一个没有办公软件的,公司它不用我们UOF文档的时候,我们采用了中文标签可以对整个文字进行有效的处理,这样便于未来的用户去读到UOF文件可以进行有效的分析,即使这样对于专用的办公软件文档,用后续的扩充奠定了基础。
同时提供了支持多语言的版本,尤其是支持ISO10646我们国家的GB13000这样的一个标准,通过统一的ID对应体系管理,可以支持多语言的转换。我们可以在中国建立中文的UOF,同时可以在日本、韩国等等英文国家建立相应、对应的英文版本和日文版本以及韩文版本。同时为了便于整个的结构化的清晰的管理,我们UOF它最大的特点是采用尽量多用元素,少用属性,这样也便于应用的扩展,共享和精确定义。同时在基本的文字处理的过程中,我们通过式样、表单这样一些统一管理,来降低应用的不规范性。通过制定五个独立的命名空间,可以提倡相关的,在命名空间中的元素的共享和结构的优化。在整个应用中,我们提倡一种定义三种应用,这样三种应用格式可以采用共享的应用模型来进行规范。在这个过程中,我们可以在一个过程中,处理、表现三种应用。包括文字处理、演示文档和电子表格。这也是我们在这整个结构过程中,为后续整个提升应用奠定了基础。
同时我们在元素共享方式,可以对对象进行公共的独立管理,便于节省存储结构。通过一些公用处理规则的表征的话,可以降低相关的一些应用程序的设计,将文档设置、用户集合等等这些方式进行统一的,作为规则进行单独的管理。
最有特点是我们通过逻辑章节的方式,采用现有的逻辑章节概念,反映人们思考中的逻辑结构,与真正的文件结构方式相统一,这样便于未来结构的应用,为后续的应用的开发和界面的处理奠定了有效的,更为逻辑化和科学化。同时我们对相应的国际标准采用了一种规则和原则,采用统一的SVG方式作为统一的图形描述规范,通过MathML作为数学公式描述规范。在引用国际标准的过程中,强调全面引用,而避免仅仅从单一的元件上的应用,这样为后续的和国际相关标准的对接奠定了一个有效的基础。
另外,由于应用的不一致性,在座我们四家公司在参与过程中,我们提供了有效的过程复制,为后续应用提供了有效的保障。由于有些产品自由的特征的一些处境,我们可以把它作为本公司的扩展性,作为保留在扩展域中给相应的应用软件给出有效的规则。对于厂商即使是不支持标准的相应决议,我们也制定了相应的原则规则,就是保留原有厂商所定义的内容,为后续的厂商特种应用提供一个有效的保证。
同时,UOF还有一个最大的特点,就是对用户XML的支持。这也是对我们相应的电子公文的一种机遇,用户相应的数据进行一种结构化的引用。通过这种方式建立相应的逻辑数,使我们的办公文档格式变成了一种结构化数据的表示层,可以为以后后续的数据库应用相应的结合奠定一个有效空间和基础。
在这里由于时间的关系,我不会用太多的时间给大家介绍。在这里给大家介绍一个实例。我们就说在相应的中文办公软件的应用过程中,已经把UOF和基于我们的XML电子公文格式这两个规范有机的协调,可以在这个过程中,将办公文档的XML数据和中文文档格式进行有机的结合,变成了一个可以和真正形式上的正式的公文相统一。
这个在办公人员来看,只要有一个模板,按照它原有的格式,就可以处理正式的公文了。这样就可以把原有文档格式的数据加以提取,为后续的全文文档的处理奠定了有效的基础。同时我们也知道,XML文档和一些二进制和一些特有的文件它的存储空间会非常大。为降低它的存储格式,我们采用相应的压缩办法,来保证我们文件的大小控制在一个合理有效的范围内,为后续整个的检索和应用都可以做到一个有效的保证,既保证了效率,又保证了XML应用的问题。在整个资料来说,UOF是一个作为XML方式整体可以做到跨平台、跨应用,便利、简单,有可拓展性和可操作性,同时我们整个的结构是面向未来的一种新的文档格式。
我们已经在座的就是有OASIS我们今天介绍的ODF,还有我们微软公司即将向中国ECMA提交的这种Open XML的文档格式也将作为这方面的,大家都采用的XML的技术,当然还有今天介绍的UOF。通过这种方式可以做到有效的不依赖于产品,而依赖于中间的交换格式,来打破单一文档格式统治一种交换文档的方式,做到相应的转换,成为一种有效的桥梁。我们可以通过UOF这种方式做到。
整个过程中,标准不是凭空捏造的,我们在后续的过程中做了一些相应的改造。标准已经正式通过国家中国信息产业电子行业协会和网站予以公布,已经完成了一个月的公式期,这个标准将在今年正式作为国家的标准正式发布。同时我们为了配合相应的工作,也在加紧的开发相应的测试工具和使用指南,与电子公文的应用。这些工作都在有序的开展。
测试工作上我不多讲了。今天要谈的,我们说OASIS提交的ODF提交的标准化组织作为投票,在今年的五月份投票过程中,中国的态度是什么?我想在这里给大家阐明一下中国对ODF的一个态度。
首先我们认为开展相应的开放式文档格式这项工作是非常有意义的。但是在我们对ODF的投票中,我们并不是完全的采纳和支持现在的ODF,我们希望在ODF的下一个这项工作是非常有意义的,但是说后续的工作过程中,应该尽量与中国制定的UOF以及微软制定的Open XML格式在相应的基础上进行融合,提供更为完善的与主流格式相转换的项目标准。这项工作是非常有意义的,所以说我们在给ODF投票的过程中,投的是在支持中国提案的基础上,接纳我们这些基础上,我们投的是赞成票。我们希望他们对这个工作表示支持。
另外一方面,我们希望在后续的应用过程中,在UOF的格式规范中尽量采用CORBA规范,而且应当尽量提供符合W3C Schema的结构,同时尽量采用元素结构的方式而不要采用大量的属性的方式。同时要增加用户定义的XML的支持,应考虑针对不同媒体内容的方式采用适合的压缩算法,应该增加非兼容内容的、具体产品可扩展方式。同时文字表格难以转换为其他格式的结构不是和合理。那么图形和图表的表现能力并不完善,电子表格中的chart比较的零乱。域的表达功能并不完善,部分的取值没有在标准的文本中予以说明,加入了markup的国际化的机制,例如相关的国际化的一些支持。中文相关的功能应进一步的增强,例如我们装订线、斜线标头这些拓展功能。
基于此点,我们希望加强和国际相关组织的合作交流。原计划我们本来是要参加关于ODF投票的一个技术研讨会,但是很遗憾的是,这个会议,不知道什么原因被取消了。我们希望这种活动应该进一步的加强和沟通,使我们这种共同促进开放文档的试图得到有序的保证。同时我们希望在下次的UOF制定的过程中,将进一步的以现在的UOF制作标准为契机,进一步的改善和完善相应的内容,我们现在完成的是UOF1.0版本,后续我们将启动UOF的2.0的版本,在后续的2.0版本中我们希望进一步的与电子政务应用相结合,与常用的电子文档的格式进行有效的结合。我们今天欣慰的看到,在IBM公司的支持下,我们已经开始了UOF和ODF之间转换器的尝试工作,这项工作是非常有意义的。同时我们也希望将我们中国的UOF通过ISO提交,作为相应的国际提案,共同来制定真正统一意义上的国际办公文档格式。
同时我们也要开展支持少数民族语言文字的工作,为支持像蒙文、藏文等等这种少数民族格式的办公文档的工作,同时要支持智能化文档的管理,面向智能化文档进行相应的工作。同时往桌面出版、网络出版进一步促进相关应用的开展。
同时在这里我由衷的感谢我们工作组相关的成员给予的高度支持。这里首先要感谢北京通信工程学院的李云(音)博士,他在UOF整个的制定过程中投入了大量的心血,很多的技术创新点都是由李云(音)博士想到的,他是我们这个小组主要的技术核心人。同时我要感谢我们的中文2000,在这个过程中他也是在整个制定过程中,对显示表的部分给予了高度的支持。中文2000公司对我们的测试和整个集成应用和推动相关产品的开发也做了大量的工作。首先没有他们的支持,我们这个工作小组是无法完成这么巨大的一项工作。
我们这项工作历时四年,用了整整四年的时间,才有了今天这样的成果。而且马上我们这个标准也会尽快加快相关的报批程序,使得它真正的成为国际推进的一个标准,让更多的软件开发公司可以受益。也感谢北京市科委在前期给予的这样一个启动支持。大家在整个UOF工作的过程中,我觉得可以充分体现一种团结、合作的方式。形成了一种和谐的社会氛围,这个标准的氛围为整个后续的应用推广奠定了一个良好的基础。我希望通过此次的研讨,将业内的更多同仁们,来记住和认识我们中文办公文档格式,我们的UOF标文通。
最后我们预祝这个采用文档开放的方式,是我们大家共同努力的方向,希望以推动UOF标准作为中文办公软件发展的一个契机,进一步来促进后续的相关产品的开发。
谢谢大家!
| 第1页:【ODF专题】吴志刚:UOF标准及发.. |