阅读内容 

XML简易教程之二

[日期:2005-04-10] 来源:中国站长学院  作者:风未起时 [字体: ]

文档格式的排错:我妈妈_的清单中有数十条菜谱,甚至数百条。如果产生一个致命错误,排错将非常困难 - 你将一行一行地寻找丢失的标记符。如果使用几层嵌套,发现错误将很困难。

但是可以找到很好的帮助。分析器 - XML代码和报告格式错误的应用程序可以在网上免费得到。其中最好的是Lark,它的作者是由Tim Bray - XML规范的技术编辑和极力鼓吹者,地球上最聪明的人之一。

我用Lark分析下面的代码。注意"chocolate chips"和它的关闭标记符出现在 标记符中的位置有错误:

Carol Schmidt

Chocolate Chip Bars

Dinner

Dessert

2/3 C butter

2 C brown sugar

1 tsp vanilla

1 3/4 C unsifted all-purpose flour

1 1/2 tsp baking powder

1/2 tsp salt

3 eggs

1/2 C chopped nuts

2 cups (12-oz pkg.) semi-sweet choc.

chips

Preheat overn to 350 degrees. Melt butter;

combine with brown sugar and vanilla in large mixing bowl.

Set aside to cool. Combine flour, baking powder, and salt; set aside.

Add eggs to cooled sugar mixture; beat well. Stir in reserved dry

ingredients, nuts, and chips.

Spread in greased 13-by-9-inch pan. Bake for 25 to 30 minutes

until golden brown; cool. Cut into squares.

下面是分析器返回的结果:

Error Report

Line 17, column 22: Encountered expected

... assumed

Line 18, column 36: Encountered with no start-tag.

有了这种信息,找到错误将不会成为问题。那么XML文件的有效性是指什么呢?

实现有效性最终我们将在组织良好的XML文档中加入信息。实际上,我们有很多事要做 - 仍然有危机潜伏 - 虽然XML文件组织良好,
但还可能丢失关键信息。看看下面的例子:


Carol Schmidt
Chocolate Chip Bars
Dinner Dessert

Melt butter; combine with, etc. ...

这份菜谱中没有包含ingredient,而且因为它组织良好,所以Lark分析器也不会发现问题。管理过哪怕是最和善的数据库的人都知道我们人类常犯的错误:如果有机会,我们会丢掉关键信息并加入无用的废话。这就是为什么XML的发明者引入DTD - 文档类型定义(Document Type Definition)。DTD提供了一种保证XML或多或少是你所想的方法。

让我们看看用在菜谱上的一个DTD。











]>
这些代码起初看起来不够友好,但当把它分解时却能看出其中的意义。让我们详细解释之:

这行是说,包含在方括号中的是具有根元素的某个文档的DTD。如我们以前提到的,根元素包含所有其它元素。

这行定义了标记符。圆括号是说其中的四种标记符必须按照顺序出现在标记符中。

这行需要详细的解释。我定义了以下的结构:

Here the meal name is mandatory
One course name may appear, but it is not
mandatory


我这样做是因为,按照我的想法,午餐不一定特定某道菜,但是晚餐可能要指出开胃食品、主菜和餐后甜点。通过指定#PCDATA - 表示经过分析的字符数据(即非二进制数据)来实现这个功能。这里,#PCDATA是文本 - 例如,“dinner”。

"course"后面的问号表示0或1对标记符将出现在标记符内。

现在让我们看看下一行:

这里的加号表示至少有一对标记符应出现在标记符内。

我们感兴趣的最后一行是:

我把sub_item*作为一项安全措施。除了要求每个item的文本之外,我希望计算每个item的内容的数量。星号是说在标记符中可以有子条目的数目。我不需要Chocolate Chip Bars菜谱的任何子条目,但是当它的组成成分很复杂时就用得着。

现在让我们把这些放在一起看看我们能得到什么。

DTD的完整例子
下面是一个完整的例子。我把另一个菜谱加入文件内,并为DTD做了注释。可以注意到我在第二个菜谱中用到子条目。















]>
 




Carol Schmidt
Chocolate Chip Bars
Dinner
Dessert


2/3 C butter
2 C brown sugar
1 tsp vanilla
1 3/4 C unsifted all-purpose flour
1 1/2 tsp baking powder
1/2 tsp salt
3 eggs
1/2 C chopped nuts
2 cups (12-oz pkg.) semi-sweetchoc. chips


Preheat oven to 350 degrees. Melt butter;
combinewith brown sugar and vanilla in large mixing bowl.
Set aside to cool. Combine flour, baking powder, andsalt;
set aside.Add eggs to cooled sugar mixture; beat well.
Stir in reserved dry ingredients, nuts, and chips.
Spread in greased 13-by-9-inch pan.
Bake for 25 to 30minutes until golden brown; cool.
Cut into squares.



Pasta with tomato Sauce
Dinner
Entree


1 lb spaghetti
1 16-oz can diced tomatoes
4 cloves garlic
1 diced onion
Italian seasoning
oregano
basil
crushed red pepper



Boil pasta. Sauté garlic and onion.
Add tomatoes.Serve hot.



既然有DTD,文档将被检查看是否符合DTD做出的限制。换句话说,我们要保证文档的有效性。

为了达到这个目的,我们需要另一个工具:有效性分析器。微软的MSXML,一个基于Java的程序,使用容易又工作得很好。上面的文档经过这个程序的检查后没有发现错误。但是如果我检查一个ingredient标记符中没有包含条目的菜谱,将会返回以下信息:

ingredients is not complete. Expected elements [item].

阅读:
录入:

推荐 】 【 打印
相关新闻      
本文评论       全部评论
发表评论
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款


点评: 字数
姓名:
Advertisement
内容查询


Advertisement