189 8069 5689

什么是XML文法分析

什么是XML文法分析?相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。

公司主营业务:做网站、成都网站建设、移动网站开发等业务。帮助企业客户真正实现互联网宣传,提高企业的竞争能力。创新互联是一支青春激扬、勤奋敬业、活力青春激扬、勤奋敬业、活力澎湃、和谐高效的团队。公司秉承以“开放、自由、严谨、自律”为核心的企业文化,感谢他们对我们的高要求,感谢他们从不同领域给我们带来的挑战,让我们激情的团队有机会用头脑与智慧不断的给客户带来惊喜。创新互联推出平房免费做网站回馈大家。

  在进行XML文法分析之前,首先有必要了解XML语法的基本规则:

词法特征:1)XML区分大小写,如元素名在打开和关闭标记中应保持大小写一致,XML的保留词串应符合大小写要求 …。

2)XML保留标记字符为:< > &,http://www.php.cn/wiki/75.html" target="_blank">保留字符不允许出现在元素名、元素文本、属性名、属性值中,< 用户打开标记,>用于关闭标记,&用于转意,常见的转意为 <生成<,>生成>,&生成&,&apos生成’,"生成”

3)元素名以下划线或字母开始,可包含字母、数字、句点、连字符、下划线、冒号和用于其他语言的扩展字符,元素名中不能有空格符(分格符、跳格符、换行符、回车符),元素名可以由名域前缀。如: 元素文本可以是除XML保留字符外的字符集合,如 my money is $2000

4)属性名的规则同元素名,属性值由单引号或双引号括约其中,可由除XML保留字符以外的字符串组成,如:。属性名有xmlns前缀,表明该属性定义了一个名域,如:

句法特征:1)XML文档由一个XML说明、多个可选的文档说明、多个可选的XML指令、多个可选的XML注释和一个根元素的数据体组成,此外还可以有嵌入语句中的CDATA段,如:

 /*XML说明*/
   /*XML文档说明*/
   /*XML注释*/
   /*XML指令*/
   /*根数据元素*/
  
  …
  
  

2)XML说明由标关闭,其中包含版本、编码等可选说明,如:
3)XML文档说明由关闭,如:
4)XML指令由关闭,如:
5)XML注释由关闭,如:
6)XML元素由<元素名>打开,由/>,或关闭,元素的打开和关闭标记相互匹配,如,XML的元素允许嵌套,应此还应保持层次上的匹配,如..
7)CDTATA段由打开,由]]>关闭,用于使居于其中的语句规避XML解析规则。如:
根据以上的XML文法特征,可以构造出用于词法分析的正则式和用于句法分析的下推自动机结构。
XML词法正则式:
#define digit [1,2,…,9] /*数字字符*/
#define letter [a,b,…,z,A,B,…,Z] /*字母字符*/
#define signs [~, ! , @, #, %, ^, &,*,(, ), ?, :, ;, “, ‘, ,, ., /,-, _, +, =, |, /] /*符号字符*/
#define ascii2 [0x80,…,0xFF] /*ASCII chart2 扩展字符*/
#define space [0x20, /t, /r, /n] /*空格符,跳格符,回车符,换行符*/
#define reserve [< , >, &] /*XML保留字符*/
1) 元素名的正则式:

  element_name -> (_ | letter | ascii2) (ε| _ | - | : | . | digit | letter | signs | ascii2)*

2) 元素文本的正则式:

  element_text -> (ε| not reserve)*

3) 属性名的正则式:

  proper_name -> (_ | letter | ascii2) (ε| _ | - | : | . | digit | letter | signs | ascii2)*

4) 属性文本的正则式:

  proper_value -> (ε| not reserve)*

XML句法结构:

 xml_document -> xml_header (ε| xml_declare | xml_instruct | xml_comments)* xml_element
  xml_header -> []
  xml_declare -> []
  xml_instruct -> []
  xml_comments -> [