华南俳烁实业有限公司

考試首頁(yè) | 考試用書 | 培訓(xùn)課程 | 模擬考場(chǎng) | 考試論壇  
  當(dāng)前位置:設(shè)計(jì)制作 > XML > 文章內(nèi)容
  

XML教程:XML入門的常見問題(三)

 [ 2017年8月29日 ] 【

  如何加載有外國(guó)和特殊字符的文檔?

  文檔可以包含外國(guó)字符,例如:

  foreign characters (úóí?)

  例如 磲 的外國(guó)字符必須在前面加上 escape 序列。外國(guó)字符可以是 UTF-8 編碼或用不同編碼指定,如下所示:

  foreign characters (磲)

  現(xiàn)在可以正確加載 XML 了。

  其他字符是保留在 XML 中的,并且需要以不同的方式處理。下面的 XML:

  This & that

  產(chǎn)生如下錯(cuò)誤:

  此處不允許有空格。

  行 0000001: This & that

  位置 0000012: ----------^

  此處 & 是 XML 句法結(jié)構(gòu)的一部分,如果它僅僅放在 XML 數(shù)據(jù)源內(nèi)部,那么不能解釋為 &。您需要替換稱為“實(shí)體”的特殊字符序列。

  This & that

  下面的字符需要相應(yīng)的實(shí)體:

  < <

  & &

  > >

  " "

  ' '

  引號(hào)字符被用作標(biāo)記中屬性值的定界符,因此通常不能在屬性值的內(nèi)部使用。例如,下面的內(nèi)容將返回錯(cuò)誤:

  此處的單引號(hào)既用作屬性定界符,又在屬性值自身中。為了糾正這個(gè)問題,可以將屬性定界符換成雙引號(hào):

  或者可以將單引號(hào)轉(zhuǎn)義為實(shí)體 '

  上述兩種方式都將通過 XML 對(duì)象模型中的 getAttribute 方法返回屬性值 John's Stuff。同樣,對(duì)于雙引號(hào),您可以使用實(shí)體

  "。

  也可以通過將文本放在 CDATA 節(jié)中來(lái)處理元素內(nèi)容中的特殊字符。下面的內(nèi)容是正確的:

  在本例子中,XML 對(duì)象模型將 CDATA 節(jié)點(diǎn)顯示 xml 節(jié)點(diǎn)的子節(jié)點(diǎn),它將返回字符串

  This & that is just "text" content.

  作為 nodeValue。

  如何在 Visual Studio 6.0 C++ 中使用 MSXML COM 組件?

  在 Visual C++ 6.0 中使用 MSXML COM 組件的最簡(jiǎn)便方式是使用 #import 指令:

  #import "msxml.dll" named_guids no_namespace#import "msxml.dll" named_guids no_namespace

  它定義了所有 IXML* 接口和接口 ID,從而可以在應(yīng)用程序中使用它們了。也可以從 INETSDK 獲取 MSXML 類型庫(kù)和頭文件(英文),以及包含類 IIDs 的 uuid.lib。

  如何在 XML 中使用 HTML 實(shí)體?

  下面的 XML 包含 HTML 實(shí)體:

  Copyright ? 2000, Microsoft Inc, All rights reserved.

  它產(chǎn)生下列錯(cuò)誤:

  引用未定義的實(shí)體 'copy'。

  行: 1, 位置:23, 錯(cuò)誤碼:0xC00CE002

  Copyright ? 2000, ...

  ----------------------^

  這是因?yàn)?XML 只有五個(gè)內(nèi)置實(shí)體。關(guān)于內(nèi)置實(shí)體的詳細(xì)信息,請(qǐng)參閱如何加載有外國(guó)和特殊字符的文檔?。

  要使用 HTML 實(shí)體,需要用 DTD 定義它們。有關(guān) DTD 的詳細(xì)信息,請(qǐng)參閱 W3C XML 建議(英文)。要使用該 DTD,請(qǐng)將它直接包括在 DOCTYPE 標(biāo)記中,如下所示:

  Copyright ? 2000, Microsoft Inc, All rights reserved.

  要加載它,需要關(guān)閉 IXMLDOMDocument 接口的 validateOnParse 屬性。請(qǐng)嘗試將它粘貼到“Validator 測(cè)試頁(yè)”中,關(guān)閉 DTD 驗(yàn)證,然后單擊“驗(yàn)證”。請(qǐng)注意文檔將加載,并且版權(quán)字符將顯示在 validator 頁(yè)面的末尾的 DOM 樹中。

  如果已經(jīng)完成了 DTD 驗(yàn)證,那么必須將作為參數(shù)實(shí)體的 HTML 實(shí)體包括在現(xiàn)有的 DTD 中,如下所示:

  %HTMLENT;

  %HTMLENT;

  它將定義所有 HTML 實(shí)體,以便在 XML 文檔中使用它們。

  在元素內(nèi)容中如何處理空白字符?

  XML DOM 有三種訪問元素文本內(nèi)容的方式:

  屬性 行為

  nodeValue 按照原始的 XML 源中指定的那樣,返回 TEXT、CDATA、COMMENT 和 PI 節(jié)點(diǎn)上的原始文本內(nèi)容(包括空白字符)。對(duì)于 ELEMENT 節(jié)點(diǎn)和 DOCUMENT 本身,則返回空值。

  數(shù)據(jù) 與 nodeValue 相同

  文本 重復(fù)連接指定子樹中的多個(gè) TEXT 和 CDATA 節(jié)點(diǎn)并返回組合結(jié)果。

  注意: 空白字符包括新行、tab 和空格。

  nodeValue 屬性通常返回原始文檔中的內(nèi)容,與文檔如何加載和當(dāng)前 xml:space 范圍無(wú)關(guān)。

  文本屬性連接指定子樹中的所有文本并擴(kuò)展實(shí)體。這與文檔如何加載、preserveWhiteSpace 開關(guān)的當(dāng)前狀態(tài)和當(dāng)前 xml:space 范圍有關(guān),請(qǐng)看如下所示:

  preserveWhiteSpace = true when the document is loaded

preserveWhiteSpace=true preserveWhiteSpace=true preserveWhiteSpace=false preserveWhiteSpace=false
xml:space=preserve xml:space=default xml:space=preserve xml:space=default
保留 保留 保留 保留并截?cái)?/FONT>

  preserveWhiteSpace = false when the document is loaded

preserveWhiteSpace=true preserveWhiteSpace=true preserveWhiteSpace=false preserveWhiteSpace=false
xml:space=preserve xml:space=default xml:space=preserve xml:space=default
半保留 半保留并截?cái)?/FONT> 半保留 半保留并截?cái)?/FONT>

  此處的保留表示和原始 XML 文檔中完全相同的原始文本內(nèi)容,截?cái)嘁馕吨皩?dǎo)和尾部空格已經(jīng)刪除,半保留意味著保留了“重要的空白字符”并規(guī)范化了“不重要的空白字符”。重要的空白字符是文本內(nèi)容內(nèi)部的空白字符。不重要的空白字符是標(biāo)記之間的空白字符,請(qǐng)看如下所示:

首頁(yè) 1 2 尾頁(yè)
本文糾錯(cuò)】【告訴好友】【打印此文】【返回頂部
將考試網(wǎng)添加到收藏夾 | 每次上網(wǎng)自動(dòng)訪問考試網(wǎng) | 復(fù)制本頁(yè)地址,傳給QQ/MSN上的好友 | 申請(qǐng)鏈接 | 意見留言 TOP
關(guān)于本站  網(wǎng)站聲明  廣告服務(wù)  聯(lián)系方式  站內(nèi)導(dǎo)航  考試論壇
Copyright © 2007-2013 中華考試網(wǎng)(Examw.com) All Rights Reserved
宁都县| 大田县| 新绛县| 登封市| 泰宁县| 保靖县| 蚌埠市| 沙雅县| 吉木乃县| 宾川县| 原阳县| 葵青区| 汝州市| 赤峰市| 广州市| 镇原县| 尚志市| 普兰县| 伊通| 泽州县| 阜新市| 新野县| 湛江市| 信宜市| 虞城县| 奉新县| 丰县| 鸡泽县| 财经| 上思县| 白沙| 南陵县| 定结县| 三明市| 米脂县| 长宁区| 襄樊市| 孟村| 香河县| 长岭县| 呼伦贝尔市|