构造未來Web頁面的工具語言—XML

人氣 6
標籤:

(http://www.epochtimes.com)
【大紀元6月16日訊】目前主流的网絡程序語言HTML是1990年被開發出來的,對因特网如今所獲的巨大發展功不可沒。但隨著新技術的不斷發展和應用功能需求的增加,HTML語言功能單一、影響网絡傳輸速度等缺點逐漸顯現出來。因此,科學家們在几年前就開始了新一代网絡語言XML的開發。該語言近年來已經獲得了越來越廣泛的應用…

Internet已經有20多年的歷史了,近几年才出現了Internet熱,這主要應歸功于Web。Internet提供了世界范圍內网絡互連和通信功能,Web則是一個環球信息資源庫。Web由無數的頁面(Home page主頁)組成,頁面上的信息包羅万象,而且時時在增加,天天在更新。用戶只要打開瀏覽器就能得到他們感興趣的資料。Web的易用性使千家万戶都能共享 Internet上巨大的信息資源。時下,人人都在談論Web和主頁,翻開報紙或新聞雜志,几乎每天都要提到Web和主頁。從一個小商店到一個大公司,從研究机關到學校,無不驕傲地向他人顯示著自己的主頁和 Web 地址。Web和主頁已經成為計算机和通信領域乃至全社會的熱點。

用戶還不能滿意現在的Web

1.鏈路丟失后不能自動糾正。 由于許多頁面的URL地址經常變化,當你瀏覽這些頁面時就會遇到煩人的404 URL地址未找到的信息。所以你不得不手工一個個地更改鏈接相關頁面的URL地址,這大大加重了Web頁面的維護工作量。

2.動態內容需要下載的部件太多。用HTML建立的頁面目前還不能對其頁面的外觀屬性,例如色彩、字體、背景等實現更新,你只能重新下載一個新的頁面或Java部件。但Java保存的數据搜索引擎是無法訪問的,所以在HTML頁面中使用Java來顯示動態內容也不是靈丹妙藥。

3.搜索時間長。由于HTML頁面沒有類似于數据庫的結构,在這樣的文檔資料中搜索目標時需要對全部頁面的所有內容掃描,往往檢索出一大堆与主題詞無關的內容, 這是因為HTML無法區分信息与元信息而造成的。而且HTML不支持信息嵌套體系結构,因而限制了全文檢索功能。

4. HTML缺乏對雙字節或多國文字的支持,或者說支持不夠。例如中文信息頁面在不同的平台下會出現格式不齊等問題。

5. HTML可擴展性差。科學家無法用HTML書寫數學公式、化學方程式以及分子晶體結构。

正是由于這些缺點,人們已經開始研究能改進或替代HTML的Web頁面制作語言。其中最有成效的,并已初步投入使用的有:可擴展標記語言——Extensible Markup Language簡稱XML、疊式頁面——Cascading Style Sheets簡稱CSS以及動態HTML即DHTML。這些語言從不同角度解決了HTML存在的問題:XML有利于信息的表達和結构化組織,從而使數据搜索更有效;CSS解決Web頁面的繼承和顯示;DHTML則主要用于Web頁的動態顯示問題。本文著重介紹可擴展標記語言XML。

XML產生的背景

XML同HTML一樣,都來自Standard Generalized Markup Language, 即標准通用標記語言,簡稱SGML。早在Web未發明之前,SGML就早已存在。正如它的名稱所言,SGML是一种用標記來描述文檔資料的通用語言,它包含了一系列的文檔類型定義(簡稱DTD),DTD 中定義了標記的含義,因而 SGML 的語法是可以擴展的。SGML十分龐大,既不容易學,又不容易使用,在計算机上實現也十分困難。鑒于這些因素,Web的發明者——歐洲核子物理研究中心的研究人員根据當時(1989年)計算机技術的能力,提出了HTML語言。

HTML只使用SGML中很小一部分標記,例如HTML 3.2定義了70种標記。為了便于在計算机上實現,HTML規定的標記是固定的,即HTML語法是不可擴展的,它不需包含DTD。HTML這种固定的語法使它易學易用,在計算机上開發 HTML的瀏覽器也十分容易。正是由于HTML的簡單性,使 Web 技術從計算机界走向全社會,走向千家万戶,Web的發展如日中天。

近年來,隨著 Web的應用越來越廣泛和深入,人們漸漸覺得HTML不夠用了,HTML過于簡單的語法嚴重地阻礙了用它來表現复雜的形式。 盡管HTML推出了一個又一個新版本,已經有了腳本、表格、幀等表達功能,但始終滿足不了不斷增長的需求。另一方面,這几年來計算机技術的發展也十分迅速,已經可以實現比當初發明創造HTML時复雜得多的Web瀏覽器,所以開發一种新的Web頁面語言既是必要的,也是可能的。

有人建議直接使用SGML 作為Web語言,這固然能解決HTML遇到的困難。但是SGML太龐大了,用戶學、用不方便尚且不說,要全面實現SGML的瀏覽器就非常困難,于是自然會想到僅使用SGML的子集,使新的語言既方便使用又實現容易。正是在這种形勢下,Web標准化組織W3C建議使用一种精簡的SGML版本——XML應運而生了。

什么是XML

XML是一個精簡的SGML,它將SGML的丰富功能与HTML的易用性結合到Web的應用中。XML保留了SGML的可擴展功能,這使XML從根本上有別于HTML。XML要比HTML強大得多,它不再是固定的標記,而是允許定義數量不限的標記來描述文檔中的資料,允許嵌套的信息結构。HTML只是Web顯示數据的通用方法,而XML提供了一個直接處理 Web 數据的通用方法。HTML著重描述Web頁面的顯示格式,而XML著重描述的是Web頁面的內容。讓我們先來看一看用XML描述天气預報的實例:

  March 25, 1998
  08:00

   Seattle

   WA

   West Coast

   USA

  
   partly cloudy

   46

   SW

   6   

  51

  87

  10

  1

DTD文件使XML頁面能包含更多的內容,表現更复雜的形式。從實例中也可以看出XML頁面信息是結构化的,有些与數据庫結构類似,因而更具訪問性,其檢索結果更有針對性、更准确。

另外你也可以將URL地址定義在DTD文件中,當Web主頁地址發生變化時,你只需改動DTD文件中的定義即可,而不必一一在HTML文檔中改變URL地址,從而使Web的維護更方便,用戶也不會遇到URL地址找不到的信息,這樣一來,Web的應用更穩定。

并不是所有的DTD文件都要下載到客戶端,已經制訂成為標准的協議,例如在后面第六點中提到的化學標記語言CML、數學標記語言MML等是不需要DTD文件的。
為了使編寫的Web頁面成為有效的XML文檔,文中每一添加的標記必須記入一個獨立的DTD文件中。當客戶瀏覽天气預報文檔時,相關的DTD文件是隨著文檔一起下載到客戶端,客戶瀏覽器就懂得怎樣來處理它們,例如你可以從几個天气報告中計算出平均溫度等,最后將結果顯示出來。
到目前為止,几乎所有的Web頁面都是用HTML編寫的。HTML簡單易學又通用,句法簡明緊湊,加上其擴充的表格、幀、腳本等功能,使它得以在Web主頁上大顯身手。但是隨著Web應用的越來越廣泛,HTML過于簡單的弱點也越來越明顯了。

除了DTD外,XML中還包括可擴展格式語言XSL(Extensible Style Language) 和可擴展鏈接語言XLL(Extensible Linking Language)。

XSL用于將XML數据翻譯為HTML或其他格式的語言。XSL提供了一种疊式頁面CSS的功能,使開發者构造出具有表達層結构的Web頁面來,以有別于XML的數据結构。XSL也能和HTML一起构造疊式頁面。XSL可以解釋數量不限的標記,它使Web的版面更丰富多彩,例如動態的文本、跑馬式的文字。此外,XSL還處理多國文字、雙字節的漢字顯示、网格的各种各樣的處理等。

XLL是XML的鏈接語言,它与HTML的鏈接相似,但功能更強大。XLL支持可擴展的鏈接和多方向的鏈接。它打破了HTML只支持超級文本概念下最簡單的鏈接限制,能支持獨立于地址的域名、雙向鏈路、環路、多個源的集合鏈接等。XLL鏈接可不受文檔制約,完全按用戶要求來指定和管理。

為了使XML易學易用,XML精簡了一大片SGML難得用一次的功能。正如几十万漢字中常用的只不過八千,SGML常用的部分只占20%,XML拋棄了SGML中不常用的部分,使它一下就精簡了80%。這樣一來,XML的語法說明書只有30頁,而SGML卻有500頁。

XML設計中也考慮了它的易用性,易用性來自兩個方面:一方面用戶編寫Web頁面方便,另一方面設計人員實現XML瀏覽器也不太困難。

總之,XML使用一個簡單而有靈活的標准格式,為基于Web的應用提供了一個描述數据和交換數据的有效手段。HTML描述了顯示全球數据的通用方法,而XML提供了直接處理全球數据的通用方法。

支持XML的公司和它們的開發工具

盡管XML還處在開發階段,其標准正在由W3C組織制定,但是已經有許多公司表示全力支持XML,并開發了不少XML工具。Adobe公司的FrameMaker可以用來書寫XML文檔。Microsoft公司推出的IE 4.0已經可以顯示、處理和編輯XML文檔,Microsoft公司作出承諾,要在下一個版本的Office 軟件如MS Word、Excel中支持XML。Netscape、Sun公司也不甘寂寞,紛紛表示要在他們的Web工具中支持XML。除了這些著名的公司有所行動外,其他小公司也把XML 作為一种商机,紛紛投入到XML的開發工作中。例如ArborText 公司的Cedar項目旨在開發XSL;ArborText公司和Microsoft公司一起向W3C提出了XSL的標准草案;Grif公司的Symposia Doc+則是一個編輯XML文檔的可見即可得的工具。此外還有Copsol公司的XML開發工具,Norbert公司的XML句法分析器,Jade公司的XSL工具包以及支持客戶/服務机應用的Serucie 98等。

XML展望

任何一項新技術的產生都是有其需求背景的,XML的誕生是在HTML遇到不可克服的困難之后。近年來HTML在許多复雜的Web應用中遇到了問題,要徹底解決這些問題,必須用功能強大的XML來替代HTML作為Web頁面的書寫工具。XML有利于信息的表達和結构化組織,從而使數据搜索更有效;XML可以使用URL別名使 Web的維護更方便,也使Web的應用更穩定;XML可以使用數字簽名使Web的應用更廣闊拓展到安全保密領域。可以認為未來的Web書寫工具必定是XML。而XML的廣泛使用必然能推動Web不斷發展,從而開創Web應用的新時代。

Web的應用將隨著XML的使用而更精彩,以下是可以預見的XML的几种應用。

XML/EDI電子數据交換

EDI(Electronic Data Interchange)是用電子技術代替基于紙張的操作手段,用于公司之間的單据交換。XML的丰富的格式語言可用來描述不同類型的單据,例如信用證、貸款申請表、保險單、索賠單以及各种發票等。結构化的XML文檔送至Web的數据可以被加密,并且很容易附加上數字簽名。XML的安全保密措施可在EDI的應用中充分顯示它的魅力,XML有希望推動EDI的大規模的應用。

化學標記語言CML和數學標記語言Math ML

CML(chamical Markup Language)和Math ML(Mathematical Markup Language)是XML應用于描述化學和數學公式的標記語言。CML可描述分子与晶體結构、化合物的光譜結构等。而Math ML則是數學家的福音,自Web問世以來,數學家們第一次可以使用Math ML將數學公式精确地顯示在瀏覽器上。

開放式軟件描述格式OSD

和EDI的命運相仿,軟件包的上网發行一直處于試行階段。OSD(Open Software Descriptipon)是XML的一組用來描述各种軟件產品的標記集,可以詳細說明軟件的規格、使用說明以及可運行平台等。

通道定義格式CDF

通道定義格式CDF(Channel definition format)是Microsoft在IE 4.0瀏覽器中使用的XML數据格式, 用于描述活動通道的內容和桌面部件,指明通道的信息及其更新情況。CDF 使不同平台的互操作成為可能,使Web發布者可以控制推(push)技術。專用的推技術將不再影響不同推技術的互操作性,這樣一來,從互不兼容的平台上可以獲得相同的Web內容。

開放式財務交換OFX

OFX(Open Financial Exchange)也是XML的一种標記集,用于描述會計事務所与客戶之間的業務往來。使用OFX,客戶与會計事務所之間可以直接交換財務數据,包括電子銀行和支付協議等說明文件。

為了推動XML的使用,W3C已經批准了XML標准1.0版本,相信XML 1??0的頒布會帶動大批高級的Web應用,用戶必須從現在起開始考慮用XML來書寫Web頁面。但是XML的大量使用并不意味著HTML會馬上消亡。習慣的勢力是強大的,正如Cobol語言在很長的一段時間里沒有退出歷史舞台一樣,由于現存的大量的Web頁面都是用HTML書寫的,HTML決不會輕易退出使用。可以預計,在未來的5年內,XML將和HTML攜手并肩共同使用在Web應用的不同領域中。(中華网) (http://www.dajiyuan.com)


    相關文章
    

  • 比爾‧蓋茨縱談電子商務未來 (6/16/2001)    
  • 微軟CEO稱XML將取代HTML (6/12/2001)    
  • 微軟表示XML是計算机革命的最新方向 (5/16/2001)    
  • 首個ebXML規范獲得批准 (5/16/2001)    
  • IT業矚目的全新XML電子商務標准出籠 (5/15/2001)    
  • 微軟﹕比爾-蓋茨談XML﹑.Net和電子商務的未來 (4/21/2001)    
  • 在SUN Java与微軟.NET之間架設橋梁 (4/19/2001)    
  • Oracle 推出全新网上培訓認證服務 (4/6/2001)    
  • 微軟吹捧XML网絡標准 (3/13/2001)    
  • Mozilla口號:打倒微軟.Net 稱霸全球互聯网 (2/6/2001)    
  • Voice XML語言將讓人們能以語音瀏覽互聯网 (1/22/2001)    
  • Sun加快推出StarOffice跨平台辦公軟件 (1/10/2001)
  • 相關新聞
    Sun加快推出StarOffice跨平台辦公軟件
    Voice XML語言將讓人們能以語音瀏覽互聯网
    Mozilla口號:打倒微軟.Net 稱霸全球互聯网
    微軟吹捧XML网絡標准
    如果您有新聞線索或資料給大紀元,請進入安全投稿爆料平台
    評論