12,3 Tài liệu XML, DTD và XML Schema
12.3.1 Vâng-Thành lập và tài liệu XML hợp lệ và XML DTD
Trong hình 12.3, chúng tôi đã thấy những gì một tài liệu XML đơn giản có thể trông như thế nào. Một tài liệu XML được hình thành tốt nếu nó sau một vài điều kiện. Đặc biệt, nó phải bắt đầu với một khai báo XML để chỉ các phiên bản của XML đang được sử dụng cũng như bất kỳ các thuộc tính khác có liên quan, như trong dòng đầu tiên trong hình 12.3. Nó cũng phải tuân theo các hướng dẫn cú pháp của mô hình dữ liệu cây. Điều này có nghĩa rằng không nên có một phần tử gốc duy nhất, và mọi phần tử phải bao gồm một cặp kết hợp của sự khởi đầu và kết thúc trong sự bắt đầu và kết thúc của phần tử cha mẹ. Điều này đảm bảo rằng các phần tử lồng nhau chỉ định một cấu trúc cây tốt được hình thành.
Một tài liệu XML cũng như hình thành là đúng cú pháp. Điều này cho phép nó để được xử lý bởi bộ xử lý chung chung mà đi qua các tài liệu và tạo ra một cây đại diện bên trong. Một mô hình tiêu chuẩn với một bộ liên kết của các API (giao diện lập trình ứng dụng) chức năng gọi DOM (Document Object Model) cho phép các chương trình để thao tác các đại diện cây kết quả tương ứng với một tài liệu XML well-formed. Tuy nhiên, toàn bộ tài liệu phải được phân tích trước khi sử dụng DOM để chuyển đổi tài liệu với DOM đại diện cấu trúc dữ liệu nội bộ tiêu chuẩn. Một API được gọi là SAX (sax) cho phép xử lý tài liệu XML trên bay bằng cách thông báo các chương trình xử lý thông qua callbacks bất cứ khi nào một sự khởi đầu hay kết thúc tag là gặp phải. Điều này làm cho nó dễ dàng hơn để xử lý các tài liệu lớn và cho phép xử lý của cái gọi là tài liệu XML trực tuyến, nơi mà các chương trình xử lý có thể xử lý các thẻ như họ đang gặp phải. Điều này còn được gọi là chế biến dựa trên sự kiện.
Một tài liệu XML cũng như hình thành có thể schemaless; nghĩa là, nó có thể có bất kỳ tên tag cho các phần tử trong tài liệu. Trong trường hợp này, không có thiết lập được xác định trước các phần tử (tên thẻ) một chương trình xử lý văn bản biết để mong đợi. Điều này cho phép các tác giả tài liệu tự do để xác định các yếu tố mới, nhưng hạn chế các khả năng tự động giải thích ý nghĩa hoặc ngữ nghĩa của các yếu tố bên trong tài liệu.
Một tiêu chí mạnh hơn là cho một tài liệu XML có giá trị. Trong trường hợp này, các tài liệu phải được hình thành tốt, và nó phải tuân theo một lược đồ cụ thể. Đó là, tên các thành phần được sử dụng trong khi bắt đầu và kết thúc cặp thẻ phải tuân theo cơ cấu được quy định trong một XML DTD (Document Type Definition) tập tin XML hoặc tập tin giản đồ riêng biệt. Đầu tiên chúng ta thảo luận về XML DTD ở đây, và sau đó chúng tôi cung cấp một cái nhìn tổng quan của lược đồ XML trong phần 12.3.2. Hình 12.4 cho thấy một tập tin XML DTD đơn giản, trong đó xác định các yếu tố (tên thẻ) và các cấu trúc lồng nhau của họ. Bất kỳ tài liệu có giá trị phù hợp với DTD này nên theo cấu trúc quy định. Một cú pháp đặc biệt tồn tại để xác định file DTD, như minh họa trong hình 12.4. Đầu tiên, một cái tên được đưa ra để các thẻ gốc của tài liệu, được gọi là dự án trong dòng đầu tiên trong hình 12.4. Sau đó, các yếu tố và cấu trúc lồng nhau của họ được quy định.
đang được dịch, vui lòng đợi..
