Nghiên cứu tập tin Xml. ngôn ngữ xml. XML không phải là sự thay thế cho HTML

XML (Có thể mở rộng Ngôn ngữ đánh dấu) là ngôn ngữ đánh dấu tài liệu có nguồn gốc SGML mới cho phép bạn cấu trúc thông tin thuộc nhiều loại khác nhau bằng cách sử dụng một bộ hướng dẫn tùy ý. Các nhà phát triển ứng dụng Internet đang cố gắng sử dụng công nghệ mới trong thực tế có thể quan tâm đến các câu hỏi cụ thể liên quan đến vấn đề tạo, xử lý tài liệu XML và hiển thị chúng ở phía máy khách. Bài viết này đưa ra ý tưởng ngắn gọn về tài liệu XML là gì và tại sao nó lại cần thiết, đồng thời minh họa bằng các ví dụ thực tế một số cơ chế xử lý tài liệu XML đơn giản nhưng cho đến nay rất ít được mô tả.

XML là gì

Ngày nay, XML có thể được sử dụng trong bất kỳ ứng dụng nào cần thông tin có cấu trúc - từ các ứng dụng địa lý phức tạp. hệ thông thông tin, với lượng thông tin khổng lồ được truyền đến các chương trình “máy tính đơn” thông thường sử dụng ngôn ngữ này để mô tả thông tin dịch vụ. Nhìn kỹ hơn vào môi trường xung quanh chúng ta thế giới thông tin Có nhiều nhiệm vụ liên quan đến việc tạo và xử lý thông tin có cấu trúc mà XML có thể được sử dụng để giải quyết:

  • Trước hết, công nghệ này có thể hữu ích cho các nhà phát triển hệ thống thông tin phức tạp, với một lượng lớn các ứng dụng được kết nối bởi các luồng thông tin có cấu trúc khác nhau. Trong trường hợp này, các tài liệu XML đóng vai trò định dạng phổ quátđể trao đổi thông tin giữa thành phần riêng biệt chương trình lớn.
  • XML là tiêu chuẩn cơ sở cho ngôn ngữ mô tả tài nguyên mới, RDF, giúp đơn giản hóa nhiều vấn đề trên Web liên quan đến việc tìm kiếm thông tin phù hợp, cung cấp khả năng kiểm soát nội dung của tài nguyên mạng, tạo thư viện số, v.v.
  • XML cho phép bạn mô tả dữ liệu loại tùy ý và được sử dụng để thể hiện các thông tin chuyên ngành, chẳng hạn như công thức hóa học, toán học, vật lý, đơn thuốc, ký hiệu âm nhạc, v.v. Điều này có nghĩa là XML có thể phục vụ như một sự bổ sung mạnh mẽ cho HTML để phân phối thông tin "không chuẩn" trên Web. Có lẽ trong tương lai rất gần, XML sẽ thay thế hoàn toàn HTML, ít nhất những nỗ lực đầu tiên để tích hợp hai ngôn ngữ này đã được thực hiện (đặc tả).
  • Tài liệu XML có thể được sử dụng làm định dạng dữ liệu trung gian trong các hệ thống ba tầng. Thông thường, mẫu tương tác giữa máy chủ ứng dụng và cơ sở dữ liệu phụ thuộc vào DBMS cụ thể và phương ngữ SQL được sử dụng để truy cập dữ liệu. Nếu kết quả truy vấn được trình bày theo một cách phổ biến nào đó định dạng văn bản, khi đó liên kết DBMS sẽ trở nên “trong suốt” đối với ứng dụng. Ngoài ra, hôm nay W3C đã đề xuất một đặc tả cho ngôn ngữ truy vấn cơ sở dữ liệu mới, XQL, ngôn ngữ này trong tương lai có thể trở thành một ngôn ngữ thay thế cho SQL.
  • Thông tin chứa trong tài liệu XML có thể được sửa đổi, truyền đến máy khách và được cập nhật từng phần. Các thông số kỹ thuật của XLink và Xpointer đang được phát triển sẽ giúp có thể tham chiếu đến các phần tử riêng lẻ của tài liệu, có tính đến các giá trị thuộc tính và lồng nhau của chúng.
  • Việc sử dụng biểu định kiểu (XSL) cho phép bạn cung cấp khả năng hiển thị tài liệu XML độc lập với thiết bị đầu ra.
  • XML có thể được sử dụng trong ứng dụng phổ biếnđể lưu trữ và xử lý dữ liệu có cấu trúc ở định dạng thống nhất.

Một tài liệu XML là một tài liệu thông thường tập tin văn bản, trong đó, bằng cách sử dụng các điểm đánh dấu đặc biệt, các phần tử dữ liệu được tạo ra, trình tự và cách lồng của chúng xác định cấu trúc của tài liệu và nội dung của nó. Ưu điểm chính của tài liệu XML là với phương pháp tạo và xử lý tương đối đơn giản (văn bản thuần túy có thể được chỉnh sửa bởi bất kỳ bộ xử lý kiểm tra nào và được xử lý bởi các trình phân tích cú pháp XML tiêu chuẩn), chúng cho phép bạn tạo thông tin có cấu trúc mà máy tính “hiểu rõ” .

Làm cách nào để tạo một tài liệu XML?

Để tạo một tài liệu XML trong trường hợp đơn giản nhất, bạn sẽ không cần bất cứ thứ gì ngoài một trình soạn thảo văn bản thông thường (theo nhiều nhà thiết kế Web, đây là công cụ tốt nhất để tạo các trang Web). Dưới đây là ví dụ về một tài liệu XML nhỏ được sử dụng thay cho sổ ghi chép thông thường:

Cuộc họp kinh doanh quan trọng Chúng ta cần gặp Ivan Ivanovich sau khi gọi điện cho anh ấy 123-12-12 ... Gọi về nhà 124-13-13

Khi tạo ngôn ngữ đánh dấu của riêng mình, bạn có thể đặt bất kỳ tên nào cho các phần tử (hầu như bất kỳ tên nào, vì danh sách các ký tự hợp lệ bị giới hạn và được đưa ra trong ), tương ứng với ngữ cảnh sử dụng của chúng. Ví dụ của chúng tôi chỉ hiển thị một trong nhiều cách để tạo cấu trúc nhật ký. Đây là tính linh hoạt và khả năng mở rộng của các ngôn ngữ có nguồn gốc từ XML - chúng được nhà phát triển tạo ra “nhanh chóng”, theo ý tưởng của anh ấy về cấu trúc của tài liệu và sau đó có thể được sử dụng bởi những người xem phổ thông cùng với bất kỳ XML nào khác -ngôn ngữ có nguồn gốc, bởi vì tất cả thông tin cần thiết để phân tích cú pháp đều có trong tài liệu.

Khi tạo một định dạng mới, cần phải tính đến thực tế là về nguyên tắc không thể có tài liệu "được viết bằng XML" - trong mọi trường hợp, các tác giả của tài liệu để đánh dấu nó sử dụng ngôn ngữ dựa trên tiêu chuẩn XML ( được gọi là ngôn ngữ có nguồn gốc từ XML), nhưng bản thân nó không phải là XML. Do đó, khi lưu tệp đã tạo, bạn có thể chọn cho nó một số tiện ích mở rộng phù hợp với tên (ví dụ: noteML).

Bạn có thể sử dụng XML để tạo các tài liệu thuộc loại và cấu trúc cụ thể cần thiết cho một ứng dụng cụ thể. Tuy nhiên, nếu phạm vi của ngôn ngữ đủ rộng và nó bắt đầu được nhiều nhà phát triển quan tâm thì đặc tả của nó có thể được gửi để W3C xem xét và sau khi được tất cả các bên quan tâm đồng ý, nó sẽ được phê duyệt. bởi tập đoàn như một khuyến nghị chính thức.

Cần lưu ý rằng quá trình tạo ra một đặc tả mới rất dài và phức tạp. Bất kỳ tài liệu nào do W3C đề xuất đều phải trải qua nhiều giai đoạn trước khi trở thành tiêu chuẩn. Đầu tiên, những mong muốn và khuyến nghị đến từ các công ty khác nhau tham gia vào quá trình phát triển của nó được chính thức hóa dưới dạng một ghi chú được xem xét, một loại giao thức về mục đích. Thông tin trong các tài liệu đó chỉ nhằm mục đích thảo luận giữa các thành viên của tập đoàn và không có sự đảm bảo nào được đưa ra rằng những nhận xét này sau đó sẽ trở thành khuyến nghị.

Giai đoạn tiếp theo của việc quảng bá tài liệu là phiên bản làm việc của đặc tả, được biên soạn và sửa đổi sau đó bởi một nhóm làm việc được thành lập đặc biệt (Nhóm làm việc), bao gồm đại diện của các công ty quan tâm đến ý tưởng này. Tất cả các thay đổi được thực hiện đối với tài liệu này nhất thiết phải được xuất bản trên máy chủ của tập đoàn www.w3.org và cho đến khi phiên bản hoạt động trở thành đề xuất, nó chỉ có thể đóng vai trò là “ngôi sao dẫn đường” cho các nhà phát triển mà công ty có thể kiểm tra kế hoạch của mình, nhưng không nên được sử dụng trong phát triển phần mềm.

Trong trường hợp các bên đã đồng ý về tất cả các vấn đề chính và có những thay đổi quan trọng hơn đối với tài liệu, phiên bản làm việc sẽ trở thành Khuyến nghị được đề xuất và sau khi các thành viên biểu quyết. nhóm làm việc có thể đã trở thành rồi Khuyến nghị chính thức W3C, tương ứng với trạng thái của tiêu chuẩn WWW.

Trình tạo XML

Các tài liệu XML có thể đóng vai trò là định dạng trung gian để truyền thông tin từ ứng dụng này sang ứng dụng khác (ví dụ: do kết quả của một truy vấn cơ sở dữ liệu), do đó nội dung của chúng đôi khi được các chương trình tạo ra và xử lý tự động. Không phải lúc nào cũng cần tạo tài liệu XML theo cách thủ công.

Ví dụ, nhiệm vụ của chúng ta là tạo một định dạng để lưu trữ dữ liệu đăng ký của một số sự kiện xảy ra trong hệ thống (tệp nhật ký). Trong trường hợp đơn giản nhất, chúng tôi có thể giới hạn bản thân trong việc ghi lại các yêu cầu thành công và không thành công đối với tài nguyên của mình - tài liệu đó phải chứa thông tin về thời gian diễn ra sự kiện, kết quả (thành công/lỗi), địa chỉ IP của nguồn yêu cầu, URI tài nguyên và mã kết quả

Tài liệu XML của chúng tôi có thể trông như thế này:

195.151.62.18 LẤY /linh tinh/ 200 195.209.248.12 LẤY /soft.htm 200

Cấu trúc của tài liệu khá đơn giản - phần tử gốc trong trường hợp này là phần tử log, mỗi sự kiện xảy ra đều được ghi lại trong phần tử sự kiện và được mô tả bằng các thuộc tính của nó (ngày - giờ và kết quả - loại sự kiện) và các phần tử bên trong ( phương thức - phương thức truy cập, ip-from - nguồn địa chỉ, url-tới - tài nguyên được yêu cầu, phản hồi - mã phản hồi). Ví dụ: tài liệu này có thể được tạo bởi mô-đun xác thực yêu cầu hệ thống và được sử dụng bởi chương trình xử lý dữ liệu đăng ký (trình xem nhật ký).

DTD là gì?

Vì vậy, chúng tôi đã tạo một tài liệu XML và đảm bảo rằng bộ thẻ được sử dụng cho phép chúng tôi thực hiện bất kỳ thao tác nào với thông tin của mình. Trong trường hợp này, để thiết lập các quy tắc cho ngôn ngữ mới của chúng tôi, tức là. danh sách các phần tử hợp lệ, nội dung và thuộc tính có thể có của chúng, chúng ta phải tạo các định nghĩa DTD (tại thời điểm viết bài, đặc tả cho các tài liệu XML vẫn chưa được phê duyệt và cho đến nay DTD là cách tiêu chuẩn duy nhất để mô tả ngữ pháp).

Một ví dụ nhỏ cho tài liệu XML của chúng tôi:

Lưu tệp này dưới dạng log.dtd và bao gồm một dòng mới trong tài liệu XML:

Bây giờ, khi xử lý một tài liệu, bộ phân tích XML xác minh sẽ kiểm tra thứ tự xác định các phần tử và thuộc tính của chúng theo cách được chỉ định trong các ký hiệu DTD của chúng tôi và trong trường hợp vi phạm cấu trúc bên trong (xác định “ngữ nghĩa” của tài liệu), đưa ra thông báo lỗi.

Không gian tên là gì?

Như đã đề cập trước đó, cái hay của việc sử dụng XML nằm ở khả năng đưa ra các thẻ của riêng bạn, tên của các thẻ này sẽ tương ứng đầy đủ nhất với mục đích của chúng. Nhưng tưởng tượng và từ vựng con người không phải là vô hạn nên hoàn toàn không có gì đảm bảo rằng tên thành phần bạn đưa ra sẽ không bị người khác sử dụng. Miễn là ứng dụng của bạn chỉ xử lý các tài liệu XML gốc thì sẽ không có bất kỳ vấn đề nào. Nhưng rất có thể cùng một tài liệu sẽ chứa thông tin của một số bộ xử lý cùng một lúc. Trong trường hợp này, tên của một số thành phần hoặc thuộc tính của chúng có thể giống nhau, gây ra lỗi trong trình phân tích cú pháp XML hoặc trình bày tài liệu không chính xác. Ví dụ: trong trường hợp của chúng tôi, phần tử sự kiện có thể dễ dàng được sử dụng để ghi lại các sự kiện khác và được ứng dụng khác xử lý.

Để khắc phục tình trạng này, chúng ta phải xác định tên duy nhất cho các thành phần và thuộc tính của chúng bằng cách “thêm” một số tiền tố phổ quát, không lặp lại vào tên thông thường của chúng. Cơ chế Không gian tên được sử dụng cho việc này (Không gian tên đã được W3C chính thức phê duyệt vào tháng 1 năm 1999 và hiện là một phần của tiêu chuẩn XML). Theo đặc tả này, để xác định "phạm vi" của thẻ (trên thực tế, thuật ngữ này, được sử dụng rộng rãi trong các ngôn ngữ lập trình thông thường, không thể áp dụng được trong XML, vì không có tập hợp nào có thể xây dựng "phạm vi" như vậy). trong tài liệu XML có cấu trúc), cần xác định một thuộc tính duy nhất mô tả tên của thành phần, nhờ đó bộ phân tích tài liệu có thể xác định nó thuộc nhóm tên nào (Có thể sử dụng mã định danh không gian tên để mô tả tên duy nhất của cả hai thành phần và thuộc tính của chúng). Trong ví dụ cuối cùng của chúng tôi, nó có thể được thực hiện như thế này:

195.151.62.18

LẤY

/linh tinh/

200

195.209.248.12

LẤY

/soft.htm

200

Tính duy nhất của thuộc tính tên được đảm bảo bằng cách sử dụng một số mã định danh tài nguyên phổ quát (ví dụ: URI hoặc ISBN) làm giá trị của nó.

Đầy đủ thông tin về việc sử dụng Không gian tên, bạn có thể tìm thấy trong tiêu chuẩn này. Trong tương lai, để đơn giản hóa các ví dụ, chúng ta sẽ bỏ qua Namespace - mô tả.

Công cụ

Xử lý tài liệu XML

Yếu tố hạn chế chính trong việc thúc đẩy công nghệ XML trên Web ngày nay là việc thiếu sự hỗ trợ đầy đủ cho định dạng này bởi tất cả các nhà sản xuất trình duyệt - các chương trình thường được sử dụng nhất ở phía máy khách. Một cách thoát khỏi tình huống này có thể là một tùy chọn trong đó phía máy chủ xử lý việc xử lý tài liệu XML. Sử dụng bất kỳ trình phân tích XML hiện có nào, bạn có thể tạo thông tin cần thiết trên máy chủ và gửi tài liệu HTML bình thường đến máy khách. Tuy nhiên, tất nhiên, phương pháp này kém linh hoạt hơn và cho phép bạn chỉ sử dụng công nghệ XML để lưu trữ thông tin có cấu trúc chứ không phải để thay đổi nó một cách linh hoạt ở phía máy khách.

Vào tháng 8 năm 1997, RFC 2376 đã được phê duyệt các loại MIMEđối với tài nguyên XML: text/xml và application/xml. Do đó, tài liệu XML có thể được truyền qua HTTP và được người xem hiển thị giống như các trang HTML thông thường. Để thực hiện việc này, bạn cần thay đổi một chút cấu hình máy chủ Web (trong Apache - thêm dòng "text/xml xml ddt" vào tệp mime.types) và ở phía máy khách có trình duyệt hỗ trợ biểu định kiểu hoặc JavaScript. Ngày nay những trình duyệt như vậy là của Microsoft trình duyệt web IE 5, trình duyệt đầu tiên hỗ trợ đặc tả XML 1.0 và bảng định kiểu XSL; Trình duyệt Amaya, được liên minh cung cấp đặc biệt cho mục đích thử nghiệm () và hỗ trợ hầu hết tất cả các tiêu chuẩn W3C đã phát triển. Hỗ trợ XML cũng được lên kế hoạch cho các phiên bản tương lai của Netscape Navigator.

Mô hình đối tượng tài liệu DOM

Một trong những giao diện mạnh mẽ nhất để truy cập nội dung của tài liệu XML là DOM.

Mô hình đối tượng của tài liệu XML là sự thể hiện cấu trúc bên trong của nó dưới dạng một tập hợp các đối tượng được xác định. Để thuận tiện, các đối tượng này được tổ chức thành một số loại cấu trúc dữ liệu giống cây - mỗi phần tử của tài liệu có thể được gán cho một nhánh riêng biệt và tất cả nội dung của nó, dưới dạng một tập hợp các phần tử lồng nhau, nhận xét, phần CDATA, vân vân. được biểu diễn trong cấu trúc này bằng các cây con. Bởi vì Vì bất kỳ tài liệu XML đúng định dạng nào cũng phải có phần tử chính được xác định nên tất cả nội dung có thể được coi là cây con của phần tử chính này, khi đó được gọi là gốc của cây tài liệu. Đối với đoạn tài liệu XML sau:

chữ chữ

Việc biểu diễn đối tượng của cấu trúc tài liệu không phải là điều mới mẻ đối với các nhà phát triển. Truy cập vào nội dung HTML các trang trong tập lệnh từ lâu đã sử dụng cách tiếp cận hướng đối tượng - các phần tử có sẵn cho Java Script hoặc VBScript tài liệu HTML có thể được tạo, sửa đổi và xem bằng các đối tượng thích hợp. Nhưng danh sách và bộ phương thức của họ liên tục thay đổi và phụ thuộc vào loại trình duyệt và phiên bản ngôn ngữ. Để cung cấp giao diện truy cập nội dung của tài liệu có cấu trúc, độc lập với ngôn ngữ lập trình và loại tài liệu cụ thể, đặc điểm kỹ thuật của mô hình đối tượng DOM Cấp 1 đã được phát triển và chính thức phê duyệt trong tập đoàn W3.

DOM là một đặc tả để truy cập độc lập với nền tảng và phần mềm vào nội dung của tài liệu và chỉ đơn giản là một loại API dành cho trình xử lý của chúng. DOM là một cách tiêu chuẩn để xây dựng mô hình đối tượng của bất kỳ tài liệu HTML hoặc XML nào, với sự trợ giúp của nó, bạn có thể tìm kiếm các đoạn cần thiết, tạo, xóa và sửa đổi các phần tử của nó.

Để mô tả các giao diện truy cập nội dung của tài liệu XML, đặc tả DOM sử dụng ngôn ngữ IDL độc lập với nền tảng và để sử dụng chúng, chúng phải được “dịch” sang một ngôn ngữ lập trình cụ thể. Tuy nhiên, điều này được thực hiện bởi chính những người tạo ra bộ phân tích; chúng ta có thể không biết gì về cách triển khai các giao diện - theo quan điểm của các nhà phát triển ứng dụng, DOM trông giống như một tập hợp các đối tượng với các phương thức và thuộc tính nhất định. Trong phần tiếp theo chúng ta sẽ xem xét ngắn gọn về mô hình đối tượng Internet của Microsoft Explorer 5, có thể truy cập được từ các tập lệnh Java Script và VBScript.

Trong bài viết này, chúng ta bắt đầu nghiên cứu ngôn ngữ XML và xem xét chi tiết các vấn đề như đánh dấu và cấu trúc của một tài liệu XML. Thông tin này Có sự hiểu biết cơ bản về XML, vì vậy tôi khuyên bạn nên nghiên cứu kỹ tài liệu này để không còn thắc mắc nào. Thành công của bạn trong tương lai và tốc độ học cả XML và XSLT, mà chúng ta sẽ nghiên cứu ngay sau khi nắm vững XML, phụ thuộc vào điều này.

Vì thế, XML (Ngôn ngữ đánh dấu có thể mở rộng) là ngôn ngữ để thể hiện thông tin dưới dạng văn bản mẫu. Bản thân nó không có toán tử và không thực hiện bất kỳ phép tính nào. Vì vậy, XML là một ngôn ngữ kim loại nhiệm vụ chính trong đó có mô tả về ngôn ngữ tài liệu mới.

Để hiểu rõ hơn bản chất của những điều trên, chúng ta hãy đi thẳng vào các ví dụ và trước tiên hãy xem xét Đánh dấu XML-các tài liệu.

Đánh dấu tài liệu XML

Đánh dấu của một tài liệu XML thực tế không khác gì đánh dấu của một tài liệu HTML thông thường ( . ). Một trong những ưu điểm của XML là nó cho phép bạn tạo số lượng thẻ không giới hạn. Như vậy, mỗi thẻ đều có ngữ nghĩa riêng, tức là nó mang một ý nghĩa nhất định. Để rõ ràng, chúng ta hãy xem một tài liệu XML có danh sách các cuốn sách.

tác giả 1 Tiêu đề 1 Giá 1 tác giả 2 Tiêu đề 2 Giá 2 tác giả 3 Tiêu đề 3 Giá 3

Như bạn có thể thấy từ ví dụ trên, mọi thứ đều rất tầm thường và đơn giản. Đồng thời, tài liệu XML chứa thông tin chi tiết hơn nhiều so với tài liệu HTML thông thường. Trong ví dụ của chúng tôi, rất dễ hiểu rằng thẻ chịu trách nhiệm về tác giả cuốn sách, gắn thẻ - cho tiêu đề, thẻ - về giá cả, v.v. Như vậy, mỗi tag đều có ý nghĩa riêng.

Một trong những tính năng quan trọng nhất của tài liệu XML là chúng có thể được xử lý dễ dàng bằng chương trình. Ví dụ: bằng cách xử lý ví dụ của văn bản trên, bạn có thể dễ dàng có được thông tin cần thiết về sách, hiển thị giá sách theo tên sách, v.v. Đồng thời, khả năng trình bày trực quan của tài liệu được bảo toàn hoàn toàn. Để làm điều này, bạn chỉ cần xác định phần tử này hoặc phần tử kia sẽ trông như thế nào.

Do đó, XML cho phép bạn tách dữ liệu khỏi cách biểu diễn của nó và tạo tài liệu ở dạng văn bản với cấu trúc rõ ràng. Nói chính xác, chỉ bằng cách mở rộng số lượng thẻ, chúng tôi đã làm như sau:

  1. Chúng tôi đã xác định rõ ràng cấu trúc trong tài liệu XML, từ đó giúp có thể xử lý tài liệu theo chương trình hơn nữa, chẳng hạn như sử dụng công nghệ XSLT mà chúng tôi sẽ nghiên cứu sau. Đồng thời, một trong những đặc điểm chính là tài liệu này vẫn dễ hiểu đối với người bình thường.
  2. Tách dữ liệu trong tài liệu XML khỏi cách trình bày dữ liệu một cách trực quan. Ngược lại, điều này đã mang lại nhiều cơ hội để xuất bản dữ liệu trên các phương tiện truyền thông khác nhau, chẳng hạn như trên giấy hoặc trên Internet.

Để tóm tắt những điều trên, chúng ta có thể kết luận rằng về mặt cú pháp, XML thực tế không có gì mới so với HTML. XML là cùng một văn bản được đánh dấu bằng các thẻ. Sự khác biệt duy nhất là XML cho phép bạn tạo bất kỳ đánh dấu nào mà bạn có thể cần để mô tả tài liệu, trong khi ở HTML chỉ có một bộ thẻ giới hạn mà bạn có thể sử dụng.

Nói tóm lại, XML là một ngôn ngữ rất đơn giản với một tập hợp nhỏ các cấu trúc cơ bản, nhưng đồng thời nó cung cấp khả năng mô tả dữ liệu không giới hạn. Do đó, mỗi nhà phát triển đều phát minh ra ngôn ngữ của riêng mình, ngôn ngữ này chỉ bị giới hạn bởi trí tưởng tượng của chính nhà phát triển.

Cấu trúc của tài liệu XML

Để giới thiệu cấu trúc của tài liệu XML, chúng ta hãy xem ví dụ đơn giản nhất về tài liệu XML.

Cuốn sách 1 tác giả 1 Giá 1 Quyển 2 tác giả 2 Giá 2 Quyển 3 tác giả 3 Giá 3

Vì vậy, chúng ta thấy rằng ví dụ này thực tế không khác gì ví dụ trước, ngoại trừ các thẻ có một chút thay đổi và một số thuộc tính. Sự khác biệt chính ở đây là dòng đầu tiên, định nghĩa tệp là tài liệu XML được xây dựng theo phiên bản đầu tiên của ngôn ngữ. Chúng ta sẽ nói về vấn đề này chi tiết hơn trong các bài viết tiếp theo trong phần “Bài học XML và XSLT”.

Tại thời điểm này, điều quan trọng nhất mà chúng ta phải hiểu là đây là một ngôn ngữ rất đơn giản và rất giống với HTML thông thường. Trong ví dụ trên, chúng ta thấy rằng XML cũng có các thẻ có thể lồng nhau, tức là chứa các thẻ khác bên trong chúng. Đồng thời, các thẻ trong XML không chỉ đơn giản giới hạn một phần văn bản mà tạo thành một phần tử riêng biệt. Dựa trên điều này, những gì được đánh dấu bằng thẻ thường được gọi là các phần tử trong XML.

Cũng cần lưu ý rằng XML cũng chứa các thuộc tính, nhận xét cũng như nhiều phần tử và cấu trúc khác. Thật không may, một bài viết là không đủ để viết chi tiết về mọi thứ, vì vậy các bài viết riêng biệt sẽ được viết về từng chủ đề. Nếu bạn không muốn bỏ lỡ chúng, tôi khuyên bạn nên đăng ký nhận bản tin theo bất kỳ cách nào thuận tiện cho bạn trong phần “” hoặc sử dụng biểu mẫu bên dưới.

Đó là tất cả. Chúc may mắn và thành công trong việc học những kiến ​​thức cơ bản về XML.

Hôm nay chúng ta sẽ bắt đầu xem xét một cách rất phổ biến và tiện lợi Ngôn ngữ đánh dấu XML. Vì định dạng trình bày dữ liệu này rất linh hoạt và phổ quát, đồng thời nó có thể được sử dụng ở hầu hết mọi nơi, điều này có nghĩa là tận tâm với điều gì đó. Do đó, một lập trình viên mới vào nghề sớm hay muộn sẽ phải đối mặt với ngôn ngữ này và việc bạn làm chính xác là gì không quan trọng, dù là lập trình web hay quản trị cơ sở dữ liệu, bởi vì mọi người đều sử dụng XML và bạn cũng sẽ sử dụng nó để thực hiện các tác vụ. bạn cần.

Như thường lệ, chúng ta sẽ bắt đầu với lý thuyết, hãy xem nó là loại ngôn ngữ gì, tại sao nó tốt, cách sử dụng và nơi nó được sử dụng.

Định nghĩa ngôn ngữ XML

XML (Ngôn ngữ đánh dấu có thể mở rộng) là ngôn ngữ đánh dấu dữ liệu phổ quát và có thể mở rộng, độc lập với hệ điều hành và môi trường xử lý. Xml được sử dụng để trình bày một số dữ liệu nhất định dưới dạng cấu trúc và bạn có thể tự phát triển cấu trúc này hoặc tùy chỉnh nó cho một chương trình cụ thể hoặc một số dịch vụ. Đó là lý do tại sao ngôn ngữ này được gọi là có thể mở rộng và đây là ưu điểm chính của nó, khiến nó được đánh giá cao.

Như bạn đã biết, có khá nhiều ngôn ngữ đánh dấu, chẳng hạn như ngôn ngữ HTML, nhưng tất cả chúng, bằng cách này hay cách khác, đều phụ thuộc vào bộ xử lý, ví dụ: cùng một html, mã mà trình duyệt phân tích cú pháp, được chuẩn hóa và không thể mở rộng, có các thẻ rõ ràng ở đó, cú pháp không thể vi phạm và trong xml bạn có thể tạo các thẻ của riêng mình, tức là. đánh dấu của bạn. Chủ yếu danh hiệu HTML và XML là html chỉ mô tả đánh dấu để hiển thị dữ liệu và xml là cấu trúc dữ liệu trừu tượng có thể được xử lý và hiển thị theo ý muốn của bạn ở bất kỳ đâu và do đó không cần phải so sánh các ngôn ngữ này, chúng có mục đích hoàn toàn khác nhau.

Như đã lưu ý ở trên, xml rất phổ biến và ngôn ngữ phổ quát, thông qua đó hầu hết tất cả các ứng dụng, cả web và chỉ dành cho máy tính, đều sử dụng nó để trao đổi thông tin, vì với sự trợ giúp của nó, bạn có thể rất dễ dàng trao đổi dữ liệu giữa các ứng dụng hoặc dịch vụ thậm chí được viết bằng ngôn ngữ khác nhau. Trong mối liên hệ này, mọi lập trình viên mới vào nghề tham gia vào bất kỳ chương trình nào đều phải có hiểu biết về XML. Nếu bạn muốn trở thành quản trị viên web thì bạn chỉ cần biết XML và chúng tôi đã thảo luận về cách trở thành Quản trị viên WEB cũng như những điều bạn cần biết để thực hiện việc này.

Ví dụ: tôi từng có nhiệm vụ viết một dịch vụ nào đó, theo yêu cầu, sẽ trả lại dữ liệu cho biểu mẫu xml, I E. một kiểu phát triển của phần máy chủ của ứng dụng và tôi không biết ứng dụng khách nào sẽ xử lý dữ liệu này được viết bằng gì và tôi đã viết một dịch vụ trả về dữ liệu ở dạng xml và thế là xong, ứng dụng đã hoạt động hoàn hảo . Và đây chỉ là một ví dụ mà tôi phải giải quyết, nhưng bây giờ hãy tưởng tượng có bao nhiêu tổ chức khác nhau cộng tác và tận tâm phát triển phần mềm cũng như trao đổi dữ liệu, và tôi sẽ không ngạc nhiên khi dữ liệu này sẽ ở dạng xml.

Ví dụ: tôi đã từng có nhiệm vụ viết một dịch vụ nhất định sẽ trả về dữ liệu ở dạng xml theo yêu cầu, tức là. một kiểu phát triển của phần máy chủ của ứng dụng và tôi không biết ứng dụng khách nào sẽ xử lý dữ liệu này được viết bằng gì và tôi đã viết một dịch vụ trả về dữ liệu ở dạng xml và thế là xong, ứng dụng đã hoạt động hoàn hảo . Và đây chỉ là một ví dụ mà tôi phải giải quyết, nhưng bây giờ hãy tưởng tượng có bao nhiêu tổ chức khác nhau cộng tác và tận tâm phát triển phần mềm cũng như trao đổi dữ liệu, và tôi sẽ không ngạc nhiên khi dữ liệu này sẽ ở dạng xml.

Ngoài ra, tôi đã từng phải lưu trữ dữ liệu xml trong cơ sở dữ liệu MS SQL 2008 để thể hiện dữ liệu này tốt hơn và trao đổi nó giữa phần máy chủ và phần máy khách của ứng dụng, chúng ta đã thảo luận vấn đề này trong bài viết - Transact-sql - doing with xml .

Bản thân ngôn ngữ XML rất đơn giản và không thể bị nhầm lẫn trong đó; tất cả sự phức tạp đều nảy sinh chính xác trong quá trình xử lý và tương tác của XML với các ứng dụng, công nghệ khác, tức là. mọi thứ xung quanh xml, đó là nơi bạn có thể dễ dàng bị nhầm lẫn.

Hôm nay chúng ta chỉ nói về Khái niệm cơ bản về XML, và chúng tôi sẽ không tập trung vào các công nghệ xử lý và tương tác với ngôn ngữ này, vì đây là tài liệu đúng, rất đồ sộ, nhưng tôi nghĩ trong tương lai chúng ta sẽ tiếp tục làm quen với các công nghệ liên quan.

Hãy chuyển sang thực hành. Và tôi sẽ viết tất cả các ví dụ mà chúng tôi sẽ xem xét trong Notepad++ chỉ vì nó rất tiện lợi, nhưng chúng tôi sẽ không nói về vấn đề này ngay bây giờ vì chúng tôi đã thảo luận về vấn đề này trong bài viết - Tại sao Notepad++ lại tốt cho người mới phát triển.

Thẻ XML

Ngôn ngữ XML sử dụng các thẻ ( thẻ có phân biệt chữ hoa chữ thường), nhưng không phải các thẻ giống như trong html mà là những thẻ bạn tự nghĩ ra, nhưng tài liệu xml cũng có cấu trúc rõ ràng, I E. có thẻ mở và thẻ đóng, có thẻ lồng nhau và tất nhiên có các giá trị nằm trong các thẻ này. Nói cách khác, mọi thứ bạn cần cho kiến thức cơ bản xml chỉ là tuân theo các quy tắc này. Cùng với nhau, thẻ mở, thẻ đóng và giá trị được gọi là một phần tử và toàn bộ tài liệu xml bao gồm chính xác các phần tử cùng nhau tạo thành cấu trúc dữ liệu. Một tài liệu xml chỉ có thể có một phần tử gốc, hãy nhớ điều này, vì nếu bạn viết hai phần tử gốc thì sẽ bị lỗi.

Và đã đến lúc đưa ra một ví dụ về đánh dấu xml và ví dụ đầu tiên bây giờ là về cú pháp:

<Начало элемента> <Начало вложенного элемента>Giá trị phần tử lồng nhau

Như bạn có thể thấy, mọi thứ khá đơn giản và có thể có rất nhiều phần tử như vậy được lồng vào nhau.

Bây giờ hãy đưa ra một ví dụ về một tài liệu xml thực:

Như các bạn thấy ở đây tôi chỉ đưa ra ví dụ về một loại catalog sách chứ tôi không khai báo tài liệu này, tức là. Tôi đã không viết một khai báo XML để thông báo cho ứng dụng sẽ xử lý dữ liệu này rằng dữ liệu XML được đặt ở đây và nó được mã hóa ở dạng nào. Bạn cũng có thể viết nhận xét và thuộc tính, vì vậy hãy đưa ra một ví dụ về tài liệu như vậy:

Cuốn sách 1 Ivan Chỉ cần cuốn 1 Quyển 2 Serge Chỉ cần cuốn 2 Quyển 3 Cuốn tiểu thuyết Chỉ cần cuốn 3

Trong đó dòng đầu tiên là tuyên bố rằng đây là tài liệu XML và phải được đọc ở dạng mã hóa UTF-8.

Nếu không được xử lý, dữ liệu này sẽ trông giống như trong trình duyệt ( Mozilla Firefox) theo cách sau:

Tôi hy vọng bạn hiểu rằng danh mục ở đây là phần tử gốc, bao gồm các phần tử sách, lần lượt bao gồm các phần tử tên, tác giả và nhận xét, và để làm ví dụ, tôi cũng đặt một số thuộc tính cho phần tử danh mục và phần tử sách .

Về những điều cơ bản, tôi nghĩ thế là đủ, vì nếu chúng ta ngày càng đi sâu hơn vào XML và tất cả các công nghệ liên quan đến ngôn ngữ này, thì bài viết này sẽ không bao giờ kết thúc. Vậy đó là tất cả cho ngày hôm nay. Tạm biệt!

Giới thiệu về đánh dấu thích hợp

XML có nghĩa Ngôn ngữ đánh dấu mở rộng với sự nhấn mạnh vào đánh dấu(đánh dấu). Bạn có thể tạo văn bản và đánh dấu nó bằng các thẻ đóng khung, biến từng từ, câu hoặc đoạn thành thông tin có thể nhận dạng và sắp xếp được. Các tệp bạn tạo hoặc bản sao của tài liệu, bao gồm các phần tử (thẻ) và văn bản, đồng thời các phần tử giúp hiểu chính xác tài liệu khi đọc trên giấy hoặc thậm chí xử lý nó trong ở dạng điện tử. Càng có nhiều yếu tố mô tả thì càng có nhiều phần của tài liệu có thể được xác định. Kể từ những ngày đầu của việc tăng giá, một trong những lợi thế của nó là nếu bị mất hệ thống máy tính in dữ liệu vẫn có thể đọc được nhờ thẻ.

Ngôn ngữ đánh dấu đã phát triển từ các hình thức đầu tiên được tạo bởi các công ty và cơ quan chính phủ sang Ngôn ngữ đánh dấu tổng quát tiêu chuẩn (SGML), Ngôn ngữ siêu văn bảnđánh dấu (Ngôn ngữ đánh dấu siêu văn bản - HTML) và cuối cùng là XML. SGML có vẻ phức tạp và HTML (về cơ bản ban đầu chỉ là một tập hợp các phần tử) đã được chứng minh là không đủ mạnh để xác định thông tin. XML được thiết kế để trở thành một ngôn ngữ đánh dấu dễ sử dụng và dễ mở rộng.

Trong XML bạn có thể tạo của riêng mình yếu tố riêng, cho phép bạn thể hiện chính xác các phần dữ liệu. Tài liệu không chỉ có thể được chia thành các đoạn văn và tiêu đề mà còn có thể đánh dấu bất kỳ đoạn nào trong tài liệu. Để việc này có hiệu quả, bạn cần xác định danh sách cuối cùng các thành phần của mình và tuân theo nó. Các phần tử có thể được xác định trong Định nghĩa loại tài liệu (DTD) hoặc trong lược đồ, như được thảo luận ngắn gọn bên dưới. Khi bạn đã thành thạo và bắt đầu sử dụng XML, đừng ngại thử nghiệm các tên thành phần khi bạn tạo các tệp thực tế.

Xây dựng một tài liệu XML

Như đã đề cập, tệp XML bao gồm văn bản và đánh dấu. Hầu hết văn bản được đặt trong các phần tử trong đó văn bản được bao quanh bởi các thẻ. Ví dụ: giả sử bạn muốn tạo một cuốn sách nấu ăn bằng định dạng XML. Chúng tôi có một công thức gọi là Kem Sundae, cần được chuyển đổi sang XML. Để đánh dấu tên của công thức, chúng tôi đặt văn bản của nó trong một phần tử bắt đầu và kết thúc bằng thẻ. Phần tử này có thể được gọi là tên công thức. Để đánh dấu thẻ bắt đầu của một phần tử, hãy đặt tên của nó trong dấu ngoặc nhọn<>), như thế này: . Sau đó nhập dòng chữ Ice Cream Sundae. Sau văn bản, chúng ta đặt thẻ kết thúc, là tên phần tử trong dấu ngoặc nhọn, cộng với dấu gạch chéo phần tử (/) trước tên phần tử, như sau:. Các thẻ này hình thành yếu tố, vào đó bạn có thể nhập văn bản và thậm chí các phần tử khác.

Tên phần tử có thể được tạo cho tài liệu cá nhân và cho các nhóm tài liệu. Theo yêu cầu của bạn, bạn có thể chỉ định các quy tắc phải tuân theo cho các thành phần. Các yếu tố có thể rất cụ thể hoặc khá chung chung. Các quy tắc cũng phải xác định những gì được chấp nhận để đưa vào mỗi thành phần. Chúng có thể nghiêm ngặt, lỏng lẻo hoặc ở giữa. Chỉ cần tạo các phần tử xác định các phần trong tài liệu mà bạn cho là quan trọng.

Bắt đầu tạo tệp XML

Dòng đầu tiên tài liệu XML có thể là một khai báo XML. Phần tùy chọn này của tệp xác định nó là tệp XML, điều này có thể giúp công cụ tự động và yêu cầu mọi người nhận ra tệp là XML chứ không phải SGML hoặc đánh dấu khác.

Tuyên bố có thể trông giống như hoặc bao gồm Phiên bản XML () và thậm chí cả mã hóa ký tự, ví dụ:cho Unicode. Vì phần khai báo này phải nằm ở phần đầu của tệp nên nếu bạn dự định kết hợp các tệp XML nhỏ thành một tệp lớn hơn thì tốt nhất nên bỏ qua phần tử tùy chọn này.

Tạo phần tử gốc

Thẻ bắt đầu và kết thúc phần tử gốc bao quanh toàn bộ văn bản của tài liệu XML. Chỉ nên có một phần tử gốc trong tệp và đây là "phần bìa" bắt buộc cho phần tử đó. hiển thị một đoạn ví dụ tôi đang sử dụng ở đây, với phần tử gốc (công thức). ( Tập tin đầy đủ XML được đưa ra dưới dạng .)

Liệt kê 1. Phần tử gốc

Khi bạn tạo tài liệu, bạn sẽ đặt văn bản và các thẻ bổ sung giữa .

Tên các phần tử

Phân biệt chữ hoa chữ thường trong thẻ

Tại tạo XML Các thanh ghi của thẻ bắt đầu và kết thúc phải khớp nhau. Nếu không, bạn có thể nhận được thông báo lỗi khi sử dụng hoặc trình xem XML. Ví dụ: Internet Explorer không hiển thị văn bản nếu có trường hợp không khớp. Thay vào đó, nó hiển thị thông báo về sự không khớp giữa thẻ bắt đầu và thẻ kết thúc.

Vậy là chúng ta có phần tử gốc . Trong XML, tên phần tử được chọn trước tiên và sau đó mô tả hoặc lược đồ DTD tương ứng được xác định dựa trên các tên đó. Tên có thể chứa chữ cái, số và dấu hiệu đặc biệt, chẳng hạn như dấu gạch dưới (_). Dưới đây là một số quy tắc về tên cần nhớ:

  • Không được phép có dấu cách trong tên thành phần.
  • Tên phải bắt đầu bằng một chữ cái, không phải số hoặc ký hiệu. (Sau chữ cái đầu tiên này, bạn có thể sử dụng bất kỳ tổ hợp chữ cái, số và ký hiệu hợp lệ nào.)
  • Trường hợp không quan trọng, nhưng hãy chắc chắn làm theo nó để tránh nhầm lẫn.
Liệt kê 2. Các phần tử khác
Kem Sundae 5 phút

Một tài liệu XML có thể chứa các thẻ trống, không có gì bên trong và có thể được biểu thị dưới dạng một thẻ thay vì một cặp thẻ bắt đầu và kết thúc. Ví dụ: đây có thể là một thẻ độc lập trong kiểu HTML . Nó không chứa bất kỳ phần tử con hoặc văn bản, vì vậy nó là phần tử trống và có thể được viết dưới dạng (có dấu cách và dấu gạch chéo quen thuộc ở cuối).

Các phần tử lồng nhau

Tệp đính kèm là vị trí của các phần tử bên trong các phần tử khác. Những phần tử mới này được gọi là công ty con các phần tử và các phần tử bao quanh chúng là cha mẹ các phần tử. Trong phần tử gốc một số phần tử được lồng nhau. Đây là những đứa trẻ lồng nhau , Bên trong một phần tử có một số phần tử con giống hệt nhau . Việc lồng nhau có thể tạo ra một tài liệu XML có nhiều cấp độ.

Đặc trưng lỗi cú pháp liên quan đến việc lồng các phần tử cha và con. Mỗi phần tử con phải được đặt hoàn toàn giữa thẻ mở và thẻ đóng của nó. phần tử cha. Các phần tử con phải kết thúc trước khi phần tử con tiếp theo bắt đầu.

Một ví dụ về phần đính kèm chính xác được đưa ra trong. Thẻ bắt đầu và kết thúc mà không có dệt với các thẻ khác.

Liệt kê 3. Việc lồng các phần tử XML đúng cách.
Kem Sundae 3 xi-rô sô-cô-la hoặc sô-cô-la kẹo mềm 1 quả hạch 1 quả anh đào 5 phút

Thêm thuộc tính

Các phần tử đôi khi được thêm vào Thuộc tính. Các thuộc tính bao gồm một cặp tên-giá trị, trong đó giá trị được lấy từ dấu ngoặc kép("), như thế này: type="dessert" . Thuộc tính cho phép bạn lưu cùng với phần tử Tùy chọn bổ sung, thay đổi giá trị của các tham số này từ phần tử này sang phần tử khác trong cùng một tài liệu.

Một thuộc tính—hoặc thậm chí nhiều thuộc tính—được chỉ định trong thẻ bắt đầu của phần tử: . Khi thêm nhiều thuộc tính, chúng được phân tách bằng dấu cách: . hiển thị tệp XML như hiện tại.

Liệt kê 4. Tệp XML của chúng tôi với các phần tử và thuộc tính
Kem Sundae 5 phút

Bất kỳ số lượng thuộc tính có thể được sử dụng. Xem xét những chi tiết bạn có thể thêm vào tài liệu của mình. Các thuộc tính đặc biệt hữu ích nếu tài liệu được lưu trữ - ví dụ: theo loại công thức nấu ăn. Tên thuộc tính có thể chứa các ký tự giống như tên thành phần, với cùng quy tắc loại trừ khoảng trắng và bắt đầu tên bằng một chữ cái.

XML được xây dựng đúng và sai

Nếu bạn tuân theo các quy tắc được xác định trong khung của mình, bạn có thể dễ dàng tạo mã XML đúng định dạng. XML đúng là mã XML được biên dịch tuân thủ tất cả các quy tắc XML: đặt tên chính xác cho các phần tử, lồng nhau, đặt tên thuộc tính, v.v.

Tùy thuộc vào chính xác những gì bạn làm với XML, bạn có thể cần phải làm việc với XML có định dạng phù hợp. Hãy xem xét ví dụ trên về việc sắp xếp theo loại công thức. Điều cần thiết là các yếu tố chứa thuộc tính loại. Điều rất quan trọng là có thể kiểm tra thành công mã và đảm bảo rằng giá trị của thuộc tính này luôn tồn tại.

Đang được xác minh (xác nhận)đề cập đến việc kiểm tra cấu trúc tài liệu xem có tuân thủ các quy tắc được thiết lập cho nó và định nghĩa các phần tử con cho từng phần tử cha hay không. Các quy tắc này được xác định trong Mô tả loại tài liệu(DTD) hoặc trong sơ đồ. Kiểu xác thực này yêu cầu bạn tạo một DTD hoặc lược đồ, sau đó tham chiếu tệp DTD hoặc lược đồ trong các tệp XML của bạn.

Để kích hoạt tính năng xác thực, bạn cần đặt phần khai báo loại tài liệu (DOCTYPE) ở gần đầu tài liệu XML của mình. Dòng này chứa liên kết đến DTD hoặc lược đồ (danh sách các thành phần và quy tắc) sẽ được sử dụng để xác minh của tài liệu này. Chuỗi DOCTYPE có thể giống như chuỗi trong .

Liệt kê 5. DOCTYPE

Ví dụ này có nghĩa là tệp danh sách mặt hàng của bạn có tên tên tập tin.dtd nằm trên máy tính của bạn (nghĩa là trong thư mục HỆ THỐNG, không phải trong thư mục CÔNG KHAI).

Sử dụng thực thể

Thực thể có thể là đoạn văn bản hoặc ký tự đặc biệt. Chúng có thể được chỉ định bên trong tài liệu hoặc bên ngoài nó. Để tránh lỗi và hiển thị chính xác, các thực thể phải được khai báo và thể hiện đúng.

Bạn không thể nhập trực tiếp các ký tự đặc biệt vào văn bản. Dùng trong văn bản ký tự đặc biệt chúng cần được tạo thành các thực thể và phải sử dụng mã của các ký tự này. Bạn có thể xác định các cụm từ, chẳng hạn như tên công ty, dưới dạng thực thể, sau đó sử dụng chúng trong toàn bộ văn bản của mình. Để tạo một thực thể, hãy đặt tên cho nó rồi chèn tên đó rồi chèn tên đó vào văn bản sau ký hiệu (&) và kết thúc bằng dấu chấm phẩy—ví dụ: (hoặc tên khác). Sau đó đặt mã này vào dòng DOCTYPE của bạn trong dấu ngoặc vuông(), như trong . Mã này chỉ định văn bản được thay thế cho thực thể.

Liệt kê 6. Thực thể

Việc sử dụng các thực thể giúp tránh lặp đi lặp lại cùng một cụm từ hoặc thông tin. Nó cũng có thể giúp việc chỉnh sửa văn bản dễ dàng hơn (ví dụ: nếu một công ty thay đổi tên) ở nhiều nơi cùng một lúc bằng cách thiết lập chuỗi định nghĩa thực thể.

Làm thế nào để tránh những sai lầm

Trong khi bạn đang học cách tạo các tệp XML, hãy mở chúng ở Trình soạn thảo XMLđể xác minh tính đúng đắn về mặt hình thức của chúng và đảm bảo rằng các quy tắc XML được tuân thủ. Ví dụ: nếu bạn có Windows® Internet Explorer®, bạn chỉ cần mở tệp XML của mình trong trình duyệt. Nếu các thành phần, thuộc tính và văn bản của bạn được hiển thị thì tệp XML được soạn thảo chính xác. Nếu có lỗi, có thể bạn đã nhầm lẫn điều gì đó trong cú pháp và bạn cần kiểm tra cẩn thận tài liệu của mình xem có lỗi chính tả hoặc thiếu thẻ và dấu câu hay không.

Phần kết luận

Đã học được một số quy tắc đơn giản, bạn có thể linh hoạt phát triển các phần tử XML của riêng mình và các thuộc tính của chúng. Các quy tắc XML không phức tạp. Việc gõ một tài liệu XML cũng dễ dàng. Điều quan trọng là phải hiểu những gì bạn muốn từ tài liệu của mình về khả năng sắp xếp và tìm kiếm, sau đó thiết kế các thành phần và thuộc tính để đáp ứng các yêu cầu đó.

Khi đã hiểu rõ mục đích và biết cách đánh dấu văn bản của mình, bạn có thể tạo yếu tố hiệu quả và các thuộc tính. Từ quan điểm này, đánh dấu cẩn thận là tất cả những gì cần thiết để tạo ra một tài liệu XML đúng định dạng và có thể sử dụng được.

XML được tạo ra để mô tả dữ liệu nhằm chú ý đến những gì dữ liệu thể hiện.

HTML được tạo ra để hiển thị dữ liệu nhằm hướng tới dữ liệu được hiển thị trông như thế nào.

XML là gì?

  • XML là viết tắt của Ngôn ngữ đánh dấu mở rộng
  • XML là ngôn ngữ đánh dấu, tương tự như HTML
  • XML được tạo ra cho mô tả dữ liệu
  • Thẻ XML không được xác định trước. Bạn có thể sử dụng thẻ của bạn
  • Sử dụng XML Định nghĩa loại tài liệu (DTD) hoặc Lược đồ XML(Lược đồ XML)để mô tả dữ liệu
  • XML được W3C khuyến nghị

Sự khác biệt chính giữa XML và HTML

XML được thiết kế để truyền dữ liệu.

XML không phải là sự thay thế cho HTML.

XML và HTML được phát triển cho các mục đích khác nhau:

  • XML được tạo ra để mô tả dữ liệu và tập trung vào dữ liệu nào đang được truyền
  • HTML được thiết kế để hiển thị dữ liệu với trọng tâm là hiển thị dữ liệu
  • Như vậy, HTML thêmđược liên kết với việc hiển thị thông tin, trong khi XML được liên kết với việc mô tả thông tin.

XML không làm gì cả

XML không được thiết kế để làm bất cứ điều gì.

Có thể không dễ hiểu nhưng XML không làm được gì cả. Ngôn ngữ đánh dấu này được tạo ra để cấu trúc, lưu trữ và truyền đạt thông tin. Ví dụ sau đây là ghi chú của Anton Ire, được trình bày bằng XML:

Ira

Anton

Lời nhắc nhở

Đừng quên buổi họp tuần này nhé!

Như bạn có thể thấy, XML rất ngắn gọn.

Một lưu ý ( ) bao gồm một tiêu đề ( ) và nội dung ( ) bức thư. Nó cho biết người gửi (thẻ - “bức thư từ ai”) và người nhận (thẻ - "cho ai"). Nhưng lá thư này chẳng có tác dụng gì. Đây là thông tin thuần túy được gói trong các thẻ. Để gửi, nhận và hiển thị thông tin này, ai đó phải viết một chương trình.

XML là ngôn ngữ đánh dấu có thể mở rộng miễn phí

Thẻ XML không được xác định trước. Bạn có thể nhập thẻ của riêng bạn.

Thẻ và cấu trúc tài liệu trong HTML được xác định trước. Người tạo tài liệu HTML chỉ có thể sử dụng các thẻ được xác định theo tiêu chuẩn.

XML cho phép bạn nhập các thẻ và cấu trúc tài liệu của mình cho tác giả của tài liệu xml. Các thẻ được hiển thị trong ví dụ (ví dụ: ) không được xác định theo tiêu chuẩn XML. Các thẻ này được nhập bởi tác giả của tài liệu.

XML là phần bổ sung cho HTML

XML không phải là sự thay thế cho HTML.

Điều quan trọng là phải hiểu rằng XML không phải là sự thay thế cho HTML. Trong tương lai, các nhà phát triển web sẽ sử dụng XML để mô tả dữ liệu, trong khi HTML sẽ được sử dụng để định dạng và hiển thị dữ liệu đó.

Của tôi độ nét tốt nhất XML là: XML là nền tảng chéo, phần mềm và phần cứng công cụ truyền tải thông tin.

Lưu ý:Đa nền tảng - phù hợp với mọi hệ điều hành và mọi phần cứng.

Nếu bạn biết có sự khác biệt hệ điều hành, ngoại trừ Windows quen thuộc. Đây là hệ điều hành Linux, Mac và các hệ điều hành khác.

Về phần cứng, có thể nói như sau: có thể là PC, laptop thông thường, máy tính bỏ túi vân vân.

XML trong tương lai của phát triển web

XML sẽ được sử dụng ở mọi nơi.

Chúng tôi đã chứng kiến ​​sự phát triển của XML kể từ khi nó ra đời. Thật ngạc nhiên khi thấy tiêu chuẩn XML được phát triển nhanh chóng và nhanh chóng đến mức nào. một số lượng lớn các nhà cung cấp phần mềmđã chấp nhận tiêu chuẩn này. Chúng tôi tin chắc rằng XML sẽ là một phần quan trọng của Internet trong tương lai giống như HTML, nền tảng của Internet và XML sẽ là công cụ phổ biến nhất cho mọi thao tác và truyền thông dữ liệu.