12.1 có cấu trúc, Semistructured, và không có cấu trúc dữ liệu.
Các thông tin được lưu trữ trong cơ sở dữ liệu được gọi là dữ liệu có cấu trúc bởi vì nó được đại diện trong một định dạng nghiêm ngặt. Ví dụ, mỗi bản ghi trong một bảng cơ sở dữ liệu quan hệ - chẳng hạn như mỗi của các bảng trong cơ sở dữ liệu CÔNG TY trong hình 3.6 - theo định dạng tương tự như các hồ sơ khác trong bảng đó. Đối với dữ liệu có cấu trúc, nó được phổ biến để thiết kế một cách cẩn thận các lược đồ cơ sở dữ liệu sử dụng các kỹ thuật như những mô tả trong Chương 7 và 8 để xác định cấu trúc cơ sở dữ liệu. DBMS sau đó kiểm tra để đảm bảo rằng tất cả các dữ liệu theo cấu trúc và các ràng buộc được quy định trong lược đồ.
Tuy nhiên, không phải tất cả các dữ liệu được thu thập và đưa vào cơ sở dữ liệu có cấu trúc được thiết kế một cách cẩn thận. Trong một số ứng dụng, dữ liệu được thu thập một cách đặc biệt trước khi nó được biết làm thế nào nó sẽ được lưu trữ và quản lý. Những thông tin này có thể có một cấu trúc nào đó, nhưng không phải tất cả các thông tin thu thập được sẽ có cấu trúc giống hệt nhau. Một số thuộc tính có thể được chia sẻ giữa các thực thể khác nhau, nhưng các thuộc tính khác có thể chỉ tồn tại trong một vài thực thể. Hơn nữa, thuộc tính bổ sung có thể được giới thiệu trong một số mục dữ liệu mới hơn bất cứ lúc nào, và không có giản đồ được xác định trước. Đây là loại dữ liệu được gọi là dữ liệu semistructured. Một số mô hình dữ liệu đã được giới thiệu để đại diện cho dữ liệu semistructured, thường dựa vào việc sử dụng các cấu trúc cây hoặc đồ thị dữ liệu hơn là các cấu trúc mô hình quan hệ phẳng.
Một sự khác biệt quan trọng giữa cấu trúc và semistructured mối quan tâm dữ liệu như thế nào cấu trúc giản đồ (chẳng hạn như tên của thuộc tính , các loại mối quan hệ, và thực thể) được xử lý. Trong dữ liệu semistructured, thông tin giản đồ được trộn lẫn với các giá trị dữ liệu, vì mỗi đối tượng dữ liệu có thể có các thuộc tính khác nhau mà không được biết trước. Do đó, loại dữ liệu này đôi khi được gọi là dữ liệu tự miêu tả. Hãy xem xét ví dụ sau. Chúng tôi muốn thu thập một danh sách các tài liệu tham khảo liên quan đến một dự án nghiên cứu nhất định. Một số có thể là cuốn sách hay báo cáo kỹ thuật, những người khác có thể bài báo nghiên cứu trên các tạp chí hoặc kỷ yếu hội nghị, và vẫn còn những người khác có thể tham khảo để hoàn thành quyển tạp chí hoặc kỷ yếu hội nghị. Rõ ràng, mỗi số này có thể có các thuộc tính khác nhau và các loại thông tin khác nhau. Ngay cả đối với cùng một loại tài liệu tham khảo nói, bài viết, chúng tôi hội nghị có thể có những thông tin khác nhau. Ví dụ, một bài viết trích dẫn có thể khá hoàn chỉnh, với đầy đủ thông tin về tên tác giả, tiêu đề, thủ tục tố tụng, số trang, và như vậy, trong khi trích dẫn khác có thể không có tất cả các thông tin có sẵn. Loại mới của các nguồn thư tịch có thể xuất hiện trong các ví dụ tương lai-cho, tài liệu tham khảo cho các trang web hoặc để nghị hướng dẫn và chúng có thể có các thuộc tính mới mà mô tả chúng.
đang được dịch, vui lòng đợi..