12.1 có cấu trúc, Semistructured, và không có cấu trúc dữ liệu
Các thông tin được lưu trữ trong cơ sở dữ liệu được gọi là dữ liệu có cấu trúc bởi vì nó được đại diện trong một định dạng nghiêm ngặt. Ví dụ, mỗi bản ghi trong một cơ sở dữ liệu quan hệ Bảng-
như mỗi bảng trong COMPANYdatabase trong hình 3.6 sau cùng
định dạng như các hồ sơ khác trong bảng đó. Đối với dữ liệu có cấu trúc, nó được phổ biến để thiết kế một cách cẩn thận các lược đồ cơ sở dữ liệu sử dụng các kỹ thuật như những mô tả trong
Chương 7 và 8 để xác định cấu trúc cơ sở dữ liệu. DBMS sau đó kiểm tra
để đảm bảo rằng tất cả các dữ liệu theo cấu trúc và các ràng buộc được quy định trong lược đồ.
Tuy nhiên, không phải tất cả các dữ liệu được thu thập và đưa vào cấu trúc được thiết kế cẩn thận
cơ sở dữ liệu. Trong một số ứng dụng, dữ liệu được thu thập một cách đặc biệt trước khi nó được
biết đến như thế nào nó sẽ được lưu trữ và quản lý. Những thông tin này có thể có một cấu trúc nào đó,
nhưng không phải tất cả các thông tin thu thập được sẽ có cấu trúc giống hệt nhau. Một số thuộc tính có thể được chia sẻ giữa các thực thể khác nhau, nhưng các thuộc tính khác có thể chỉ tồn tại trong
một vài thực thể. Hơn nữa, thuộc tính bổ sung có thể được giới thiệu trong một số các
mục dữ liệu mới hơn bất cứ lúc nào, và không có giản đồ được xác định trước. Đây là loại dữ liệu được
gọi là dữ liệu semistructured. Một số mô hình dữ liệu đã được giới thiệu để
đại diện cho dữ liệu semistructured, thường dựa vào việc sử dụng các cấu trúc cây hoặc đồ thị dữ liệu
chứ không phải là các cấu trúc mô hình quan hệ phẳng.
Một sự khác biệt quan trọng giữa cấu trúc và semistructured mối quan tâm dữ liệu như thế nào
cấu trúc giản đồ (chẳng hạn như tên của thuộc tính , các loại mối quan hệ, và thực thể)
được xử lý. Trong dữ liệu semistructured, thông tin giản đồ được trộn inwith các
giá trị dữ liệu, vì mỗi đối tượng dữ liệu có thể có các thuộc tính khác nhau mà không được biết đến ở
trước. Do đó, loại dữ liệu này đôi khi được gọi là dữ liệu tự miêu tả.
Hãy xem xét ví dụ sau. Chúng tôi muốn thu thập một danh sách các tài liệu tham khảo
đang được dịch, vui lòng đợi..
