Hồ sơ y tế điện tử có thể là thách thức cho các môi trường kho dữ liệu, do tính biến cực đoan của họ và khối lượng có khả năng khắc nghiệt. Bệnh nhân '
hồ sơ bệnh dữ liệu đi kèm trong nhiều hình thức khác nhau, từ các dữ liệu số để
bình luận chữ tự nhập vào bởi một chuyên nghiệp để hình ảnh và hình ảnh y tế. Chúng tôi sẽ tiếp tục thảo luận các dữ liệu phi cấu trúc trong Chương 21: Big Data Analytics;
hồ sơ y tế và / hoặc sức khỏe điện tử có thể trở thành một trường hợp sử dụng cổ điển dành cho dữ liệu lớn.
Một điều chắc chắn. Số lượng và biến đổi dữ liệu điện tử trong y tế
ngành công nghiệp sẽ tiếp tục tăng trưởng.
Đo Loại Dimension cho Facts thưa
Như nhà thiết kế, nó là hấp dẫn để phấn đấu cho một khung tiêu chuẩn hóa có thể
được mở rộng để xử lý biến đổi dữ liệu. Ví dụ, bạn có thể có khả năng xử lý các
thay đổi của kết quả thử nghiệm trong phòng thí nghiệm với một loại số đo chiều mô tả những gì
hàng thực tế có nghĩa là, hay nói cách khác, những gì thực tế chung hiện. Các đơn vị
đo cho một mục số nhất định được tìm thấy trong các loại số đo liên quan
chiều kích liên tiếp, cùng với bất kỳ hạn chế additivity, như thể hiện trong hình 14-6.
Lab thử nghiệm đo lường Loại Kích thước
Lab thử nghiệm đo lường Loại khóa (PK)
Lab thử nghiệm đo lường Loại Mô tả
Lab thử nghiệm đo lường Loại Đơn vị Đo
thứ tự ngày Key (FK)
Kiểm tra ngày Key (FK)
Key Patient (FK)
thầy thuốc Key (FK)
Lab thử nghiệm Key (FK)
Lab thử nghiệm đo lường Loại khóa (FK)
Quan sát kết quả test Giá trị
Lab thử nghiệm Kết quả Sự kiện
Hình 14-6: quan sát thử nghiệm Lab với loại số đo kích thước.
Cách tiếp cận này là tuyệt vời linh hoạt; bạn có thể thêm các loại đo lường mới chỉ đơn giản bằng
cách thêm các hàng mới trong các loại số đo kích thước, không phải bằng cách làm thay đổi cấu trúc
của bảng thực tế. Cách tiếp cận này cũng giúp loại bỏ các null trong các vị trí thực tế cổ điển
thiết kế bảng vì một hàng tồn tại chỉ khi đo tồn tại. Tuy nhiên, có
thương mại-off. Sử dụng một chiều loại số đo có thể tạo ra rất nhiều mới thực tế
hàng bảng vì các hạt là "một hàng cho mỗi phép đo cho mỗi sự kiện" chứ không phải là
điển hình hơn "một hàng cho mỗi sự kiện." Nếu một kết quả thử nghiệm trong phòng thí nghiệm trong 10 phép đo số,
hiện nay có 10 dòng trong bảng thực tế chứ không phải là một hàng duy nhất trong thiết kế cổ điển.
Với những tình huống cực kỳ thưa thớt, chẳng hạn như phòng thí nghiệm, thử nghiệm lâm sàng sản xuất
môi trường, đây là một thỏa hiệp hợp lý. Tuy nhiên, khi mật độ của các sự kiện
Chương 14 350
phát triển, bạn kết thúc phun ra quá nhiều hàng thực tế. Tại thời điểm này, bạn không còn phải
kiện thưa thớt và nên trở về thiết kế bảng thực tế cổ điển với các cột cố định.
Hơn nữa, đo lường loại phương pháp này có thể làm phức tạp thêm các ứng dụng truy cập dữ liệu BI. Trong lược đồ sao quan hệ, kết hợp hai số đó đã bị bắt giữ
như là một phần của một sự kiện duy nhất là khó khăn hơn với phương pháp này bởi vì bây giờ bạn phải
lấy hai hàng từ bảng thực tế. SQL thích để thực hiện chức năng số học trong
một hàng, không phải qua hàng. Ngoài ra, bạn phải cẩn thận không để trộn tương thích
số tiền trong một tính toán bởi vì tất cả các biện pháp số cư trú trong một số tiền duy nhất
cột. Nó đáng chú ý là khối OLAP đa chiều là hơn khoan dung của
biểu diễn các tính toán trên các kiểu đo lường.
Tiêu Freeform Bình luận
bình văn bản Freeform, chẳng hạn như ghi chú lâm sàng, đôi khi được kết hợp với thực tế
sự kiện bảng. Mặc dù ý kiến văn bản không phải là rất mạnh phân tích, trừ khi họ đang
phân tích thành chiều cũng cư xử thuộc tính, người dùng doanh nghiệp thường không muốn
chia tay với họ cho cốm nhúng thông tin.
comments nguyên bản không nên được lưu trữ trong một bảng thực tế trực tiếp vì họ lãng phí
không gian và hiếm khi tham gia vào câu truy vấn. Một số nhà thiết kế nghĩ rằng nó cho phép lưu trữ
các lĩnh vực văn bản trong bảng thực tế, miễn là họ đang gọi kích thước như thoái hóa.
kích thước thoái hóa thường được sử dụng nhất để kiểm soát giao dịch hoạt động
số và định danh; nó không phải là một phương pháp có thể chấp nhận hoặc mẫu cho tranh
với các lĩnh vực văn bản cồng kềnh. Lưu trữ comments freeform trong bảng thực tế cho biết thêm lộn xộn mà
có thể tác động tiêu cực đến hiệu suất của các truy vấn định lượng chi tiết điển hình của giới phân tích.
Các ý kiến văn bản không bị chặn hoặc cần được lưu giữ trong một bình luận riêng biệt
kích thước hoặc điều trị như các thuộc tính trong một chiều kiện giao dịch. Một vấn đề quan trọng khi đánh giá hai phương pháp này là cardinality của trường text. Nếu có
gần một bình luận duy nhất cho mỗi sự kiện bảng thực tế, lưu trữ các lĩnh vực văn bản trong một chiều hướng giao dịch làm cho ý nghĩa nhất. Tuy nhiên, trong nhiều trường hợp, No Comment được
kết hợp với rất nhiều hàng thực tế. Vì số lượng các ý kiến văn bản duy nhất trong
tình huống này là nhỏ hơn nhiều so với số lượng giao dịch duy nhất, nó sẽ làm cho
ý nghĩa hơn để lưu trữ các dữ liệu văn bản trong một chiều bình với một liên kết
khóa ngoại trong bảng thực tế. Trong cả hai trường hợp, các truy vấn liên quan đến cả những ý kiến văn bản
và số liệu thực tế sẽ thực hiện tương đối kém cho sự cần thiết phải giải quyết tham gia giữa
hai bảng đồ sộ. Thông thường người dùng doanh nghiệp muốn đi sâu vào ý kiến cho văn bản
tiếp tục điều tra sau khi các bộ lọc truy vấn bảng thực tế chọn lọc cao đã được áp dụng.
Hình ảnh
Đôi khi các dữ liệu bị bắt trong hồ sơ y tế điện tử của bệnh nhân là một hình ảnh,
thêm vào hoặc số lượng hoặc ghi chú định tính. Có đánh đổi
sức khỏe 351
giữa chiếm được một tên tập tin JPEG trong bảng thực tế để chỉ một hình ảnh gắn liền
so với việc nhúng các hình ảnh như là một blob trực tiếp trong cơ sở dữ liệu. Lợi thế của việc
sử dụng một tên tập tin JPEG là chương trình tạo hình ảnh, xem và chỉnh sửa khác
có thể tự do truy cập các hình ảnh. Nhược điểm là một cơ sở dữ liệu riêng biệt của đồ họa
tập tin phải được duy trì đồng bộ với bảng thực tế.
đang được dịch, vui lòng đợi..