1. Giới thiệu
Có một số lượng lớn các "đăng nhập" dữ liệu được tạo ra ở bất kỳ khá lớn
công ty internet. Những thông tin này thường bao gồm (1) hoạt động người dùng
sự kiện tương ứng với thông tin đăng nhập, số lần xem trang, nhấp chuột, "thích",
chia sẻ, bình luận, và các truy vấn tìm kiếm; (2) số liệu hoạt động
như dịch vụ gọi stack, độ trễ cuộc gọi, lỗi, và số liệu hệ thống
như CPU, bộ nhớ, mạng, hoặc sử dụng đĩa trên mỗi
máy. Đăng nhập dữ liệu từ lâu đã là một thành phần của phân tích sử dụng để
theo dõi sự tham gia của người sử dụng, sử dụng hệ thống, và các số liệu khác.
Xu hướng Tuy nhiên gần đây trong các ứng dụng internet đã thực hiện hoạt động
dữ liệu là một phần của đường ống dữ liệu sản xuất sử dụng trực tiếp trong trang web
tính năng. Việc sử dụng bao gồm (1) tìm kiếm phù hợp, (2)
các khuyến nghị có thể được thúc đẩy bởi sự phổ biến mục hoặc cooccurrence
trong dòng hoạt động, (3) nhắm mục tiêu và báo cáo quảng cáo,
và (4) các ứng dụng an ninh bảo vệ chống lại các hành vi lạm dụng
như là spam hoặc nạo dữ liệu trái phép, và (5) newsfeed
tính năng mà tổng hợp cập nhật trạng thái của người dùng hoặc hành động cho họ
"bạn bè" hoặc "kết nối" để đọc.
sản xuất này, thời gian thực sử dụng các dữ liệu đăng nhập tạo mới
thách thức cho các hệ thống dữ liệu bởi vì khối lượng của nó là đơn đặt hàng của
cường độ lớn hơn so với các dữ liệu "thực". Ví dụ, tìm kiếm,
giới thiệu, quảng cáo và thường đòi hỏi máy tính
đang được dịch, vui lòng đợi..
