4.1.2 Ví dụ về Suối Nguồn
Trước khi tiếp tục, chúng ta hãy xem xét một số cách thức mà dòng dữ liệu phát sinh một cách tự nhiên.
cảm biến dữ liệu
Hãy tưởng tượng một cảm biến nhiệt độ nhấp nhô về trong đại dương, gửi lại một trạm đọc của nhiệt độ bề mặt mỗi giờ . Các dữ liệu sản xuất của bộ cảm biến này là một dòng các số thực. Nó không phải là một dòng rất thú vị, vì tốc độ dữ liệu là rất thấp. Nó sẽ không nhấn mạnh công nghệ hiện đại, và toàn bộ dòng có thể được lưu giữ trong bộ nhớ chính, về cơ bản mãi mãi. Bây giờ, cung cấp cho các cảm biến một đơn vị GPS, và để cho nó báo cáo chiều cao bề mặt thay vì nhiệt độ. Chiều cao bề mặt thay đổi khá nhanh so với nhiệt độ trúc, vì vậy chúng tôi có thể có các bộ cảm biến gửi lại một đọc mỗi phần mười của một giây. Nếu nó sẽ gửi một số thực 4-byte mỗi lần, sau đó nó tạo ra 3,5 MB mỗi ngày. Nó vẫn sẽ mất một thời gian để điền vào bộ nhớ chính, hãy cho mình một đĩa đơn. Nhưng một bộ cảm biến có thể không phải là thú vị. Để tìm hiểu điều gì đó về hành vi đại dương, chúng ta có thể muốn triển khai một triệu bộ cảm biến, mỗi gửi lại một dòng, với tỷ lệ mười phần thứ hai. Một triệu bộ cảm biến không phải là rất nhiều, sẽ có một cho mỗi 150 dặm vuông của biển. Bây giờ chúng ta có 3,5 terabyte đến mỗi ngày, và chúng tôi chắc chắn cần phải suy nghĩ về những gì có thể được bảo quản trong kho làm việc và những gì chỉ có thể được lưu trữ.
dữ liệu ảnh
vệ tinh thường gửi xuống suối đất gồm nhiều terabyte hình ảnh mỗi ngày. Camera giám sát sản xuất hình ảnh với độ phân giải thấp hơn so với các vệ tinh, nhưng có thể có nhiều trong số họ, mỗi sản xuất một dòng của hình ảnh trong khoảng thời gian như một thứ hai. London được cho là có sáu triệu máy ảnh như vậy, mỗi sản xuất một dòng.
Internet và Web giao thông
Một chuyển đổi nút ở giữa của Internet nhận được một số gói IP từ nhiều yếu tố đầu vào và các tuyến đường họ kết quả đầu ra của nó. Thông thường, công việc của chuyển đổi là để truyền dữ liệu và không giữ lại nó hoặc truy vấn nó. Nhưng có một xu hướng để đưa khả năng nhiều hơn nữa vào việc chuyển đổi, ví dụ như khả năng phát hiện tấn công từ chối dịch vụ tấn công hoặc khả năng định tuyến lại các gói tin dựa trên thông tin về tắc nghẽn trong mạng. Các trang web nhận được dòng các loại. Ví dụ, Google nhận được SEV-Eral trăm triệu truy vấn tìm kiếm mỗi ngày. Yahoo! chấp nhận tỷ "nhấp chuột" mỗi ngày trên các trang web khác nhau của nó. Nhiều điều thú vị có thể được học từ những dòng suối. Ví dụ, sự gia tăng các truy vấn như "đau họng" cho phép chúng tôi theo dõi sự lây lan của virus. Sự gia tăng đột ngột trong tỷ lệ nhấp chuột cho một liên kết có thể chỉ ra một số tin tức kết nối với trang đó, hoặc nó có thể có nghĩa là các liên kết bị hỏng và cần phải được sửa chữa
đang được dịch, vui lòng đợi..
