4.1.4 các vấn đề trong dòng xử lý
trước khi tiến hành để thảo luận về thuật toán, cho chúng tôi xem xét những hạn chế mà chúng tôi làm việc khi giao dịch với dòng. Trước tiên, suối thường cung cấp các yếu tố rất nhanh chóng. Chúng ta phải xử lý các yếu tố trong thời gian thực, hoặc chúng tôi mất cơ hội để xử lý chúng ở tất cả, mà không cần truy cập vào các lưu trữ lưu trữ. Do đó, nó thường là quan trọng rằng các thuật toán dòng xử lý được thực hiện trong bộ nhớ chính, mà không cần truy cập để lưu trữ thứ cấp hoặc với chỉ hiếm truy cập để lưu trữ thứ cấp. Hơn nữa, ngay cả khi là "chậm," như trong ví dụ dữ liệu cảm biến của phần 4.1.2, có thể có nhiều dòng như vậy. Ngay cả khi mỗi dòng của chính nó có thể được xử lý bằng cách sử dụng một số lượng nhỏ của bộ nhớ chính, Các yêu cầu của tất cả các dòng suối với nhau có thể dễ dàng vượt quá số lượng bộ nhớ chính có sẵn. Vì vậy, nhiều vấn đề về luồng dữ liệu sẽ là dễ dàng để giải quyết nếu chúng tôi đã có đủ bộ nhớ, nhưng trở nên khá khó khăn và đòi hỏi sự phát minh ra kỹ thuật mới để thực hiện một tốc độ thực tế trên một máy kích thước thực tế. Dưới đây là hai chung chung về dòng thuật toán giá trị mang trong tâm trí khi bạn đọc qua chương này:
• thông thường, nó là nhiều hơn nữa efficient để có được một câu trả lời gần đúng cho vấn đề của chúng tôi hơn một giải pháp chính xác.
• như trong chương 3, một loạt các kỹ thuật liên quan đến băm, lần lượt ra được hữu ích. Nói chung, các kỹ thuật giới thiệu hữu ích ngẫu nhiên vào hành vi của thuật toán, để tạo ra một câu trả lời gần đúng là rất gần với kết quả thực sự.
đang được dịch, vui lòng đợi..
