Hình 1 cho thấy các bước chính của phương pháp tiếp cận của chúng tôi bằng cách sử dụng Hadoop. Bước đầu tiên là để thu thập Netflow hồ sơ (1) thông qua xuất khẩu từ router đến một nhà sưu tập. Sau đó, sự tương tác giữa máy chủ được phân tích để sản xuất đồ thị phụ thuộc (2). Biểu đồ này là đầu vào cho PageRank [18] ra máy chủ được kết nối tốt mình chẳng hạn như trong một mạng lưới P2P. Chúng tôi thử nghiệm đầu tiên cho thấy các nút cổ chai của cách tiếp cận của chúng tôi là thuật toán PageRank đã để iterate nhiều lần trước khi trưng bày kết quả ổn định. Do đó PageRank được thực thi trên Hadoop bởi phân phối các ma trận kề của đồ thị phụ thuộc trong số tất cả datanodes (3) trước khi thực hiện bản đồ và làm giảm công việc (4).
đang được dịch, vui lòng đợi..
