6.1 TRƯỜNG HỢP SỬ DỤNGĐể khuyến khích các cuộc thảo luận, nó là giá trị nhìn vào bốn điển hình dữ liệu lớn analytics sử dụng trường hợp được lựa chọn trong số các đặc tính hiện thực thảo luận trong chương 2:1. được nhắm mục tiêu khách hàng tiếp thị, trong đó khách hàng cấu hình được phân tích cho các mục đích xây dựng tùy chỉnh các chiến dịch tiếp thị để ảnh hưởng đến khách hàng mua hành vi.2. xã hội truyền thông analytics ứng dụng quét qua suối ofsocial kênh truyền thông tìm kiếm tình cảm tích cực hay tiêu cực được tương quan đến hành vi của một tập thể của cá nhân.3. gian lận phát hiện thuật toán phân tích các mô hình lịch sử của hoạt động tìm kiếm hành vi đáng ngờ được chỉ của gian lận hoặc lạm dụng, cũng như chức năng quét các giao dịch trong thời gian thực tìm kiếm hành vi bất thường đòi hỏi phải tiếp tục điều tra.4. trang Web giới thiệu động cơ đòn bẩy lớn bộ tiêu mẫu lịch sử giao dịch kết hợp với khách hàng cấu hình để xác định các đề xuất thêm khoản mục được trình bày cho khách hàng như tiện ích tiềm năng mua.6.1 bảng cung cấp một số cân nhắc để lưu trữ, thiết bị phần cứng, và quản lý dữ liệu liên quan đến trường hợp sử dụng6.1 bảng xem xét cho một số ví dụ về các ứng dụng lớn dữ liệuSử dụng AnalyticsQuản lý dữ liệu cân nhắc thiết bị lưu trữ trường hợp cân nhắcCân nhắcKhách hàng được nhắm mục tiêu cải thiện tiếp thị phải kết hợp các dữ liệu trực tiếp để phân tích với khách hàng cấu hình thông thườnglưu trữ trong một nhà kho dữ liệu. Thiết bị phần cứng có thể hỗ trợ dữ liệu truyền thống nhà kho mô hìnhcũng như phân tích môi trường có thể được ưa thích. Hồ sơ khách hàng có thể được quản lý bằng cách sử dụng một nhà kho dữ liệu tiêu chuẩn sử dụng chiều mô hình. Phân tích các thuật toán có thể đòi hỏi cấu trúc dữ liệu linh hoạt hơn chẳng hạn như bảng băm hoặc đồ thị.Xã hội truyền thông analytics tùy thuộc vào số lượng thông tin để được xem trực tiếp, có thể yêu cầu một dấu chân lưu trữ lớn với tốc độ cao I/O để xử lý khối lượng. Tuy nhiên, kể từ khi các dữ liệu dòng một cách nhanh chóng và giá trị instantiation có thể được thoáng qua, ứng dụng này có thể được khoan dung của thất bại. Hầu hết các cuộc thảo luận xung quanh việc sử dụng khả năng mở rộng cao hiệu suất động cơ phân tích tập trung vào phân tích phương tiện truyền thông xã hội, với Hadoop được bố trí trên các cấu hình phần cứng một lựa chọn phổ biến. Các ứng dụng này có một sự phụ thuộc cao vào thuật toán thực hiện, nhưng cũng có thể yêu cầu tổ chức khai thác và nhận dạng độ phân giải, Hải mộtsự kết hợp củadữ liệu truyền thốngquản lý và nền tảng NoSQL.Phát hiện gian lận tùy thuộc vào các ứng dụng đó sẽ là cần thiết cho việc chụp và quản lý một lượng lớn dữ liệu qua thời gian dài. Phụ thuộc vào kích thước của các phân tích. Môi trường lớn hơn sẽ đòi hỏi khả năng mở rộng và đàn hồi nền tảng tính toán. Phát hiện gian lận kết hợp các phân tích liên tục trong tìm kiếm của mô hình có thể được liên quan đếncá nhân hoặc cohorts mà có thể hoặc là được biết hoặc không biết. Điều này cho thấy một nhu cầu cho một loạt các mô hình phân tích khác nhau có thể được tích hợp với mô hình dữ liệu quan hệ truyền thống.Trang web khuyến nghị động cơ cho các ứng dụng thương mại điện tử lớn, số lượng dữ liệu là tỷ lệ thuận với số lượng khách truy cập và mức trung bìnhsố lượng trang web sự kiện mỗilượt truy cập, có khả năng kết quả là số tiền lớn của dữ liệu đòi hỏi phải có một dấu chân lớn, khả năng mở rộng lưu trữ. Như với xã hộiphương tiện truyền thông analytics, có thể có một số khả năng chịu thất bại. Xác định phần cứng so với phần mềm thiết bị gia dụng liên quan đến sự mong đợi hiệu suất. Sự cần thiết cho thời gian thực hoặc tính toán ngay lập tức và phản ứng có thể chỉ ra sự cần thiết cho hệ thống phần cứng chuyên dụng. Như với các ứng dụng lớn dữ liệu khác, điều này sẽ cần phải kết hợp các thông tin tĩnh cấu hình với tính toán năng động liên kết với các hoạt động thời gian thực, đòi hỏi một sự kết hợp củakho dữ liệu truyền thống và chiết trung hơn các mô hình có thể được triển khai bằng cách sử dụngNoSQL phong cách khung.
đang được dịch, vui lòng đợi..
