Về mặt kỹ thuật, Splunk là một chuỗi thời gian indexer, nhưng để đơn giản hóa mọi thứ, chúng tôi sẽ chỉ nói rằng đó là một sản phẩm
chăm sóc của ba Vs rất tốt. Trong khi đó, hầu hết các sản phẩm mà chúng tôi mô tả ở trên có nguồn gốc trong
chế biến dấu vết con người tạo ra, Splunk bắt đầu như là một sản phẩm được thiết kế để xử lý dữ liệu máy tính.
Vì những khởi đầu khiêm tốn, Splunk không phải luôn luôn được coi là một cầu thủ trong dữ liệu lớn. Nhưng điều đó không ngăn cản
bạn từ việc sử dụng nó để phân tích dữ liệu lớn thuộc cấp dấu chân kỹ thuật số, bởi vì, như cuốn sách này cho thấy, Splunk
làm một công việc tuyệt vời của nó. Splunk có ba chức năng chính:
• Dữ liệu thu thập, trong đó có thể được thực hiện cho dữ liệu tĩnh hoặc bằng cách giám sát những thay đổi và bổ sung
cho các tập tin hoặc thư mục hoàn chỉnh trên cơ sở thời gian thực. Dữ liệu cũng có thể được thu thập từ mạng lưới
cảng hoặc trực tiếp từ các chương trình hoặc các kịch bản. Ngoài ra, Splunk có thể kết nối với các quan hệ
cơ sở dữ liệu để thu thập, chèn hoặc cập nhật dữ liệu.
www.it-ebooks.info
Chương 1 ■ Dữ liệu Big VÀ Splunk
6
• lập chỉ mục dữ liệu, trong đó các dữ liệu thu thập được chia nhỏ thành các sự kiện, tương đương với
cơ sở dữ liệu hồ sơ, hoặc chỉ đơn giản là dòng dữ liệu. Sau đó, các dữ liệu được xử lý và hiệu suất cao
chỉ số được cập nhật, mà chỉ vào dữ liệu được lưu trữ.
• Tìm kiếm và phân tích. Sử dụng xử lý ngôn ngữ Splunk, bạn có thể tìm kiếm dữ liệu
và vận dụng nó để có được những kết quả mong muốn, dù dưới hình thức các báo cáo hoặc thông báo. Các
kết quả có thể được trình bày như là sự kiện cá nhân, bảng, hoặc biểu đồ.
Mỗi một trong những chức năng có thể mở rộng một cách độc lập; Ví dụ, các thành phần thu thập dữ liệu có thể mở rộng
để xử lý hàng trăm ngàn máy chủ. Các chức năng xuất dữ liệu có thể mở rộng đến một số lượng lớn các máy chủ,
mà có thể được cấu hình như các đồng nghiệp phân phối, và, nếu cần thiết, với một tùy chọn sẵn sàng cao để xử lý minh bạch
khả năng chịu lỗi. Người đứng đầu tìm kiếm, như các máy chủ dành riêng cho các chức năng tìm kiếm và phân tích được biết đến, cũng có thể
mở rộng lên tới bao nhiêu là cần thiết. Ngoài ra, mỗi người trong số các tính năng này có thể được sắp xếp theo một cách mà họ có thể được
tối ưu hóa để chứa các vị trí địa lý, thời gian các khu, các trung tâm dữ liệu, hoặc các yêu cầu khác. Splunk là rất
linh hoạt về khả năng mở rộng mà bạn có thể bắt đầu với một trường hợp duy nhất của các sản phẩm chạy trên máy tính xách tay của bạn và phát triển
từ đó.
Bạn có thể tương tác với Splunk bằng SplunkWeb, giao diện người dùng dựa trên trình duyệt, hoặc trực tiếp bằng cách sử dụng
giao diện dòng lệnh ( CLI). Splunk là linh hoạt ở chỗ nó có thể chạy trên Windows hay chỉ là về bất kỳ biến thể của Unix.
Splunk cũng là một nền tảng có thể được sử dụng để phát triển các ứng dụng để xử lý phân tích dữ liệu lớn. Nó có một sức mạnh
tập các API có thể được sử dụng với Python, Java, JavaScript, Ruby, PHP, và C #. Sự phát triển của các ứng dụng trên đầu trang của
Splunk là vượt ra ngoài phạm vi của cuốn sách này; Tuy nhiên, chúng tôi mô tả làm thế nào để sử dụng một số ứng dụng phổ biến được tự do có
sẵn. Chúng tôi sẽ để nó ở đó, như tất cả các phần còn lại của cuốn sách là về Splunk.
đang được dịch, vui lòng đợi..
