5.3 THE DIFFERENCE WITH BIG DATASET

5.3 THE DIFFERENCE WITH BIG DATASETS
On the other hand, big datasets neither exhibit these characteristics, nor do they have similar types of business impacts. Big data analytics is generally centered on consuming massive amounts of a combination of structured and unstructured data from both machine-generated and human sources. Much of the analysis is done without considering the business impacts of errors or inconsistencies across the different sources, from where the data originated, or how frequently it is acquired.
Big data applications look at many input streams originating from within and outside the organization, some taken from a variety of social networking streams, syndicated data streams, news feeds, preconfigured search filters, public or open-sourced datasets, sensor networks, or other unstructured data streams. Such diverse datasets resist singular approaches to governance.
When the acquired datasets and data streams originate outside the organization, there is little facility for control over the input. The original sources are often so obfuscated that there is little capacity to even know who created the data in the first place, let alone enable any type of oversight over data creation.
Another issue involves the development and execution model for big data applications. Data analysts are prone to develop their own models in their private sandbox environments. In these cases, the developers often bypass traditional IT and data management channels, opening greater possibilities for inconsistencies with sanctioned IT projects. This is complicated more as datasets are tapped into or downloaded directly without IT’s intervention.
Consistency (or the lack thereof) is probably the most difficult issue. When datasets are created internally and a downstream user recognizes a potential error, that issue can be communicated to the originating system’s owners. The owners then have the opportunity to find the root cause of the problems and then correct the processes that led to the errors.
But with big data systems that absorb massive volumes of data, some of which originates externally, there are limited opportunities to engage process owners to influence modifications or corrections to the source. On the other hand, if you opt to “correct” the recognized data error, you are introducing an inconsistency with the original source, which at worst can lead to incorrect conclusions and flawed decision making.

0/5000

Từ: -

Sang: -

Kết quả (Việt) 1: [Sao chép]

Sao chép!

5.3 KHÁC BIỆT VỚI LỚN DATASETSMặt khác, lớn datasets cũng thể hiện những đặc điểm, cũng không làm họ có loại tương tự của các tác động kinh doanh. Lớn dữ liệu analytics thường là trung tâm trên tiêu thụ một lượng lớn của một sự kết hợp của cấu trúc và cấu trúc dữ liệu từ cả hai tạo ra máy và con người các nguồn. Hầu hết các phân tích được thực hiện mà không xem xét các tác động kinh doanh của lỗi hoặc mâu thuẫn trên khắp các nguồn khác nhau, từ nơi mà các dữ liệu có nguồn gốc, hoặc mức độ thường xuyên nó được mua lại.Lớn dữ liệu ứng dụng nhìn nhiều dòng đầu vào có nguồn gốc từ bên trong và bên ngoài tổ chức, một số Lấy từ một loạt các xã hội mạng suối, dòng dữ liệu cung cấp thông tin, tin tức nguồn cấp dữ liệu, bộ lọc tìm cấu hình sẵn, datasets công cộng hoặc mã nguồn mở, cảm biến mạng, hoặc dòng dữ liệu không có cấu trúc khác. Như vậy datasets khác nhau chống lại từ phương pháp tiếp cận để quản trị.Khi dòng datasets và dữ liệu mua lại có nguồn gốc bên ngoài tổ chức, có các thiết bị nhỏ cho kiểm soát đầu vào. Những tài liệu gốc thường rất được obfuscated là có khả năng ít thậm chí biết người đã tạo ra các dữ liệu tại địa điểm đầu tiên, hãy để một mình sử bất kỳ loại giám sát trên dữ liệu sáng tạo.Một vấn đề khác liên quan đến mô hình phát triển và thực hiện cho các ứng dụng lớn dữ liệu. Nhà phân tích dữ liệu là dễ bị phát triển riêng của họ mô hình trong môi trường chỗ thử riêng của họ. Trong những trường hợp này, các nhà phát triển thường bỏ qua truyền thống dữ liệu và quản lý kênh, mở lớn hơn khả năng cho các mâu thuẫn với xử phạt nó dự án. Điều này là phức tạp hơn như datasets được khai thác vào hoặc tải về trực tiếp mà không có sự can thiệp.Thống nhất (hoặc thiếu đó) có lẽ là vấn đề khó khăn nhất. Khi datasets được tạo ra trong nội bộ và người dùng hạ lưu công nhận một lỗi tiềm năng, vấn đề đó có thể được truyền đạt đến chủ sở hữu của hệ thống nguồn gốc. Các chủ sở hữu sau đó có cơ hội để tìm nguyên nhân gốc rễ của những vấn đề và sau đó sửa chữa các quá trình đó đã dẫn đến các lỗi.Nhưng với các hệ thống lớn dữ liệu hấp thụ các khối lượng lớn dữ liệu, một số trong đó có nguồn gốc bên ngoài, có những hạn chế cơ hội để tham gia vào quá trình chủ sở hữu để ảnh hưởng đến sửa đổi hoặc sửa đổi để nguồn. Mặt khác, nếu bạn chọn để "sửa chữa" lỗi dữ liệu được công nhận, bạn đang giới thiệu một mâu thuẫn với nguồn gốc, lúc tồi tệ nhất có thể dẫn đến kết luận không chính xác và thiếu sót ra quyết định.

đang được dịch, vui lòng đợi..

Kết quả (Việt) 2:[Sao chép]

Sao chép!

5.3 SỰ KHÁC BIỆT VỚI BIG bộ dữ liệu
Mặt khác, tập hợp dữ liệu lớn không trưng bày những đặc điểm này, và cũng không có các loại tương tự của các tác động kinh doanh. Phân tích dữ liệu lớn thường tập trung vào tiêu thụ số lượng lớn của một sự kết hợp của dữ liệu có cấu trúc và phi cấu trúc từ cả hai nguồn máy tạo ra và con người. Phần lớn các phân tích được thực hiện mà không xem xét các tác động kinh doanh của các lỗi hoặc không nhất quán trên các nguồn khác nhau, từ nơi mà dữ liệu có nguồn gốc, hoặc làm thế nào nó thường xuyên được mua lại.
ứng dụng dữ liệu lớn nhìn vào nhiều dòng đầu vào có nguồn gốc từ bên trong và bên ngoài tổ chức, một số lấy từ một loạt các dòng mạng xã hội, cung cấp thông tin các luồng dữ liệu, các thông tin, các bộ lọc tìm kiếm cấu hình sẵn, bộ dữ liệu công cộng hoặc mã nguồn mở, mạng cảm biến, hoặc dữ liệu phi cấu trúc khác suối. Bộ dữ liệu đa dạng như chống lại cách tiếp cận đơn lẻ đến quản trị.
Khi các bộ dữ liệu và dữ liệu thu được suối nguồn từ bên ngoài tổ chức, có rất ít cơ sở để kiểm soát đầu vào. Các nguồn gốc thường rất khó hiểu rằng có rất ít khả năng thậm chí còn biết ai tạo ra các dữ liệu ở nơi đầu tiên, hãy để một mình cho phép bất kỳ loại giám sát qua việc tạo ra dữ liệu.
Một vấn đề khác liên quan đến việc phát triển và thực hiện mô hình cho các ứng dụng dữ liệu lớn. Phân tích dữ liệu dễ bị phát triển các mô hình riêng của họ trong môi trường sandbox riêng tư của họ. Trong những trường hợp này, các nhà phát triển thường bỏ qua các kênh thông tin và quản lý dữ liệu truyền thống, mở khả năng lớn hơn cho sự mâu thuẫn với các dự án CNTT bị xử phạt. Điều này trở nên phức tạp hơn khi bộ dữ liệu được khai thác thành hoặc tải trực tiếp mà không cần sự can thiệp của IT.
Tính nhất quán (hoặc thiếu đó) có lẽ là vấn đề khó khăn nhất. Khi bộ dữ liệu được tạo ra trong nội bộ và người dùng hạ lưu công nhận một lỗi tiềm năng, vấn đề mà có thể được thông báo cho chủ sở hữu các hệ thống nguồn gốc của. Các chủ sở hữu sau đó có cơ hội để tìm ra nguyên nhân gốc rễ của vấn đề và sau đó sửa các quá trình dẫn đến sai sót.
Nhưng với các hệ thống lớn dữ liệu mà hấp thụ khối lượng lớn dữ liệu, một số trong đó có nguồn gốc từ bên ngoài, có rất ít cơ hội để tham gia vào quá trình chủ sở hữu để ảnh hưởng đến sự thay đổi hoặc chỉnh sửa để nguồn. Mặt khác, nếu bạn chọn "đúng" các lỗi dữ liệu được công nhận, bạn đang giới thiệu một sự mâu thuẫn với nguồn gốc, mà lúc tồi tệ nhất có thể dẫn đến những kết luận chính xác và đưa ra quyết định sai lầm.

đang được dịch, vui lòng đợi..

Kết quả (Việt) 3:[Sao chép]

Sao chép!

đang được dịch, vui lòng đợi..

Các ngôn ngữ khác

Hỗ trợ công cụ dịch thuật: Albania, Amharic, Anh, Armenia, Azerbaijan, Ba Lan, Ba Tư, Bantu, Basque, Belarus, Bengal, Bosnia, Bulgaria, Bồ Đào Nha, Catalan, Cebuano, Chichewa, Corsi, Creole (Haiti), Croatia, Do Thái, Estonia, Filipino, Frisia, Gael Scotland, Galicia, George, Gujarat, Hausa, Hawaii, Hindi, Hmong, Hungary, Hy Lạp, Hà Lan, Hà Lan (Nam Phi), Hàn, Iceland, Igbo, Ireland, Java, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Kurd, Kyrgyz, Latinh, Latvia, Litva, Luxembourg, Lào, Macedonia, Malagasy, Malayalam, Malta, Maori, Marathi, Myanmar, Mã Lai, Mông Cổ, Na Uy, Nepal, Nga, Nhật, Odia (Oriya), Pashto, Pháp, Phát hiện ngôn ngữ, Phần Lan, Punjab, Quốc tế ngữ, Rumani, Samoa, Serbia, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenia, Somali, Sunda, Swahili, Séc, Tajik, Tamil, Tatar, Telugu, Thái, Thổ Nhĩ Kỳ, Thụy Điển, Tiếng Indonesia, Tiếng Ý, Trung, Trung (Phồn thể), Turkmen, Tây Ban Nha, Ukraina, Urdu, Uyghur, Uzbek, Việt, Xứ Wales, Yiddish, Yoruba, Zulu, Đan Mạch, Đức, Ả Rập, dịch ngôn ngữ.