Complex databases are challenging t

Complex databases are challenging to explore and query by users unfamiliar with their schemas. Enterprise databases often have hundreds of inter-linked tables, so even when extensive documentation is available, new users must spend a considerable amount of time understanding the schema before they can retrieve any information from the database. The problem is aggravated if the documentation is missing or outdated, which may happen with legacy databases. In this paper we identify limitations of previous approaches to address this vexing problem, and propose a principled approach to summarizing the contents of a relational database, so that a user can determine at a glance the type of information it contains, and the main tables in which that information resides. Our approach has three components: First, we deﬁne the importance of each table in the database as its stable state value in a random walk over the schema graph, where the transition probabilities depend on the entropies of table attributes. This ensures that the importance of a table depends both on its information content, and on how that content relates to the content of other tables in the database. Second, we deﬁne a metric space over the tables in a database, such that the distance function is consistent with an intuitive notion of table similarity. Finally, we use a Weighted

-Center algorithm under this distance function to cluster all tables in the database around the most relevant tables, and return the result as our summary. Weconductanextensiveexperimentalstudyonabenchmark database, comparing our approach with previous methods, as well aswithseveralhybridmodels. Weshowthatourapproach notonly achievessigniﬁcantlyhigheraccuracythanthepreviousstateofthe art,butisalsofasterand scaleslinearlywiththesizeof theschema graph.

-Center algorithm under this distance function to cluster all tables in the database around the most relevant tables, and return the result as our summary. Weconductanextensiveexperimentalstudyonabenchmark database, comparing our approach with previous methods, as well aswithseveralhybridmodels. Weshowthatourapproach notonly achievessigniﬁcantlyhigheraccuracythanthepreviousstateofthe art,butisalsofasterand scaleslinearlywiththesizeof theschema graph.

0/5000

Từ: -

Sang: -

Kết quả (Việt) 1: [Sao chép]

Sao chép!

Cơ sở dữ liệu phức tạp được thử thách để khám phá và truy vấn của người dùng không quen với lược đồ của họ. Cơ sở dữ liệu doanh nghiệp thường xuyên có hàng trăm các liên kết giữa hai bảng, do đó, ngay cả khi mở rộng tài liệu có sẵn, new người dùng phải dành một số lượng đáng kể thời gian tìm hiểu về giản đồ trước khi họ có thể lấy bất cứ thông tin từ cơ sở dữ liệu. Vấn đề là trầm trọng hơn nếu các tài liệu còn thiếu hoặc lỗi thời, mà có thể xảy ra với cơ sở dữ liệu di sản. Trong bài này, chúng tôi xác định các hạn chế của phương pháp tiếp cận trước để giải quyết vấn đề gây nhiều tranh cãi này, và đề xuất một cách tiếp cận nguyên tắc để tổng kết nội dung của cơ sở dữ liệu quan hệ, do đó người dùng có thể xác định nhanh các loại thông tin chứa, và các bảng chính thông tin đó cư trú. Cách tiếp cận của chúng tôi có ba thành phần: đầu tiên, chúng tôi deﬁne tầm quan trọng của mỗi bảng trong cơ sở dữ liệu như trạng thái ổn định giá trị của nó trong bộ ngẫu nhiên trên đồ thị lược đồ, nơi mà các xác suất chuyển đổi phụ thuộc vào entropies bảng tính. Điều này đảm bảo rằng tầm quan trọng của một bảng phụ thuộc cả nội dung thông tin của nó, và làm thế nào có nội dung liên quan đến nội dung của các bảng trong cơ sở dữ liệu. Thứ hai, chúng tôi deﬁne một số liệu space trên các bảng trong cơ sở dữ liệu, như vậy mà hàm khoảng cách là phù hợp với một khái niệm tương tự bảng trực quan. Cuối cùng, chúng tôi sử dụng một Weighted-Trung tâm các thuật toán dưới này hàm khoảng cách để nhóm tất cả các bảng trong cơ sở dữ liệu xung quanh các bảng có liên quan nhất, và trả lại kết quả như là bản tóm tắt của chúng tôi. Weconductanextensiveexperimentalstudyonabenchmark cơ sở dữ liệu, so sánh các phương pháp tiếp cận của chúng tôi với các phương pháp trước đó, như là tốt aswithseveralhybridmodels. Weshowthatourapproach notonly achievessigniﬁcantlyhigheraccuracythanthepreviousstateofthe nghệ thuật butisalsofasterand scaleslinearlywiththesizeof theschema đồ thị.

đang được dịch, vui lòng đợi..

Kết quả (Việt) 2:[Sao chép]

Sao chép!

Cơ sở dữ liệu phức tạp được thử thách để khám phá và truy vấn của người dùng không quen thuộc với các lược đồ của họ. Cơ sở dữ liệu doanh nghiệp thường có hàng trăm bảng gắn kết với nhau, vì vậy ngay cả khi tài liệu phong phú có sẵn, người dùng mới phải dành một số lượng đáng kể thời gian tìm hiểu sơ đồ trước khi họ có thể lấy bất kỳ thông tin từ cơ sở dữ liệu. Vấn đề là trầm trọng hơn nếu tài liệu bị thiếu hoặc lỗi thời, mà có thể xảy ra với cơ sở dữ liệu di sản. Trong bài báo này, chúng tôi xác định những hạn chế của phương pháp trước đây để giải quyết vấn đề gây nhiều tranh cãi này, và đề xuất một cách tiếp cận có nguyên tắc để tóm tắt nội dung của một cơ sở dữ liệu quan hệ, do đó người dùng có thể xác định điểm các loại thông tin mà nó chứa, và các bảng chính trong mà thông tin đó cư trú. Cách tiếp cận của chúng tôi có ba thành phần: Thứ nhất, chúng tôi de fi ne tầm quan trọng của mỗi bảng trong cơ sở dữ liệu như giá trị trạng thái ổn định của nó trong một bước đi ngẫu nhiên trên biểu đồ lược đồ, nơi các xác suất chuyển đổi phụ thuộc vào entropy của bảng thuộc tính. Điều này đảm bảo rằng tầm quan trọng của một bảng phụ thuộc cả về nội dung thông tin của mình, và làm thế nào nội dung có liên quan đến nội dung của các bảng khác trong cơ sở dữ liệu. Thứ hai, chúng tôi de fi ne một không gian metric trên các bảng trong một cơ sở dữ liệu, như vậy là hàm khoảng cách phù hợp với một khái niệm trực quan của bảng tương tự. Cuối cùng, chúng tôi sử dụng một trọng

thuật toán -Center dưới hàm khoảng cách này để tụ họp tất cả các bảng trong cơ sở dữ liệu trên các bảng liên quan nhất, và trả về kết quả là tóm tắt của chúng tôi. Cơ sở dữ liệu Weconductanextensiveexperimentalstudyonabenchmark, so sánh cách tiếp cận của chúng tôi với các phương pháp trước đó, cũng aswithseveralhybridmodels. Weshowthatourapproach notonly achievessigni nghệ thuật cantlyhigheraccuracythanthepreviousstateofthe fi, butisalsofasterand scaleslinearlywiththesizeof theschema đồ thị.

đang được dịch, vui lòng đợi..

Kết quả (Việt) 3:[Sao chép]

Sao chép!

đang được dịch, vui lòng đợi..

Các ngôn ngữ khác

Hỗ trợ công cụ dịch thuật: Albania, Amharic, Anh, Armenia, Azerbaijan, Ba Lan, Ba Tư, Bantu, Basque, Belarus, Bengal, Bosnia, Bulgaria, Bồ Đào Nha, Catalan, Cebuano, Chichewa, Corsi, Creole (Haiti), Croatia, Do Thái, Estonia, Filipino, Frisia, Gael Scotland, Galicia, George, Gujarat, Hausa, Hawaii, Hindi, Hmong, Hungary, Hy Lạp, Hà Lan, Hà Lan (Nam Phi), Hàn, Iceland, Igbo, Ireland, Java, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Kurd, Kyrgyz, Latinh, Latvia, Litva, Luxembourg, Lào, Macedonia, Malagasy, Malayalam, Malta, Maori, Marathi, Myanmar, Mã Lai, Mông Cổ, Na Uy, Nepal, Nga, Nhật, Odia (Oriya), Pashto, Pháp, Phát hiện ngôn ngữ, Phần Lan, Punjab, Quốc tế ngữ, Rumani, Samoa, Serbia, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenia, Somali, Sunda, Swahili, Séc, Tajik, Tamil, Tatar, Telugu, Thái, Thổ Nhĩ Kỳ, Thụy Điển, Tiếng Indonesia, Tiếng Ý, Trung, Trung (Phồn thể), Turkmen, Tây Ban Nha, Ukraina, Urdu, Uyghur, Uzbek, Việt, Xứ Wales, Yiddish, Yoruba, Zulu, Đan Mạch, Đức, Ả Rập, dịch ngôn ngữ.