We generated different datasets fro

We generated different datasets from the original one by extracting a subpart or by adding links in order to test configurations having between 100k and 300 millions of links. Preliminary experiments have shown that the number of nodes has no impact on the execution time. Because scores are propagated through them, the number of intermediate MapReduce key-value pairs is dependent on the number of links. Furthermore, the execution time of a single iteration is approximatively the same for a given configuration because the algorithm do exactly the same process at each iteration.
In figure 4, the configuration of the cluster varies with different numbers of slave nodes. As previously argued, the number of links highly impacts on the execution time. Because the x-axis has a logarithmic scale, the curves seem exponential but they are almost linear with different slopes (except for con-figurations having few links). For example, the execution time is multiplied by about 6 when the number of links is multiplied by 10 with 8 slaves. Obviously, when more machines are
involved for running tasks, the execution time decreases. With few links, the differences are small as highlighted in figure 4(b). In fact, distributing the work using MapReduce entails a lot of additional tasks (data splitting, reduce phase) and also more delays due to network communications. Therefore, for problems with few links and so few computations, MapRe-duce is useless. Our experiments show that using Hadoop (#slaves > 1) is useful with at least 1 million links (figure
4(b)) and having more than 4 slave machines is efficient with at least 10 millions links which is the case with the original dataset (57 millions). Finally, using all our machines reduces the execution time by 7 comparing to a single machine with a huge dataset since this ratio seems stable for 100 millions links or more.

0/5000

Từ: -

Sang: -

Kết quả (Việt) 1: [Sao chép]

Sao chép!

Chúng tôi tạo ra datasets khác nhau từ một bản gốc bằng cách chiết một subpart hoặc bằng cách thêm liên kết để kiểm tra cấu hình có từ 100 k đến 300 triệu liên kết. Sơ bộ thí nghiệm đã chỉ ra rằng số nút đã không có tác động về thời gian thực hiện. Bởi vì điểm số được tuyên truyền thông qua họ, số lượng các trung gian MapReduce khóa-giá trị cặp là phụ thuộc vào số lượng các liên kết. Hơn nữa, thời gian thực hiện của lặp đi lặp lại duy nhất là cự ly khoảng tương tự cho một cấu hình nhất định vì các thuật toán làm chính xác quá trình cùng một lúc mỗi iteration.Trong hình 4, cấu hình của các nhóm khác nhau với các con số khác nhau của các nút nô lệ. Như lập luận trước đó, số lượng các liên kết rất cao tác động về thời gian thực hiện. Bởi vì trục x có quy mô lôgarít, các đường cong có vẻ mũ nhưng họ gần như tuyến tính với các sườn núi khác nhau (ngoại trừ côn-figurations có số liên kết). Ví dụ, thời gian thực hiện nhân của khoảng 6 khi số lượng các liên kết được nhân với 10 với 8 nô lệ. Rõ ràng, là khi thêm máy làliên quan để chạy các tác vụ, thời gian thực hiện giảm. Với số liên kết, sự khác biệt là nhỏ như đánh dấu trong hình 4(b). Trong thực tế, điều phối công việc bằng cách sử dụng MapReduce đòi hỏi rất nhiều nhiệm vụ bổ sung (dữ liệu tách, giảm bớt giai đoạn) và cũng có thêm một số sự chậm trễ do mạng truyền thông. Vì vậy, đối với vấn đề với số liên kết và tính toán quá ít, MapRe-duce là vô ích. Thí nghiệm của chúng tôi cho thấy rằng bằng cách sử dụng Hadoop (#slaves > 1) là hữu ích với ít nhất 1 triệu liên kết (hình4(b)) và có nhiều hơn 4 nô lệ máy là hiệu quả với các liên kết ít nhất 10 triệu trường hợp với số liệu ban đầu (57 triệu). Cuối cùng, bằng cách sử dụng tất cả các máy của chúng tôi làm giảm thời gian thực hiện 7 so với một máy tính duy nhất với một tập dữ liệu lớn kể từ khi tỷ lệ này dường như ổn định liên kết 100 triệu trở lên.

đang được dịch, vui lòng đợi..

Kết quả (Việt) 2:[Sao chép]

Sao chép!

Chúng tôi tạo ra dữ liệu khác nhau từ bản gốc bằng cách chiết xuất một phần nhỏ hoặc bằng cách thêm các liên kết để kiểm tra cấu hình có giữa 100k và 300 triệu liên kết. Thí nghiệm sơ bộ cho thấy số lượng các nút không có tác động về thời gian thực hiện. Bởi vì điểm số được truyền thông qua họ, số lượng MapReduce trung gian cặp khóa-giá trị phụ thuộc vào số lượng của các liên kết. Hơn nữa, thời gian thực hiện của một sự lặp lại duy nhất là approximatively tương tự cho một cấu hình được vì các thuật toán thực hiện chính xác các quá trình tương tự tại mỗi lần lặp.
Trong hình 4, cấu hình của các cụm khác nhau với số lượng khác nhau của các nút nô lệ. Như đã lập luận trước đây, số lượng các liên kết cao tác động đến thời gian thực hiện. Bởi vì các trục x có thang logarit, các đường cong dường như mũ nhưng họ hầu như tuyến tính với độ dốc khác nhau (ngoại trừ con-figurations có vài liên kết). Ví dụ, thời gian thực hiện được nhân lên khoảng 6 khi số lượng các liên kết được nhân 10 với 8 người nô lệ. Rõ ràng, khi có nhiều máy được
tham gia để chạy nhiệm vụ, thời gian thực hiện giảm. Với số liên kết, sự khác biệt là nhỏ như đánh dấu trong hình 4 (b). Trong thực tế, phân phối công việc sử dụng MapReduce đòi hỏi rất nhiều nhiệm vụ bổ sung (tách dữ liệu, làm giảm giai đoạn) và cũng có nhiều sự chậm trễ do truyền thông mạng. Vì vậy, đối với vấn đề với số liên kết và quá ít tính toán, MapRe-Duce là vô ích. Thí nghiệm của chúng tôi cho thấy rằng việc sử dụng Hadoop (#slaves> 1) là hữu ích với ít nhất 1 triệu liên kết (hình
4 (b)) và có hơn 4 máy slave là hiệu quả với ít nhất 10 triệu liên kết đó là trường hợp với các số liệu ban đầu (57 triệu). Cuối cùng, sử dụng tất cả các máy của chúng tôi làm giảm thời gian thực hiện 7 so sánh với một máy duy nhất với một tập dữ liệu rất lớn kể từ khi tỷ lệ này có vẻ ổn định cho 100 triệu liên kết hoặc nhiều hơn.

đang được dịch, vui lòng đợi..

Kết quả (Việt) 3:[Sao chép]

Sao chép!

đang được dịch, vui lòng đợi..

Các ngôn ngữ khác

Hỗ trợ công cụ dịch thuật: Albania, Amharic, Anh, Armenia, Azerbaijan, Ba Lan, Ba Tư, Bantu, Basque, Belarus, Bengal, Bosnia, Bulgaria, Bồ Đào Nha, Catalan, Cebuano, Chichewa, Corsi, Creole (Haiti), Croatia, Do Thái, Estonia, Filipino, Frisia, Gael Scotland, Galicia, George, Gujarat, Hausa, Hawaii, Hindi, Hmong, Hungary, Hy Lạp, Hà Lan, Hà Lan (Nam Phi), Hàn, Iceland, Igbo, Ireland, Java, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Kurd, Kyrgyz, Latinh, Latvia, Litva, Luxembourg, Lào, Macedonia, Malagasy, Malayalam, Malta, Maori, Marathi, Myanmar, Mã Lai, Mông Cổ, Na Uy, Nepal, Nga, Nhật, Odia (Oriya), Pashto, Pháp, Phát hiện ngôn ngữ, Phần Lan, Punjab, Quốc tế ngữ, Rumani, Samoa, Serbia, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenia, Somali, Sunda, Swahili, Séc, Tajik, Tamil, Tatar, Telugu, Thái, Thổ Nhĩ Kỳ, Thụy Điển, Tiếng Indonesia, Tiếng Ý, Trung, Trung (Phồn thể), Turkmen, Tây Ban Nha, Ukraina, Urdu, Uyghur, Uzbek, Việt, Xứ Wales, Yiddish, Yoruba, Zulu, Đan Mạch, Đức, Ả Rập, dịch ngôn ngữ.