A Job object forms the specificatio

A Job object forms the specification of the job and gives you control over how the job
is run. When we run this job on a Hadoop cluster, we will package the code into a JAR
file (which Hadoop will distribute around the cluster). Rather than explicitly specifying
the name of the JAR file, we can pass a class in the Job’s setJarByClass() method,
which Hadoop will use to locate the relevant JAR file by looking for the JAR file con‐
taining this class.
Having constructed a Job object, we specify the input and output paths. An input path
is specified by calling the static addInputPath() method on FileInputFormat, and it
can be a single file, a directory (in which case, the input forms all the files in that direc‐
tory), or a file pattern. As the name suggests, addInputPath() can be called more than
once to use input from multiple paths.
The output path (of which there is only one) is specified by the static setOutput
Path() method on FileOutputFormat. It specifies a directory where the output files
from the reduce function are written. The directory shouldn’t exist before running the
job because Hadoop will complain and not run the job. This precaution is to prevent
data loss (it can be very annoying to accidentally overwrite the output of a long job with
that of another).
Next, we specify the map and reduce types to use via the setMapperClass() and
setReducerClass() methods.
The setOutputKeyClass() and setOutputValueClass() methods control the output
types for the reduce function, and must match what the Reduce class produces. The map
output types default to the same types, so they do not need to be set if the mapper
produces the same types as the reducer (as it does in our case). However, if they are
different, the map output types must be set using the setMapOutputKeyClass() and
setMapOutputValueClass() methods.
The input types are controlled via the input format, which we have not explicitly set
because we are using the default TextInputFormat.
After setting the classes that define the map and reduce functions, we are ready to run
the job. The waitForCompletion() method on Job submits the job and waits for it to
finish. The single argument to the method is a flag indicating whether verbose output
is generated. When true, the job writes information about its progress to the console.
The return value of the waitForCompletion() method is a Boolean indicating success
(true) or failure (false), which we translate into the program’s exit code of 0 or 1.

0/5000

Từ: -

Sang: -

Kết quả (Việt) 1: [Sao chép]

Sao chép!

Một đối tượng công việc hình thành đặc điểm kỹ thuật của công việc và cho phép bạn kiểm soát cách các công việchoạt động. Khi chúng tôi chạy công việc này trên một cụm Hadoop, chúng tôi sẽ gói mã vào một JARtập tin (mà Hadoop sẽ phân phối xung quanh cụm). Chứ không phải là xác định một cách rõ ràngtên tập tin JAR, chúng ta có thể vượt qua một lớp trong các phương pháp setJarByClass() của công việc,Hadoop sẽ sử dụng để xác định vị trí các tập tin JAR có liên quan bằng cách tìm kiếm tập tin JAR con‐taining lớp này.Chúng tôi đã xây dựng một đối tượng công việc, xác định các đầu vào và đầu ra đường. Một đường dẫn nhậpđược xác định bằng cách gọi phương pháp tĩnh addInputPath() trên FileInputFormat, và nócó thể là một tập tin, thư mục (trong trường hợp đó, đầu vào hình thức tất cả các file trong đó direc‐Tory), hoặc một mẫu tập tin. Như tên cho thấy, addInputPath() có thể được gọi là nhiều hơnmột lần sử dụng đầu vào từ nhiều đường.Đường dẫn đầu ra (trong đó có chỉ là một) được chỉ định bởi setOutput tĩnhPath() các phương pháp trên FileOutputFormat. Nó chỉ định một thư mục nơi các tập tin đầu ratừ các chức năng giảm được viết. Thư mục không nên tồn tại trước khi chạy cáccông việc bởi vì Hadoop sẽ khiếu nại và không chạy công việc. Biện pháp phòng ngừa này là để ngăn chặnmất dữ liệu (nó có thể rất khó chịu để vô tình ghi đè lên đầu ra của một công việc lâu dài vớiđiều đó khác).Tiếp theo, chúng tôi xác định bản đồ và làm giảm các loại để sử dụng thông qua setMapperClass() vàphương pháp setReducerClass().SetOutputKeyClass() và setOutputValueClass() các phương pháp kiểm soát đầu raCác loại giảm hoạt động, và phải phù hợp với những gì các lớp học giảm sản xuất. Bản đồsản lượng loại mặc định cùng loại, vì vậy họ không cần phải được cài đặt nếu máy bức xạsản xuất các loại tương tự như Pháp (như trong trường hợp của chúng tôi). Tuy nhiên, nếu họ làkhác nhau, các loại bản đồ đầu ra phải được thiết lập bằng cách sử dụng setMapOutputKeyClass() vàphương pháp setMapOutputValueClass().Các loại đầu vào được điều khiển thông qua các định dạng đầu vào, chúng tôi đã không một cách rõ ràng đặtbởi vì chúng tôi đang sử dụng mặc định TextInputFormat.Sau khi thiết lập các lớp học mà xác định các bản đồ và làm giảm chức năng, chúng tôi sẵn sàng để chạycông việc. Phương pháp waitForCompletion() việc nộp công việc và chờ đợi cho nó đểkết thúc. Đối số duy nhất với phương pháp là một lá cờ cho biết dù tiết rađược tạo ra. Khi sự thật, công việc viết các thông tin về sự tiến bộ của mình để giao diện điều khiển.Giá trị trả lại các phương pháp waitForCompletion() là một thành công cho thấy Boolean(true) hay sai sót (sai), chúng tôi dịch sang mã thoát chương trình 0 hoặc 1.

đang được dịch, vui lòng đợi..

Kết quả (Việt) 2:[Sao chép]

Sao chép!

Một đối tượng công việc tạo thành các đặc điểm kỹ thuật của công việc và cung cấp cho bạn kiểm soát như thế nào công việc
được chạy. Khi chúng tôi chạy công việc này trên một cụm Hadoop, chúng tôi sẽ gói mã vào một JAR
file (mà Hadoop sẽ phân phối khoảng cluster). Thay vì chỉ định rõ
tên của tập tin JAR, chúng ta có thể vượt qua một lớp học trong phương pháp (), setJarByClass của công việc
mà Hadoop sẽ sử dụng để xác định vị trí các tập tin JAR có liên quan bằng cách tìm kiếm các tập tin JAR con-
TaiNing lớp này.
Sau khi xây dựng một công việc đối tượng, chúng tôi chỉ định đường dẫn đầu vào và đầu ra. Một con đường đầu vào
được xác định bằng cách gọi phương thức addInputPath tĩnh () trên FileInputFormat, và nó
có thể là một tập tin duy nhất, một thư mục (trong trường hợp này, các đầu vào tạo thành tất cả các tập tin trong đó vị trí Giám đốc
thổ), hoặc một mô hình tập tin. Như tên cho thấy, addInputPath () có thể được gọi là nhiều hơn
một lần để sử dụng đầu vào từ nhiều đường dẫn.
Các đường dẫn đầu ra (trong đó chỉ có một) được quy định bởi các tĩnh setOutput
phương pháp Path () trên FileOutputFormat. Nó chỉ định một thư mục nơi các tập tin đầu ra
từ giảm chức năng được viết. Các thư mục không nên tồn tại trước khi chạy các
công việc vì Hadoop sẽ phàn nàn và không chạy các công việc. Đề phòng này là để ngăn chặn
mất mát dữ liệu (nó có thể rất khó chịu vô tình ghi đè lên các sản phẩm của một công việc lâu dài với
đó của người khác).
Tiếp theo, chúng tôi xác định bản đồ và làm giảm các loại để sử dụng thông qua các setMapperClass () và
setReducerClass () phương pháp.
các setOutputKeyClass () và setOutputValueClass () phương pháp kiểm soát đầu ra
loại cho giảm chức năng, và phải phù hợp với những gì các lớp giảm sản xuất. Bản đồ
các loại sản lượng mặc định cho các loại tương tự, vì vậy họ không cần phải được thiết lập nếu các mapper
sản xuất các loại giống như bộ giảm (như trong trường hợp của chúng tôi). Tuy nhiên, nếu họ là
khác nhau, các loại đầu ra bản đồ phải được thiết lập bằng cách sử dụng setMapOutputKeyClass () và
setMapOutputValueClass () phương pháp.
Các loại đầu vào được kiểm soát thông qua các định dạng đầu vào, mà chúng tôi đã không rõ ràng thiết
bởi vì chúng ta đang sử dụng TextInputFormat mặc định.
Sau khi thiết lập các lớp học mà xác định bản đồ và giảm chức năng, chúng tôi đã sẵn sàng để chạy
công việc. Phương pháp waitForCompletion () vào việc trình công việc và đợi cho nó để
kết thúc. Các đối số duy nhất cho phương pháp này là một lá cờ chỉ có đầu ra dài
được tạo ra. Khi sự thật, công việc viết thông tin về sự tiến bộ của nó để giao diện điều khiển.
Các giá trị trả về của phương waitForCompletion () là một Boolean cho biết thành công
(true) hay thất bại (false), mà chúng tôi dịch sang mã lối ra của chương trình là 0 hoặc 1.

đang được dịch, vui lòng đợi..

Kết quả (Việt) 3:[Sao chép]

Sao chép!

đang được dịch, vui lòng đợi..

Các ngôn ngữ khác

Hỗ trợ công cụ dịch thuật: Albania, Amharic, Anh, Armenia, Azerbaijan, Ba Lan, Ba Tư, Bantu, Basque, Belarus, Bengal, Bosnia, Bulgaria, Bồ Đào Nha, Catalan, Cebuano, Chichewa, Corsi, Creole (Haiti), Croatia, Do Thái, Estonia, Filipino, Frisia, Gael Scotland, Galicia, George, Gujarat, Hausa, Hawaii, Hindi, Hmong, Hungary, Hy Lạp, Hà Lan, Hà Lan (Nam Phi), Hàn, Iceland, Igbo, Ireland, Java, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Kurd, Kyrgyz, Latinh, Latvia, Litva, Luxembourg, Lào, Macedonia, Malagasy, Malayalam, Malta, Maori, Marathi, Myanmar, Mã Lai, Mông Cổ, Na Uy, Nepal, Nga, Nhật, Odia (Oriya), Pashto, Pháp, Phát hiện ngôn ngữ, Phần Lan, Punjab, Quốc tế ngữ, Rumani, Samoa, Serbia, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenia, Somali, Sunda, Swahili, Séc, Tajik, Tamil, Tatar, Telugu, Thái, Thổ Nhĩ Kỳ, Thụy Điển, Tiếng Indonesia, Tiếng Ý, Trung, Trung (Phồn thể), Turkmen, Tây Ban Nha, Ukraina, Urdu, Uyghur, Uzbek, Việt, Xứ Wales, Yiddish, Yoruba, Zulu, Đan Mạch, Đức, Ả Rập, dịch ngôn ngữ.