Lớp Mapper là một loại chung chung, với bốn thông số loại chính thức chỉ định các
trọng điểm đầu vào, giá trị đầu vào, đầu ra quan trọng, và các loại giá trị sản lượng của các chức năng bản đồ. Đối với các
ví dụ hiện nay, các chính đầu vào là một số nguyên dài bù đắp, các giá trị đầu vào là một dòng văn bản,
phím đầu ra là một năm, và giá trị đầu ra là một nhiệt độ không khí (một số nguyên). Thay
vì sử dụng được xây dựng trong các loại Java, Hadoop cung cấp tập các loại cơ bản đó là op-
timized cho serialization mạng. Chúng được tìm thấy trong các pack- org.apache.hadoop.io
tuổi. Ở đây chúng tôi sử dụng LongWritable, tương ứng với một Java Long, văn bản (như Java
String), và IntWritable (như Java Integer).
Các phương pháp bản đồ () được thông qua một khóa và một giá trị. Chúng tôi chuyển đổi các giá trị bản có chứa
các dòng đầu vào thành một Java String, sau đó sử dụng phương pháp của nó substring () để trích xuất các
cột chúng ta quan tâm.
Các phương pháp bản đồ () cũng cung cấp một ví dụ của bối cảnh để viết ra để. Trong
trường hợp, chúng tôi viết năm như một đối tượng văn bản (kể từ khi chúng tôi chỉ sử dụng nó như là một chìa khóa), và
nhiệt độ được bọc trong một IntWritable. Chúng tôi viết một hồ sơ đầu ra chỉ khi tem-
perature hiện diện và mã chất lượng chỉ ra đọc nhiệt độ là OK.
đang được dịch, vui lòng đợi..
