Though a fixed number of bytes per

Though a fixed number of bytes per code point appear convenient, it is not as useful as it appears. It makes truncation easier but not significantly so compared to UTF-8 and UTF-16 (both of which can search backwards for the point to truncate by looking at 2-4 code units at most).

It is extremely rare that code wishes to find the N'th code point without earlier examining the code points 0 to N-1[citation needed]. This means an integer index that is incremented by 1 for each character can be replaced with an integer offset, measured in code units and incremented by the number of code units as each character is examined. This removes all speed advantages of working with UTF-32. The few instances where N is generated without looking at the earlier code points, such as some hashing and high-speed search algorithms, do not require that N be exact, and thus, like truncation, can be made to work on UTF-8 or UTF-16 by adjusting the position to the nearest code point boundary, a fixed-time operation.

UTF-32 does not make calculating the displayed width of a string easier, since even with a “fixed width” font there may be more than one code point per character position (combining marks) or more than one character position per code point (for example CJK ideographs). Editors that limit themselves to left-to-right languages and precomposed characters can take advantage of fixed-sized code units, but such editors are unlikely to support non-BMP characters and thus can work equally well with 16-bit UTF-16 encoding.

It is extremely rare that code wishes to find the N'th code point without earlier examining the code points 0 to N-1[citation needed]. This means an integer index that is incremented by 1 for each character can be replaced with an integer offset, measured in code units and incremented by the number of code units as each character is examined. This removes all speed advantages of working with UTF-32. The few instances where N is generated without looking at the earlier code points, such as some hashing and high-speed search algorithms, do not require that N be exact, and thus, like truncation, can be made to work on UTF-8 or UTF-16 by adjusting the position to the nearest code point boundary, a fixed-time operation.

UTF-32 does not make calculating the displayed width of a string easier, since even with a “fixed width” font there may be more than one code point per character position (combining marks) or more than one character position per code point (for example CJK ideographs). Editors that limit themselves to left-to-right languages and precomposed characters can take advantage of fixed-sized code units, but such editors are unlikely to support non-BMP characters and thus can work equally well with 16-bit UTF-16 encoding.

0/5000

Từ: -

Sang: -

Kết quả (Việt) 1: [Sao chép]

Sao chép!

Mặc dù một số cố định của byte cho mỗi mã điểm xuất hiện thuận tiện, nó không phải là hữu ích như nó xuất hiện. Nó làm cho truncation dễ dàng hơn nhưng không đáng kể như vậy so UTF-8 và UTF-16 (cả hai đều có thể tìm ngược trở lại cho các điểm đến truncate bằng cách nhìn vào 2-4 mã đơn vị tại hầu hết).Nó là cực kỳ hiếm mã mong muốn tìm thấy điểm mã N'th mà không có trước đó kiểm tra mã điểm 0 đến N-1 [cần dẫn nguồn]. Điều này có nghĩa một chỉ số số nguyên incremented bởi 1 cho mỗi nhân vật có thể được thay thế bằng một số nguyên bù đắp, được đo bằng đơn vị mã và tăng lên theo số đơn vị mã như mỗi nhân vật được kiểm tra. Điều này loại bỏ tất cả các lợi thế tốc độ làm việc với UTF-32. Các trường hợp vài nơi N được tạo ra mà không xem xét các điểm mã trước đó, chẳng hạn như một số băm và thuật toán tìm kiếm tốc độ cao, không yêu cầu rằng N là chính xác, và do đó, như truncation, có thể được thực hiện để làm việc trên UTF-8 hoặc UTF-16 bằng cách điều chỉnh vị trí ranh giới điểm mã gần nhất, một hoạt động thời gian cố định.UTF-32 không làm cho tính toán chiều rộng Hiển thị của một chuỗi dễ dàng hơn, vì ngay cả với một chữ "chiều rộng cố định" có thể có nhiều hơn một mã số điểm cho mỗi vị trí ký tự (kết hợp nhãn hiệu) hoặc vị trí nhân vật nhiều hơn một cho mỗi mã điểm (ví dụ CJK ideographs). Biên tập viên giới hạn mình để ngôn ngữ trái sang phải và những nhân vật có thể tận dụng lợi thế của các đơn vị có kích thước cố định mã, nhưng các biên tập viên có khả năng hỗ trợ ký tự BMP và do đó có thể làm việc như nhau tốt với mã hóa UTF-16 16-bit.

đang được dịch, vui lòng đợi..

Kết quả (Việt) 2:[Sao chép]

Sao chép!

Mặc dù một số cố định của byte cho mỗi điểm mã xuất hiện thuận tiện, nó không phải là hữu ích vì nó xuất hiện. Nó làm cho cắt ngắn dễ dàng hơn nhưng không đáng kể như vậy so với UTF-8 và UTF-16 (cả hai đều có thể tìm kiếm ngược cho điểm để cắt bằng cách nhìn vào 2-4 đơn vị mã là nhiều nhất). Nó là vô cùng hiếm hoi mà mã muốn tìm các điểm mã n'th mà không có trước đó kiểm tra các điểm mã từ 0 đến N-1 [cần dẫn nguồn]. Điều này có nghĩa là một chỉ số nguyên được tăng thêm 1 cho mỗi nhân vật có thể được thay thế bằng một số nguyên bù đắp, được đo bằng đơn vị mã và tăng thêm số lượng các đơn vị mã như mỗi nhân vật được kiểm tra. Điều này loại bỏ tất cả các lợi thế tốc độ làm việc với UTF-32. Trong vài trường hợp, nơi N được tạo ra mà không cần nhìn vào các điểm mã trước đó, chẳng hạn như một số băm và tốc độ cao các thuật toán tìm kiếm, không yêu cầu N được chính xác, và do đó, như cắt ngắn, có thể được thực hiện để làm việc trên UTF-8 hoặc UTF-16 bằng cách điều chỉnh các vị trí ranh giới điểm mã gần nhất, một thời gian cố định hoạt động. UTF-32 không làm cho việc tính toán chiều rộng hiển thị của một chuỗi dễ dàng hơn, vì ngay cả với một font "chiều rộng cố định" có thể có nhiều hơn một mã điểm cho mỗi vị trí ký tự (kết hợp vạch) hoặc nhiều hơn một vị trí ký tự mỗi điểm mã (ví dụ chữ Hán CJK). Biên giới hạn bản thân mình sang trái sang phải ngôn ngữ và ký tự precomposed có thể tận dụng lợi thế của các đơn vị mã kích thước cố định, nhưng các biên tập như vậy không chắc để hỗ trợ các ký tự không BMP và do đó có thể làm việc tốt như nhau với 16-bit UTF-16 mã hóa.

đang được dịch, vui lòng đợi..

Kết quả (Việt) 3:[Sao chép]

Sao chép!

đang được dịch, vui lòng đợi..

Các ngôn ngữ khác

Hỗ trợ công cụ dịch thuật: Albania, Amharic, Anh, Armenia, Azerbaijan, Ba Lan, Ba Tư, Bantu, Basque, Belarus, Bengal, Bosnia, Bulgaria, Bồ Đào Nha, Catalan, Cebuano, Chichewa, Corsi, Creole (Haiti), Croatia, Do Thái, Estonia, Filipino, Frisia, Gael Scotland, Galicia, George, Gujarat, Hausa, Hawaii, Hindi, Hmong, Hungary, Hy Lạp, Hà Lan, Hà Lan (Nam Phi), Hàn, Iceland, Igbo, Ireland, Java, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Kurd, Kyrgyz, Latinh, Latvia, Litva, Luxembourg, Lào, Macedonia, Malagasy, Malayalam, Malta, Maori, Marathi, Myanmar, Mã Lai, Mông Cổ, Na Uy, Nepal, Nga, Nhật, Odia (Oriya), Pashto, Pháp, Phát hiện ngôn ngữ, Phần Lan, Punjab, Quốc tế ngữ, Rumani, Samoa, Serbia, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenia, Somali, Sunda, Swahili, Séc, Tajik, Tamil, Tatar, Telugu, Thái, Thổ Nhĩ Kỳ, Thụy Điển, Tiếng Indonesia, Tiếng Ý, Trung, Trung (Phồn thể), Turkmen, Tây Ban Nha, Ukraina, Urdu, Uyghur, Uzbek, Việt, Xứ Wales, Yiddish, Yoruba, Zulu, Đan Mạch, Đức, Ả Rập, dịch ngôn ngữ.