Mặc dù một số cố định của byte cho mỗi điểm mã xuất hiện thuận tiện, nó không phải là hữu ích vì nó xuất hiện. Nó làm cho cắt ngắn dễ dàng hơn nhưng không đáng kể như vậy so với UTF-8 và UTF-16 (cả hai đều có thể tìm kiếm ngược cho điểm để cắt bằng cách nhìn vào 2-4 đơn vị mã là nhiều nhất). Nó là vô cùng hiếm hoi mà mã muốn tìm các điểm mã n'th mà không có trước đó kiểm tra các điểm mã từ 0 đến N-1 [cần dẫn nguồn]. Điều này có nghĩa là một chỉ số nguyên được tăng thêm 1 cho mỗi nhân vật có thể được thay thế bằng một số nguyên bù đắp, được đo bằng đơn vị mã và tăng thêm số lượng các đơn vị mã như mỗi nhân vật được kiểm tra. Điều này loại bỏ tất cả các lợi thế tốc độ làm việc với UTF-32. Trong vài trường hợp, nơi N được tạo ra mà không cần nhìn vào các điểm mã trước đó, chẳng hạn như một số băm và tốc độ cao các thuật toán tìm kiếm, không yêu cầu N được chính xác, và do đó, như cắt ngắn, có thể được thực hiện để làm việc trên UTF-8 hoặc UTF-16 bằng cách điều chỉnh các vị trí ranh giới điểm mã gần nhất, một thời gian cố định hoạt động. UTF-32 không làm cho việc tính toán chiều rộng hiển thị của một chuỗi dễ dàng hơn, vì ngay cả với một font "chiều rộng cố định" có thể có nhiều hơn một mã điểm cho mỗi vị trí ký tự (kết hợp vạch) hoặc nhiều hơn một vị trí ký tự mỗi điểm mã (ví dụ chữ Hán CJK). Biên giới hạn bản thân mình sang trái sang phải ngôn ngữ và ký tự precomposed có thể tận dụng lợi thế của các đơn vị mã kích thước cố định, nhưng các biên tập như vậy không chắc để hỗ trợ các ký tự không BMP và do đó có thể làm việc tốt như nhau với 16-bit UTF-16 mã hóa.
đang được dịch, vui lòng đợi..
