Nhiều hệ thống xếp hàng lớn, như các trung tâm cuộc gọi và các trung tâm dữ liệu, chứa hàng ngàn máy chủ. Đối với các trung tâm cuộc gọi, nó là phổ biến để có 500 máy chủ trong một cuộc gọi trung tâm [1]. Đối với các trung tâm dữ liệu, Google đã có hơn 45 trung tâm dữ liệu vào năm 2009, và mỗi người trong số họ có nhiều hơn 1000 máy [2]. Khi số lượng máy chủ đi đến vô cùng, nhiều hệ thống xếp hàng phải được ổn định như dài như cường độ giao thông? N <1 (tức là, tỷ lệ xuất hiện là nhỏ hơn so với năng lực dịch vụ). Cường độ lưu lượng cho một hệ thống sắp hàng với n các máy chủ có thể được coi là tỷ lệ đến việc chia tỷ lệ mà tại đó công việc được phục vụ. Đồng thời, hệ thống xếp hàng nên
làm việc hiệu quả, có nghĩa là? N nên cách tiếp cận 1, tức là, lim n! 1? N = 1. Chế độ hoạt động này được gọi là chế độ giao thông đông đúc. Giấy của chúng tôi tập trung vào việc thiết lập giới hạn lưu lượng lớn, và sử dụng các giới hạn để thiết kế một nguồn điện hiệu quả đám mây dựa trên các yêu cầu QoS khác nhau.
Một số kết quả cổ điển về hạn mức giao thông nặng được đưa ra bởi Iglehart trong [3], Halfin và Whitt trong [4], và tóm tắt bởi Whitt trong chương 5 của cuốn sách gần đây của mình [5]. Giới hạn này có lưu lượng lớn ((1-? N) √n đi vào một hằng số là n đi đến vô cùng) bây giờ được gọi là chế độ Halfin-Whitt. Gần đây, hành vi của chiều dài hàng đợi bình thường trong chế độ này đã được nghiên cứu bởi AA Puhalskii và MI [6] Reiman, J. Reed [7], D. và P. Momeilovic Gamarnik [8], và Ward Whitt [9,10 ]. Dựa trên những nghiên cứu này, một số thiết kế và kiểm soát các chính sách được đề xuất trong [11-14].
đang được dịch, vui lòng đợi..
