Hệ thống đếm lớn nhiều, như cuộc gọi Trung tâm và các trung tâm dữ liệu, chứa hàng nghìn máy chủ. Cho Trung tâm cuộc gọi, người ta thường có 500 máy chủ trong một cuộc gọi Trung tâm [1]. Đối với Trung tâm dữ liệu, Google đã hơn 45 Trung tâm dữ liệu tính đến năm 2009, và mỗi người trong số họ có chứa hơn 1000 máy [2]. Khi số lượng máy chủ đi đến vô cùng, nhiều hệ thống đếm nên được ổn định miễn là các lưu lượng truy cập cường độ n < 1 (tức là, tỷ lệ đến là nhỏ hơn so với khả năng dịch vụ). Cường độ lưu lượng truy cập cho một hệ thống đếm với n máy chủ có thể được dùng như tỷ lệ khách đến công việc chia tỷ lệ tại công việc mà được phục vụ. Cùng lúc đó, các hệ thống đếm nênlàm việc hiệu quả, có nghĩa là rằng n nên tiếp cận 1, tức là, lim n! 1 n = 1. Chế độ này hoạt động được gọi là chế độ lưu lượng truy cập nặng. Giấy của chúng tôi tập trung vào việc thiết lập giới hạn lưu lượng truy cập nặng, và bằng cách sử dụng các giới hạn này để thiết kế một đám mây hiệu quả năng lượng dựa trên yêu cầu QoS khác nhau.Một số kết quả cổ điển trên giới hạn lưu lượng truy cập nặng đang được đưa ra bởi Iglehart [3], Halfin và Whitt trong [4], và tóm tắt của Whitt trong chương 5 của cuốn sách của ông tại [5]. Giới hạn lưu lượng truy cập nặng này ((1− n) √n đi vào một hằng số như n đi đến vô cùng) bây giờ được gọi là chế độ Halfin-Whitt. Gần đây, hành vi của chiều dài hàng đợi bình thường ở chế độ này đã được nghiên cứu bởi A. A. Puhalskii và M. I. Reiman [6], J. Reed [7], mất Gamarnik và P. Momeilovic [8] và p. Whitt [9,10]. Dựa trên các nghiên cứu này, một số thiết kế và kiểm soát các chính sách được đề nghị vào [11-14].
đang được dịch, vui lòng đợi..