The basic encoding technique that we just described is called pulse code modulation
(PCM). Speech encoding often uses PCM, with a sampling rate of 8,000 samples per
second and 8 bits per sample, resulting in a rate of 64 kbps. The audio compact disk
(CD) also uses PCM, with a sampling rate of 44,100 samples per second with 16 bits
per sample; this gives a rate of 705.6 kbps for mono and 1.411 Mbps for stereo.
PCM-encoded speech and music, however, are rarely used in the Internet.
Instead, as with video, compression techniques are used to reduce the bit rates of the
stream. Human speech can be compressed to less than 10 kbps and still be intelligible. A popular compression technique for near CD-quality stereo music is MPEG 1
layer 3, more commonly known as MP3. MP3 encoders can compress to many different rates; 128 kbps is the most common encoding rate and produces very little
sound degradation. A related standard is Advanced Audio Coding (AAC), which
has been popularized by Apple. As with video, multiple versions of a prerecorded
audio stream can be created, each at a different bit rate.
590 CHAPTER 7 • MULTIMEDIA NETWORKING
Although audio bit rates are generally much less than those of video, users are
generally much more sensitive to audio glitches than video glitches. Consider, for
example, a video conference taking place over the Internet. If, from time to time, the
video signal is lost for a few seconds, the video conference can likely proceed without too much user frustration. If, however, the audio signal is frequently lost, the
users may have to terminate the session.
7.1.3 Types of Multimedia Network Applications
The Internet supports a large variety of useful and entertaining multimedia applications. In this subsection, we classify multimedia applications into three broad categories: (i) streaming stored audio/video, (ii) conversational voice/video-over-IP,
and (iii) streaming live audio/video. As we will soon see, each of these application
categories has its own set of service requirements and design issues.
Streaming Stored Audio and Video
To keep the discussion concrete, we focus here on streaming stored video, which
typically combines video and audio components. Streaming stored audio (such as
streaming music) is very similar to streaming stored video, although the bit rates are
typically much lower.
In this class of applications, the underlying medium is prerecorded video, such
as a movie, a television show, a prerecorded sporting event, or a prerecorded usergenerated video (such as those commonly seen on YouTube). These prerecorded
videos are placed on servers, and users send requests to the servers to view the videos
on demand. Many Internet companies today provide streaming video, including
YouTube (Google), Netflix, and Hulu. By some estimates, streaming stored video
makes up over 50 percent of the downstream traffic in the Internet access networks
today [Cisco 2011]. Streaming stored video has three key distinguishing features.
• Streaming. In a streaming stored video application, the client typically begins
video playout within a few seconds after it begins receiving the video from the
server. This means that the client will be playing out from one location in
the video while at the same time receiving later parts of the video from the
server. This technique, known as streaming, avoids having to download
the entire video file (and incurring a potentially long delay) before playout begins.
• Interactivity. Because the media is prerecorded, the user may pause, reposition
forward, reposition backward, fast-forward, and so on through the video content.
The time from when the user makes such a request until the action manifests itself
at the client should be less than a few seconds for acceptable responsiveness.
• Continuous playout. Once playout of the video begins, it should proceed
according to the original timing of the recording. Therefore, data must be
received from the server in time for its playout at the client; otherwise, users
7.1 • MULTIMEDIA NETWORKING APPLICATIONS 591
experience video frame freezing (when the client waits for the delayed frames)
or frame skipping (when the client skips over delayed frames).
By far, the most important performance measure for streaming video is average
throughput. In order to provide continuous playout, the network must provide an
average throughput to the streaming application that is at least as large the bit rate of
the video itself. As we will see in Section 7.2, by using buffering and prefetching, it
is possible to provide continuous playout even when the throughput fluctuates, as
long as the average throughput (averaged over 5–10 seconds) remains above the
video rate [Wang 2008].
For many streaming video applications, prerecorded video is stored on, and
streamed from, a CDN rather than from a single data center. There are also many
P2P video streaming applications for which the video is stored on users’ hosts
(peers), with different chunks
Các kỹ thuật mã hóa cơ bản mà chúng tôi chỉ mô tả được gọi là pulse code modulation(PCM). Bài phát biểu mã hóa thường sử dụng PCM, với một tỷ lệ lấy mẫu 8000 mẫu mỗiThứ hai và 8 bit / mẫu, kết quả là một tỷ lệ của 64 kbps. Đĩa compact âm thanh(CD) cũng sử dụng PCM, với một tỷ lệ lấy mẫu mẫu 44,100 mỗi thứ hai với 16 bitmỗi mẫu; Điều này cung cấp cho một tỷ lệ 705.6 kbps cho mono và 1.411 Mbps cho âm thanh stereo.PCM mã hóa giọng nói và âm nhạc, Tuy nhiên, hiếm khi được sử dụng trên Internet.Thay vào đó, như với video, kỹ thuật nén được sử dụng để giảm tỷ lệ bit của cácdòng. Bài phát biểu của con người có thể được nén để ít hơn 10 kbps và vẫn còn được minh bạch. Một kỹ thuật nén phổ biến nhất gần đĩa CD-chất lượng âm thanh stereo âm nhạc là MPEG 1lớp 3, thường được biết đến như MP3. Bộ mã hóa MP3 có thể nén với nhiều mức độ khác nhau; 128 kbps là mức mã hóa phổ biến nhất và tạo ra rất ítâm thanh xuống cấp. Một tiêu chuẩn có liên quan là Advanced Audio Coding (AAC), màđã được phổ biến rộng rãi bởi Apple. Như với video, nhiều phiên bản của một prerecordeddòng suối âm thanh có thể được tạo ra, mỗi lúc một tỷ lệ bit khác nhau.590 CHƯƠNG 7 • MẠNG ĐA PHƯƠNG TIỆNMặc dù tỷ lệ bit âm thanh thường ít hơn nhiều so với những người trong video, người dùngthông thường nhiều hơn nữa nhạy cảm với âm thanh ổn định hơn video ổn định. Xem xét, choVí dụ, một hội nghị video diễn ra trên Internet. Nếu, theo thời gian, cáctín hiệu video bị mất trong một vài giây, hội nghị video có thể có khả năng tiến hành mà không có quá nhiều sự thất vọng người sử dụng. Nếu, Tuy nhiên, các tín hiệu âm thanh là thường xuyên bị mất, cácngười dùng có thể chấm dứt các phiên họp.7.1.3 loại đa mạng ứng dụngInternet hỗ trợ nhiều ứng dụng hữu ích và giải trí đa phương tiện. Trong tiểu mục này, chúng tôi phân loại các ứng dụng đa phương tiện vào ba loại rộng: (i) được lưu trữ âm thanh/video streaming, (ii) đàm thoại bằng giọng nói/video-over-IP,và (iii) streaming audio/video trực tiếp. Như chúng tôi sẽ sớm thấy, mỗi người trong số ứng dụngthể loại đã thiết lập riêng của mình về yêu cầu dịch vụ và các vấn đề thiết kế.Trực tuyến lưu trữ âm thanh và VideoĐể giữ cho các cuộc thảo luận cụ thể, chúng tôi tập trung ở đây trên trực tuyến lưu trữ video, đóthông thường kết hợp các thành phần của video và âm thanh. Streaming âm thanh được lưu trữ (chẳng hạn nhưstreaming âm nhạc) là rất tương tự như video được lưu trữ trực tuyến, mặc dù tỷ lệ bitthường thấp hơn nhiều.Trong lớp này của các ứng dụng, các phương tiện cơ bản prerecorded video, chẳng hạn nhưlà một bộ phim, show truyền hình, một sự kiện thể thao prerecorded hoặc một usergenerated prerecorded video (chẳng hạn như những người thường thấy trên YouTube). Các prerecordedvideo được đặt trên các máy chủ, và người dùng gửi yêu cầu đến các máy chủ để xem các videotheo yêu cầu. Rất nhiều các công ty Internet ngày nay cung cấp video trực tuyến, bao gồm cảYouTube (Google), Netflix và Hulu. Theo một số ước tính, được lưu trữ video trực tuyếnlàm cho hơn 50 phần trăm của lưu lượng truy cập ở phía trong mạng truy cập Internetngày nay [Cisco 2011]. Lưu trữ video trực tuyến, có ba tính năng quan trọng để phân biệt.• Streaming. Trong một ứng dụng video được lưu trữ trực tuyến, khách hàng thường bắt đầuplayout video trong vòng vài giây sau khi nó bắt đầu nhận được các video từ cácHệ phục vụ. Điều này có nghĩa rằng khách hàng sẽ chơi từ một địa điểm ởtrong khi video cùng lúc nhận được các bộ phận sau của đoạn video từ cácHệ phục vụ. Kỹ thuật này, được gọi là trực tuyến, tránh có để tải vềtoàn bộ tập tin video (và incurring một sự chậm trễ lâu dài có khả năng) trước khi playout bắt đầu.• Tương tác. Bởi vì phương tiện truyền thông prerecorded, người dùng có thể tạm dừng, đặt lại vị tríphía trước, reposition lạc hậu, nhanh về phía trước, và như vậy trên thông qua nội dung video.Thời gian từ khi người sử dụng làm cho một yêu cầu cho đến khi hành động thể hiện bản thânkhách hàng nên có ít hơn một vài giây để chấp nhận được để đáp ứng.• Liên tục playout. Sau khi playout video bắt đầu, nó sẽ tiến hànhtheo thời gian ban đầu của đoạn ghi âm. Do đó, dữ liệu phảinhận được từ các máy chủ trong thời gian cho playout tại khách hàng; Nếu không, người dùng7.1 • ĐA PHƯƠNG TIỆN MẠNG ỨNG DỤNG 591trải nghiệm video khung đóng băng (khi khách hàng chờ đợi cho các khung bị trì hoãn)hoặc bỏ qua khung (khi khách hàng bỏ qua trên khung chậm trễ).Bởi đến nay, các biện pháp hiệu suất quan trọng nhất cho streaming video là trung bìnhthông qua. Để cung cấp liên tục playout, mạng phải cung cấp mộtTrung bình băng thông cho các ứng dụng streaming có ít lớn tỷ lệ bit củaCác video riêng của mình. Như chúng ta sẽ thấy trong phần 7.2, bằng cách sử dụng bộ đệm và tải trước, nócó thể cung cấp liên tục playout ngay cả khi thông qua sự biến động, như làmiễn là những thông lượng trung bình (trung bình hơn 5-10 giây) vẫn còn ở trên cáctỷ lệ video [Wang 2008].Cho nhiều ứng dụng video streaming, prerecorded video được lưu trữ trên, vàxem trực tiếp từ một đô la Canada chứ không phải là từ một trung tâm dữ liệu duy nhất. Có cũng nhiềuP2P video streaming ứng dụng mà các video được lưu trữ trên máy chủ của người dùng(đồng nghiệp), với các khối khác nhau
đang được dịch, vui lòng đợi..
Các kỹ thuật mã hóa cơ bản mà chúng ta vừa mô tả được gọi là điều biến mã xung
(PCM). Mã hóa Speech thường sử dụng PCM, với một tỷ lệ lấy mẫu của 8.000 mẫu mỗi
thứ hai và 8 bit cho mỗi mẫu, kết quả là tỷ lệ 64 kbps. Các đĩa nhỏ gọn âm thanh
(CD) cũng sử dụng PCM, với một tỷ lệ lấy mẫu của 44.100 mẫu mỗi thứ hai với 16 bit
cho mỗi mẫu; điều này cho phép một tỷ lệ 705,6 kbps cho mono và 1.411 Mbps cho âm thanh stereo.
bài phát biểu PCM-mã hóa và âm nhạc, tuy nhiên, hiếm khi được sử dụng trong Internet.
Thay vào đó, như với video, kỹ thuật nén được sử dụng để giảm tốc độ bit của
dòng. Ngôn ngữ con người có thể được nén đến dưới 10 kbps và vẫn có thể hiểu được. Một kỹ thuật nén phổ biến cho âm nhạc stereo gần CD-chất lượng là MPEG 1
lớp 3, thường được biết đến như MP3. Bộ mã hóa MP3 có thể nén nhiều mức độ khác nhau; 128 kbps là tốc độ mã hóa phổ biến nhất và tạo ra rất ít
sự xuống cấp âm thanh. Một tiêu chuẩn có liên quan là Advanced Audio Coding (AAC), trong đó
đã được phổ biến bởi Apple. Như với video, nhiều phiên bản của một thu nhận được
dòng âm thanh có thể được tạo ra, mỗi lúc một tốc độ bit khác nhau.
590 Chương 7 • MULTIMEDIA MẠNG
Mặc dù tỷ lệ bit, âm thanh nói chung là ít hơn nhiều hơn so với các video, người dùng
thường nhạy cảm hơn để ổn âm thanh hơn ổn định video. Xem xét, ví
dụ, một hội nghị video diễn ra trên Internet. Nếu, theo thời gian, các
tín hiệu video bị mất trong một vài giây, các hội nghị video có khả năng có thể tiến hành mà không có quá nhiều người dùng thất vọng. Tuy nhiên, nếu các tín hiệu âm thanh được thường xuyên bị mất,
người dùng có thể phải chấm dứt phiên.
7.1.3 Các loại ứng dụng mạng Đa phương tiện
Internet hỗ trợ một lượng lớn các ứng dụng đa phương tiện hữu ích và giải trí. Trong tiểu mục này, chúng tôi phân loại các ứng dụng đa phương tiện thành ba nhóm chính: (i) trực tuyến lưu trữ âm thanh / video, (ii) bằng giọng nói đàm thoại / video-over-IP,
và (iii) truyền trực tiếp âm thanh / video. Như chúng ta sẽ sớm thấy, mỗi một trong các ứng dụng
loại có thiết lập riêng của các yêu cầu dịch vụ và các vấn đề thiết kế.
Truyền trực tuyến lưu trữ Audio và Video
Để giữ cho bê tông thảo luận, chúng tôi tập trung ở đây trên streaming video được lưu trữ, mà
thường kết hợp các thành phần video và âm thanh. Streaming audio được lưu trữ (chẳng hạn như
âm nhạc trực tuyến) là rất tương tự như streaming video được lưu trữ, mặc dù tốc độ bit là
thường thấp hơn nhiều.
Trong lớp học này của các ứng dụng, các phương tiện cơ bản là video được ghi âm, chẳng hạn
như một bộ phim, một chương trình truyền hình, một được ghi âm sự kiện thể thao, hoặc một video UserGenerated được ghi âm (chẳng hạn như những người thường nhìn thấy trên YouTube). Những dùng ghi
video được đặt trên các máy chủ, và người dùng gửi yêu cầu đến máy chủ để xem các đoạn video
theo yêu cầu. Nhiều công ty Internet ngày nay cung cấp streaming video, bao gồm cả
YouTube (Google), Netflix và Hulu. Theo một số ước tính, streaming video được lưu trữ
chiếm hơn 50 phần trăm của lưu lượng hạ nguồn trong mạng truy cập Internet
ngày nay [Cisco 2011]. Streaming video được lưu trữ có ba đặc điểm khác biệt quan trọng.
• Streaming. Trong một tuyến lưu trữ ứng dụng video, các khách hàng thường bắt đầu
phát sóng video trong vòng một vài giây sau khi nó bắt đầu nhận được các video từ các
máy chủ. Điều này có nghĩa rằng các khách hàng sẽ được chơi ra từ một vị trí trong
các video trong khi cùng một lúc nhận được phần sau của đoạn video từ
máy chủ. Kỹ thuật này được gọi là trực tuyến, tránh được việc phải tải về
toàn bộ tập tin video (và phải gánh chịu một sự chậm trễ có khả năng dài) trước khi phát sóng bắt đầu.
• Tương tác. Bởi vì các phương tiện truyền thông là được ghi âm, người dùng có thể tạm dừng, đặt lại vị trí
phía trước, đặt lại vị trí lạc hậu, nhanh về phía trước, và như vậy thông qua các nội dung video.
Hiện từ khi người dùng tạo một yêu cầu như vậy cho đến khi hành động thể hiện
tại khách hàng nên được ít hơn một vài giây để phản ứng có thể chấp nhận.
• Liên tục phát sóng. Khi phát sóng của phim bắt đầu, cần tiến hành
theo thời gian ban đầu của việc ghi chép. Do đó, dữ liệu phải được
nhận từ máy chủ trong thời gian phát sóng của nó tại các khách hàng; cách khác, người sử dụng
7.1 • MULTIMEDIA MẠNG ỨNG DỤNG 591
khung hình video kinh nghiệm đóng băng (khi khách hàng chờ đợi cho các khung bị trì hoãn)
hoặc khung bỏ qua (khi khách hàng bỏ qua trên khung hình bị trễ).
Cho đến nay, các biện pháp thực hiện quan trọng nhất cho streaming video là trung bình
thông . Để cung cấp phát sóng liên tục, mạng phải cung cấp một
thông lượng trung bình cho các ứng dụng trực tuyến mà là ít nhất là lớn tốc độ bit của
video. Như chúng ta sẽ thấy trong phần 7.2, bằng cách sử dụng đệm và nạp trước, nó
có thể cung cấp cho phát sóng liên tục ngay cả khi thông lượng dao động, như
miễn là thông lượng trung bình (trung bình trên 5-10 giây) vẫn còn trên các
tỷ lệ video [Wang 2008] .
Đối với nhiều ứng dụng video streaming, video được ghi âm được lưu trữ trên, và
xem trực tiếp từ, một CDN hơn là từ một trung tâm dữ liệu duy nhất. Ngoài ra còn có rất nhiều
các ứng dụng video P2P streaming mà video được lưu trữ trên máy chủ của người sử dụng
(đồng nghiệp), với khối khác nhau
đang được dịch, vui lòng đợi..