多媒体网络不是一组协议的集合,而是在不可靠、无保证的网络之上,构造"人类可感知连续体验"的系统工程。
多媒体网络面对的是一组不可消除、只能权衡的根本矛盾:
这些矛盾决定了: 👉 多媒体网络无法依赖网络本身的确定性,只能通过端系统与应用层机制进行补偿。
多媒体网络并不追求“网络指标最优”,而是追求:
感知质量最优(QoE, Quality of Experience)
因此,系统设计遵循的不是“零丢包、零错误”,而是:
┌──────────────────────┐
│ 用户感知层(QoE) │ ← 连续体验、音画同步
├──────────────────────┤
│ 应用适配层 │ ← 编码、缓存、自适应
├──────────────────────┤
│ 媒体承载层 │ ← RTP / UDP / TCP
├──────────────────────┤
│ 会话与控制平面 │ ← SIP / RTSP
├──────────────────────┤
│ 网络服务模型 │ ← Best Effort / DiffServ / QoS
└──────────────────────┘
关键思想:
👉 核心思想: 空间冗余换时间连续性(压缩 + 缓冲)
👉 核心思想: 允许不完整,但不能不及时
缓存不是性能优化,而是时间不确定性的吸收器:
服务器
└─ TCP发送缓存
↓
网络
↓
客户端
└─ TCP接收缓存
↓
└─ 应用播放缓存
↓
解码与显示
关键点
典型协议:RTP / RTSP 设计哲学:
👉 时间优先于完整性
关键机制
适应性 HTTP 流(DASH)
👉 用时间换确定性
| 维度 | UDP 实时流 | HTTP 流 |
|---|---|---|
| 核心目标 | 低时延 | 稳定播放 |
| 丢包处理 | 忽略 / 掩盖 | 重传 |
| 网络适应 | 弱 | 强 |
| 工程可部署性 | 低 | 高 |
👉 宁可丢,也不能等
策略选择
| 方法 | 本质 | 代价 |
|---|---|---|
| 前向纠错 | 空间换可靠性 | 带宽增加 |
| 交织 | 时间分摊风险 | 时延增加 |
| 掩盖 | 感知容忍 | 信号失真 |
提供但不保证
👉 RTP 不解决问题,只暴露问题给应用
解决的问题
👉 SIP 本质上是:
实时通信世界的“HTTP + DNS”
| 模型 | 思想 | 现实地位 |
|---|---|---|
| 尽力而为 | 简单、可扩展 | 主流 |
| 区分服务 | 有限优先级 | 局部使用 |
| QoS 保证 | 确定性 | 理论理想 |
👉 互联网选择了“应用层复杂,网络层简单”
这是一个工程与现实博弈的结果:
👉 胜出的不是最"优雅"的方案,而是最能活下来的方案。
多媒体网络核心能力
├── 时间连续性
│ ├── 缓存
│ ├── 延迟播放
├── 带宽适应性
│ ├── 预取
│ ├── 自适应码率
├── 丢包容忍
│ ├── FEC
│ ├── 掩盖
└── 会话控制
├── 建立
├── 维护
└── 终止