视频格式就是通常所说的.mp4
,.flv
,.ogv
,.webm
等。简单来说,它其实就是一个盒子,用来将实际的视频流以一定的顺序放入,确保播放的有序和完整性。
(资料图)
视频压缩格式和视频格式具体的区别就是,它是将原始的视频码流变为可用的数字编码。因为,原始的视频流非常大,打个比方就是,你直接使用手机录音,你会发现你几分钟的音频会比市面上出现的 MP3 音频大小大很多,这就是压缩格式起的主要作用。
首先,由原始数码设备提供相关的数字信号流,然后经由视频压缩算法,大幅度的减少流的大小,然后交给视频盒子,打上相应的dts,pts字段,最终生成可用的视频文件。
DTS(Decoding Time Stamp):即解码时间戳,这个时间戳的意义在于告诉播放器该在什么时候解码这一帧的数据。
PTS(Presentation Time Stamp):即显示时间戳,这个时间戳用来告诉播放器该在什么时候显示这一帧的数据。
视频实际上就是一帧一帧的图片,拼接起来进行播放而已。而图片本身也可以进行相关的压缩,比如去除重复像素,合并像素块等等。不过,还有另外一种压缩方法就是,运动估计和运动补偿压缩,因为相邻图片一定会有一大块是相似的,所以,为了解决这个问题,可以在不同图片之间进行去重。
所以,总的来说,常用的编码方式分为三种:
变换编码:消除图像的帧内冗余运动估计和运动补偿:消除帧间冗余熵编码:提高压缩效率熵编码即编码过程中按熵原理不丢失任何信息的编码。信息熵为信源的平均信息量(不确定性的度量)。常见的熵编码有:香农(Shannon)编码、哈夫曼(Huffman)编码和算术编码(arithmetic coding)。
现在,常用的直播协议有 RTMP,HLS,HTTP-FLV。最常用的还是 HLS 协议,因为支持度高,技术简单,但是延迟非常严重。这对一些对实时性比较高的场景,比如运动赛事直播来说非常的不友好。这里来细分的看一下每个协议。
协议 | 优势 | 劣势 | 延时 |
HLS | 支持性广 | 延时巨高 | 10s 以上 |
RTMP | 延时性好,灵活 | 量大的话,负载较高 | 1s 以上 |
HTTP-FLV | 延时性好,游戏直播常用 | 只能在手机 APP 播放 | 2s 以上 |
HLS 全称是 HTTP Live Streaming。这是Apple提出的直播流协议。
HLS 由两部分构成,一个是.m3u8
文件,一个是.ts
视频文件(TS 是视频文件格式的一种)。整个过程是,浏览器会首先去请求.m3u8
的索引文件,然后解析m3u8
,找出对应的.ts
文件链接,并开始下载。
他的使用方式为:
直接可以将m3u8
写进src
中,然后交由浏览器自己去解析。当然也可以采取fetch
来手动解析并获取相关文件。HLS 详细版的内容比上面的简版多了一个playlist
,也可以叫做master
。在master
中,会根据网络段实现设置好不同的 m3u8 文件,比如,3G/4G/wifi 网速等。比如,一个 master 文件中为:
#EXTM3U#EXT-X-VERSION:6#EXT-X-STREAM-INF:PROGRAM-ID=1,BANDWIDTH=2855600,CODECS="avc1.4d001f,mp4a.40.2",RESOLUTION=960x540live/medium.m3u8#EXT-X-STREAM-INF:PROGRAM-ID=1,BANDWIDTH=5605600,CODECS="avc1.640028,mp4a.40.2",RESOLUTION=1280x720live/high.m3u8#EXT-X-STREAM-INF:PROGRAM-ID=1,BANDWIDTH=1755600,CODECS="avc1.42001f,mp4a.40.2",RESOLUTION=640x360live/low.m3u8#EXT-X-STREAM-INF:PROGRAM-ID=1,BANDWIDTH=545600,CODECS="avc1.42001e,mp4a.40.2",RESOLUTION=416x234live/cellular.m3u8
大家只要关注BANDWIDTH
(带宽)字段,其他的看一下字段内容大致就清楚了。假如这里选择high.m3u8
文件,那么,里面内容为:
#EXTM3U#EXT-X-VERSION:6#EXT-X-TARGETDURATION:10#EXT-X-MEDIA-SEQUENCE:26#EXTINF:9.901,http://media.example.com/wifi/segment26.ts#EXTINF:9.901,http://media.example.com/wifi/segment27.ts#EXTINF:9.501,http://media.example.com/wifi/segment28.ts
注意,其中以ts
结尾的链接就是在直播中真正需要播放的视频文件。该第二级的m3u8
文件也可以叫做media
文件。该文件,其实有三种类型:
<https://developer.apple.com/library/archive/referencelibrary/GettingStarted/AboutHTTPLiveStreaming/about/about.html>
HLS 缺陷就是延迟性太大了。HLS 中的延时包括:
TCP 握手m3u8 文件下载m3u8 文件下所有 ts 文件下载这里先假设每个 ts 文件播放时长为 5s,每个 m3u8 最多可携带的 ts 文件数为 3~8。那么最大的延迟则为 40s。注意,只有当一个m3u8
文件下所有的 ts 文件下载完后,才能开始播放。这里还不包括 TCP 握手,DNS 解析,m3u8 文件下载。所以,HLS 总的延时是非常令人绝望的。
那解决办法有吗? 有,很简单,要么减少每个 ts 文件播放时长,要么减少m3u8
的中包含 ts 的数量。如果超过平衡点,那么每次请求新的 m3u8 文件时,都会加上一定的延时,所以,这里需要根据业务指定合适的策略。
RTMP 全称为:Real-Time Messaging Protocol
。它是基于FLV
格式进行开发的,所以,第一反应就是,又不能用了!!!
是的,在现在设备中,由于 FLV 的不支持,基本上 RTMP 协议在 Web 中,根本用不到。不过,由于MSE
(MediaSource Extensions)的出现,在 Web 上直接接入 RTMP 也不是不可能的。基本思路是根据 WebSocket 直接建立长连接进行数据的交流和监听。RTMP 协议根据不同的套层,也可以分为:
RTMP 内部是借由 TCP 长连接协议传输相关数据,所以,它的延时性非常低。并且,该协议灵活性非常好(所以,也很复杂),它可以根据 message stream ID 传输数据,也可以根据 chunk stream ID 传递数据。两者都可以起到流的划分作用。流的内容也主要分为:视频,音频,相关协议包等。
该协议和 RTMP 比起来其实差别不大,只是落地部分有些不同:
RTMP 是直接将流的传输架在 RTMP 协议之上,而 HTTP-FLV 是在 RTMP 和客户端之间套了一层转码的过程,由于,每个 FLV 文件是通过 HTTP 的方式获取的,所以,它通过抓包得出的协议头需要使用chunked编码。
Content-Type:video/x-flvExpires:Fri, 10 Feb 2017 05:24:03 GMTPragma:no-cacheTransfer-Encoding:chunked
它用起来比较方便,不过后端实现的难度和直接使用 RTMP 来说还是比较大的。
由于各大浏览器的对 FLV 的围追堵截,导致 FLV 在浏览器的生存状况堪忧,但是,FLV 凭借其格式简单,处理效率高的特点,使各大视频后台的开发者都舍不得弃用,如果一旦更改的话,就需要对现有视频进行转码,比如变为 MP4,这样不仅在播放,而且在流处理来说都有点重的让人无法接受。而 MSE 的出现,彻底解决了这个尴尬点,能够让前端能够自定义来实现一个 Web 播放器,确实完美。(不过,苹果觉得没这必要,所以,在 IOS 上无法实现。)
MSE 全称就是Media Source Extensions
。它是一套处理视频流技术的简称,里面包括了一系列 API:Media Source
,Source Buffer
等。在没有 MSE 出现之前,前端对 video 的操作,仅仅局限在对视频文件的操作,而并不能对视频流做任何相关的操作。现在 MSE 提供了一系列的接口,使开发者可以直接提供 media stream。
来看一下 MSE 是如何完成基本流的处理的。
var vidElement = document.querySelector("video");if (window.MediaSource) { var mediaSource = new MediaSource(); vidElement.src = URL.createObjectURL(mediaSource); mediaSource.addEventListener("sourceopen", sourceOpen);} else { console.log("The Media Source Extensions API is not supported.")}function sourceOpen(e) { URL.revokeObjectURL(vidElement.src); var mime = "video/webm; codecs="opus, vp9""; var mediaSource = e.target; var sourceBuffer = mediaSource.addSourceBuffer(mime); var videoUrl = "droid.webm"; fetch(videoUrl) .then(function(response) { return response.arrayBuffer(); }) .then(function(arrayBuffer) { sourceBuffer.addEventListener("updateend", function(e) { if (!sourceBuffer.updating && mediaSource.readyState === "open") { mediaSource.endOfStream(); } }); sourceBuffer.appendBuffer(arrayBuffer); });}
上面这个例子可以简单理解为:
第一步,通过异步拉取数据。第二步,通过 MediaSource 处理数据。第三步,将数据流交给 audio/video 标签进行播放。而中间传递的数据都是通过Buffer
的形式来进行传递的。
中间有个需要注意的点,MS 的实例通过URL.createObjectURL()
创建的 url 并不会同步连接到 video.src。换句话说,URL.createObjectURL()
只是将底层的流(MS)和 video.src 连接中间者,一旦两者连接到一起之后,该对象就没用了。
MediaSource 是 Media Source Extensions API 表示媒体资源 HTMLMediaElement 对象的接口。MediaSource 对象可以附着在 HTMLMediaElement 在客户端进行播放。
MS(MediaSource) 只是一系列视频流的管理工具,它可以将音视频流完整的暴露给 Web 开发者来进行相关的操作和处理。所以,它本身不会造成过度的复杂性。
MS 整个只挂载了 4 个属性,3 个方法和 1 个静态测试方法。
4 个属性:
sourceBuffers: 获得当前创建出来的 SourceBufferactiveSourceBuffers: 获得当前正处于激活状态的 SourceBufferreadyState: 返回当前 MS 的状态,比如:closed
,open
,ended
.duration: 设置当前 MS 的播放时长。3 个方法:
addSourceBuffer(): 根据给定的 MIME 创建指定类型的 SourceBufferremoveSourceBuffer(): 将 MS 上指定的 SourceBuffer 移除。endOfStream(): 直接终止该流1 个静态测试方法:
isTypeSupported(): 主要用来判断指定的音频的 MIME 是否支持。最基本的就是使用addSourceBuffer
该方法来获得指定的 SourceBuffer。
var sourceBuffer = mediaSource.addSourceBuffer("video/mp4; codecs="avc1.42E01E, mp4a.40.2"");
资料:<https://developer.mozilla.org/zh-CN/docs/Web/API/MediaSource>
SourceBuffer 接口表示通过 MediaSource 对象传递到 HTMLMediaElement 并播放的媒体分块。它可以由一个或者多个媒体片段组成。
一旦利用 MS 创建好 SourceBuffer 之后,后续的工作就是将额外获得的流放进 Buffer 里面进行播放即可。所以,SourceBuffer 提供两个最基本的操作appendBuffer
,remove
。之后,就可以通过appendBuffer
直接将 ArrayBuffer 放进去即可。
其中,SourceBuffer 还提供了一个应急的方法abort()
如果该流发生问题的话可以直接将指定的流给废弃掉。
音视频的 ArrayBuffer 通过 MediaSource 和 SourceBuffer 的处理直接将
&&
接入。然后,就可以实现正常播放的效果。
资料:<https://developer.mozilla.org/zh-CN/docs/Web/API/SourceBuffer>
flv.js是来自Bilibli的开源项目。它解析FLV文件传给原生HTML5 Video标签播放音视频数据,使浏览器在不借助Flash的情况下播放FLV成为可能。
flv.js只做了一件事,在获取到FLV格式的音视频数据后通过原生的JS去解码FLV数据,再通过Media Source Extensions API 传递给原生HTML5 Video标签。(HTML5 原生仅支持播放 mp4/webm 格式,不支持 FLV)
//下载flv.js包npm i flv.js -S//引入flv.js包import flv from "flv.js"//HTML部分//script部分//创建一个Player实例,它接收一个MediaDataSource(必选), 一个Config(可选) flvjs.createPlayer(mediaDataSource: MediaDataSource, config?: Config)export default { data() { return { player: null, } }, created() { if (flv.isSupported()) { this.player = flv.createPlayer({ type: "flv", isLive: true, url: "https://api.tjdataspace.com/flv.flv" }, { enableWorker: true, enableStashBuffer: false, stashInitialSize: 128, } ); } }, mounted() { this.player.attachMediaElement(this.$refs.myVideo); this.player.load(); this.player.play(); setInterval(() => { if (!this.player.buffered.length) {return;} let end = this.player.buffered.end(0); let diff = end - this.player.currentTime; if (diff >= 1.5) { //延时如果大于1.5秒,就让直播跳到当前时间位置播放 this.player.currentTime = end - 0.5; } }, 3 * 60 * 1000); },}
flv.js资料:<https://www.npmjs.com/package/flv.js>
参考资料:
<https://segmentfault.com/a/1190000008916399>
<https://segmentfault.com/a/1190000010440054>
<https://blog.csdn.net/An1090239782/article/details/108972491>
<https://zhuanlan.zhihu.com/p/47773064>
<https://juejin.cn/post/6900540290432499725>