【音视频】音视频录制、播放原理

news/2025/2/26 20:10:03

一、音视频录制原理

通常,音视频录制的步骤如下图所示:
在这里插入图片描述

  • 我们分别从音频和视频开始采样,通过麦克风和摄像头来接受我们的音频信息和图像信息,这通常是同时进行的,不过,通常视频的采集会比音频的采集慢,因此我们需要对采样后的数据进行同步,也就是对相应的音频帧和视频帧进行同步。通常我们会引入一个时钟作为同步标志,可以是视频作为主时钟,也可以是音频,或者是使用系统时钟作为同步等等,不过在实际中,使用音频作为主时钟比较常见,因为人对音频的感受更为明显。

  • 采集到音频帧和视频帧之后,通常会根据需要对它们做一层处理,比如对音频进行降噪增益调整等操作,而对于视频帧,可以进行例如饱和度调整、锐化等操作。

  • 处理好的音频帧和视频帧会放入分别放入一个队列中,这个队列用于存储临时的帧,以便后续的编码操作。同时队列也有着缓冲区的作用,可以避免采样和编码速度不匹配等情况。

  • 队列中的帧会被取出,用于相应的音频、视频编码,这一步是为了使用特定的格式,如音频的MP3AAC,视频的H264H265。经过压缩后的音视频体积将大大减小,方便后续的传输和存储。

  • 编码后的音视频将放入音频包和视频包队列,等待进一步处理。

  • 接着,从包队列中取出音视频数据,通过复用器音视频进行封装,也就是使用各种容器包装音视频,如MP4TSAVI

  • 最后,这些特定格式的容器就可以作为文件保存了,也就是我们平常创建的视频文件。

复用器是一个音视频封装的工具,可以将经过编码后的音视频数据包,使用特定的容器格式,如MP4、AVI等,合成一个完整的音视频文件

二、音视频播放原理

音视频播放的步骤通常与录制相反,二者可以看做是各自的逆操作,通常,步骤如下图所示:
在这里插入图片描述

  • 首先我们从系统中读取媒体文件,如(MP4AVI等),文件中通常包含着编码好的音频流和视频流,有时还有字幕流等,那么我们就需要将文件中的这些对应流进行分离,才能进行下一步处理。
  • 我们利用解复用器就可以将媒体文件中的音频和视频数据还原出来,这一步称为音视频解封装
  • 解封装出来的音视频数据将被存放在音频包、视频包队列中,等待后续的解码操作。
  • 从对应的队列中取出数据包,就需要对相应的数据包进行解码,如音频的AACMP3、视频的H264、H264等,通常,解码的难度通常比编码的难度小。解码后的数据包变成了录制时的帧数据,存储在帧队列中,等待后续的渲染操作。
  • 从视频帧和音频队列取出帧之后,如果无需进行特殊处理,我们可以对其进行同步,而同步策略通常以音频作为主时钟。有时,我们还可以将同步策略放在处理帧之后。
  • 最终,处理好的音频和视频帧结果处理和调整,将同步渲染到外部设备中,如扬声器和显示器等,此时的视频才真正被播放出来,经过我们的眼睛和耳朵接收到。

解复用器与录制时的复用器相反,它主要是把封装在一起的音频和视频数据包分离出来,变成独立的音频数据和视频数据


http://www.niftyadmin.cn/n/5869131.html

相关文章

网络原理---HTTP/HTTPS

通过之前的网络编程,我们已经初步了解UDP和TCP的基本实现方法,接下来我们对其进一步的学习。 在网络编程中: 1.读和写数据通过Socket,通过Socket内置的InputStream和OutputStream(读写的基本单位都是字节)。2.当在编…

半导体芯片制造中 W CVD(钨化学气相沉积)

半导体芯片制造中 W CVD(钨化学气相沉积) 的 Nucleation 解析 在钨(W)化学气相沉积(CVD)工艺中,Nucleation(成核) 是沉积过程的初始阶段,指钨原子或分子在基…

Ollama辅助工具在思源笔记中的核心玩法助力实现AI高效创作

前言:在创作的道路上,找到合适的工具就像找到了一位贴心的好伙伴。思源笔记以其强大的编辑功能、灵活的整理方式和丰富的插件支持,成为了许多写作者的心头好。无论是记录闪现的灵感火花,还是撰写复杂的文档,它都能轻松…

基于STM32的智能工业生产线质量检测系统

1. 引言 传统工业质检依赖人工目检与抽样检测,存在效率低、漏检率高、标准不统一等问题。本文设计了一款基于STM32的智能工业生产线质量检测系统,通过机器视觉、多传感器融合与AI缺陷识别技术,实现产品全检自动化、缺陷分类精准化与质量追溯…

深入解析React useEffect与useLayoutEffect:区别、原理与实践

🌌 ‌深入解析React useEffect与useLayoutEffect:区别、原理与实践 在React函数组件中,useEffect和useLayoutEffect是处理副作用的两个核心Hook。它们看似相似,但在执行时机和应用场景上有本质区别。本文将通过‌原理剖析‌、‌对…

【虚拟仪器技术】labview操作指南和虚拟仪器技术习题答案(一)

今天是2025年2月24日,画的是fate/Grand Order里面的阿尔托莉雅.卡斯特,武内老师的画。 目录 第1章 第2章 第3章 第4章 第5章 关注作者了解更多 我的其他CSDN专栏 毕业设计 求职面试 大学英语 过程控制系统 工程测试技术 虚拟仪器技术 可编程…

Python游戏编程之赛车游戏6-2

3.2 move()方法的定义 Player类的move()方法用于玩家控制汽车左右移动,当玩家点击键盘上的左右按键时,汽车会相应地进行左右移动。 move()方法的代码如图7所示。 图7 move()方法的代码 其中,第20行代码通过pygame.key.get_pressed()函数获…

Java进阶(vue基础)

目录 1.vue简单入门 ?1.1.创建一个vue程序 1.2.使用Component模板(组件) 1.3.引入AXOIS ?1.4.vue的Methods(方法) 和?compoted(计算) 1.5.插槽slot 1.6.创建自定义事件? 2.Vue脚手架安装? 3.Element-UI的…