知识音频音频基本知识

今天给各位分享小知识音频的一些知识，其中也会对音频基本知识进行解释，文章篇幅可能偏长，如果能碰巧解决你现在面临的问题，别忘了关注本站，现在就马上开始吧！

音频基本知识

外界传来的声音引起人耳鼓膜振动经听小骨及其他组织传给听觉神经，听觉神经传给大脑，这样就听到了声音。

音调：声音的高低，由频率决定，频率越高音调越高。

响度：又称音量、音强，由振幅和距离声源的距离决定。

音色：又称音品，由发声物体本身材料、结构决定。

单声道：单声道是指把来自不同方位的音频信号混合后统一由录音器材把它记录下来，再由一只音箱进行重放。在单声道的音响器材中，你只能感受到声音、音乐的前后位置及音色、音量的大小，而不能感受到声音从左到右等横向的移动。

双声道：双声道就是有两个声音通道，其原理是人们听到声音时可以根据左耳和右耳对声音相位差来判断声源的具体位置，在电路上它们往往各自传递的电信号是不一样的，电声学家在追求立体声的过程中，由于技术的限制，在最早的时候只有采用双声道来实现。

立体声：就是指具有立体感的声音。是一个几何概念，是指在三维空间中占有位置的事物。因为声源有确定的空间位置，声音有确定的方向来源，人们的听觉有辨别声源方位的能力，尤其是有多个声源同时发声时，人们可以凭听觉感知各个声源在空间的位置分布状况。

模拟信号：音频信号是典型的连续信号，在时间和幅度上都是连续的。在任何一个特定的时间点都有一个对应是幅值。我们把时间和幅度上都是连续的信号称为模拟信号。

数字信号：在某些特定的时刻对这种模拟信号进行测量叫做采样。在有限个特点时间的采样得到的信号叫做离散时间信号。采到的幅值是一个实数，因此幅度还是一个连续的值，当我们将幅值限定为有限个数值，就称为离散数值信号。我们把时间和幅值都用离散的值表示的时候，此时表示的信号就是数字信号。

人们日常生活听到的各种声音信息是典型的连续信号，它不仅在时间上连续，而且在幅度上也连续，我们称之为模拟音频。在数字音频技术产生之前，我们只能用磁带或胶木唱片来存储模拟音频，随着技术的发展，声音信号逐渐过渡到了数字化存储阶段，可以用计算机等设备将它们存储起来。

模拟音频数字化：对于计算机来说，处理和存储的只可以是二进制数，所以在使用计算机处理和存储声音信号之前，我们必须使用模数转换（A/D）技术将模拟音频转化为二进制数，这样模拟音频就转化为数字音频了。所谓模数转换就是将模拟信号转化为数字信号，模数转换的过程包括采样、量化和编码三个步骤。模拟音频向数字音频的转换是在计算机的声卡中完成的。

采样：采样是指将时间轴上连续的信号每隔一定的时间间隔抽取出一个信号的幅度样本，把连续的模拟量用一个个离散的点表示出来，使其成为时间上离散的脉冲序列。

著名的采样定理（Nyquist定理）中给出有明确的答案：要想不产生低频失真，采样频率至少应为所要录制的音频的最高频率的2倍。例如，电话话音的信号频率约为3.4 kHz，采样频率就应该≥6.8 kHz，考虑到信号的衰减等因素，一般取为8kHz。

量化：将采样后离散信号的幅度用二进制数表示出来的过程称为量化。每个采样点所能表示的二进制位数称为量化精度，或量化位数。量化精度反映了度量声音波形幅度的精度。

编码：采样和量化后的信号还不是数字信号，需要将它转化为数字编码脉冲，这一过程称为编码。模拟音频进采样、量化和编码后形成的二进制序列就是数字音频信号。

PCM编码： PCM（Pulse Code Modulation），即脉冲编码调制，指模拟音频信号只经过采样、模数转换直接形成的二进制序列，未经过任何编码和压缩处理。PCM编码的最大的优点就是音质好，最大的缺点就是体积大。

非平衡音频：使用两根线（一根信号线，一根地线）传送一路（单声道）音频信号。非平衡音频传输过程中信号不稳定，举例说明：比如我们需要将音频信号A从一段传送到另一端，这个过程会有其他型号进入到这一根线，比如电脑的wifi信号B，手机产生的信号C等。等到音频接收端收到的信号就变为了信号A+B+C。

平衡音频信号：使用三跟线（分别是热端、冷端、地线）来传送一路音频信号。传输原理：热端和冷端传送的信号是同一个信号，信号的发送端把一个声音信号分成两路，一路正相进入热端，一个反相后进入冷端。在信号的接收端把冷端进行反相和热端合并，得到最终的信号。

抗干扰原理：我们将音频信号A从一端发送另一端。在发送前，先兵分两路，让原始的A进入热端，把A做一个反相之后进入冷端，变成-A，然后出发！路上遇到了变压器来的干扰B进入线路，。热线上的信号变成了A+B，冷线上的信号变成了-A+B。还有手机干扰C，热线上变成了A+B+C，冷线上变成了-A+B+C。现在到接收端了，先把冷端做一个反相-（-A+B+C）=A-B-C。然后，把这个反相过的冷端和热端的信号混合，也就是（热端）+（冷端）：（A+B+C）+（A-B-C）。

结果呢，不用我说了吧，B和C这两个干扰源在这里正好被完全抵消了！消得干干净净！剩下的只有我们要传送的信号A！

AES/EBU是一种无压缩的数据音频格式，以单向串行码来传送两个声道的高质量数字音频数据（最高24bit量化），及传送相关的控制信息(包括数字信道的源和目的地址、日期时间码、采样点数、字节长度和其它业务信息)并有检测误码的能力。

AES/EBU信号数字格式

同步符：也称引导符，占据每个子帧开头的4bit，用以标识每一个子帧的开始。子帧的开始：分三种情况，分别是一般子帧A，一般子帧B，既是块的开始也是子帧A的开始；用于区分上述三种情况，AES/EBU规定了X、Y、Z三种同步符，用以分别标识。

音频数据：AES/EBU支持 16- 24 bit的音频样本数据。在音频样本大于 20 bit时,数据同时占据辅助和音频数据域;在等于、小于 20

bit时,仅存放在音频数据域中, 4 bit辅助域可用于存放其它数据。

V（合法标记）位：合法标记位表示此音频采样是否正确、有无包错误、是否适合作为数模转换。

U(用户)位：没有定义，可以用户定义使用。

C（通道状态）位：每一个子帧的音频样本都对应一个C（通道状态）位，所以一个块中的A、B子帧各送了192个bit C（通道状态）位；在节目端，各自的192bit被分别记忆组合，形成了两个24字节的数据集合，称为通道状态块。子帧 A、B的通道状态块是独立的,与 A、B声道的音频样品对应。通道状态块每192帧更新一次。

P（奇偶校验）位：为偶校验位,可检出子帧中奇数个错。

通道状态块数据结构：

音频数据：AES/EBU支持 16- 24 bit的音频样本数据。在音频样本大于 20 bit时,数据同时占据辅助和音频数据域;在等于、小于 20 bit时,仅存放在音频数据域中, 4 bit辅助域可用于存放其它数据。

V（合法标记）位：合法标记位表示此音频采样是否正确、有无包错误、是否适合作为数模转换。

U(用户)位：没有定义，可以用户定义使用。

P（奇偶校验）位：为偶校验位,可检出子帧中奇数个错。

通道状态块：

Data Burst Format：

音频知识详解(一)

现实生活中，我们听到的声音都是时间连续的，我们称为这种信号叫模拟信号。模拟信号需要进行数字化以后才能在计算机中使用。

目前我们在计算机上进行音频播放都需要依赖于音频文件。音频文件的生成过程是将声音信息采样、量化和编码产生的数字信号的过程，人耳所能听到的声音，最低的频率是从20Hz起一直到最高频率20KHZ，因此音频文件格式的最大带宽是20KHZ。根据奈奎斯特的理论，只有采样频率高于声音信号最高频率的两倍时，才能把数字信号表示的声音还原成为原来的声音，所以音频文件的采样率一般在40~50KHZ，比如最常见的CD音质采样率44.1KHZ。

采样：波是无限光滑的，采样的过程就是从波中抽取某些点的频率值，就是把模拟信号数字化。如下图所示：

采样频率：单位时间内对模拟信号的采样次数。采样频率越高，声音的还原就越真实越自然，当然数据量就越大。采样频率一般共分为22.05KHz、44.1KHz、48KHz三个等级。8KHz-电话所用采样率,对于人的说话已经足够，22.05KHz只能达到FM广播的声音品质(适用于语音和中等品质的音乐)，44.1KHz则是是最常见的采样率标准，理论上的CD音质界限，48KHz则更加精确一些(对于高于48KHz的采样频率人耳已无法辨别出来了，所以在电脑上没有多少使用价值)。

采样位数(也成量化级、样本尺寸、量化数据位数)：每个采样点能够表示的数据范围。采样位数通常有8bits或16bits两种，采样位数越大，所能记录声音的变化度就越细腻，相应的数据量就越大。8位字长量化（低品质）和16位字长量化（高品质），16 bit是最常见的采样精度。

量化：将采样后离散信号的幅度用二进制数表示出来的过程称为量化。（日常生活所说的量化，就是设定一个范围或者区间，然后看获取到的数据在这个条件内的收集出来）。

PCM： PCM（Pulse Code Modulation），即脉冲编码调制，对声音进行采样、量化过程，未经过任何编码和压缩处理。

声道数：声道数是指支持能不同发声的音响的个数，它是衡量音响设备的重要指标之一。

码率：(也成位速、比特率)是指在一个数据流中每秒钟能通过的信息量，代表了压缩质量。比如MP3常用码率有128kbit/s、160kbit/s、320kbit/s等等，越高代表着声音音质越好。MP3中的数据有ID3和音频数据组成，ID3用于存储歌名、演唱者、专辑、音轨等我们可以常见的信息。

音频帧：音频数据是流式的，本身没有明确的一帧帧的概念，在实际的应用中，为了音频算法处理/传输的方便，一般约定俗成取2.5ms~60ms为单位的数据量为一帧音频。这个时间被称之为“采样时间”，其长度没有特别的标准，它是根据编解码器和具体应用的需求来决定的。

模拟信号->输入设备（传递电压值）->声卡（经过采样跟量化（即设置声音大小等各种值））->磁盘（文件）->声卡->输出设备->模拟信号

我们声音在物理上用波形表示，那么我们将这些波形称作为模拟信号。而我们计算机磁盘只能存储（01010101）的格式。我们将模拟信号转换成能够被磁盘存储的格式（010101）称之为数字信号。这个转换的过程我们叫模数转换。

我们发出来的声音（模拟信号）是连续的，我们如果要一直的对模拟信号进行转化，产生的数字信号会很大。那么我们就要采样，而采样精度就是每秒计算机对模拟信号进行采样的次数。最常见的采样精度就是上面提到的44.1khz/s,这个是经过大师们多年研究得出的数据，低于这个数据，效果就会很差，而高于这个数据，效果的差距不是很明显。

采样后就是变成了（0101010110100101...），那声音的音量是有大小的，那这串数据，怎样表示声音的大小呢？这就涉及到了比特率，它是指在一个数据流中每秒钟能通过的信息量。比特率就是将声音的大小划分为多少等级。举例下：8比特，在二进制中，表示有8位，表示的十进制的值就是0（00000000）～256（11111111），那每个数值就代表着一个声音大小。

经过采样、量化、编码后转化成数字信号，然后存储为文件。

文件是用来装数字信号的，文件包括了比特率、采样率、声道、编码方式、以及被编码过后的数字信号。

文件格式就是制造者自己规定的一种名称，在每个文件格式都会特定支持几种编码格式。打个比方就是文件就是一个容器，里面可以装不同的水，有的可以装一种，有的可以装好几种。

经过采样后的数字信号很大，有时候我们不需要这么大的，所以我们就要进行编码压缩，当然压缩技术都是有损的。在不大影响音频的效果的情况下，舍弃掉一些高频或者低频的数据。

编码格式可以理解为每种音频格式不同的编解码方式。

封装格式就是文件格式，编码就是编码格式。

了解了基础概念之后我们就可以列出一个经典的音频播放流程（以MP3为例）：

在iOS系统中apple对上述的流程进行了封装并提供了不同层次的接口（图片引自官方文档）。

下面对其中的中高层接口进行功能说明：

可以看到apple提供的接口类型非常丰富，可以满足各种类别类需求：

https://msching.github.io/大神之作

https://www.jianshu.com/p/5c5e95d89c4f写的相当不错

https://www.jianshu.com/p/423726cc9090知识点很全

https://www.jianshu.com/p/b3db09fb69dc总结的挺好

https://www.jianshu.com/p/a75f2411225f有点专业，了解一部分

http://blog.csdn.net/liusandian/article/details/52488078概念很清晰易懂

音频小样是什么

问题一：音乐中唱“小样”是什么意思？“小样”指歌曲正式录音制作前的试唱初步效果，一般由唱“小样”的音乐者来完成。不是所有的歌手都识谱的，而唱“小样”的音乐者必须是专业的。初始的旋律称为前奏，还有间奏和结尾部分。

问题二：什么叫歌曲小样?用英文来说就是demo

demo就字面而言是“演示”的意思。在游戏发售前发布的所谓demo版，有的是演示游戏画面，有的是游戏的试玩

或者音乐的小样

demo在大部分的音乐当中是指伴奏音乐,但是有的时候也可以指一段音乐或者旋律的前奏,有的时候还特指音乐的后期处理,例如:Demo A还有其他的解释我就不太清楚了.

问题三：什么叫歌曲小样?用英文来说就是demo demo就字面而言是“演示”的意思。在游戏发售前发布的所谓demo版，有的是演示游戏画面，有的是游戏的试玩或者音乐的小样 demo在大部分的音乐当中是指伴奏音乐,但是有的时候也可以指一段音乐或者旋律的前奏,有的时候还特指音乐的后期处理,例如:Demo A还有其他的解释我就不太清楚了.

问题四：什么叫做音乐作品小样？ demo

简单来说就是演示样品

问题五：音乐Midi小样是什么？音乐人把音乐制作出来后找人唱小样，然后再卖给歌手，歌手跟着小样学就行

问题六：怎样制作音乐小样? MIDI是现在电子音乐发展的一个趋势，就现在的技术，已经算是比较完善的了，如果你拥有一套很牛的设备，是完全可以用MIDI来代替真实乐器的。但是如果要想达到那种效果的话，那些设备的投资也是很大的。一个普通的家庭音乐工作室至少也要1万左右。如果你只想制作MIDI的话，也是有一种节约的方法的。

其实制作小样，只要你会吉他或者是钢琴已经足够了。袁惟仁老师（代表作《旋木》）的大部分作品都是以吉他为主的。如果你MIDI制作得好的话，也是完全可以制作出一个很完美的伴奏的，不过学习MIDI里面也有很多很多的困难。

一般你可以用这种方法来制作小样，在你有完整作品的情况下，先用吉他来弹伴奏，然后再加上唱，两轨合在一起就可以了。不过你如果会做MIDI的话，在录了吉他伴奏以后，还可以制作鼓，电吉他，贝司，钢琴，以及其他很多很多音色进去。在伴奏做好后，就可以加入人声了。加上一些后期处理，你的作品就算是完成了。

以上都是些大致过程，其中还有很多很多细节问题。

问题七：音乐中“粗糙的半成品小样”是指什么？刚录完音的半成品的磁带。

问题八：怎样做歌曲小样如果你不着急，也不怕麻烦，自己去音频制作、录制小样之类的论坛去学习，网址很多，自己找就可以了，需要学习音乐制作软件，我想说一句，对一个初学者来说这不是一件简单的事情，你肯定不能清唱（除非你的歌实在是太好听了），你需要有伴奏，伴奏就需要乐器或者用软件里的乐器音色，我不知道你的音乐水平怎么样，反正你必须要具有一定的音乐理论知识，要把握好歌曲的编配，唱和伴奏解决了之后你还要进行后期制作，也就是说要把整首歌处理到最佳，也就是听起来舒服音色好。当然，你经济允许的情况下也可以找音乐工作室之类的帮你录制，一般是千元左右吧，这是保守估计，因为你只有唱，剩下的伴奏、音乐编配等等都是别人来做。

以上就是一个大概的框架，下面说句题外话，我不赞成你给唱片公司直接寄去小样，我不知道你对国内的唱片公司了解多少，他们有专门存放小样的地方，可以说是成堆的，都是全国各地寄来的，你觉得他们有多大的几率会拿起你的小样然后花上一些时间去认真的听？我在北京做过几年的乐队，对乐坛还算有些了解，这个方法行不通，如果你有实力，创作的歌曲也受欢迎，公司会找你谈，前提是要让他们知道你，所以唱片公司总喜欢关注这超女那快男，因为唱片公司是要挣钱的，一般情况下他们需要知道你的音乐会不会有市场才能考虑和你谈，能和唱片公司坐下来谈谈自己的音乐是绝大多数未出名音乐人的目标，只有进行到了这一步才有可能往下谈签约的事情，这个过程一般是很艰难的，还是那句话，除非你的音乐确实出众。当然你要是有关系的话可以找经纪人之类的直接把你的小样送到有关人士那里让他们听，这只是让他们听而已，在没有把握的情况下任何唱片公司都不会贸然和一个没有一定影响力的音乐人签约的。

我就说这么多，坚持下去，因为这也是我曾经的一个梦，现在已经醒了，呵呵，祝你成功！

问题九：音乐后期制作中什么是娱乐小样级出版发行级网络发行级娱乐小样一般就是非常简单的编曲和制作算是比较低质量的曲子

网络发行没有这个说法因为发在网络上不需要任何部门的许可如果说的是一般网络歌曲的质量

那你可以找找许嵩徐良早期的歌曲编曲伴奏以及录音混音方面就是那个层次

至于出版发行是在文化局拿到出版许可正式出版发行的音像制品

就是你可以听到歌手的专辑唱片那种

好了，文章到这里就结束啦，如果本次分享的小知识音频和音频基本知识问题对您有所帮助，还望关注下本站哦！

知识宝库

知识音频音频基本知识

音频基本知识

音频知识详解(一)

音频小样是什么

相关内容

最新更新

知识宝库

知识音频 音频基本知识

音频基本知识

音频知识详解(一)

音频小样是什么

相关内容

最新更新

知识音频音频基本知识