DSP是声卡的核心部件,是处理速度高、集成度大的可编程芯片,能及时处理数据并以所需要的方式传送给用户。就处理以运算为主的工作而言,DSP较一般的CPU快数十倍。DSP减轻了CPU的繁重负担,增加了声卡的智能性,诸如噪声滤波、声音压缩,甚至语音识别等功能都可由DSP完成。
5)音乐合成芯片
音乐合成芯片是处理MIDI音乐的关键,合成音乐有两种方式:频率调制(FM)和波形表(WaveTable)合成方式。较早期的8位声卡SoundBlasterPro采用的是FM合成方式,现大多数16位声卡在保留了FM合成器的基础上采用了波形表合成方式来合成MIDI音乐。波形音效的逼真感远胜于FM合成器的效果。波形合成芯片依靠波形表ROM为其提供波形样本。
6)波形表ROM
并不是所有的波形表都能达到相同的效果,取得成功的关键在于提供足够多的音色样本数据。对于128种声音的GeneralMIDI,利用256KB的空间便可以存放所有乐器的基本数据。但事实上,许多声卡提供了多达4MB的样本数据。
7)CDROM驱动器接口
声卡上含有一个或多个CDROM驱动器接口,如SoundBlaster系列的一些声卡在卡上安排了Panasonic、Sony和Mitsumi三种接口,有一些声卡必须与特定的CDROM驱动器相连,采用SCSI2标准CDROM驱动器的接口卡,使得用户可以使用丰富的CD节目。声卡的附带软件还可以使电脑成为一个功能强大的CD唱机。
8)功率放大器
音频信号在输出之前必须经过功率放大。声卡一般把信号放大到4W输出,输出的立体声音频信号可以接到耳机、有源音响或是功率较大的立体声功放。
9)总线连接
声卡插在电脑的总线扩展槽上,为了实现高速传输数据的要求,声卡和电脑内存之间采用DMA传输方式,当传输完毕时声卡向CPU发送一个中断请求信号(IRQ)。这种方式保证了数据的高速传输,减轻了CPU的负担,为声卡的后台工作提供了可能。
2.声卡的基本工作原理
声卡有4种常见的处理声音信号的方式,在不同处理方式下,音频信号(数字的及模拟的)所通过的路径是不同的。声卡的工作原理如图49所示。
1)纯模拟音频通道
外界的各种模拟音频信号,包括LINEIN、MICIN及CD音频信号通过相应的输入插座送到声卡的混音器芯片,通过软件,可以控制混音器芯片对各种音源的选取、放大和混合比例,以及控制左右声道的输出平衡。在这个过程中,音频信号没有被数字化,声卡充当由电脑控制的模拟混音设备。
2)数字录音
外界音频信号经过混音器及前置放大器的混合放大,进入DSP。根据软件设置的频率及采样频率,DSP将模拟信号进行A/D转换,产生数字信号,然后利用DMA方式将声音的数字信号传输到计算机内存,最后在硬盘上形成声音文件,如WAV文件。
3)数字声音的回放
在播放声音文件时,数字化的声音调入内存,通过DMA方式输入声卡的DSP。DSP根据相应的采样特征对声音数据进行D/A转换,将其恢复成模拟信号,传送入混音器,最后模拟信号通过功率放大器向外界输出。
4)MIDI的播放
MIDI文件首先从硬盘调入内存,传送给声卡,音乐合成芯片根据MIDI文件的内容,从波形表中获取有关的预存放的声音样本,经过变换和加工产生模拟音频信号,此后通过混音器及功放向外界输出。
4.4.2声卡的主要性能指标和功能
1.声卡的主要性能指标
①信噪比SNR(SignaltoNoiseRatio)是对声卡抑制噪声能力的评价。在一般情况下,有用信号功率与噪声信号功率的比值就是SNR,单位是分贝(dB)。SNR值越高说明声卡的滤波效能越好,声音听起来就越清晰。
②总谐波失真THD+N(TotalHarmonicDistortion+Noise)是对声卡保真度的总体评价。它将输入声卡的信号与声卡的输出信号相比较,看它们波形的吻合程度。当音频信号通过D/A转换成模拟信号后肯定会出现某种程度的失真(主要是高次谐波的出现)。THD+N就是代表这种失真的程度,其单位也是dB。THD+N的数值越低,意味着声卡的失真率越小。
③频率响应FR(FrequencyResponse)是对声卡D/A与A/D转换器频率响应能力的评价。人耳对声音的听觉范围是20Hz~20kHz。作为声卡应对这一范围内的音频信号有良好的响应能力,以真实地重现播放的声音。
2.声卡的功能
声卡必须配有功能强大的软件,这些软件在操作系统支持下运行,实现声卡的基本功能。这些功能是大多数声卡所具有的。
1)录制、编辑和回放数字声音文件
来自麦克风、录音机、收音机及激光唱盘等音源的声音信号,经采样、编码、处理后以数字声音文件的形式存储。数字声音文件可以由软件进行编辑、剪裁、粘贴、插入混合等工作,还可以进行一些特别的控制回声、音量等工作。数字声音文件在经过各种加工后可以存储起来,需要时又可以利用声卡回放。多数声卡均能对立体声和单声道声音信号进行采样、编码和回放。采样频率是可调的,最高采样频率为44.1kHz(或48kHz)。
2)对数据进行压缩和对压缩的数据进行解压的功能
在记录数字声音信号时,应先进行数据压缩。在进行数字声音文件的回放时,应先进行解压。在声卡上,利用专用语音信号压缩芯片或DSP对声音信号进行数据压缩,一般压缩比在2∶1以上。YAMAHA公司用ADPCM方法使声音信号压缩比达到了3∶1。还有更高压缩比的声音信号压缩方法,只是必须注意到,声卡用在记录、处理和回放要求音响效果很高的场合,因此追求压缩比的时候必须注意到声音的质量。
经过压缩的数字声音信号以某种记录格式存储在磁盘中,必要时再由磁盘文件制成CDROM激光盘。回放时,先采用记录的逆过程对磁盘文件(或CDROM)的数据进行解压缩,还原成原始声音信号,最后经滤波、放大,加到音箱上播放出来。
3)语音合成技术的使用
现在大多数声卡都具备语音合成的功能,能够将文字直接转换成声音。目前大多是英文文本到语音的转换。有了这种功能,多媒体计算机在声卡的支持下便可用语音来朗读各种文本文件。由于语音合成技术的限制,目前所产生的声音听起来不是很自然,但至少可用于发现文章的句法和语法错误,对校对文章是很有用的。
另外,有些声卡可在软件的支持下剪裁某段文本进行朗读,甚至朗读网络上发来的新闻和电子邮件。有的多媒体计算机还具有动态数据交换服务方式(DDESever)。在Windows支持下,凡提供DDE和动态链接库(DLL)的应用程序,均可在声卡支持下加入文本朗读功能,而且,随着技术的不断发展,这一功能会不断增强。
4)语音识别功能
目前,声卡所具备的语音识别功能还只是初步的,而且不是每种声卡都具备这样的功能。当前声卡的语言识别功能主要用来识别操作人员的口令。同一般语音识别相仿,声卡在软件支持下,首先由操作人员进行训练学习,使计算机记下操作人员的语音口令特征,然后,就可以正式使用语音命令,让计算机完成某种命令的操作。现在,小词汇量的语音识别无论从识别率及识别速度上都达到了实用阶段。
5)音量控制
在声卡中,混声器集成电路芯片与软件相结合,可以对各种声源以及数字的、模拟的声音信号的音量进行控制。大多数声卡都为用户提供Mixer程序,它显示带有多个滑键的控制面板,可用来调节声卡上混音器的工作,还可用鼠标控制麦克风、录音机、激光唱盘及其他音源的音量,以及调节音调、增加回音等。
6)具有MIDI接口(乐器数字接口)
利用MIDI接口,计算机可以控制多台具有MIDI接口的乐器。乐器可由MIDI接口产生MIDI文件。这种文件比WAV文件更节省内存,而且也可以对MIDI文件进行编辑和回放。MIDI接口可连接游戏操作杆,通过它人们可在多媒体计算机上玩各种游戏。
与音乐有关,大多数声卡上配有功能强大的FM(调频)音乐合成器。这样一来,在软件的支持下,操作人员可以在计算机上自己谱曲,自己演奏,这对音乐爱好者来说是十分方便的。
7)多媒体制作及演示
多媒体软件的制作过程中少不了加入音频信号(语音、音乐及其他),因此必然需要声卡及其有关软件的支持。在多媒体硬、软件制作平台支持下,可制作各种语音、音乐、动画、图像以至电视节目。所有这些节目的制作过程中的演示,无不需要声卡硬、软件。
8)软件开发工具
凡是功能强的声卡,均配有十分完备的软件,其中包括用于二次开发(制作)的工具软件。这些工具软件与其他媒体的工具软件,再加上强有力的操作系统共同形成了多媒体计算机的软件平台。
思考与练习题一、名词解释
模拟音频数字音频采样量化声道数MIDI音频
二、不定项选择题
1.数字音频采样和量化过程所用的主要硬件是。
A.数字编码器B.数字解码器
C.模拟到数字的转换器(A/D转换器)D.数字到模拟的转换器(D/A转换器)
2.音频卡的分类是按照进行的。
A.采样频率B.声道数C.采样量化位数D.压缩方式
3.两分钟双声道,16位采样位数,22.05kHz采样频率声音的不压缩数据量是。
A.5.05MBB.10.58MBC.10.35MBD.10.09MB
4.目前音频卡具备的功能有。
A.录制和回放数字音频文件B.混音
C.语音特征识别D.实时解/压缩数字单频文件
5.以下的采样频率中,()是目前音频卡所支持的。
A.20kHzB.22.05kHzC.100kHzD.50kHz
6.1984年公布的音频编码标准G.721,它采用的编码方式是。
A.均匀量化B.自适应量化C.自适应差分脉冲D.线性预测
7.AC3数字音频编码提供了五个声道的频率范围是。
A.20Hz到2kHzB.100Hz到1kHz
C.20Hz到20kHzD.20Hz到200kHz
8.MIDI的音乐合成器有。
A.FMB.波表C.复音D.音轨
9.下列采集的波形声音质量最好的是。
A.单声道、8位量化、22.05kHz采样频率
B.双声道、8位量化、44.1kHz采样频率
C.单声道、16位量化、22.05kHz采样频率
D.双声道、16位量化、44.1kHz采样频率
10.在数字音频信息获取与处理过程中,下述顺序中正确的是。
A.A/D变换、采样、压缩、存储、解压缩、D/A变换
B.采样、压缩、A/D变换、存储、解压缩、D/A变换
C.采样、A/D变换、压缩、存储、解压缩、D/A变换
D.采样、D/A变换、压缩、存储、解压缩、A/D变换
11.以下不属于音频卡功能的是。
A.音频的录制与播放B.MIDI接口
C.编辑与合成处理D.视频接口
12.在数字音频信息获取过程中,顺序正确的是。
A.量化、采样、压缩、存储B.采样、压缩、量化、存储
C.采样、量化、存储、压缩D.采样、量化、压缩、存储
13.目前,常用的声卡主要支持的采样频率是。
A.20HzB.22.05kHzC.44.1kHzD.50kHz
14.MIDI音频文件是。
A.一种波形文件
B.一种采用PCM压缩的波形文件
C.是MP3的一种格式
D.是一种符号化的音频信号,记录的是一种指令序列,而不是波形本身
三、填空题
1.常见的音频信号主要有电话音频信号和高保真数字的立体声音频信号。
2.影响数字化声音质量的因素主要有三个,即。
3.由产生音频的方式不同,音频可分为波形音频,和三类。
4.一个乐音主要由3个要素组成:音高、和。
5.MIDI即,是音乐与结合的产物。它是一种计算机与之间连接的硬件,同时也是一种数字音乐的国际标准。
四、简答题
1.选择采样频率为22.05kHz和样本精度为16位的录音参数。在不采用压缩技术的情况下,计算和录制2分钟的立体声音需要多少MB(兆字节)的存储空间(1MB=1024×1024B)?
2.声音的三要素是什么?各依赖于什么?
3.什么叫MIDI?它有什么特点?简述指定MIDI标准的意义。