点击上方获取邀请码注册baituge.com,100TB套图视频等你下载!
您需要 登录 才可以下载或查看,没有帐号?这里注册
x
序言——我们究竟该用怎样的方式认识和评论器材
从2002年大学时购入第一只高保真耳机AKGK271s开始,发烧至今已有15年。中间有热情高的时候,有安心听音乐的时候。而最近半年换了工作,闲暇时间和闲钱都多了一些,陆续进出了一些器材,颇有一些想法。如今写在这里,算是一路走来的一个总结吧。会是个长篇大论,但是我相信干货是有的。
首先说一下自己的器材,都是些普通的东西。给读者做个参考,看看我的心得和结论是在什么器材上得出的,仅此而已。
目前拥有的耳机: HD800 SDR Mod (40XXX号) HD800 Stock (47XXX号) HD650 (2011版) HD600 (2014版) HD598 TH-X00 Mahogany Etymotic ER4P
有过但已卖出的耳机: Beyer T1 HD650 (2005版) TH-X00 Purple Heart SR325i SR325e SR80 Shure SE535 AKG K271
放大器: Rudistor RPX-33 DarkVoice 336SE – 常用RCA 5692 and Mullard 6080 Tubes
音源: McIntosh D-100 Benchmark DAC-1 USB ECHO Audiofire 4 (火线连PC,同轴输出去DAC)
其他设备: Genelec M040 Studio Monitor Yamaha HS80 Studio Monitor
线材和周边都是些机线或亚马逊级别的产品,这个我会在第四章谈谈自己的观点。
我一直在反复思考的一点是,我们究竟该用什么样的方式去认识和评论器材?我觉得者必须是客观数据和主观听感结合的方式,两者缺一不可。
我们都看过太多形容词堆砌,令人一头雾水的评测和枪文,听到过“数据没用,耳朵收货最重要”这样的言论。可是耳朵真的可靠吗?有多少次我们对一件新器材的第一印象是A,结果换了个环境,换了时间、心情、曲目,即便是在同样的器材搭配之下这个第一印象被颠覆的?我认同了解一个器材是需要时间的,这就是因为我们的主观感受可能受各种因素的影响而变得不可靠。我们需要长时间不同情况下聆听体验的平均值来消除这种不可靠,了解器材在不同环境和音乐类型下的表现,才能有个比较全面的认识。从方法上,以一件熟悉的器材作为参照物,去比对另一件新器材,是建立比较坚实的主观听感最快速有效的办法。
而数据是永远比主观感受来的可靠的。但是理论,数据,公式,模型,永远是对复杂现实的一种简化和抽象,因此是不全面的。我们也必须认识到客观数据的局限性,并使用不同方面的数据相互印证来进行理性分析。
总结一下,我认为认识和评价器材的良好方法是这样的: 1. 首先从客观数据入手,并且了解这些数据的内涵、影响,局限,和互相之间的关系; 2. 然后以熟悉的器材为参照,以丰富的主观听感来佐证客观数据。当二者有出入的时候,尤其要弄明白哪里出了问题,然后据此修正客观测量方法,或主观印象; 3. 在表达和评论的时候,注意明确各种概念和形容词的定义。而其中特别重要的一点,是明确主观听感中的概念在客观数据中可以通过什么方式体现。
本文的第一至三章将主要讨论技术指标和各种主观听感指标的内涵、影响,局限,和互相之间的关系。第四、五章讨论基于以上理解和数据所形成的一些观点。第六至十章讨论一些具体耳机的主观听感和经验。 一、耳机好不好推的技术指标
像大多数烧友走过的路一样,从客观数据入手可能有难度,毕竟不是人人都学过电子工程,OTL,负反馈,傅里叶变换这样的词看到肯定是让人头大。可是我觉得一些基本的概念和技术数据并不太难理解,在这里我想先解释一些对我很有帮助的基本概念。我觉得作为普通烧友,理解这几个基本概念就可以对器材的最关键部分有一个大方向的把握。而更干货的,则是我认为一些发烧术语是如何反映在这些技术数据上的。
首先,几个有关耳机好不好推的指标。说起好不好推,大多数烧友往往会看高阻低阻。其实阻抗只是反映了好不好推的一半,另一半是灵敏度。
灵敏度Sensitivity或SPL。这是指给定功率(单位是dB/1mW)或者给定电压(因为是交流电通常是平均1V,称为1Vrms,单位是dB/1Vrms)下耳机发出声音的大小。这两种标法是可以通过计算换算的,都很常用,要注意区分。下面公式用的是第一个标法。
阻抗。这其实就是交流电下的电阻概念,虽然有相位的影响是个复数,但是可以等价于直流电的电阻。所以大家中学时候学过的欧姆定律,电压=电流X电阻还是适用的。
干货1:为什么这两个指标要一起看,而且只看这两个就够了呢?因为一旦掌握了这两个指标,再给定一个“充分驱动”的响度,一般认为持续播出110dB,一副耳机达到这个响度所需要的电压,电流,功率都可以计算出来。
先从电压开始(公式不好打,就用Excel公式代替了):
110dB所需电压=SQRT((10^((110-灵敏度)/10)/1000*阻抗))
算出了电压,所需要的电流和功率根据欧姆定律就可以算出来:
所需电流=电压/阻抗
所需功率=电流X电压
干货2:由此,我制作了一个常见耳机的驱动特性表,本来想分享Excel原件,但是附件类型非法,只能上传截图。如有需要大家可以去隔壁搜我的帖子下载Excel。
这个表按照所需电压(D列)将常见耳机从难推至易推排了个序。当然这个排序也可以按照电流或者功率来,有了Excel各位烧友可以按照需要自行排序。很有意思的是,高阻耳机对总功率的需求反而比低阻耳机小。高阻耳机工作电压高一点,但是低阻耳机工作电流要高更多。总听老烧说“低阻耳机吃电流”,这是为什么,怎么个算法,明确了以上几点就都弄懂了。更糟糕的是,放大器在不同功率状态下失真度是变化的,一般功率越高的状态失真度越大(大多少第四章有数据)。所以高阻不一定难推,低阻低敏的才是最难推的。
这个表的首要作用当然是给耳机和放大器的功率匹配做一个指导。但是在计算的时候还需要注意几点:
1. 动圈耳机的磁圈震动时会有电感,造成不同频率和响度下阻抗特性的变化,据说有些耳机这个变化还很大。所以标称的阻抗并不是固定的。
2. 二是这里的功率是指持续输出功率,术语称正弦波功率。而音乐的强度是不断变化的。不是某个dB的固定值,当音频信号有峰值过来的时候瞬时功率要求可能会突破放大器的能力,所以不是说平均的功率够了就推好了,功率余量也很重要。考虑到110dB已经远超正常听音音量,按照以前音箱标称峰值功率是正弦波功率的10-15倍计算,以上功率数据x10作为阻抗匹配之下放大器的功率余量要求,应该可以算是绝对够了(可能过大了。。。因为110dB实在是很大了,内行请指教。当然公式都给出来了,如果觉得100dB更合理自行计算就是了)。
3. 放大器的功率和阻抗负载是成反比变化的。所以对放大器标称的最大功率,首先要弄清它是什么阻抗负载下的。举个例子,标称32欧下功率2W(2000mW)的放大器,推300欧的耳机比如HD800就只有约200mW的功率。如果以上计算HD800 110dB的正弦波功率需求是20mW,x10得到充分驱动需要的功率是200mw,可以得出结论这个放大器的推力是足够驱动HD800的。
这个表其实还有有很多可以把玩之处,值得慢慢发掘。首先当然是看到K1000这个怪物,所需要的电压电流功率都和别的耳机不在一个数量级上。其次可以对各家品牌的产品做个分类统计,可以总结出一些规律。比如:
- 从功率需求上看,HD800并不比650和580难推。T1也是如此,所需的电压,电流和功率并不高。HD800和T1不好搞是音色匹配的问题,这个下文再说。
- 拜亚的高低阻版本满天飞。阻抗特性最为分散。
- AKG总是出一些低阻低敏的奇怪物体,比如55欧的在产240系列,看起来不难推,其实对功率要求是HD800的4倍。
- Grado指标比较一致,虽说是低阻,但是灵敏度并不算高,导致并不好推,对总功率的需求接近森海的580, 650, 800。
随之而来的一个问题就是,工作功率更高的耳机发出的声音和低功率的一样,那么多余的能量去哪了?我觉得只能是发热了。换能效率这个因素对音质,佩戴,寿命的影响还没有见到过讨论。另外我推测有两个耳机插口的放大器最好还是不要插一个高阻一个低阻的,工作状态太不一样了。当然这个取决于耳放的设计,两个端口是否完全隔离还是share一些元件,有没有可能相互干扰。
总之,这几个指标可以很清晰的反映出从功率需求上,每个耳机到底有多难推。这个结果可能会推翻很多人的认知,但这是从功率角度看的客观数据。而音色的匹配是能不能推好的问题,留待下一章讨论。 | 二、有关耳机音质的技术指标
如果认为上面的讨论解决了“充分驱动”在功率上的问题,下面我们讨论一下驱动功率足够的情况下有关耳机的“音质”的技术指标。而在讨论具体的指标之前,我认为需要先考虑一个问题:我们应该看哪几个技术指标来比较全面的认识一个耳机在“音质”方面的特性?
我们常常看到这样的形容词来形容音质:低频“权威”,中频“带着一丝甜味”,高频“华丽”,“贵气”,“毛茸茸的”。。。我看到这些形容词总是觉得一头雾水,十分气馁。这些是根本无法定义的感受,而每个人的感受是很不一样的。形容低频“权威”,一个人可能理解为“量感足”,另一个人可能理解为“下潜深”。一个人觉得中频“甜”,另一个人听同样的声音可能会形容为“醇厚”,而另一个人可能会形容为“通透”。。。这样定义不清的讨论只能是鸡同鸭讲,一笔糊涂账。
我明白声音很难用语言来形容,可是正因为如此,我们的讨论必须建立在一套大家都认同的定义之上。我觉得这个定义的过程可以分两步:
1. 定义主观听感指标。比如说如上的“权威”,“贵气”,“华丽”,就不是很好的主观指标,因为这些形容词每个人都有不同的定义。我觉得一组大多数烧友都比较认同的定义是刘汉盛的音响二十要。个人认为,即使是这一组比较公认的定义,每个人的理解也是不同的,见下文分析。我们姑且先拿来使用,而本文的重点在于第二步。
2. 将主观听感指标整合到客观指标之中。我一直在思考的问题是,这“二十要”的主观听感指标究竟由哪些客观技术指标决定的?
换句话说,如果我是一个耳机或音响的制作者,我该如何从技术上实现比如“声场更大”,“瞬态更好”这样的听感呢?毕竟声场是一个主观的听感,是无法量化的。无法量化的指标是无法制作出来的。而如果能把“声场大”这个主观听感转化为“声道分离度高”、“声波的指向性好”这样可以测量并通过技术实现的客观指标,我们就知道如何把声场做得更大。反过来,对烧友来说,知道如何将主观听感指标融入客观指标之中,就可以从客观指标上推测听感,也可以印证自己的主观感受是不是正确。
我先说自己的结论:我认为耳机音质的主要决定因素,基本上可以在如下三个指标里反映出来:
1. 频响曲线,反映持续功率时不同频率的能量属性。
2. 瞬态响应,反映器材对瞬时信号跟随的时间属性。
1、2两个指标结合,就是三维的瀑布图(Cumulative Spectral Decay,或直译作累积衰减曲线)。我认为这个图实际上可以看出一个耳机音色的大部分基本要素。
3. 失真度,这个比较复杂,我也并不能理解透彻,但推测这与上两个指标是有一定相关性,但更直接的反映错误率的指标。我觉得THD总谐波失真应该是可以部分的从频响曲线上反映出来,而瞬态失真TIM应该可以部分的从瀑布图的陡峭程度上反映出来的。越平直的频响曲线,越快速的瞬态响应,THD和TIM应该越低。为什么说是部分的反映,请看下文细说。
我并不是学电子工程的,所以我的结论很可能是错的。很多疑惑也需要真正的内行来解答。但我的逻辑是这样的:
先看频响曲线。这是一个大家都会看的图。可是我们看到了全部吗?这要从什么是乐器声音的质地谈起。乐器的声音,是一个基波与其不同倍数的谐波的叠加。而声音的质地,取决于基波和不同倍数谐波的能量比例关系。换言之,钢琴的中央C音,和小提琴上的对应C音,是一个相同的261.63 Hz正弦波(基波),加上一串不同响度的522Hz(2倍谐波),784Hz(3倍谐波),1046Hz(4倍谐波)。。。这样的谐波所组成的总和。因为两者的谐波能量分布不同,可能钢琴的522Hz谐波响一点,小提琴的522Hz谐波弱一点,以此类推。。。这样总共构成了两个独特的声音质地。所以任何一个乐器的声音不过是一系列不同频率和响度的声音的总和。换句话说,“声音的质地”并不是一个独立的概念,而是一串不同频率和响度的简单正弦波的叠加。基于这个理解来看频响曲线,就不仅能反映三频能量分布,两端延伸这些显而易见的听感指标,而且决定了声音质地的准确度。理想平直的频响曲线意味着任何一种质地分解出的每一个不同频率的谐波都有准确的响度,这样叠加出的声音质地一定是准确的。所以,声音在不同频率上的能量属性其实决定了声音的质地。
再看瞬态响应,这个指标反映音响器材跟随一个瞬时信号的产生声音的时间长短,时间越短速度越快。不光包括发出声音的速度,也包括停止声音的速度,而这两者往往是高度相关的。频率响应只能反映出声音的能量属性,并不能反映声音信号的时间属性。所以瞬态响应和频响曲线是互相独立的两个属性。我们来看看瞬态响应可能影响哪些主观听感上的指标,我认为很显然的有以下几个:
- 细节的表达,或解析力。只有当一个器材能快速响应电信号的时候,一些微小的细节才能被清晰的表达。响应不够快,还没来得及反应,细小的信号已经过去了,由此吃掉细节。停止不够快,上一个信号的余振还没结束,下一个信号就叠加进去,由此细节含糊。
- 动态。动态是声音强弱的对比,既取决于跟随一个峰值电信号能发出声音的响度,也取决于强信号之后迅速减弱能达到的安静程度。动态很大程度上取决于响应时间,一锤鼓下去音头的爆发力也就0.X秒,反应慢的等声音出来最强的电信号已经过去了,放出来的已经不是最强的部分,动态就被削弱了。和上面的解析一个道理。当然,这是在驱动充足,能量分布均衡的前提之下,动态强弱就主要由瞬态响应决定了。
- 活生感和速度感。根据刘汉盛的文章,这基本就是瞬态响应的主观表达。
除此之外,我觉得其实与声场、空间、位置感相关的概念,仍然是与瞬态响应息息相关的,请看下文分析。
瞬态响应由什么技术指标去测量呢?由单个信号去测量的指标可以看Step Response,或者Impulse Response脉冲响应,或者方波波形。但我觉得最全面的还是瀑布图,因为他反映了耳机在整个频率范围内的频响曲线的瞬态指标,是能量属性和时间属性的综合反映。
http://en.goldenears.net/22602
上面这个网站的图04是HD800的瀑布图。他的横轴和纵轴其实就是简单的频响曲线。而多出的Z轴表示时间。最远的那一根红线其实就是持续信号下的频响曲线。那些由远及近的等高线一般的层层叠叠的线条表达了不同频率的电信号停止之后声音信号的衰减速度。由远及近每隔0.06秒测量一次。直观的表达就是这个坡度越陡峭,信号停止的速度越快,瞬态响应越好。反之越平缓则速度越慢,瞬态越差。
最后看一下失真度。如果说以上两个指标更多的是衡量“数量”,失真度则是衡量“质量”。不论是哪种失真度,衡量的都是输出信号相对于源信号某一个侧面的畸变程度。这个指标的机理比较复杂,牵涉的数学和电路知识比较难懂,总的来说我对于这部分的理解很有限,主观听感也相对难以整合到客观指标上。
有几种不同的失真指标可以反映不同类型的失真。比如谐波失真THD,互调失真IMD,相位失真,瞬态失真TIM。我的理解是互调失真和相位失真一般适用于放大器,这里先不讨论。而谐波失真和瞬态失真是既适用于放大器又适用于耳机的。而这两个指标同样可以归结到频谱的能量分布属性和时间属性上:
- 谐波失真表达的是失真的能量属性,计算器材产生的不属于源信号的谐波能量和源信号能量的比值。谐波失真的程度在不同频率是不同的,所以同样可以画一个基于频率的曲线。而“总谐波失真THD”是器材在全部频率上的加权平均,只用一个%表达。由此可见这个指标对于声音的质地有非常大的影响,谐波失真大会直接改变声音的质地。我推测THD和频响曲线应该是有一定相关的。因为失真产生的某个频率的谐波能量高了,必然会在那个频率的响应曲线上有表现。但是实际看到的频响曲线更平滑的耳机未必THD就更低,比如HD600的频响曲线就比HD800要平直,但是HD600的THD标称0.1%,而HD800是0.02%。要解释这个矛盾,我暂时只能这样理解:当THD在不同频率上有波动时,会使频响曲线出现波动。可是,假设我们从一个理想的平直频响曲线出发,在全频率引入一个固定能量的谐波失真,那么包含这个失真的频响曲线看起来可能还是平直的。所以THD只会部分的反映在频响曲线上,还是需要引入一个独立的指标来衡量失真的程度。
- 瞬态失真TIM表达是失真的时间属性,某种程度上可以由以上测试瞬态的指标和瀑布图表达出来。而我对这一点有的问题与THD类似,是不是拥有越陡峭迅速的瀑布图的耳机TIM也一定越小呢?由于TIM并不是一个通常会被测试的数据,能找到TIM的耳机并不多,所以这一点无从印证,也希望内行指点了。
总结一下失真度,我认为THD与频率响应曲线有一定的相关性,但是是衡量失真能量属性的一个更直接的指标。TIM与瀑布图的陡峭程度有一定的相关性,但是是衡量失真时间属性的一个更直接的指标。所以失真度还是可以被整合到能量属性和时间属性这两个大框架里,只是更直接的反映这两个属性的“质量”或畸变程度。自己分析器材会以瀑布图为主,失真指标为辅,但是很大程度上还是由于对失真指标的理解并不透彻,还望内行指点。
说了半天,我想表达的是这样一个观点:
观点1:我认为如果一件器材在持续功率时不同频率的能量分布上是精确的(频响曲线平直,THD小),并且的不同频率的瞬态响应上是精确的(方波平,瀑布图陡峭,TIM小),则这件器材在几乎所有的主观听感指标上都将是优秀的。
三、音响二十要都在说什么,如何反映到客观指标上
这一章主要通过分析“音响二十要”中的主观指标来验证以上 “观点1”。这个分析和验证的方法,也是本文最主要的目的之一,就是将这二十个主观听感指标整合到客观技术指标上。
我的逻辑是,如果这二十个主观指标都可以被整合到以上的某一个或几个客观指标上,那么只要这五六个技术指标做好了,二十个主观指标都不会差。而烧友们理性的认识一件器材,只要掌握以上五六个技术指标,就可以大致把握器材的主要属性了。
先来看看音响二十要的原文:
http://www.360doc.com/content/12/0527/17/4409833_214071343.shtml
前面说过,我觉得这二十条怎么定义,有些还是比较含糊的,也有些是互相重合的。所以先讨论一下定义。具体想说一下几点:
- 音质(第一)与音色(第二)。我觉得刘汉盛这两个分类没有说清楚。说音质的时候简单地说是好不好听,美不美,非常含糊笼统。说音色的时候又说,音质就像布料的材质,音色就像布料的颜色。我认为后一个定义的分法是比较明确的,采纳进来定义如下:
o 音质就是声音的质地,英文为Texture,比如小提琴声和钢琴声的不同质地。如上文分析,是基波和各次谐波的不同能量叠加,会反映在频响曲线和THD上。
o 音色是是声音的色调。这里刘汉盛又语焉不详了,试图说冷暖,又扯到软硬,又说到偏黄偏白偏蓝。我觉得这些描述都不够精确。视觉上的色调是什么?是不同频率光谱的能量分布。类似的描述声学概念,我认为就是不同频率声波的能量分布。能量集中在低频则暖,集中在高频则冷。这是我认可的精确描述。
- 音场表现(第四),结像力与形体感(第十),空间感(第十七)。这几个概念,都涉及声音的体积,需要定义一下。我认为最需要明确的,是“音场”和“空间感”,哪一个指的是声源,哪一个指的是聆听场所的整体空间?比如我们去音乐厅听交响乐,乐队本身作为发声源有一个体积(或是一系列点声源的总和),音乐厅作为混响空间又有一个体积。看刘汉盛的描述,“音场”似乎只是指乐队。音乐厅的体积则被定义为“空间感”。就我理解,很多烧友在描述“音场”的时候似乎是混合了这两者,并没有做出区分。姑且认可刘汉盛的这两个定义,则由此带来的问题是,同属于发声源体积的“音场”和“结像力与形体感”有什么区别?我认为说来说去,这里一共只有两个概念,没有第三个概念:
o 发声源的体积,我认可结像力与形体感(第十)这个指标是明确指代这个概念的;
o 整个声音充斥的空间体积,包括直达声和反射声的总和,我认为一般烧友讨论的“音场/声场(第四)”指的是这个,在此这样定义。
如此定义之后,空间感(第十七)是一个重复的概念,舍去不讨论。
- 透明感(第六)。刘汉盛在这里说了两个概念,一是要透明,不能蒙了一层雾;二是要柔和,听起来不疲劳。我觉得这完全是两回事:
o 蒙了一层雾这样的感觉,我理解在两种情况下会产生,一是高频暗淡,能量不足,比如650相对600就像蒙了一层雾;二是解析力不足,听不清细节,像是隔了一层纱看东西。所以这一层意思完全可以由三频能量分布,以及解析力这两个指标涵盖。我觉得没有必要作为单独的指标存在。
o 柔和感,首先是能量分布得当没有那个频段冲出来,第二是失真较低,包括THD和TIM,两者都会造成声音变硬变冲。所以这个概念也是完全包含在其他指标当中的。
所以我认为,这个指标没有必要存在,舍去不讨论。
- 活生感(第九)与速度感(第十二)。这两个是一回事,合并为速度感。
- 解析力(第十一)与细节再生(第十六)这两个也是一回事,合并为解析力。
- 结像力与形体感(第十)与乐器与人声的大小比例(第十四),这两个指标有什么差别?在结像力与形体感优秀,三频能量准确,声场均衡的情况下,乐器人声之间比例难道不是固定的吗?我不认为第十四是一个单独的指标,舍去不讨论。
- 乐器与人声的质感和空气感(第十五)。刘汉盛把这里的质感定义为“接触那一刹那所发生的质感”,我觉得纯属多余。那就是质地加瞬态而已。之后说到空气感的时候定义为“吹气的感觉,声波振动的感觉”。我只能说,确实不知所云。不振动哪来的声音呢。。。所有的声音不都是空气振动,声波振动吗?最多能理解为高频的细节吧,并入解析力,舍去不讨论。
- 整体的平衡性(第十八)与高中低频的分布与控制力(第三),我认为没有区别,并入第三。
- 第十九和二十,并不是声音本身的属性,此处不讨论。
再次声明,以上定义只是个人的理解。每个人可能理解不一样,这就是主观指标天生的不确定性和局限性,即使公认如“音响二十要”。经此一讨论,去掉十七,六,九,十六,十四,十五,十八,十九和二十,一共九个指标,这二十要其实只有十一要。个人觉得,凑数的还是不少的。
干货3:接下来就到了讨论的核心部分:这十一要是由哪些技术指标决定的?我认为在第二章讨论的两个大类(能量分布属性,瞬态响应的时间属性),四个核心技术指标(频响曲线,THD,瀑布图,TIM),加上瞬态相应的其他1-2个指标(方波和脉冲响应),五六个技术指标基本决定了这十一要。因为我认为每一个主观听感指标都可以由这五六个中的一个或几个来决定,并将这十一个指标整合进以下的三个大类中。
1. 由全频段的能量分布属性和精确度(频率响应,THD)控制的主观指标
- 音质(第一)——定义为声音的质地。如上文分析,是基波和各次谐波的叠加,会反映在频响曲线和THD上。频响曲线越平直,THD越低,音质越是准确。
- 音色(第二)——定义为声音的冷暖色调,进一步解读为在不同频率的能量分布,又回到频响曲线上了。
- 高中低频的分布与控制力(第三)——这个概念也包括了频响的宽度,两端延伸。这就是频响曲线本身不是吗?
- 声音的密度与重量感(第五)——按照刘汉盛自己的解释:“推测与供电的充足及中频段、低频段的饱满有关。”供电充足,理解为推力充足吧,是第一章解决的问题。剩下的中低频饱满,还是频率响应的能量分布问题。
2. 由瞬态响应的时间属性和精确度(瀑布图,TIM,方波)控制的主观指标
- 解析力(第十一)
- 速度感(第十二)
- 强弱和动态(第十三)
这三个没什么好多说的,第二章已经讨论了直接和瞬态相关。
3. 由能量分布和瞬态响应共同控制的主观指标
- 音场表现(第四),定位感(第八),结像力与形体感(第十)
这几个概念都牵涉到人耳对空间、位置、远近、体积等等的判断。我觉得必须合在一起说,因为这牵涉到人耳和大脑处理和判断的原理。我们知道,鼓膜是感受声波的器官。而鼓膜是深入耳道内部的,耳道也不是直的。所以声波到达鼓膜,已经丧失了原有的方向性,只是一个衍射波。可是人却可以借此判断方向和远近。我看的文章都表明这个判断的依据就是声音的相对强弱(能量属性),直达声到达双耳的时间差(时间属性),声波在头部和耳廓的反射和衍射造成的细微次级声音的强度和时间。最后,判断体积是依据声音在空间中形成的反射声的质地,强度,和衰减的时间长短。所有这些依据都是由上两个大类的五六个指标决定的,并不需要引入新的技术指标。
人耳的左右分布,造成来自左右方向的声音到达左右耳的响度和时间差较为明显,所以分辨左右来源的声音的方向和远近是很容易的。而竖直的上下和正前或正后方的声音到达双耳的响度和时间都类似,这时候远近可以通过相对的响度,高频衰减,环境反射声等判断,而上下和前后的方向就需要头部和耳廓的反射衍射来辨别了。注意没有,这就是为什么我们的耳朵在前后和上下方向都是不对称的。这样来自这几个方向的声波会在头部和耳廓形成不一样的反射和衍射。
在大多数录音是两个麦克风吊在乐队左右两边录制的情况下,要用音箱回放,才能重现录音中左右声道的互馈,然后用头部和耳廓的接受来重建声波的前后上下的方向信息。而耳机重建这个信息却有两点天生的劣势:
- 一是左耳只能听见左声道,右耳只能听见右声道,这样左右声道无互馈,将声场向左右拉扁。只听左右我们总觉得站在指挥的位置上,小提琴和大提琴180度分布在左右两边。
- 二是声波没有经过头部和耳廓的反射衍射,直接灌进耳道里。所以对前后上下的方向判断极为困难,造成头中效应。我们听唱片总是觉得声音在脑子里面,要靠想象认为声音来自前方不高不低的位置,然后通过录音中的相对的响度,高频衰减,环境反射声等判断距离,有限的还原声场的深度。而这个深度和180度的左右分布又互相矛盾,造成一种畸形的声场。最后对声场高度的判断,我的理解是这里只能有个体积上的大概判断,原因还是对于上下,耳机无法辨别方向,只能判断距离。
实话实说,耳机的声场都是左右拉扁,前后不分的。精确的描述耳机声场的深度高度我总觉得很悬乎。就我听过的这么些耳机,包括很多烧友评论的T1的“正圆形声场”,我是无论如何听不出正圆形的。还有烧友说听得出管乐比弦乐高一米,我也只能佩服,觉得或多或少是脑补的吧。或者我们应该说,耳机的声场,只能是在默认这种畸变的情况下,通过不同耳机的相对表现力来讨论。
什么是正圆形声场,大家可以用耳机听一下人头录音。这个方法在录音环节重建了听觉接受过程的左右互馈和头部和耳廓的反射衍射等过程,听的时候这些信息都已经包含,真的是如临其境。而同样的器材,同一只耳机,完全一样的声波角度,听人头录音与普通录音可以感到这样巨大的差异,更是证明了人耳对于声场的判断就是基于这些声音本身的细节,并没有什么其他神秘的东西。
回到正题,我认为从人耳对空间、位置、远近、体积的判断原理出发,这些信息还是包含在频率的能量分布,时间属性,和失真程度的细节之中,并无必要引入新的技术指标来描述这些主观感受。这是我的观点,欢迎讨论。
耳机之外,影响空间、位置、远近、体积的还有音源和放大器的声道分离度,相位失真程度,如果是音箱的话还有声波的指向性和衰减速度,房间声学环境。此处就不展开讨论了。
- 层次感(第七)——刘汉盛解释为乐器远近一排排之间的间隔。我认为这是一是需要三频能量均衡,二是需要播放由强到弱,由快到慢的信号要能体现出细微的阶差。如此是由声音的能量属性和时间属性共同决定的。这样想,如果铜管的高频能量较多,大提琴的低频能量较多,如果一副耳机的高频能量过多,铜管听起来就会跑到大提琴前面。而一个乐队从前排到后排算20米距离,声速340米会造成1/17秒,也就是0.06秒左右的时间差。器材的瞬态响应是不是快到可以反映这样的时间差就决定了层次感的优劣。
讨论到这一步,我觉得客观技术指标,主观听感指标的定义,以及他们之间的关系都阐释清楚了。像很多烧友一样,很长一段时间以来我一直以为频响曲线、THD这些指标只能反映声音特点的很小一部分,不能涵盖全貌,所以没什么用处。花了这么长的篇幅解释这些,是为了说明一个观点:
观点2:频响曲线、瀑布图、THD这几个基本指标,并不是什么“您购买的汽车有四个轮子四个门”这样只能反映有限信息的指标。相反的,从这几个指标可以看出耳机声音的全部主要特质。这些指标不是没有用,而是非常有用。
第四、五两章会依据这些指标和理解,对系统搭配和发烧理念说一些我的观点。第六章开始,会依据这些客观指标,对我拥有过的器材进行一些主观分析
|