140dB 动态范围要来了?

/ 阅读:14299
作者: 飞飞

很多几十年前我们无法离开的东西,今天已无关紧要。例如算盘、收音机、缝纫机...

我们把时间缩短一点,十年

2006 年你觉得必不可少的 :

光驱、诺基亚、MP3 随身听

CD 唱片, 报纸, CCTV..

它们现在也无关紧要了




今天,我们想谈论一个..

同样可能会消失的概念:

【 音 质 】

你会疑惑:这怎么可能?

就像当年数码相机“像素越高越好”,LCD 显示器“拖影/延迟越低越好”、“对比度越大越好”、“坏点越少越好”——现在这些概念都无关紧要。我们先来看这个概念:


————————

动态范围

————————

数码相片放大后都是“格子”

但只要这些格子足够小

你觉得就是真实的画面




数字音频也是“格子”

只要“格子”足够小

声音就像真的一样

不过与图片不一样的是,

数字音频的格子有时间线

以及 0dB(FS) 的音量上限


既然是格子就有“长”和“宽”

横轴是采样率/Sample Rate

(本文暂不讨论采样率)

纵轴叫“精度/Bit”



1979 年 SONY 制定 CD 的标准是 16bit/44.1kHz,其中 44.1kHz 采样率意味着:

横轴上把 1 秒切成 44100 份


但“精度”的公式要复杂些

我们且将它理解为“音量下限”

可以套用一个简化的计算式:

1 个 bit 能增加 -6dB

因此 16-bit 能记录的细节是:

-6dB x 16 = -96dB


对于普通人、普通设备和普通场合,12-bit 对应的 -72dB 已经够用。在普通的民用播放器里,你可以试试将一首歌衰减 72dB,你可能就听不到声音了。


记录微弱的声音有何用?

为了“真实感”和“空间感”

在日常的环境里,声音有无限的反射,人耳的进化结构能根据这些细微的声音反射,本能地判断声源位置、空间大小、以及空间质感——闭着眼睛你都能分别自己是在浴室唱歌、还是在教堂唱歌。如果把普通人放到“消音室”这种完全无反射的环境,很多人会疯掉。

如果试听环境安静、耳朵也灵敏,-72dB 并不能满足你,SONY 当年制定 16-bit/44100Hz(采样频率要达到声音频率的两倍)为标准,因为:

人耳的听力极限是 -90dB

听力的频率上限是 20kHz


昂贵的音箱起码对你家狗是有意义的...


然而播放器出来的声音, 

还要经过其他设备

耳机还好,对于音箱系统,信号还要经过——前级放大、线材、后级放大、单元... 每过一道工序,就有音质损失和“声染”。

为了准确还原 16-bit / 44kHz

播放设备最好高于 16bit

而录音师还有更多考虑 :

假如以 16-bit 录制音频,经过软件的几十轨混音处理后,单独的细节肯定无法高于 16-bit,因此录音必须用 24-bit,母带的格式通常也在 20-bit 或 24-bit。

如果你是音乐人,理解“精度”是很容易的,打开 Pro Tools 加入一个 Lo-Fi(或者其他可以“降比特”处理的插件),马上就可以体会 4-bit(噪声)、8-bit(不自然)和 12-bit 的区别。



录音师还可以做个实验,在 Pro Tools 插入一轨 Signal Generator,发出 0dB 正弦波,声卡开到 0dBFS,音箱开到 Unity Gain,看音轨的音量能往下拉多少才听不见——小编试了下能到 -110dB,因此这个动态对录音师依然有意义。


————————————

动态范围 & 音质

————————————

【音质】是一个整体的考核对象,一定能通过参数反应,如果不能——说明参数还不够全面。

通常我们有四点来考量音质 :

动态范围/信噪比, 失真, 

频率响应, 左右声道串音

【频率响应】影响的是声音的整体“风格”,不过现在的设备频率响应基本都很平直,其实讨论播放器的“风格”已经没有意义,音箱和耳机有风格就行

如果播放器还有“风格”,那就有可能抵消或强化音箱耳机的风格,导致整体风格的混乱。

我们只需判断其他三个参数:动态范围、失真和串音。怎么判断?——它们是有关联的,我们看看叉烧评测室之前的实测数据:


除了频响,其他参数分为两种

有些以“% 百分比”为单位

有些以 “dB” 为单位


有没有发现一个现象:

dB 单位的参数都很接近?

例如 Noise Level/底噪、Dynamic Range/动态范围、Crosstalk/串音 基本都一样,而以百分比为单位的数据其实也很接近,另外:

百分比和 dB 可以转化

有不少专门的网站做这种单位换算,例如上一代 Symphony 的 THD 是 0.0002%,这对应 -114dB 的失真,IMD + Noise 的 0.0007% 对应 103dB 的失真。通常来说,

其他参数都比动态范围更大

这是因为 :

动态范围是参数的下限

SPL 提出了一个“数字动态(芯片)”和“模拟动态(模拟电路底噪)”的概念,

假如 D/A(数模转换)的动态范围是 -120dB,而模拟部分的动态(底噪)是 -118dB,那声卡的整体实测动态会在 -118dB;而假如模拟部分的动态(底噪)是 -122dB,那整体实测动态会在 -120dB。

无论底噪, 失真, 串音参数如何

它们都 ≥ 芯片动态范围


————————————

芯片动态的进化

————————————

我们在“口袋中的母带声卡” MIYO 的评测中提过这个进化,对于录音棚而言:

• 1996 年录音棚最好的输出音质是 96dB(Digidesign 882,@16-bit)
• 1998 年录音棚最好的输出音质是 110dB(Digidesign 888|24 I/O,@24-bit)
• 2002 年输出达到了 117dB(Digidesign 192 I/O,@24-bit)
• 2008 年输出达到了 129dB(Apogee Symphony I/O,@24-bit)


这是专业级,我们看看民用级:

• 1998 年“创新”声卡输出达到 82dB(SoundBlaster Live 1024,@16-bit)
• 2002 年 AC97 集成声卡输出达到 90dB(Xilinx LM4550,@18-bit)
• 2008 年 AC97 集成声卡输出达到 98dB(Realtek ALC269,@24-bit)
• 2012 年 iPhone 5 输出实测达到 102dB(Cirrus Logic 338S1077,@24-bit)

PS:很多国产手机采用了 120dB 芯片,但我看其他网站实测并没超过 100dB~


无论专业级与民用级

动态范围一直在提升

2015 年音质水准最高的千元专业声卡 Spartan A,输出已经达到了 2002 年最高水准的 888|24 I/O,而现在一台千元手机的动态范围也可能超过 1998 以前录音棚最好的 D/A。我们认为:

民用级达到 110dB 后

讨论“音质”将失去意义

而对于专业录音行业,小编觉得 129dB 以上也失去了意义,但作为最追求声音的群体,“跑分”有心理意义,129dB 的记录已经整整 8 年没有突破了,但这只是时间问题。

本文的主角要登场了:

ES 9038 Pro

esstech.com/index.php?cID=360

在今年初的 CES 上,AKM 发布了新旗舰芯片 AK4497EQ 动态范围 129dB,这只是追上了 ESS 公司和 TI 公司,不过 ESS 公司发布的 ES 9038 Pro 真是吓人一跳:

140dB 动态范围 !



恐怖的还有 THD+N

达到 0.00008% (-122dB)


那你就能用上 140dB 动态?

依然有不少难度——

正如 SPL 官方所说的

“模拟”也有动态范围

目前主流专业设备中,参数最高的“前级” Phonitor X 只达到 136dB,这得用上 120V 高压电路和分立运放,模拟电路的设计对数字音频厂商是很大的挑战,Symphony I/O 当年为了上 129dB 还被迫装了风扇,发热太大也造成不少问题。

ES9038 有三种模式,只有单通道模式能达到 140dB(然而并没有单通道的声卡...),立体声和 8 通道的参数官方没有公布,如果 8 通道有 130dB,考虑到上述模拟设计能力的限制,我觉得 8 通道设计最现实,而 Apogee 很可能采用立体声设计~(136dB?)

应该说 ESS 并不是录音行业的主流设计,大家看叉烧的声卡评测,除了 Apogee 就没别家了,Avid、UA、Antelope 都是 TI 方案(不过 Apogee 的设计师去了 Antelope),要改整体方案,涉及到人士变动,这里难度最大。

其实 ES9018 的最大意义是

迫使 120dB 的设备降价

不过这一切不会那么快发生

厂商还要设计、试错、生产

新技术成本高让用户不买单


小编个人预计的时间节点是 :

• 2016 年底或 2017 年初,我们有望看到第一台采用 ES9038 的民用声卡
• 2017 年,千元入门声卡有望普及 110dB(目前普遍在 105dB)
• 2018 年,3K ~ 6K 价位的中端声卡有望普及 120dB(目前普遍是 115dB)
• 2019 年,万元级专业声卡有望普及 125dB(目前普遍在 120dB)


音质提升只是时间问题

未来音质可能没有意义

音质到头后还有什么可玩 ?

可玩的还有很多

便利性, 低能耗, 延迟..

随便举几个“痛点”:

• 有源监听音箱最好都能带蓝牙,现在依然很少,尤其是高端监听音箱;
• 集成电池的蓝牙话筒也会面世,不光要求音质好,A/D 和运放还要省电;
• 专业领域没普及无线是因为延迟,主打低延迟的 aptX LL 只能做到 50ms;
• 手机的音质需要高压、高热、高能耗,这就严重影响了电池的续航能力。


其实在脱离“音质”之后

音乐才能恢复本来面貌

很多音乐爱好者在听蔡琴、听王菲、听《加州旅馆》,其实并不是在听音乐,

而是在听一堆铁、听一堆钱

你知道《加州旅馆》是鬼故事吗?

你知道结尾双吉他编曲多美妙吗?

音质本来不应成为重点

幸好, 以后也不会是



  • "意味着把1秒切成44100份...", 应该是22020份, 因为一个位置需要两个点去采, 因此能采到的理论频率上限是22.020KHz。
    Picker 评论道
  • 我想想,44100 个采样点真的是 22020 份吗?不能说是一个位置用“两份”去采吗?也就是一份只能采半个周期...我是这么理解的。
    飞飞 评论道
  • 1秒切成44100份没错啊,44100是采样率,单位就是点数/秒。声音频率又不是固定到上限22050的,怎么会是22020份?“一个位置”究竟是指的一个什么?这概念好模糊……
    ajunk 评论道
  • 每秒对时域波形采样44100次,即44.1kHz,每次采样间隔相同,都是1/44100秒,奈奎斯特理论是指采样频率是实际波形能达到的频率上限的两倍以上则无失真,可还原原有信号。当然这只是理论上,实际要考虑滤波器、处理能力等各方面。另外一半是22050,楼下的数学是谁教的?
    zhuqin 评论道
  • 我觉得单通道动态范围还是可以达到的,因为不少DAC已经采用每通道一片甚至多片DAC芯片以求性能最大化,比如antelope的platinum。
    zhuqin 评论道
  • 汗,我也没发现 22020 这个梗...
    飞飞 评论道
  • 哈哈昨晚熬多了, 应该是22050的频率上限。
    Picker 评论道
  • 就像你说的,是指按照Nyquist极限,能采到的极限是fs/2,所以至少要两倍于对象频率再加上限频才不会出现aliasing。因此我说的“一个位置需要两个点去采”确实不严谨。
    Picker 评论道
  • 所以卖音箱还是长久之计233。失真都在最后的环节了。话筒技术的搁浅也是一大瓶颈,不过录音师玩的开心就好
    NSX 评论道
  • 140dB,震惊中...但让科技风暴来得更猛烈些吧,受益的会是我们
    ZDB 评论道
  • 好好好!折腾起来!用16bit的CD听出140db的动态来!
    风云烈火 评论道
  • 强烈好奇厂家的跟进,看哪家推出新机器,达到140db对电路设计布局有个考验。
    风云烈火 评论道
  • 9018才登上巅峰没多久,9038就要来了,科技发展的同时人们真正应该关注的点究竟是什么…
    LeeWorld 评论道
  • 2018年,UA用9038pro设计出来动态高达133dB的Apollo 16X,回来看看简直神预言
    Ktvzk 评论道
    • 啊?我们还没拆过...你在哪里看的拆解?...
      飞飞 回复 Ktvzk
      • 诶?我记错了?
        Ktvzk 回复 飞飞