140dB 动态范围要来了？

2016.04.20 / 阅读：30497

作者: 飞飞

很多几十年前我们无法离开的东西，今天已无关紧要。例如算盘、收音机、缝纫机...

我们把时间缩短一点，十年

2006 年你觉得必不可少的 :

光驱、诺基亚、MP3 随身听

CD 唱片, 报纸, CCTV..

它们现在也无关紧要了

今天，我们想谈论一个..

同样可能会消失的概念:

【音质】

你会疑惑：这怎么可能?

就像当年数码相机“像素越高越好”，LCD 显示器“拖影/延迟越低越好”、“对比度越大越好”、“坏点越少越好”——现在这些概念都无关紧要。我们先来看这个概念：

————————

动态范围

————————

数码相片放大后都是“格子”

但只要这些格子足够小

你觉得就是真实的画面

数字音频也是“格子”

只要“格子”足够小

声音就像真的一样

不过与图片不一样的是，

数字音频的格子有时间线

以及 0dB(FS) 的音量上限

既然是格子就有“长”和“宽”

横轴是采样率/Sample Rate

（本文暂不讨论采样率）

纵轴叫“精度/Bit”

1979 年 SONY 制定 CD 的标准是 16bit/44.1kHz，其中 44.1kHz 采样率意味着：

横轴上把 1 秒切成 44100 份

但“精度”的公式要复杂些

我们且将它理解为“音量下限”

可以套用一个简化的计算式：

1 个 bit 能增加 -6dB

因此 16-bit 能记录的细节是:

-6dB x 16 = -96dB

对于普通人、普通设备和普通场合，12-bit 对应的 -72dB 已经够用。在普通的民用播放器里，你可以试试将一首歌衰减 72dB，你可能就听不到声音了。

记录微弱的声音有何用？

为了“真实感”和“空间感”

在日常的环境里，声音有无限的反射，人耳的进化结构能根据这些细微的声音反射，本能地判断声源位置、空间大小、以及空间质感——闭着眼睛你都能分别自己是在浴室唱歌、还是在教堂唱歌。如果把普通人放到“消音室”这种完全无反射的环境，很多人会疯掉。

如果试听环境安静、耳朵也灵敏，-72dB 并不能满足你，SONY 当年制定 16-bit/44100Hz（采样频率要达到声音频率的两倍）为标准，因为：

人耳的听力极限是 -90dB

听力的频率上限是 20kHz

昂贵的音箱起码对你家狗是有意义的...

然而播放器出来的声音,

还要经过其他设备

耳机还好，对于音箱系统，信号还要经过——前级放大、线材、后级放大、单元... 每过一道工序，就有音质损失和“声染”。

为了准确还原 16-bit / 44kHz

播放设备最好高于 16bit

而录音师还有更多考虑 :

假如以 16-bit 录制音频，经过软件的几十轨混音处理后，单独的细节肯定无法高于 16-bit，因此录音必须用 24-bit，母带的格式通常也在 20-bit 或 24-bit。

如果你是音乐人，理解“精度”是很容易的，打开 Pro Tools 加入一个 Lo-Fi（或者其他可以“降比特”处理的插件），马上就可以体会 4-bit（噪声）、8-bit（不自然）和 12-bit 的区别。

录音师还可以做个实验，在 Pro Tools 插入一轨 Signal Generator，发出 0dB 正弦波，声卡开到 0dBFS，音箱开到 Unity Gain，看音轨的音量能往下拉多少才听不见——小编试了下能到 -110dB，因此这个动态对录音师依然有意义。

————————————

动态范围 & 音质

————————————

【音质】是一个整体的考核对象，一定能通过参数反应，如果不能——说明参数还不够全面。

通常我们有四点来考量音质 :

动态范围/信噪比, 失真,

频率响应, 左右声道串音

【频率响应】影响的是声音的整体“风格”，不过现在的设备频率响应基本都很平直，其实讨论播放器的“风格”已经没有意义，音箱和耳机有风格就行

如果播放器还有“风格”，那就有可能抵消或强化音箱耳机的风格，导致整体风格的混乱。

我们只需判断其他三个参数：动态范围、失真和串音。怎么判断？——它们是有关联的，我们看看叉烧评测室之前的实测数据：

除了频响，其他参数分为两种

有些以“% 百分比”为单位

有些以 “dB” 为单位

有没有发现一个现象:

dB 单位的参数都很接近?

例如 Noise Level/底噪、Dynamic Range/动态范围、Crosstalk/串音基本都一样，而以百分比为单位的数据其实也很接近，另外：

百分比和 dB 可以转化

有不少专门的网站做这种单位换算，例如上一代 Symphony 的 THD 是 0.0002%，这对应 -114dB 的失真，IMD + Noise 的 0.0007% 对应 103dB 的失真。通常来说，

其他参数都比动态范围更大

这是因为 :

动态范围是参数的下限

SPL 提出了一个“数字动态（芯片）”和“模拟动态（模拟电路底噪）”的概念，

假如 D/A（数模转换）的动态范围是 -120dB，而模拟部分的动态（底噪）是 -118dB，那声卡的整体实测动态会在 -118dB；而假如模拟部分的动态（底噪）是 -122dB，那整体实测动态会在 -120dB。

无论底噪, 失真, 串音参数如何

它们都 ≥ 芯片动态范围

————————————

芯片动态的进化

————————————

我们在“口袋中的母带声卡” MIYO 的评测中提过这个进化，对于录音棚而言：

• 1996 年录音棚最好的输出音质是 96dB（Digidesign 882，@16-bit）

• 1998 年录音棚最好的输出音质是 110dB（Digidesign 888|24 I/O，@24-bit）

• 2002 年输出达到了 117dB（Digidesign 192 I/O，@24-bit）

• 2008 年输出达到了 129dB（Apogee Symphony I/O，@24-bit）

这是专业级，我们看看民用级：

• 1998 年“创新”声卡输出达到 82dB（SoundBlaster Live 1024，@16-bit）

• 2002 年 AC97 集成声卡输出达到 90dB（Xilinx LM4550，@18-bit）

• 2008 年 AC97 集成声卡输出达到 98dB（Realtek ALC269，@24-bit）

• 2012 年 iPhone 5 输出实测达到 102dB（Cirrus Logic 338S1077，@24-bit）

PS：很多国产手机采用了 120dB 芯片，但我看其他网站实测并没超过 100dB~

无论专业级与民用级

动态范围一直在提升

2015 年音质水准最高的千元专业声卡 Spartan A，输出已经达到了 2002 年最高水准的 888|24 I/O，而现在一台千元手机的动态范围也可能超过 1998 以前录音棚最好的 D/A。我们认为：

民用级达到 110dB 后

讨论“音质”将失去意义

而对于专业录音行业，小编觉得 129dB 以上也失去了意义，但作为最追求声音的群体，“跑分”有心理意义，129dB 的记录已经整整 8 年没有突破了，但这只是时间问题。

本文的主角要登场了：

ES 9038 Pro

esstech.com/index.php?cID=360

在今年初的 CES 上，AKM 发布了新旗舰芯片 AK4497EQ 动态范围 129dB，这只是追上了 ESS 公司和 TI 公司，不过 ESS 公司发布的 ES 9038 Pro 真是吓人一跳：

140dB 动态范围 !

恐怖的还有 THD+N

达到 0.00008% (-122dB)

那你就能用上 140dB 动态?

依然有不少难度——

正如 SPL 官方所说的

“模拟”也有动态范围

目前主流专业设备中，参数最高的“前级” Phonitor X 只达到 136dB，这得用上 120V 高压电路和分立运放，模拟电路的设计对数字音频厂商是很大的挑战，Symphony I/O 当年为了上 129dB 还被迫装了风扇，发热太大也造成不少问题。

ES9038 有三种模式，只有单通道模式能达到 140dB（然而并没有单通道的声卡...），立体声和 8 通道的参数官方没有公布，如果 8 通道有 130dB，考虑到上述模拟设计能力的限制，我觉得 8 通道设计最现实，而 Apogee 很可能采用立体声设计~（136dB？）

应该说 ESS 并不是录音行业的主流设计，大家看叉烧的声卡评测，除了 Apogee 就没别家了，Avid、UA、Antelope 都是 TI 方案（不过 Apogee 的设计师去了 Antelope），要改整体方案，涉及到人士变动，这里难度最大。

其实 ES9018 的最大意义是

迫使 120dB 的设备降价

不过这一切不会那么快发生

厂商还要设计、试错、生产

新技术成本高让用户不买单

小编个人预计的时间节点是 :

• 2016 年底或 2017 年初，我们有望看到第一台采用 ES9038 的民用声卡

• 2017 年，千元入门声卡有望普及 110dB（目前普遍在 105dB）

• 2018 年，3K ~ 6K 价位的中端声卡有望普及 120dB（目前普遍是 115dB）

• 2019 年，万元级专业声卡有望普及 125dB（目前普遍在 120dB）

音质提升只是时间问题

未来音质可能没有意义

音质到头后还有什么可玩 ?

可玩的还有很多

便利性, 低能耗, 延迟..

随便举几个“痛点”：

• 有源监听音箱最好都能带蓝牙，现在依然很少，尤其是高端监听音箱；

• 集成电池的蓝牙话筒也会面世，不光要求音质好，A/D 和运放还要省电；

• 专业领域没普及无线是因为延迟，主打低延迟的 aptX LL 只能做到 50ms；

• 手机的音质需要高压、高热、高能耗，这就严重影响了电池的续航能力。

其实在脱离“音质”之后

音乐才能恢复本来面貌

很多音乐爱好者在听蔡琴、听王菲、听《加州旅馆》，其实并不是在听音乐，

而是在听一堆铁、听一堆钱

你知道《加州旅馆》是鬼故事吗?

你知道结尾双吉他编曲多美妙吗?

CD 唱片, 报纸, CCTV..

它们现在也无关紧要了

今天，我们想谈论一个..

同样可能会消失的概念:

【 音 质 】

你会疑惑：这怎么可能?

动态范围

但只要这些格子足够小

你觉得就是真实的画面

数字音频也是“格子”

只要“格子”足够小

声音就像真的一样

纵轴叫“精度/Bit”

但“精度”的公式要复杂些

1 个 bit 能增加 -6dB

-6dB x 16 = -96dB

记录微弱的声音有何用？

为了“真实感”和“空间感”

人耳的听力极限是 -90dB

听力的频率上限是 20kHz

然而播放器出来的声音,

还要经过其他设备

播放设备最好高于 16bit

而录音师还有更多考虑 :

动态范围 & 音质

动态范围/信噪比, 失真,

频率响应, 左右声道串音

有些以“% 百分比”为单位

有些以 “dB” 为单位

有没有发现一个现象:

dB 单位的参数都很接近?

百分比和 dB 可以转化

动态范围是参数的下限

它们都 ≥ 芯片动态范围

芯片动态的进化

无论专业级与民用级

动态范围一直在提升

民用级达到 110dB 后

讨论“音质”将失去意义

ES 9038 Pro

140dB 动态范围 !

恐怖的还有 THD+N

达到 0.00008% (-122dB)

正如 SPL 官方所说的

“模拟”也有动态范围

迫使 120dB 的设备降价

音质提升只是时间问题

未来音质可能没有意义

可玩的还有很多

便利性, 低能耗, 延迟..

其实在脱离“音质”之后

音乐才能恢复本来面貌

音质本来不应成为重点

幸好, 以后也不会是

【音质】