140dB 动态范围要来了?

/ 阅读:9747
作者: 飞飞

很多几十年前我们无法离开的东西,今天已无关紧要。例如算盘、收音机、缝纫机...我们再把时间缩短一点:十年。2006 年你觉得必不可少的东西,现在无关紧要:

光驱、诺基亚、MP3 随身听、CD 唱片、报纸、CCTV...

没有它们,年轻人的生活不会有任何影响。

今天我们谈论一个同样可能会消失的概念:

【音质】

很多人觉得:这怎么可能?

就像当年数码相机“像素越高越好”,LCD 显示器“拖影/延迟越低越好”、“对比度越大越好”、“坏点越少越好”——现在这些概念都无关紧要。我们先来看这个概念:

————————

动态范围

————————

把任何数码相片放大,你看到的都是“格子”,但格子足够小时,你觉得就像真实的画面。

---

数字音频也都是格子,只要“格子”足够小,声音就像真的一样。

与图片不一样的是,数字音频的格子有时间线,以及 0dBFS 的音量上限,

横轴叫“采样率/Sample Rate”,纵轴叫“精度/Bit”

1979 年 SONY 制定 CD 的标准是 16-bit/44.1kHz,意味着把 1 秒切成 44100 份,但精度的公式更复杂一点,我们暂且将它理解为“音量下限”,最简单的计算方式是:

1 个 bit 对应 -6dB

16-bit 能记录(-6dB x 16)= -96dB 的细节。

对于普通人、普通设备和普通场合,12-bit 对应的 -72dB 你可能是够用的。在一些功能强大的民用播放器里,将一首歌衰减 72dB,你可能就听不到声音了。

那这么小声的细节有什么用?

——“真实感”和“空间感”。

在一般环境里,声音有无限的反射,人耳的进化结构能根据这些细微的声音反射,本能地判断声源位置、空间大小、以及空间质感——闭着眼睛你都能分别自己是在浴室唱歌、还是在教堂唱歌。如果把普通人放到“消音室”这种完全无反射的环境,很多人会疯掉。

如果设备够档次、试听环境安静、耳朵也灵敏,-72dB 并不能满足你,SONY 当年制定 16-bit/44100Hz(采样频率要达到声音频率的两倍)为标准,因为:

人耳的听力极限是 -90dB,频率是 20kHz

(因此 96kHz 对人类没有意义,但对你家狗是有意义的)

不过播放器出来还要经过其他设备

耳机还好,音箱系统要经过前级放大、线材、后级放大、以及单元,每过一道工序,就有音质损失和“声染”,为了准确还原 16-bit/44kHz,播放设备最好高于 16-bit。

对于录音师,还有更多的考虑:

假如以 16-bit 录制音频,经过软件的几十轨混音处理之后,单独的细节肯定无法高于 16-bit,因此录音必须用 24-bit,母带的格式通常也在 20-bit 或 24-bit。

如果你是音乐人,理解“精度”是很容易的,打开 Pro Tools 加入一个 Lo-Fi 插件(或者其他可以“降比特”的插件),马上就可以体会 4bit(噪声)、8bit 和 12bit 的区别。

录音师还可以做个小实验,将 Pro Tools 插入一轨 Signal Generator,发出 0dB 正弦波,声卡开到 0dBFS,音箱开到 Unity Gain,看音轨的音量能往下拉多少才听不见——小编试了下可以达到 -110dB 左右,因此这个动态对录音师依然有意义。

---

——————————————

动态范围和音质

——————————————

【音质】是一个整体的考核对象,一定能通过参数反应,如果不能——说明参数还不够全面。通常我们会有四个点来考量:

频率响应、动态范围/信噪比、失真、左右串音。

现在的设备频率响应基本都很平,讨论播放器“风格”已经没有意义,只需判断其他三类参数,那...怎么判断?——它们是有关联的,我们来看叉烧评测室之前测试的数据:

2016 新款 Symphony I/O 已到评测室,有意思的是,官方 DA 从 129dB 降到 126dB ~

除了频率范围,其他参数主要有两种,一种以百分比为单位,一种以 dB 为单位。

有没有发现 dB 为单位的都很接近?

例如 Noise Level/底噪、Dynamic Range/动态范围、Crosstalk/串音 基本都一样,而以百分比为单位的数据也很接近,另外:

百分比和 dB 是可以转化的

有不少专门的网站做这种单位换算,例如上一代 Symphony 的 THD 是 0.0002%,这对应 -114dB 的失真,IMD + Noise 的 0.0007% 对应 103dB 的失真。

总之,通常其他参数都比动态范围更大,因为——

动态范围是一个“下限”

SPL 提出了一个“数字动态(芯片)”和“模拟动态(模拟电路底噪)”的概念,

假如 D/A(数模转换)的动态范围是 -120dB,而模拟部分的动态(底噪)是 -118dB,那声卡的整体实测动态会在 -118dB;而假如模拟部分的动态(底噪)是 -122dB,那整体实测动态会在 -120dB。

无论底噪、失真、串音数据如何,它们都 ≥ 芯片动态范围。

---

——————————————

芯片动态的进化

——————————————

我们在“口袋中的母带声卡” MIYO 的评测中提过这个进化,对于录音棚而言:

• 1996 年录音棚最好的输出音质是 96dB(Digidesign 882,@16-bit)
• 1998 年录音棚最好的输出音质是 110dB(Digidesign 888|24 I/O,@24-bit)
• 2002 年输出达到了 117dB(Digidesign 192 I/O,@24-bit)
• 2008 年输出达到了 129dB(Apogee Symphony I/O,@24-bit)

这是专业级,我们看看民用级:

• 1998 年“创新”声卡输出达到 82dB(SoundBlaster Live 1024,@16-bit)
• 2002 年 AC97 集成声卡输出达到 90dB(Xilinx LM4550,@18-bit)
• 2008 年 AC97 集成声卡输出达到 98dB(Realtek ALC269,@24-bit)
• 2012 年 iPhone 5 输出实测达到 102dB(Cirrus Logic 338S1077,@24-bit)

PS:很多国产手机采用了 120dB 芯片,但我看其他网站实测并没超过 100dB~

无论专业与民用级,音质一直在提升

2015 年音质水准最高的千元专业声卡(AudioProbe Spartan A),输出已经达到了 2002 年之前最高水准的 888|24 I/O,而现在一台千元以上的手机,动态范围也能超过 1998 以前录音棚最好的 D/A。我们认为:

民用级达到 110dB 之后,讨论音质将失去意义。

谈回专业圈,其实小编觉得 129dB 以上也失去了意义,但作为最追求声音的群体,“跑分”有心理意义,129dB 的记录已经整整 8 年没有突破了,但这只是时间问题。

本文的主角要登场了:

ES 9038 Pro

http://www.esstech.com/index.php?cID=360

在今年初的 CES 上,AKM 发布了新旗舰芯片 AK4497EQ 动态范围 129dB,这只是追上了 ESS 公司和 TI 公司,不过 ESS 公司发布的 ES 9038 Pro 真是吓人一跳:

140dB 动态范围!

恐怖的还有 THD+N,达到了 0.00008%(-122dB)

那你就能用上 140dB 动态吗?依然有难度——

正如 SPL 所说的,“模拟”也有动态范围

目前主流专业设备中,参数最高的“前级” Phonitor X 只达到了 136dB,这得用上 120V 高压电路和分立运放,模拟电路的功力对数字音频厂商是很大的挑战,Symphony I/O 当年为了上 129dB 还被迫装了个风扇(发热太大),造成不少问题。

ES 9038 有三种模式,只有单通道模式能达到 140dB(然而并没有单通道的声卡...),立体声和 8 通道的参数官方没有公布,如果 8 通道有 130dB,考虑到上述模拟设计能力的限制,我觉得 8 通道设计最现实,而 Apogee 很可能采用立体声设计~(136dB?)

应该说 ESS 并不是录音行业的主流设计,大家看叉烧的声卡评测,除了 Apogee 就没别家了,Avid、UA、Antelope 都是 TI 方案(不过 Apogee 的设计师去了 Antelope...),要改整体方案,涉及到人士变动,这里难度最大。

其实我们觉得 ES9018 的最大意义是:

迫使 130dB、120dB 的设备降价

不过没有这么快,厂商还要设计、试错、生产和运输,小编个人预计:

• 2016 年底或 2017 年初,我们有望看到第一台采用 ES9038 的专业声卡
• 2017 年,千元入门声卡有望普及 110dB(目前普遍在 105dB)
• 2017 年,3K ~ 6K 价位的中端声卡有望普及 120dB(目前普遍是 115dB)
• PCM1794 的 132dB 潜力还没完全挖掘,但大哥 TI 最好能推出新的芯片来“跑分”
• 2018 年,万元级专业声卡有望达到 125dB(目前普遍在 120dB)

总之,音质提升只是时间问题

时间越早到,音质越没有意义

那音质到头后还有什么可玩?——便利性、低能耗都很关键:

• 有源音箱都加上蓝牙,自带 AD 都上 120dB(目前中端监听主流是 110dB)
• 集成电池的蓝牙话筒也会面世,不光要音质好,关键 AD 和运放要省电
• 手机的音质重要(高压、高热、高能耗),还是续航重要?但以后这并不矛盾

在脱离音质之后,音乐才能恢复成本来面貌

很多人听蔡琴、听王菲、听《加州旅馆》,其实并不是在听音乐,而是在听一堆铁。你知道《加州旅馆》讲的是个鬼故事吗?你知道里面的双吉他编曲有多美妙吗?

对于热爱音乐——而不是热爱器材的真正爱好者,

音质本来不应该成为重点,以后也不会是。

---

  • "意味着把1秒切成44100份...", 应该是22020份, 因为一个位置需要两个点去采, 因此能采到的理论频率上限是22.020KHz。
    Picker 评论道
  • 我想想,44100 个采样点真的是 22020 份吗?不能说是一个位置用“两份”去采吗?也就是一份只能采半个周期...我是这么理解的。
    飞飞 评论道
  • 1秒切成44100份没错啊,44100是采样率,单位就是点数/秒。声音频率又不是固定到上限22050的,怎么会是22020份?“一个位置”究竟是指的一个什么?这概念好模糊……
    ajunk 评论道
  • 每秒对时域波形采样44100次,即44.1kHz,每次采样间隔相同,都是1/44100秒,奈奎斯特理论是指采样频率是实际波形能达到的频率上限的两倍以上则无失真,可还原原有信号。当然这只是理论上,实际要考虑滤波器、处理能力等各方面。另外一半是22050,楼下的数学是谁教的?
    zhuqin 评论道
  • 我觉得单通道动态范围还是可以达到的,因为不少DAC已经采用每通道一片甚至多片DAC芯片以求性能最大化,比如antelope的platinum。
    zhuqin 评论道
  • 汗,我也没发现 22020 这个梗...
    飞飞 评论道
  • 哈哈昨晚熬多了, 应该是22050的频率上限。
    Picker 评论道
  • 就像你说的,是指按照Nyquist极限,能采到的极限是fs/2,所以至少要两倍于对象频率再加上限频才不会出现aliasing。因此我说的“一个位置需要两个点去采”确实不严谨。
    Picker 评论道
  • 所以卖音箱还是长久之计233。失真都在最后的环节了。话筒技术的搁浅也是一大瓶颈,不过录音师玩的开心就好
    NSX 评论道
  • 140dB,震惊中...但让科技风暴来得更猛烈些吧,受益的会是我们
    ZDB 评论道
  • 好好好!折腾起来!用16bit的CD听出140db的动态来!
    风云烈火 评论道
  • 强烈好奇厂家的跟进,看哪家推出新机器,达到140db对电路设计布局有个考验。
    风云烈火 评论道
  • 9018才登上巅峰没多久,9038就要来了,科技发展的同时人们真正应该关注的点究竟是什么…
    LeeWorld 评论道