소니의 고해상도 지원 코덱 "LDAC"무엇이 굉장? 개발자에 의문을 부딪친 (2015년 기사)

 

 

 소니가 1 월에 발표 한 새로운 코덱 "LDAC (에루닷쿠)." 손실 압축의 Bluetooth 오디오하면서 현재 최대 96kHz / 24bit의 오디오 데이터를 전송할 수있는 "고해상도 상당"의 음질이 매도 다. 2015 봄 여름 모델도 속속 LDAC 대응 모델이 투입 돼 12 일 발표 된 스피커 'SRS-X99 / X88 / X77」나 도코모에서 발매가 결정된 「Xperia Z4'에도 대응하는 등 소니 자세도 엿볼 수있다.

LDAC 대응 제품. 고해상도의 워크맨 'NW-ZX2 "(왼쪽)와 Bluetooth 헤드폰'MDR-1ABT"(오른쪽)

 

 그러나 리니어 PCM에서는 음악 CD의 약 3 배에 달하는 데이터 폭이 필요한 96kHz / 24bit의 음원을 어떻게하면 음악 CD 다음의 데이터 폭으로 압축하고 있는지 등 어설픈 모르는 점이 많다. 소니 제품 이외에도 채용이 진행 것인가라는 불안도 닦아 수 없다.

 

 그래서 소니 LDAC 개발진 인터뷰를 행해, LDAC 대해 이것 저것하고 의문점을 부딪쳐왔다. 기존의 비 손실 압축 코덱 알고리즘의 차이 오디오 데이터 압축에 대한 생각 타사에 라이센스 정책 ...... 본고에서는 의문을 닦아 주실 것이다.

 

 취재에 응 해준 것은 소니의 시스템 연구 개발 본부에서 오디오 기술 개발에 해당하는 스즈키 시로우 씨와 마츠 무라 유우키 씨, 剱持 치사토 씨, 그리고 고해상도 관련 제품의 사업 전략을 담당하는 미야 靖武 씨의 4 명 ( 다음 경칭 생략).

왼쪽에서 소니 시스템 연구 개발 본부에서 LDAC 등 오디오 기술 개발을하고있는 마츠 무라 유우키 씨, 스즈키 시로 씨, 剱持 치사토 씨, V & S 사업 본부에서 고해상도 관련 제품의 사업 전략을 담당하는 미야 靖武 씨

Bluetooth 오디오에서 '코덱'의 역할

 LDAC의 이야기로 진행하기 전에 이른바 Bluetooth 오디오에서 '코덱'의 역할에 대해 설명하고 싶다.

 Bluetooth에서는 Hi-Fi 오디오 프로파일로 "A2DP (Advanced Audio Distribution Profile) '을 규정하고있다. 오디오 관련 프로파일로는 Bluetooth는 HFP (Hands-Free Profile) 및 HSP (Headset Profile)도 존재하지만, 음성 통화 용이며 재생 주파수 대역은 좁아 소리를 즐긴다는 점에서 A2DP를 비 부 위해도 없다.

 

 A2DP는 스테레오 또는 모노 오디오 데이터를 ACL (Asynchronous Connectionless Link)라는 방식을 사용 비동기 적으로 전송한다. 그러나 규격 책정 당시는 Bluetooth 전송 속도 제한이 1Mbps 정도이며, 고품질의 스테레오 오디오를 처리하려면 조건으로 엄격했다. 오디오 CD를 무 압축으로 스트리밍하는 데 필요한 비트 레이트는 약 1.4Mbps (44100Hz / 16bit / 2ch)이며, Bluetooth 2.0에서 비동기 통신 할 때 데이터 전송 속도가 최대 723kbps이기 때문에해도 하등 대책이 걸렸다 사정은 이해 할 수있을 것이다.

 

 그래서 생각 해낸 방법이 음성 부호화 및 복호화를 행할 소프트웨어의 도입, 즉 코덱 (CODEC 어원은 COder / DECoder)에 의한 데이터 압축이다Bluetooth / A2DP는 필수 코덱으로 "SBC"를 정의하여 비 압축 PCM ()에 비해 효율적인 데이터 전송을 가능하게하고있다. 즉, Bluetooth 오디오 기기를 개발하는 경우 필수 SBC 만 지원두면 어떤 기기에서도 소리 나름대로 잘 들리 것이다. 또한, HFP의 최신 사양 (v1.6)는 SBC를 바탕으로 개발 된 코덱 "mSBC (modified SBC) '을 지원하지만, 모노만을위한 오디오 용도에는 적합하지 않다.

 

 A2DP는 SBC 이외의 코덱도 이용 가능하다. 옵션으로 MEPG-2 / 4 AAC 및 MPEG-1 Audio (MP3), ATRAC이 준비되는 것 외에 최근에는 영국 CSR 사의 aptX를 지원하는 오디오 기기도 많다사용하는 코덱은 압축 알고리즘과 데이터 전송 구조가 다르기 때문에 한 입에는 말할 수 없지만, SBC보다 MP3 플레이어, MP3보다 AAC, AAC보다 aptX 쪽이 음질 적으로 유리하게된다. 그러나 그들은 기존의 코덱이 사실상 취급 정보량은 최대 48kHz / 16bit라는 음악 CD 수준에서 소위 "고해상도"에는 대응하지 않는다. 덧붙여서, AAC는 최대 96kHz / 24bit의 프로필은 준비되어 있지만, 고부하 이룬다 네 데이터 효율이 낮고, 지금까지 지원하는 오디오 용도의 칩은 개발되어 있지 않다.

LDAC의 특징으로 "수수께끼"의 부분

LDAC 로고

 그런 상황 등장한 것이 소니가 개발 한 새로운 코덱 "LDAC '이다. 제한된 데이터 폭에 효율적으로 오디오 데이터를 담는 것으로, 그것은 Bluetooth / A2DP되는 코덱의 역할이지만, 새로운 컨셉의 채용으로 어려웠던 고해상도 상당 품질의 오디오 데이터 전송을 가능하게하고있다. 기기에서 96kHz 샘플링 / 990kbps시 20Hz ~ 40kHz의 넓은 재생 대역 (기존 코덱은 20Hz ~ 20kHz)을 가지는 것도 LDAC 그래서이다.

 

 가장 큰 특징은 "데이터 폭을 넓힐"수. SBC의 최대 비트 레이트는 328kbps하지만 LDAC의 상한은 약 3 배의 990kbps. Bluetooth는 "EDR (Enhanced Data Rate) '라는 고속 통신용 확장 규격이 있으며, 2Mbps와 3Mbps의 두 가지 정의 된 전송 속도 중 2Mbps가 자주 사용되는 실효 값은 1.4Mbps 정도이며, 마진 부분을 ​​고려하면 1Mbps 정도가 현실적된다. 그것을 힘껏 사용 정보량을 늘려 최대 96kHz / 24bit라는 고해상도 상당의 소리 데이터를 처리 할 음질 향상을 도모하고자한다는 것이다.

 

 "가벼운"수도 LDAC의 중요한 특징이라고 할 수있다. 데이터 압축의 지식이 있으면 복잡한 연산을 수행 압축률을 높이는 것으로 데이터 효율을 높이고있는 것이다, 그래서 처리는 무겁게 요구 사양도 높은 것이 틀림 없다 ......라는 선입견 LDAC를 봐 버렸 쉽지만 LDAC는 오히려 그 반대로 간다허프만 코딩 (출현 횟수가 많은 데이터를 더 짧은 코드로 대체하여 정보의 압축을 도모 무손실 압축의 대표적인 알고리즘 .ZIP 등의 압축 파일 형식과 JPEG로 채용되고있다) 등 고부하 연산 를 수반하기 때문이다. 그래서 발생하는 부하는 기존 코덱과 큰 차이없는 수준으로 고성능이지만 비싼 최신 칩도 필요 없다.

 "소리를 남긴다」것도 특징의 하나. MP3와 AAC는 인간의 청각으로는 식별하기 어려운 고주파수 성분을 청각 심리 모델 분석을 통해 알아 내서 대담하게 자르는 데이터 총량을 크게 줄이고 있지만, LDAC는 청각 심리 모델 분석은하지 않는다. 다른 코덱을 잘라 버리는 고역 성분도 제대로 남아있을 것이다.

 

 하지만 어떤 방법으로 데이터를 효율화하지 않는 한, 비 압축 CD의 3 배 이상의 정보량이되는 96kHz / 24bit의 소리는 990kbps는 환율에 실리지 않는다MP3와 AAC 정도는 아니더라도 LDAC 약간의 데이터 손실을 수반하는 "로시"코덱 인 것은 확실하다. 그 근처의 신비를 탐험 것이 이번 LDAC 개발진을 물었다 이유 다.

기존 코덱 (48kHz / 16bit)와 LDAC (최대 96kHz / 24bit)는 데이터의 표현 영역이 크게 다르다. 48/16의 주파수 특성은 24kHz까지 다이나믹 레인지는 0에서 -96dB 대해 96 / 24는 주파수 특성이 48kHz까지 다이나믹 레인지는 0에서 -144dB까지 표현할 수

고음질의 비밀은 "단순"에

 우선 LDAC는 코덱의 구조와 어떻게하면 고해상도 음질을 Bluetooth / A2DP를 싣고 있는지, 그 근처의 사정에 대해 묻고 보았다.

LDAC의 개발은 언제쯤 시작했다 있을까요.

 

스즈키 시로 씨

스즈키 : LDAC의 기반이되는 코덱의 개발에 착수 한 것은 10 년 전입니다. 당시는 미디어 용량의 제약이 엄격 압축률을 우선 생각이 지배적 이었지만,이 코덱은 음질에 중점을 둔 설계했습니다. 오랫동안 정식 무대에는 나타나지 않았지만 ...... 무선이라는 제약이 많은 장면에서 사용할 수있을 것이라고. 그래서 편곡을 더해 Bluetooth / A2DP 호환 코덱을 정리 한 셈입니다. 그래서 LDAC 이콜 Bluetooth 코덱이라는 것은 없습니다.

LDAC 부호화 처리의 흐름이지만, MP3와 같은 청각 심리 모델을 이용한 분석도 허프만 코딩도하지 않는다라고 이해 맞죠?

스즈키 : 그렇습니다. 코딩 프로세스를 단순화하고 "가볍게"하고 데이터 폭을 넓혀 정보량을 늘려 음질 향상을 도모하고 있습니다. 샘플링 된 신호를 여러 주파수 성분으로 변환하는기구 주파수 스펙트럼의 형상을 수치화하는 '양자화'같은 기본적인 코딩 처리의 흐름은 기존의 오디오 코덱과 비슷하지만 LDAC는 더 간단합니다 . LDAC는 서브 밴드 (부분 대역) 분할하지 않고 그대로 주파수 변환으로 이동합니다.

 

마츠 무라 유우키 씨

마츠 무라 : 청각 심리 모델을 사용 코덱의 경우, 인간의 귀에 "들리지 않는다"라고하는 음역을 불필요한 데이터로 크게 깎아 있지만 LDAC의 경우 이러한 작업은하지 않습니다.

스즈키 : 원본 데이터가 남아만큼 "0"의 연속 등 같은 데이터가 나타나는 상황에 부족한 LDAC의 경우 압축률을 뽑지 못하고 비교적 높은 부하가 걸리게되므로, 허프만 코딩을하지 않으며 그럴 필요도 없는 것입니다.

그렇군요. 그러나 서브 밴드 분할은 데이터의 효율성 측면에서 일정한 효과가있는 것은?

스즈키 : 효율성이라는 관점에서 서브 밴드 분할을 행한 것이 좋지만, LDAC는 효율만을 추구하는 것은 아닙니다. 게다가 별칭 성분이 들어 오기 때문에 (필자 주 : 이른바 '소리를 마는 "처리), 음질 적으로는 불리하게됩니다. 높은 부하가 걸리는 것을 피하고 싶은 것도 있지만.

그렇게되면, 어떻게 소리의 데이터 량을 줄이고있는 것? 압축 프로세스를 단순화하면 압축률이 낮아 그만큼 한정된 비트 레이트에詰め込める정보는 줄어들지 않을까요 ?

스즈키 : 양자화 부분에서 데이터를 줄일 수 있습니다. 소리 데이터를 주파수로 변환 할 때마다 주파수 대역마다 데이터 양이 다른 "커브"가 발생 있지요. 예를 들어, 낮은 중역의 정보량은 많지만 고역을 향해 체감 해 나간다 든가.

마츠 무라 : 주파수 대역마다 정보량의 두께에 변화를 줄 것이에요. 알기 쉽게 말하면, 중저역은 정보량이 많기 때문에 24bit 할당하지만, 더 위의 음역은 그만큼도 없기 때문에 16bit 인간의 귀에 거의 들리지 않는다고하는 음역은 또한 할당을 적고, 식입니다.

스즈키 : 정보량은 줄어들 수 있지만, 데이터 날카롭게 않고 남겨두기 때문에 다른 코덱은 손실되기 쉬운 음장감 등 독특한 뉘앙스도 알 수 있다는 것입니다. 인간의 청각 이상의 고음역의 경우 성분이있는 것 자체 중요하지만 거기에 8bit도 맞출 필요는 부족한라는 생각입니다. 한편 중저음은 알기 쉬운이기 때문에, 24bit 풀에 할당해야합니다.

주파수 대역마다 정보량의 "신축성을 갖게하는"것이군요. 는 견해를 바꾸어 PCM과 비교하면 어떻습니까?

스즈키 : PCM은 모든 주파수 대역에서 일률적으로 정보량을 가지고 있기 때문에, 24bit 음원의 경우 전체 대역폭을 24bit로 기록합니다. 기존에 충실한다는 의미는 합니다만 낭비가 많은 것도 사실입니다. 영상에 비유하면 주인공의 표정과 피부의 질감도 배경 나무와 파도의 웅성 거림도 일률의 정보량을 갖게하고, 라고나할까요? LDAC에서 그 배경을 그리기위한 자원을 절약 할 정보량을 절약하고있는 것입니다.

그렇다면 어떤 부분에 원래의 상태 유지 자원을 절약한다는 판단은 어느 시점에서 행하고있는 것일까?

마츠 무라 : 입력 신호에 따라 처리하고 있습니다. 소스에 따라 동적으로 최적화 한 처리를 행하는 것입니다.

스즈키 : 시간축으로 기록 된 PCM은 전후의 샘플의 연속성 / 무결성을 유지하기 위해 동적 최적화는 할 수 없습니다. 그러나 주파수로 변환 (양자화) 한 후라면 비트 배분의 최적화 자재입니다. 여기가 LDAC 포인트는 아닐까요.

 

리니어 PCM의 비트 할당 방법의 개념도. 모든 성분에 대해 균일 밖에 배분하지 못하고, 인간의 청각 특성을 고려하면 고역의 데이터 배분은 과잉 기미

 

LDAC의 비트 할당 방법의 개념도. 게인에 따라 비트를 최적 배분함으로써 데이터 량을 리니어 PCM의 절반 정도로 감소 할뿐만 아니라, "Super Spectrum Mapping"라는 수법으로 고역을 조금 줄이고 990kbps는 비트 레이트에서도 96kHz / 24bit를 표현할 수

"구현의 용이성 '에서 LDAC 대응 제품이 증가 날이 가까이!?

 현재 LDAC는 Bluetooth / A2DP는 "상자"에서 작동하는 소프트웨어이며 "상자"를 구성하는 오디오 플레이어 등 송신자와 스피커로 대표되는 수신 장치이다. 발표에서 일천 만 해당 장치는 적고, 본고 집필 시점에서는 소니 제품 정도 것. 그 특징과 장점은 이해하더라도 선택이 늘지 않는 것은 고조 방법이없는 것은 확실 할 것이다. 그 근처의 질문도 LDAC 개발진에 부딪쳐 보았다.

LDAC 기기에는 어느 정도의 스펙이 필요할까요?

 

미야 靖武 씨

미야하라 : 너무 높은 부하를 필요로하지 않기 때문에 현재 다른 코덱에 사용되는 칩과 동일한 정도의 스펙이 있으면 충분하다. 구체적으로는 수십 MIPS 정도의 처리 능력이 있으면 충분합니다.

수십 MIPS는 지내며 "가벼운"라고 할 수준 이네요. 그러나 새로운 Bluetooth 칩을 일으켜야없는 것은?

剱持: C로 작성하는 참조 코드를 준비하고 있기 때문에, 그렇게 해 주시는 것은 물론 가능합니다. 특정 플랫폼에 대한 의존성도 없습니다. 어셈블러 수준에서 대응이 필요한 칩의 경우 레퍼런스를 바탕으로 어셈블러 코드를 작성하실 필요가 있지만.

스즈키 : 그것은 힘들 텐데 것으로, 영국 CSR의 "8675"라는 칩의 절차를 갖추고 있습니다. CSR8675 용으로 코드를 구현 제이기 때문에, 칩을 구입하여 주시고, 게다가 LDAC의 허가 주시면 LDAC 대응 제품으로 개발할 수 있습니다.

미야 : 영국 CSR에 LDAC를 라이센스하는 권리가 아니라 소니가 개별적으로 라이센스를하는 형태입니다. 또한, 제 1 탄은 영국 CSR했지만, 물론 타사의 칩에도 대응 가능합니다. "파트너의 칩을 사용하고 싶다」라고하는 요망이 있으면, 우리가 구현을 지원하는 형태가 될 것입니다.

그러나 이미있는 Bluetooth 제품에 "끝머리"의 형태로 칩을 싣는 것은 어렵지?

 

剱持 치사토 씨

剱持: 다른 코덱보다 구현하기 쉽다고 생각 해요. 처리 크기도 부호화 타이밍과 패킷 전송 방법도 ...... 미디어 페이로드는 SBC와 거의 같은 디자인입니다. 이렇게 디자인하지 않으면 사용주지 않는 것이란 생각이 있었 으니까. 코덱은 SBC를 대체 형태로 LDAC가 움직이는라는 이미지입니다.

스즈키 : Bluetooth / A2DP 표준 프레임 워크를 답습하고 개발하고 있기 때문에, 시스템 흐름은 SBC의 것을 거의 그대로 계승 것이 아닐까요.

는 PC와 소니 제품 이외의 스마트 폰에서 LDAC 대응은 어떻습니까?

스즈키 : 현재 유통되고있는 Bluetooth 칩은 주로 무선 통신 부분을 담당하고 있습니다. A2DP 사용되는 코덱은 소프트웨어 스택으로 나누어 볼 수있는 것이 많기 때문에, 나머지는 OS 벤더대로군요. Android 스마트 폰의 경우, 제조업체가 될 것입니까?

剱持: 실제로 BlueZ (필자 주 : Linux 및 Android OS에 채택 된 Bluetooth 스택)에 LDAC를 구현했을 때의 수정 부분은 무시할이었습니다. 첫 번째 협상 부분과 코덱의 전환을 수행하기위한 코드를 추가 기입 정도에서 움직이고 버렸 으니까.

스즈키 : Android OS 4.x의 경우 해당 레이어까지 고해상도 데이터를 가져 오는 "경로"가 없다는 문제가 있지만 (필자 주 : OS 표준의 오디오 처리 계는 고해상도 신호를 처리하지 못한다, 그래서 별도 개발 이 필요). 스택 BlueZ 또는 Bluedroid 하나에 대응도 달라집니다.

剱持: iPhone과 같은 Apple 제품에 관해서는, 스택의 사양을 파악하고 있지만 라이브러리로는 ARM에서도 움직임 때문에, 대응 가능한 것이 아닐까요.

미야 : 당사 Web 사이트에 LDAC 문의 페이지를 준비하고 있습니다 때문에, 연락 주시면 당장이라도.

스즈키 : LDAC 라이브러리 급한 제공합니다 (웃음).

 

소니 제품 이외의 보급에 기대. 192kHz / 32bit 및 멀티 채널 등 앞으로의 행보도 주목

 LDAC의 발표 이후 필자는 종종 LDAC를 이용한 시청의 장에 참여하고 있지만, 그 소리는 기존의 Bluetooth 오디오와는 분명히 수준이 다르다. 소리의 윤곽의 선명도와 리얼한 음장감 고조파 성분의 자연 스러움 등 "고해상도 다움"을 맛볼만한 용량을 느끼게한다.

 주파수 대역마다 정보량의 신축성을 붙이는하지만 소리 정보의 유무 자체는 깎아 없다는 LDAC 부호화 방식은 독특하고, 또한 의미가 있다고 생각했다. 고해상도의 정보량을 Bluetooth / A2DP라는 상자에 넣는 것은 어딘가에서 "절약"하지 않는 한 어렵지만 인간의 청각 특성을 고려하여에서 정보의 농담이라면 납득할 수있다.

 소니의 "LDAC를 보급시키고 싶다"는 의사도 느껴졌다. 그것도 괜찮 으시면 부디라는 소극적인 것이 아니라 "꼭 많은 메이커에 채용 해 주셨으면」(미야 씨)라는 적극적인 것으로, 실제 영국 CSR과의 협업으로 대응 칩을 준비 하 형태로 나타나고있다. 소니로서는 일정한 품질 검사를 실시 한 후 라이선스를 결정하는 것이지만, 아무래도 "고해상도 (상당) 코덱 '인만큼 그냥 둥글게 만의 Bluetooth 스피커로 LDAC 대응을 판매하려고하는 제조사는 적은 것. 아마도 일정한 프리미엄을 가진 오디오 기기를 중심으로 채용이 진행되는 것이다.

 LDAC의 앞으로의 전개도 흥미로운 것이다. 현재는 최대 96kHz / 24bit하는 스펙이지만 LDAC 자체는 최대 192kHz / 32bit까지 대응 가능하다고한다. 채널도 2ch 이상으로 늘리는 것이 가능 서라운드도 시야에 들어간다그 의미는 LDAC는 "Bluetooth 이외도 포함한 무선 오디오 코덱 '이라는 관점에서 평가해야하며, 그러한 제품이 등장 할 것을 기대하고 싶다.

도코모가 출시 Xperia Z4는 스마트 폰 최초의 LDAC 대응 모델

해상 시노부

IT / AV 칼럼니스트. UNIX 계 OS와 스마트 폰에 대한 연재 · 저작 다수. 기술 기사를 다루는 한편, 항목 층을위한 부드러운 칼럼도 좋아 집필한다. 오디오 & 비주얼 방면에서는 OS 및 Web 개발 방면의 정보 수집력을 살린 제품 플랫폼의 동향 분석 및 Bluetooth와 DLNA 등 무선 분야의 취재가 특기. 2012 년부터 AV 기기 어워드 'VGP "심사 위원.

 

https://av.watch.impress.co.jp/docs/topic/700991.html

 

 

+ Recent posts