"Sonic Visualiser '이라는 무료 오디오 음악 데이터 분석 소프트웨어를 알고 있을까? Windows, Mac, Linux에서도 작동하는 소프트웨어이며, 런던 대학의 Centre for Digital Music라는 곳에서 개발 된 것. 오래전부터 존재하고 있던 것이므로, 사용해 본 적이있는 사람은 적지 않을 것이다.

Sonic Visualiser

 필자도 10 년 전에 만진 적이 있었지만, 그 때는 핀과 오지 않고,별로 사용할 수없는 상태였다. 하지만 그 후에도 조금씩 버전 업을 반복하고있는 것 같고, 현재는 3.1이라는 버전. 얼마 전 SNS에서 조금 화제가되고 있었기 때문에 오랜만에 사용해 보았는데, 상당히 재미있는 기능을 여러 가지는 소프트 이었기 때문에 재차 소개해 보자.

간단한 화면에서 다양한 분석 지원

 Sonic Visualiser는 GNU General Public License 전, 무료로 배포되는 소프트웨어. Sonic Visualiser 사이트에서 누구나 자유롭게 다운로드하여 사용할 수있다. GNU라는 데서도 알 수 있듯이, Linux에서 동작을 메인으로하는 것이기는하지만 Windows와 Mac에서 모두 사용할 수 있으며 누구나 부담없이 사용할 도구이기도하다. 파일 크기으로 Windows 용도 Mac 버전도 18MB 정도로 최근의 소프트로서는 아주 가벼운 것 인 것도 사실이다.

Sonic Visualiser 사이트

 그 Sonic Visualiser는 최근 소개 한 MAGIX의 Sound Forge와 마찬가지로 프리웨어 Audacity 등과 같은 오디오 데이터를 읽어 들여 파형 표시를 할 수 있지만, 그것을 편집 해 나가는 것이 목적이 아니라, 그것을 다양한 형태로 분석하는 것에 주목적이 놓인 독특한 도구이다. 이 Digital Audio Laboratory에서도 오디오를 분석하는 경우가 자주 있지만 평소에는 상용 소프트웨어 인 Sound Forge 외에도 Steinberg의 WaveLab 또한 국산 프리웨어이다 WaveSpectra 등을 사용하는 경우가 많다. 하지만 만약 Sonic Visualizer가 편리하게 사용할 소프트이라면 앞으로이 연재 용으로도 활용할 수있는 것이 ......라는 것이 이번 시도 한 목적이기도하다.

 누구나 추시 수 있도록 가능한 정보를 공개하면서 문서를 만들고있는 것이지만, 무료 소프트웨어를 이용할 수 있다면 많은 독자 분들에게도 유용한 것. 게다가 Windows에서도 Mac에서도, Linux에서도 같은 수 있다면 더더욱 것이다.

 그래서, 즉시 사용해 보았습니다 만, 여기에서는 Linux 대신 Windows를 시도했다. 해당 Windows 버전에 32bit 버전과 64bit 버전이 각각 존재하므로 Windows 10의 64bit 버전을 사용하고있는 필자로서는 물론 64bit 버전을 다운로드하고 설치 시도했다.

32bit 버전과 64bit 버전이있다

설치 화면

 시작하다 보면 시작 화면에 이어 거의 새하얀 심플한 화면이 등장 해 온다. 여기에 오디오 데이터를 읽어 들여 분석가는 셈이다. 읽을 수있는 파일 형식은 WAV, MP3, AIFF, FLAC, OggVorbis과 대충 갖추어져있는 것처럼 보이지만, GNU 라이센스라는 것이 관계하고있는 것일까, AAC는 Windows Media Audio 등에 대응하고 있습니다 없다는 것은 조금 불편도 느낄 곳이다. 가장 WaveSpectra이라고 WAV 밖에 읽을 수 없으니까 파일 포맷의 대응 수를 이러쿵 저러쿵 말할 생각은 없지만 ...

시작 화면

초기 화면은 단순

지원 포맷

 이제 192kHz / 24bit 스테레오 오디오 파일을 읽어 보았는데, 일반적으로 파형이 표시됩니다. 운동에 5.1ch의 WAV 파일을 로딩도 제대로 6ch의 데이터로 표시되는 것은 우수한 곳.

192kHz / 24bit의 파일을 읽어 들인 곳

5.1ch WAV 파일은 제대로 6ch의 데이터로 표시된

 다시 스테레오 데이터를 읽어 들인 상태에서 재생 버튼을 클릭 해 보면, 소리가 나오는 동시에 화면도 움직이기 시작한다. 원하는 오디오 인터페이스에서 소리가 나오게하고 싶습니다, File 메뉴에서 Preferences를 선택합니다. 그러자 각종 설정 화면이 나오는데, Audio I / O 탭을 보면 여기에서 원하는 오디오 인터페이스를 선택할 수있다.

재생시 화면

Audio I / O 탭에서 오디오 인터페이스를 선택

 그러나 Sonic Visualiser가 전혀 일본어 대응하지 않는 것도 있고, 특히 Windows의 경우 글꼴이 깨져 버렸다. 적어도 ASIO에 대응 해 두어 주었으면했지만 보았는데 MME 드라이버 만. 이것도 GNU 제약 무리일지도. 마찬가지로 WASAPI에도 대응하고 있지 않기 때문에, 재생 도구로 보면 좀 구식 생각도 해 버린다. Mac은 원래가 CoreAudio 그래서 좀 더 제대로 쓸만한는있다. 무엇보다, Sonic Visualiser는 재생 소프트웨어가 아닌 오디오를 시각화 해 나갈 분석 소프트웨어이며, 봐야 곳은 재생 성능은 아니다. 실제로 어떤 표시를 할 수 있는지 살펴 보자.

 기본적으로 파형 표시되지만, Pane (창) 메뉴에서 선택하여 기본 스펙트로 그램 디스플레이, 음계마다 보이는 스펙트럼 표시 피크 주파수에서 볼 스펙트로 그램 디스플레이, 또한 스펙트럼 디스플레이와 다양한 표시 방법이 준비되어 있으며, 그것은 순식간에 표시되어 버리는 것이 최대의 특징.

 또한 "스펙트럼"는 음성의 주파수 분포 (주파수 신호의 강도)을 시간 축에 따라 표시하는 것으로, 말은 비슷하지만 "스펙트럼"은 가로축이 주파수에서 세로축이 강도 (크기)를 나타낸다.

기본 파형 표시

pane 메뉴

스펙트로 그램 표시

음계 당 스펙트로 그램 표시

피크 주파수에서의 스펙트럼 표시

스펙트럼 표시

2 개의 표시 방법을 목적에 따라 이용 가능

 처음에는 조금 당황은 Sonic Visualiser에 Pane 및 Layer 두 가지 표시 방법이있는 것이다. 간단하게 말하면, Pane 여러 정렬 할 때 트랙처럼 세로로 표시되어가는 것. 반면 Layer는 여러 화면을 거듭해 나간다는 것. 또한 필요에 따라 여러 Pane을 정렬 한 후, 각각 여러 Layer를 거듭 한 것도 가능하게되어있다.

Pane 표시

Layer 메뉴

여러 Pane을 정렬 한 다음, 여러 레이어를 겹쳐진다

 그 Layer가 조금 알기 어렵 기 때문에 조금 보충 해두면, 전술 한 바와 같이 시작할 때 1 개의 Pane이 열릴 것이지만, 화면 오른쪽을 봐도 알 수 있듯이 처음부터 3 개의 레이어를 거듭하고있다. Layer 1은 화면을 확대 시키거나 하단의 글로벌 표시에서 원하는 부분을 선별하거나 화면 스크롤을 맡는 것, Layer 2 눈금자 표시 및 Layer 3 파형 표시의 것으로되어있다. 각 Layer는 화면 우측 하단의 스위치로 표시할지 여부의 전환도 가능하다. 여기 스펙트럼 표시와 스펙트럼 표시 등 좋아하는 Layer를 거듭해가는 것이지만, Layer로 이용할 수있는 것은 이러한 오디오 데이터 분석 결과 만은 아니다. Layer 메뉴에는 이외에도 다양한 Layer가 준비되어있다.

처음부터 3 개의 레이어가 표시

각 레이어는 화면 우측 하단의 스위치로 표시 전환 가능

Layer 메뉴에는 다양한 항목이 포함되어있다

 구체적으로는 시간축에 마커를 칠 Time Instants Layer 시간 축에 따라 자동화를 그리 듯 선을 그어 갈 Time Vaules Layer 피아노 롤적인 MIDI 순서를 그릴 Note Layer가있다.

Instants Layer

Time Vaules Layer

Note Layer

 그 외에도 지역을 잘라 갈 Regions Layer 텍스트를 쓸 Text Layer 이미지를 묻을 Images Layer 등이있다.

Regions Layer

Text Layer

 무엇을 어떻게 Layer를 거듭해 나갈 것인가는 아이디어 나름이지만, 개인적으로 조금 재미 있다고 생각한 것은 음계마다 표시 Melodic Range Spctrogram 표시와 Note Layer를 중첩시키는 비결. 이 Melodic Range Spctrogram는 세로축이 음계 가로축이 시간이 될 것이지만, 여러 악기가 섞인 사운드에서 어떤 음정의 소리가 나오고 있는지를 시각화된다.

Melodic Range Spctrogram와 Note Layer를 거듭된다

 실제로 배음도 눈에 띄게 표시되므로 자동으로 음정을 꺼내 보면 화한다는 것은 매우 어렵지만, 소위 귀 카피위한 큰 단서는 될 것 같다. 이 Melodic Range Spctrogram에서 두드러지고있다 음정을 확인하면서 그것을 모방 같이 Note Layer에 써 나가기로 MIDI 데이터를 생성 할 수있다.

 연주하면 내장 간단한 악기로 연주 할 수도 있지만이를 MIDI 데이터로 내보낼 수이므로 나중에 DAW에로드하고 활용 뭐라고 방법도있을 것 같다.

소리의 분석을 쉽게

 그런데 Sonic Visualiser 자체 편집 기능을 가지고 있지는 않지만, 플러그인을 사용하여 소리를 변화시키는 것이 가능이라고 쓰여져있다. 해도 GNU 규칙에서 Steinberg VST 플러그인은 NG. 한편, Audio Units은 규칙으로 괜찮지 만, 현재는 지원되지 않는다. 반면 사용 가능한 것은 Linux의 DAW 등으로 이용되고있다 LADSPA 및 DSSI.

 이러한 Windows 버전 없잖아려고하니, Audacity가 LADSPA에 대응하고있는 것도 있고, 존재하는 것이라고. 역시 무료로 배포되는 90 개 이상의 플러그인을 세트로 한 「LADSPA_plugins-win-0.4.15.exe "라는 것을 설치 보았다.

 설치 디렉토리는 "C : Program Files (x86) AudacityPlug-Ins"라고되어 있었으므로, 32bit 버전이다라고 생각하고 궁금했는데, 아니나 다를까, 64bit 버전의 Sonic Visualiser는 사용할 수 없습니다 했다.

플러그인은 64bit 버전의 Sonic Visualiser에서 사용할 수 없었던

 그래서 다시 32bit 버전의 Sonic Visualiser를 설치하고 사용해 보았는데, 새로운 Layer를 만드는 것 같은 느낌으로 효과를 걸 수 있도록했다. 다만, 실제로는 어떤 효과를 선택해서 그 순간에 Sonic Visualiser 자체가 떨어져 버려, 사용할 수 없었다. 다시 보면, LADSPA_plugins-win-0.4.15.exe의 타임 스탬프는 2006 년. 더 이상 업데이트되지 않은 것을 보면, 역시 LADSPA를 Windows에서 사용하는 것은별로 현실적이지 않은 것 같다.

32bit 버전의 Sonic Visualiser에 효과를 걸 수 있도록하지만, 이번 환경에서는 사용할 수 없었던

 Sonic Visualiser 사이트에 VST를 LADSPA로 변환하는 래퍼 소프트도 존재한다는 것이었지만, 이쪽도 역시 잘 움직일 수없이 포기. Linux이면 플러그인도 사용할 수있는 것이라고 생각하지만 너무 복잡한 것을 기대하지 않을지도 모른다.

 어쨌든, Sonic Visualiser를 사용하면 쉽게 스펙트로 그램 표시가있는 것을 확인할 수 있었다 때문에 향후 기사에서 스펙트럼의 분석이 필요할 때 사용해 보는 것도 재미있을 것 같다. 단지 스펙트럼 표시는 특정 소음을 지울 때 매우 유용하게 활용할 수 있지만,이 소프트웨어 자체 편집 기능을 가지고 있지 않기 때문에 어떤 활용법이 있는지는 아직 찾지 않은 곳이기도하다.

후지모토 켄

 리크루트에 15 년 근무한 후 2004 년에 유한 회사 프랙탈 디자인을 설립. 리크루트 재적 시대부터 MIDI, 오디오, 레코딩 관련 기사를 중심으로 집필하고있다. 이전에는 시퀀스 소프트웨어의 개발이나 MIDI 인터페이스, PC 용 음원의 개발에 종사 한 적도 있기 때문에 현재에도 시스템 주위의 지식은 깊다. 저서로는 「컴플리트 DTM 가이드 북」(릿토 뮤직 크) "수 하츠네 미쿠 & 카가미 네 린 · 렌」(임프레스 재팬), 「MASTER OF SONAR"(BNN 신사) 등이있다. 또한 블로그 형 뉴스 사이트 DTM 스테이션 을 운영하는 한편, All About에서는 DTM · 디지털 레코딩 담당 가이드도 맡고있다. Twitter는 @kenfujimoto .

 

https://av.watch.impress.co.jp/docs/series/dal/1134161.html

 

 

소니의 고해상도 지원 코덱 "LDAC"무엇이 굉장? 개발자에 의문을 부딪친 (2015년 기사)

 

 

 소니가 1 월에 발표 한 새로운 코덱 "LDAC (에루닷쿠)." 손실 압축의 Bluetooth 오디오하면서 현재 최대 96kHz / 24bit의 오디오 데이터를 전송할 수있는 "고해상도 상당"의 음질이 매도 다. 2015 봄 여름 모델도 속속 LDAC 대응 모델이 투입 돼 12 일 발표 된 스피커 'SRS-X99 / X88 / X77」나 도코모에서 발매가 결정된 「Xperia Z4'에도 대응하는 등 소니 자세도 엿볼 수있다.

LDAC 대응 제품. 고해상도의 워크맨 'NW-ZX2 "(왼쪽)와 Bluetooth 헤드폰'MDR-1ABT"(오른쪽)

 

 그러나 리니어 PCM에서는 음악 CD의 약 3 배에 달하는 데이터 폭이 필요한 96kHz / 24bit의 음원을 어떻게하면 음악 CD 다음의 데이터 폭으로 압축하고 있는지 등 어설픈 모르는 점이 많다. 소니 제품 이외에도 채용이 진행 것인가라는 불안도 닦아 수 없다.

 

 그래서 소니 LDAC 개발진 인터뷰를 행해, LDAC 대해 이것 저것하고 의문점을 부딪쳐왔다. 기존의 비 손실 압축 코덱 알고리즘의 차이 오디오 데이터 압축에 대한 생각 타사에 라이센스 정책 ...... 본고에서는 의문을 닦아 주실 것이다.

 

 취재에 응 해준 것은 소니의 시스템 연구 개발 본부에서 오디오 기술 개발에 해당하는 스즈키 시로우 씨와 마츠 무라 유우키 씨, 剱持 치사토 씨, 그리고 고해상도 관련 제품의 사업 전략을 담당하는 미야 靖武 씨의 4 명 ( 다음 경칭 생략).

왼쪽에서 소니 시스템 연구 개발 본부에서 LDAC 등 오디오 기술 개발을하고있는 마츠 무라 유우키 씨, 스즈키 시로 씨, 剱持 치사토 씨, V & S 사업 본부에서 고해상도 관련 제품의 사업 전략을 담당하는 미야 靖武 씨

Bluetooth 오디오에서 '코덱'의 역할

 LDAC의 이야기로 진행하기 전에 이른바 Bluetooth 오디오에서 '코덱'의 역할에 대해 설명하고 싶다.

 Bluetooth에서는 Hi-Fi 오디오 프로파일로 "A2DP (Advanced Audio Distribution Profile) '을 규정하고있다. 오디오 관련 프로파일로는 Bluetooth는 HFP (Hands-Free Profile) 및 HSP (Headset Profile)도 존재하지만, 음성 통화 용이며 재생 주파수 대역은 좁아 소리를 즐긴다는 점에서 A2DP를 비 부 위해도 없다.

 

 A2DP는 스테레오 또는 모노 오디오 데이터를 ACL (Asynchronous Connectionless Link)라는 방식을 사용 비동기 적으로 전송한다. 그러나 규격 책정 당시는 Bluetooth 전송 속도 제한이 1Mbps 정도이며, 고품질의 스테레오 오디오를 처리하려면 조건으로 엄격했다. 오디오 CD를 무 압축으로 스트리밍하는 데 필요한 비트 레이트는 약 1.4Mbps (44100Hz / 16bit / 2ch)이며, Bluetooth 2.0에서 비동기 통신 할 때 데이터 전송 속도가 최대 723kbps이기 때문에해도 하등 대책이 걸렸다 사정은 이해 할 수있을 것이다.

 

 그래서 생각 해낸 방법이 음성 부호화 및 복호화를 행할 소프트웨어의 도입, 즉 코덱 (CODEC 어원은 COder / DECoder)에 의한 데이터 압축이다Bluetooth / A2DP는 필수 코덱으로 "SBC"를 정의하여 비 압축 PCM ()에 비해 효율적인 데이터 전송을 가능하게하고있다. 즉, Bluetooth 오디오 기기를 개발하는 경우 필수 SBC 만 지원두면 어떤 기기에서도 소리 나름대로 잘 들리 것이다. 또한, HFP의 최신 사양 (v1.6)는 SBC를 바탕으로 개발 된 코덱 "mSBC (modified SBC) '을 지원하지만, 모노만을위한 오디오 용도에는 적합하지 않다.

 

 A2DP는 SBC 이외의 코덱도 이용 가능하다. 옵션으로 MEPG-2 / 4 AAC 및 MPEG-1 Audio (MP3), ATRAC이 준비되는 것 외에 최근에는 영국 CSR 사의 aptX를 지원하는 오디오 기기도 많다사용하는 코덱은 압축 알고리즘과 데이터 전송 구조가 다르기 때문에 한 입에는 말할 수 없지만, SBC보다 MP3 플레이어, MP3보다 AAC, AAC보다 aptX 쪽이 음질 적으로 유리하게된다. 그러나 그들은 기존의 코덱이 사실상 취급 정보량은 최대 48kHz / 16bit라는 음악 CD 수준에서 소위 "고해상도"에는 대응하지 않는다. 덧붙여서, AAC는 최대 96kHz / 24bit의 프로필은 준비되어 있지만, 고부하 이룬다 네 데이터 효율이 낮고, 지금까지 지원하는 오디오 용도의 칩은 개발되어 있지 않다.

LDAC의 특징으로 "수수께끼"의 부분

LDAC 로고

 그런 상황 등장한 것이 소니가 개발 한 새로운 코덱 "LDAC '이다. 제한된 데이터 폭에 효율적으로 오디오 데이터를 담는 것으로, 그것은 Bluetooth / A2DP되는 코덱의 역할이지만, 새로운 컨셉의 채용으로 어려웠던 고해상도 상당 품질의 오디오 데이터 전송을 가능하게하고있다. 기기에서 96kHz 샘플링 / 990kbps시 20Hz ~ 40kHz의 넓은 재생 대역 (기존 코덱은 20Hz ~ 20kHz)을 가지는 것도 LDAC 그래서이다.

 

 가장 큰 특징은 "데이터 폭을 넓힐"수. SBC의 최대 비트 레이트는 328kbps하지만 LDAC의 상한은 약 3 배의 990kbps. Bluetooth는 "EDR (Enhanced Data Rate) '라는 고속 통신용 확장 규격이 있으며, 2Mbps와 3Mbps의 두 가지 정의 된 전송 속도 중 2Mbps가 자주 사용되는 실효 값은 1.4Mbps 정도이며, 마진 부분을 ​​고려하면 1Mbps 정도가 현실적된다. 그것을 힘껏 사용 정보량을 늘려 최대 96kHz / 24bit라는 고해상도 상당의 소리 데이터를 처리 할 음질 향상을 도모하고자한다는 것이다.

 

 "가벼운"수도 LDAC의 중요한 특징이라고 할 수있다. 데이터 압축의 지식이 있으면 복잡한 연산을 수행 압축률을 높이는 것으로 데이터 효율을 높이고있는 것이다, 그래서 처리는 무겁게 요구 사양도 높은 것이 틀림 없다 ......라는 선입견 LDAC를 봐 버렸 쉽지만 LDAC는 오히려 그 반대로 간다허프만 코딩 (출현 횟수가 많은 데이터를 더 짧은 코드로 대체하여 정보의 압축을 도모 무손실 압축의 대표적인 알고리즘 .ZIP 등의 압축 파일 형식과 JPEG로 채용되고있다) 등 고부하 연산 를 수반하기 때문이다. 그래서 발생하는 부하는 기존 코덱과 큰 차이없는 수준으로 고성능이지만 비싼 최신 칩도 필요 없다.

 "소리를 남긴다」것도 특징의 하나. MP3와 AAC는 인간의 청각으로는 식별하기 어려운 고주파수 성분을 청각 심리 모델 분석을 통해 알아 내서 대담하게 자르는 데이터 총량을 크게 줄이고 있지만, LDAC는 청각 심리 모델 분석은하지 않는다. 다른 코덱을 잘라 버리는 고역 성분도 제대로 남아있을 것이다.

 

 하지만 어떤 방법으로 데이터를 효율화하지 않는 한, 비 압축 CD의 3 배 이상의 정보량이되는 96kHz / 24bit의 소리는 990kbps는 환율에 실리지 않는다MP3와 AAC 정도는 아니더라도 LDAC 약간의 데이터 손실을 수반하는 "로시"코덱 인 것은 확실하다. 그 근처의 신비를 탐험 것이 이번 LDAC 개발진을 물었다 이유 다.

기존 코덱 (48kHz / 16bit)와 LDAC (최대 96kHz / 24bit)는 데이터의 표현 영역이 크게 다르다. 48/16의 주파수 특성은 24kHz까지 다이나믹 레인지는 0에서 -96dB 대해 96 / 24는 주파수 특성이 48kHz까지 다이나믹 레인지는 0에서 -144dB까지 표현할 수

고음질의 비밀은 "단순"에

 우선 LDAC는 코덱의 구조와 어떻게하면 고해상도 음질을 Bluetooth / A2DP를 싣고 있는지, 그 근처의 사정에 대해 묻고 보았다.

LDAC의 개발은 언제쯤 시작했다 있을까요.

 

스즈키 시로 씨

스즈키 : LDAC의 기반이되는 코덱의 개발에 착수 한 것은 10 년 전입니다. 당시는 미디어 용량의 제약이 엄격 압축률을 우선 생각이 지배적 이었지만,이 코덱은 음질에 중점을 둔 설계했습니다. 오랫동안 정식 무대에는 나타나지 않았지만 ...... 무선이라는 제약이 많은 장면에서 사용할 수있을 것이라고. 그래서 편곡을 더해 Bluetooth / A2DP 호환 코덱을 정리 한 셈입니다. 그래서 LDAC 이콜 Bluetooth 코덱이라는 것은 없습니다.

LDAC 부호화 처리의 흐름이지만, MP3와 같은 청각 심리 모델을 이용한 분석도 허프만 코딩도하지 않는다라고 이해 맞죠?

스즈키 : 그렇습니다. 코딩 프로세스를 단순화하고 "가볍게"하고 데이터 폭을 넓혀 정보량을 늘려 음질 향상을 도모하고 있습니다. 샘플링 된 신호를 여러 주파수 성분으로 변환하는기구 주파수 스펙트럼의 형상을 수치화하는 '양자화'같은 기본적인 코딩 처리의 흐름은 기존의 오디오 코덱과 비슷하지만 LDAC는 더 간단합니다 . LDAC는 서브 밴드 (부분 대역) 분할하지 않고 그대로 주파수 변환으로 이동합니다.

 

마츠 무라 유우키 씨

마츠 무라 : 청각 심리 모델을 사용 코덱의 경우, 인간의 귀에 "들리지 않는다"라고하는 음역을 불필요한 데이터로 크게 깎아 있지만 LDAC의 경우 이러한 작업은하지 않습니다.

스즈키 : 원본 데이터가 남아만큼 "0"의 연속 등 같은 데이터가 나타나는 상황에 부족한 LDAC의 경우 압축률을 뽑지 못하고 비교적 높은 부하가 걸리게되므로, 허프만 코딩을하지 않으며 그럴 필요도 없는 것입니다.

그렇군요. 그러나 서브 밴드 분할은 데이터의 효율성 측면에서 일정한 효과가있는 것은?

스즈키 : 효율성이라는 관점에서 서브 밴드 분할을 행한 것이 좋지만, LDAC는 효율만을 추구하는 것은 아닙니다. 게다가 별칭 성분이 들어 오기 때문에 (필자 주 : 이른바 '소리를 마는 "처리), 음질 적으로는 불리하게됩니다. 높은 부하가 걸리는 것을 피하고 싶은 것도 있지만.

그렇게되면, 어떻게 소리의 데이터 량을 줄이고있는 것? 압축 프로세스를 단순화하면 압축률이 낮아 그만큼 한정된 비트 레이트에詰め込める정보는 줄어들지 않을까요 ?

스즈키 : 양자화 부분에서 데이터를 줄일 수 있습니다. 소리 데이터를 주파수로 변환 할 때마다 주파수 대역마다 데이터 양이 다른 "커브"가 발생 있지요. 예를 들어, 낮은 중역의 정보량은 많지만 고역을 향해 체감 해 나간다 든가.

마츠 무라 : 주파수 대역마다 정보량의 두께에 변화를 줄 것이에요. 알기 쉽게 말하면, 중저역은 정보량이 많기 때문에 24bit 할당하지만, 더 위의 음역은 그만큼도 없기 때문에 16bit 인간의 귀에 거의 들리지 않는다고하는 음역은 또한 할당을 적고, 식입니다.

스즈키 : 정보량은 줄어들 수 있지만, 데이터 날카롭게 않고 남겨두기 때문에 다른 코덱은 손실되기 쉬운 음장감 등 독특한 뉘앙스도 알 수 있다는 것입니다. 인간의 청각 이상의 고음역의 경우 성분이있는 것 자체 중요하지만 거기에 8bit도 맞출 필요는 부족한라는 생각입니다. 한편 중저음은 알기 쉬운이기 때문에, 24bit 풀에 할당해야합니다.

주파수 대역마다 정보량의 "신축성을 갖게하는"것이군요. 는 견해를 바꾸어 PCM과 비교하면 어떻습니까?

스즈키 : PCM은 모든 주파수 대역에서 일률적으로 정보량을 가지고 있기 때문에, 24bit 음원의 경우 전체 대역폭을 24bit로 기록합니다. 기존에 충실한다는 의미는 합니다만 낭비가 많은 것도 사실입니다. 영상에 비유하면 주인공의 표정과 피부의 질감도 배경 나무와 파도의 웅성 거림도 일률의 정보량을 갖게하고, 라고나할까요? LDAC에서 그 배경을 그리기위한 자원을 절약 할 정보량을 절약하고있는 것입니다.

그렇다면 어떤 부분에 원래의 상태 유지 자원을 절약한다는 판단은 어느 시점에서 행하고있는 것일까?

마츠 무라 : 입력 신호에 따라 처리하고 있습니다. 소스에 따라 동적으로 최적화 한 처리를 행하는 것입니다.

스즈키 : 시간축으로 기록 된 PCM은 전후의 샘플의 연속성 / 무결성을 유지하기 위해 동적 최적화는 할 수 없습니다. 그러나 주파수로 변환 (양자화) 한 후라면 비트 배분의 최적화 자재입니다. 여기가 LDAC 포인트는 아닐까요.

 

리니어 PCM의 비트 할당 방법의 개념도. 모든 성분에 대해 균일 밖에 배분하지 못하고, 인간의 청각 특성을 고려하면 고역의 데이터 배분은 과잉 기미

 

LDAC의 비트 할당 방법의 개념도. 게인에 따라 비트를 최적 배분함으로써 데이터 량을 리니어 PCM의 절반 정도로 감소 할뿐만 아니라, "Super Spectrum Mapping"라는 수법으로 고역을 조금 줄이고 990kbps는 비트 레이트에서도 96kHz / 24bit를 표현할 수

"구현의 용이성 '에서 LDAC 대응 제품이 증가 날이 가까이!?

 현재 LDAC는 Bluetooth / A2DP는 "상자"에서 작동하는 소프트웨어이며 "상자"를 구성하는 오디오 플레이어 등 송신자와 스피커로 대표되는 수신 장치이다. 발표에서 일천 만 해당 장치는 적고, 본고 집필 시점에서는 소니 제품 정도 것. 그 특징과 장점은 이해하더라도 선택이 늘지 않는 것은 고조 방법이없는 것은 확실 할 것이다. 그 근처의 질문도 LDAC 개발진에 부딪쳐 보았다.

LDAC 기기에는 어느 정도의 스펙이 필요할까요?

 

미야 靖武 씨

미야하라 : 너무 높은 부하를 필요로하지 않기 때문에 현재 다른 코덱에 사용되는 칩과 동일한 정도의 스펙이 있으면 충분하다. 구체적으로는 수십 MIPS 정도의 처리 능력이 있으면 충분합니다.

수십 MIPS는 지내며 "가벼운"라고 할 수준 이네요. 그러나 새로운 Bluetooth 칩을 일으켜야없는 것은?

剱持: C로 작성하는 참조 코드를 준비하고 있기 때문에, 그렇게 해 주시는 것은 물론 가능합니다. 특정 플랫폼에 대한 의존성도 없습니다. 어셈블러 수준에서 대응이 필요한 칩의 경우 레퍼런스를 바탕으로 어셈블러 코드를 작성하실 필요가 있지만.

스즈키 : 그것은 힘들 텐데 것으로, 영국 CSR의 "8675"라는 칩의 절차를 갖추고 있습니다. CSR8675 용으로 코드를 구현 제이기 때문에, 칩을 구입하여 주시고, 게다가 LDAC의 허가 주시면 LDAC 대응 제품으로 개발할 수 있습니다.

미야 : 영국 CSR에 LDAC를 라이센스하는 권리가 아니라 소니가 개별적으로 라이센스를하는 형태입니다. 또한, 제 1 탄은 영국 CSR했지만, 물론 타사의 칩에도 대응 가능합니다. "파트너의 칩을 사용하고 싶다」라고하는 요망이 있으면, 우리가 구현을 지원하는 형태가 될 것입니다.

그러나 이미있는 Bluetooth 제품에 "끝머리"의 형태로 칩을 싣는 것은 어렵지?

 

剱持 치사토 씨

剱持: 다른 코덱보다 구현하기 쉽다고 생각 해요. 처리 크기도 부호화 타이밍과 패킷 전송 방법도 ...... 미디어 페이로드는 SBC와 거의 같은 디자인입니다. 이렇게 디자인하지 않으면 사용주지 않는 것이란 생각이 있었 으니까. 코덱은 SBC를 대체 형태로 LDAC가 움직이는라는 이미지입니다.

스즈키 : Bluetooth / A2DP 표준 프레임 워크를 답습하고 개발하고 있기 때문에, 시스템 흐름은 SBC의 것을 거의 그대로 계승 것이 아닐까요.

는 PC와 소니 제품 이외의 스마트 폰에서 LDAC 대응은 어떻습니까?

스즈키 : 현재 유통되고있는 Bluetooth 칩은 주로 무선 통신 부분을 담당하고 있습니다. A2DP 사용되는 코덱은 소프트웨어 스택으로 나누어 볼 수있는 것이 많기 때문에, 나머지는 OS 벤더대로군요. Android 스마트 폰의 경우, 제조업체가 될 것입니까?

剱持: 실제로 BlueZ (필자 주 : Linux 및 Android OS에 채택 된 Bluetooth 스택)에 LDAC를 구현했을 때의 수정 부분은 무시할이었습니다. 첫 번째 협상 부분과 코덱의 전환을 수행하기위한 코드를 추가 기입 정도에서 움직이고 버렸 으니까.

스즈키 : Android OS 4.x의 경우 해당 레이어까지 고해상도 데이터를 가져 오는 "경로"가 없다는 문제가 있지만 (필자 주 : OS 표준의 오디오 처리 계는 고해상도 신호를 처리하지 못한다, 그래서 별도 개발 이 필요). 스택 BlueZ 또는 Bluedroid 하나에 대응도 달라집니다.

剱持: iPhone과 같은 Apple 제품에 관해서는, 스택의 사양을 파악하고 있지만 라이브러리로는 ARM에서도 움직임 때문에, 대응 가능한 것이 아닐까요.

미야 : 당사 Web 사이트에 LDAC 문의 페이지를 준비하고 있습니다 때문에, 연락 주시면 당장이라도.

스즈키 : LDAC 라이브러리 급한 제공합니다 (웃음).

 

소니 제품 이외의 보급에 기대. 192kHz / 32bit 및 멀티 채널 등 앞으로의 행보도 주목

 LDAC의 발표 이후 필자는 종종 LDAC를 이용한 시청의 장에 참여하고 있지만, 그 소리는 기존의 Bluetooth 오디오와는 분명히 수준이 다르다. 소리의 윤곽의 선명도와 리얼한 음장감 고조파 성분의 자연 스러움 등 "고해상도 다움"을 맛볼만한 용량을 느끼게한다.

 주파수 대역마다 정보량의 신축성을 붙이는하지만 소리 정보의 유무 자체는 깎아 없다는 LDAC 부호화 방식은 독특하고, 또한 의미가 있다고 생각했다. 고해상도의 정보량을 Bluetooth / A2DP라는 상자에 넣는 것은 어딘가에서 "절약"하지 않는 한 어렵지만 인간의 청각 특성을 고려하여에서 정보의 농담이라면 납득할 수있다.

 소니의 "LDAC를 보급시키고 싶다"는 의사도 느껴졌다. 그것도 괜찮 으시면 부디라는 소극적인 것이 아니라 "꼭 많은 메이커에 채용 해 주셨으면」(미야 씨)라는 적극적인 것으로, 실제 영국 CSR과의 협업으로 대응 칩을 준비 하 형태로 나타나고있다. 소니로서는 일정한 품질 검사를 실시 한 후 라이선스를 결정하는 것이지만, 아무래도 "고해상도 (상당) 코덱 '인만큼 그냥 둥글게 만의 Bluetooth 스피커로 LDAC 대응을 판매하려고하는 제조사는 적은 것. 아마도 일정한 프리미엄을 가진 오디오 기기를 중심으로 채용이 진행되는 것이다.

 LDAC의 앞으로의 전개도 흥미로운 것이다. 현재는 최대 96kHz / 24bit하는 스펙이지만 LDAC 자체는 최대 192kHz / 32bit까지 대응 가능하다고한다. 채널도 2ch 이상으로 늘리는 것이 가능 서라운드도 시야에 들어간다그 의미는 LDAC는 "Bluetooth 이외도 포함한 무선 오디오 코덱 '이라는 관점에서 평가해야하며, 그러한 제품이 등장 할 것을 기대하고 싶다.

도코모가 출시 Xperia Z4는 스마트 폰 최초의 LDAC 대응 모델

해상 시노부

IT / AV 칼럼니스트. UNIX 계 OS와 스마트 폰에 대한 연재 · 저작 다수. 기술 기사를 다루는 한편, 항목 층을위한 부드러운 칼럼도 좋아 집필한다. 오디오 & 비주얼 방면에서는 OS 및 Web 개발 방면의 정보 수집력을 살린 제품 플랫폼의 동향 분석 및 Bluetooth와 DLNA 등 무선 분야의 취재가 특기. 2012 년부터 AV 기기 어워드 'VGP "심사 위원.

 

https://av.watch.impress.co.jp/docs/topic/700991.html

 

 

 

2 주 전에 도시의 클리블랜드 (Cleveland) 테스트 베드에서 실시 된 새로운 ATSC 3.0 텔레비전 방송 플랫폼을 통해 상향 변환 된 HDR (High Dynamic Range) 정보를 전송하는 방송 전송 테스트는이 프로젝트에 참여한 엔지니어들에 의해 "엄청난 성공"으로 간주되었습니다.

 

목요일에 Technicolor 웹 사이트 에 게시 된 보고서에 따르면 현장 테스트는 5 월 14 일부터 16 일까지 NAB (National Association of Broadcasters)의 감독하에 다중 산업 엔지니어링 팀에 의해 진행되어 HDR 이미지를 전송하는 ATSC 3.0 신호가 어떻게 향상되는지를 보여줍니다 기존의 디지털 TV 방송 시스템의 경제적 및 기술적 성능.

 

"이 시험은 엄청난 성공이었습니다. 우리는 까다로운 도시 환경에서 향상된 공중파 서비스를 지원할 수있는 ATSC 3.0의 기능을 보여줄 수있는 상용 시스템을 구축했습니다. "Technicolor의 기술 개발 및 표준 부사장 인 Alan Stein이 게시에서 다음과 같이 말했습니다. "필드 테스트를 통해 다양한 환경에서 인구 밀도가 높은 대도시 지역에서 고화질 (HDR) 비디오 서비스를 제공 할 수있는 능력을 확인했습니다."

 

전문가 및 소비자 장비의 조합을 포함하는 테스트는 NAB 및 소비자 기술 협회 (CTA)가 후원하는 실험용 TV 방송국을 사용하여 실행되었습니다. 그것은 Cleveland의 Tribune 소유 WJW (Fox 8)에 위치하고있었습니다.

이 테스트 베드는 다양한 ATSC 3.0 요소에 대한 개념 증명 시험 및 ATSC 3.0 기반의 신제품 및 서비스를위한 창업 보육 기관으로 활동하기 위해 설립되었습니다. 

 

최신 테스트를 위해 팀은 신호가 주변 구조물에서 반사되는 조밀 한 개발 지역에 위치한 사무실 건물에 수신기를 배치했습니다. 이 상태는 일부 ATSC 1.0 신호를 동결시킬 수있는 심각한 다중 경로 간섭을 일으키는 것으로 알려져 있습니다.

조건에도 불구하고, 그룹은 신호 수신이 성공적이라고 말했다.

 

Technicolor에 따르면 테스트 내용은 Technicolor HDR1이라고도하는 Technicolor SL-HDR1로 인코딩되었습니다. 또한 SHVC라고도하는 MPEG 확장형 HEVC도 포함되었습니다.

 

이 밖에도 한국 기술 연구소 인 ETRI의 LDM (Layer Division Multiplexing) 기술이 포함되어있다.

 

시험에 사용 된 장비는 ETRI에서 제공 한 전문 ATSC 3.0 수신기; 한국의 기술 제공 업체 인 Kai Media가 제공하는 전문 HEVC 및 확장 가능한 HEVC 및 SL-HDR1 디코더;  
소비자 OLED는 4K / UHD / HDR의 TV LG에서 제공.

흥미롭게도 Technicolor Intelligent Tone Management (ITM) 기술은 Technicolor 파트너 인 Cobalt Digital에서 제공하는 장비를 사용하여 SDR에서 HDR로 원본 컨텐츠를 변환하는 데 사용되었습니다.

 

NAB의 엔지니어링 및 기술 정책 담당 수석 이사 인 켈리 윌리엄스 (Kelly Williams)는 "현장 테스트는 ATSC 3.0이 시청자에게 새로운 가치를 제공하고 방송사에게보다 효과적인 플랫폼을 제공하는 방법에 대한 또 다른 긍정적 인 검증이었다. "단일 채널에서 Technicolor SL-HDR1로 인코딩 된 콘텐츠 인 강화 된 비디오의 여러 방송을 제공하는 기능은 방송 업계의 경제를 변화시키고 소비자가 현재 가지고있는 높은 기대치를 충족시키는 데 도움이 될 것입니다."

지난 해는, NBC와 SES와 협력 클리블랜드 시험 설비가 시험 역에서 방송 클리블랜드 역에서 디코딩 된 한국에서 동계 올림픽의 4K UHDTV 위성 피드, ATSC 3.0 형식으로 다시 인코딩을 전송하는 데 사용되었고, 미국 시장에 적합한 한국의 ATSC 3.0 TV에서 성공적으로 수신되었습니다.

 

이 테스트는 ATSC 3.0 표준이 주요 대도시 지역의 맞춤형 서비스 응용 프로그램을 어떻게 용이하게하는지 보여줍니다.

미국 전역의 방송사는 현재 현재 방송국에서 구현할 기능과 기능을 결정하기 위해 ATSC 3.0의 기능을 평가하고 있습니다. 방송사의 자발적인 업그레이드는 상당한 투자를 수반 할 것입니다. 현지 시장 수요는 각 방송사가 언제 어떻게 진행할 것인지에 중요한 요소입니다.

 

각 방송국은 현재의 ATSC 1.0 신호를 새로운 ATSC 3.0과 동시에 계속해서 방송해야하는데, 이는 특정 시장에서 다른 방송사와의 스펙트럼 공유를 포함 할 가능성이 높습니다.

 

현재 한 가지 문제는 ATSC 3.0 튜너가 내장 된 가정용 TV 세트를 판매하지 않는다는 것입니다. 그것은 내년에 바뀔 것으로 예상됩니다. 그러나 레거시 장비는 외부 튜너 동글과 셋톱 박스를 추가 할 수있을 것으로 예상됩니다.

 

Technicolor Advanced HDR은 방송사를 고려한 경쟁 HDR 프로파일 중 하나입니다. 현재 LG의 4K 울트라 HDTV에만 Technicolor Advanced HDR 프로파일에 대한 지원 기능이 내장되어 있습니다.

 

Technicolor Advanced HDR 포맷의 일부 구현의 이점 중 일부는 방송 회사의 업그레이드 비용을 낮추는 것이지만, 일부 구현에서는 TV 세트 제조업체 및 소비자에게 추가 비용을 부과 할 수 있습니다.

 

높은 다이나믹 레인지는 동시에 사진의 밝기와 어두운 검은 영역 모두에 현저한 변화를 추가하기 때문에 중요한 향상입니다. 이것은 또한 색의 풍부함과 음영을 향상시키는 데 도움이됩니다. 그러나 방송 사업자는 시청자의 이익과 수요를 정당화하는 비용을 느끼지 못한다면 4K Ultra HD 해상도 또는 HDR을 추가 할 의무가 없습니다.

 

이러한 결정이 지금 이루어지고 있습니다. 계속 지켜봐.

https://hdguru.com/atsc-3-0-test-for-hdr-deemed-immense-success/

 

ATSC 3.0 Test For HDR Deemed `Immense Success’ | HD Guru

Tests of broadcast transmissions carrying upconverted High Dynamic Range (HDR) information over the new ATSC 3.0 television broadcasting platform conducted in an urban Cleveland testbed two weeks ago…

hdguru.com

 

+ Recent posts