Breaking News

[Focusrite] IP 클럭킹의 놀라운 세계

Audio-Over-IP : 오디오 엔지니어를 디지털 글리치로 부터 자유롭게 하다

 

모든 디지털 오디오 시스템은 연결된 디바이스의 동기화를 위해 일정하고 지속적인 클럭을 반드시 필요로 한다. 네트워크 오디오 기술이 발전하면서 새로운 인프라가 구축되고, 이에 따라 에러 없는 오디오 전송을 위해 새로운 방식의 클러킹 싱크 방식이 요구되었다.

기존의 디지털 오디오 시스템의 동기화는 워드 클럭(word clock)을 사용하는 방식이었다. 포커스라이트의 Will Hoult는 아래와 같이 설명하였다. “클럭을 배포하기 위한 가장 단순한 방법은 BNC 케이블을 한 디바이스의 word clock 아웃풋에서 다른 디바이스의 word clock 인풋으로 연결하는 것입니다. ADAT, AES3, S/PDIF 등의 디지털 오디오는 다른 케이블을 통해서 연결되고, 클럭 케이블은 단순히 동기화를 위해서 사용되는 것이지요. BNC 케이블을 통해 전송되는 시그널은 네모의 파형을 가지고 있으며, 사용되는 샘플레이트 마다 하나의 펄스를 가지고 있습니다. 예를 들어 96kHZ 샘플레이트를 사용하고 있으면, 초당 96,000개의 펄스가 있는 것입니다. 이 클럭 시그널은 수신 장치에 각 샘플의 시작부분이 어디인지 알려주는 역할을 합니다. ”

BNC 케이블을 추가하여 더 많은 디바이스를 사용할 경우, 클럭 시그널은 다음 장비로 전달되며 동기화는 유지된다. 이 방식은 레코딩 스튜디오나 마스터링룸과 같이 비교적 작은 공간에서는 문제 없이 사용할 수 있다.

Hoult은 추가적으로 이렇게 말하였다 : “하지만 이 개념을 거대한 데이터와 대역폭을 가진 IP 네트워크에 적용한다면, 사실 그렇게 효율적인 방법은 아닙니다. ”

수많은 네트워크가 존재할 때, IP 기반 시스템을 워크 클럭을 내보내는데 사용하는 것은 매우 비실용적이다.

 

IP 클러킹 : 새로운 개념

단테와 같은 Audio-Over-IP 시스템을 사용할 때, 전통적인 워크 클럭을 사용하는 것이 비실용적인 이유는 데이터와 대역폭만이 문제가 아니다. 장거리로 데이터를 전송 시, 노이즈가 없는 데이터 스트림을 유지하는 것 자체가 기술적으로 어려울 수 밖에 없다. 기존 클럭 시그널을 IP 네트워크에서 사용할 경우 예측 할 수 없는 문제가 발생할 수도 있으며, 단테와 같은 거대한 네트워크로 각 장치가 수십 미터 씩 떨어져 있는 시스템에서는 클럭 시그널이 유지되기 어려운 점이 있다.

다행히도, IP 시스템의 설계자들은 오디오 장비들의 LAN 영역에 진입하기도 전에 이 문제의 해결책을 발견하였다. 단테로 연결되는 장치들은 기존과는 완전히 다른 방식으로 클럭 동기화를 하는데, 이 클럭 방식의 공식 명칭은 IEEE 1588 v1 Precision Time Protocal 로 불리우며, ‘PTP’ 로 줄여 부르기도 한다. “PTP 클럭 시스템을 이용하는 각 장치들은 압력과 온도와 같은 환경 요인에 큰 영향을 받지 않는 고품질의 크리스탈 오실레이터를 사용합니다. 각 장치는 개별적인 클럭을 내장하고 있어, 스스로 데이터를 처리할 수 있습니다. 즉 모든 장치가 스스로 카운팅 하고 있는 것이죠.”

 

물론 아직 동기화에 대한 문제가 남아있다. 예를 들어 두개의 디바이스가 다른 장소에 위치하여 있으면, 각기 다른 온도와 압력에 노출되며 결과적으로 다른 레이트로 카운트를 할 수 있다.

단테 장비들은 여러 클럭 연결성을 가지고 있지만, 단테 네트워크로 연결되어 있을 경우에는 굳이 다른 방식의 클럭을 사용할 필요가 없다.

“PTP는 결국 어떤 역할을 하냐면, 일정한 간격으로 타이밍 레퍼런스를 제공하여, 모든 장비가 스스로 클럭을 보정할 수 있도록 하는 것입니다. 정확히 말하자면 1/4초(250ms) 마다 이 정보를 업데이트 할 수 있도록 말이죠.” 워드 클럭 시스템과는 다르게, 이젠 실제 시간을 배분하고 있는 것이죠.”

*오디오 네트워크에 있어서, 특수한 GPS 마스터 클럭을 이용하는 방송 시스템을 제외하고는 실제 시간은 무의미하다. 포커스라이트 RedNet 과 Red 장치들은 UNIX 타임(POSIX 혹은 Epoch 타임으로 불리기도 한다)을 사용하고 있다. 이 것은 1970년도 1월 1일(UTC) 이후로 몇 초가 지났는지를 나타내고 있으며, 이 아티클이 쓰여질 당시 1487473910151 UNIX time 을 나타내고 있다.

 

소리내어 카운팅하기

Hoult은 PTP를 쉽게 설명하기 위해 이를 음악적으로 비유했다.

“서로 다른 3명의 사람이 숫자 1부터 5까지는 소리내어 세고, 6부터 10까지는 머리 속으로, 숫자가 11이 되었을 때 크게 말한다고 가정을 해봅시다. 아마 3명 모두 1부터 5까지 셀 때는 거의 동일하게 셀 테지만, 11을 소리 내어 말할 때는 각각 다르게 말할 것입니다. 만일 이 상황에서 지휘자가 있다면 어떨까요?”

“오케스트라에서 지휘자가 모든 박자를 세어주지는 않습니다. 4분 음표를 한번씩 표시해주는 정도만 할 것입니다. 연주자들은 지휘자의 모든 움직임을 따르기 보다는, 주기적으로 한번씩 참고를 할 뿐입니다. 드러머는 마디를 셀 때, 마디의 첫 부분은 참고하지만, 그 사이사이는 본인의 타이밍을 유지하는 것입니다. PTP와 같은 경우, 각 연주자의 카운팅이 크리스탈 오실레이터이며, 지휘봉은 네트워크로 전송되는 각 장비가 참고하여 보정하는 타이밍 레퍼런스인 셈이죠. ”

지휘자는 모든 연주자가 따라야 할 주기적인 타이밍 레퍼런스를 제공한다. 이것은 단테 장치들이 사용하는 PTP 프로토콜과 유사한 과정이다.

하지만 이 타이밍 레퍼런스는 어디서 오는 것일까? 기존의 워드 클럭 시나리오에서는, 운영자가 연결된 장치 중 마스터를 선택하고, 나머지 연결된 장비들은 슬레이브 장치로 설정을 한다. Audio-Over-IP 네트워크에서는 클럭 선정 프로토콜 (clock election protocol)이 연결된 각 장치의 내부 클럭을 측정하여 그 중 가장 안정적인 장치를 “GrandMaster”로 지정을 한다. 결국 시스템이 모든 과정을 알아서 진행 한다는 것이지만, 사용자가 Dante Controller 소프트웨어를 사용하여 네트워크에 존재하는 장비 중, 선호하는 마스터 장치를 직접 선택할 수도 있다.

 

장점

비록 PTP의 재설정 시간인 1/4초(250ms)이 디지털 오디오에서는 과하게 길게 느껴질 수 있지만, 실제 디바이스들은 그 정도의 데이터만 있어도 충분하다는 것이다. 초당 96,000 펄스를 내보내던 기존 워드 클럭 시스템과는 다르게, 초당 4개의 데이터 패킷만 전송하면 되기 때문에 대역폭 소모가 매우 적은 점도 있다.

 

“클럭을 잃어버리는 건 최악이죠. 네트워크에 존재하는 가장 중요한 시그널이기 때문에, QOS(Quality of Service : 서비스 품질) 설정을 통해 오디오 데이터 보다 높은 우선순위로 설정했습니다. 이것이 반직관적으로 보일 수 있지만, 시스템 전체에 정확한 타이밍을 유지하는 것이 더 중요합니다. 그렇지 않으면 오디오의 싱크가 맞지 않을 테니까요.”

 

물론, 세상에 완벽한 시스템은 존재하지 않는다. 네트워크 디바이스가 데이터 패킷을 분실하는 일이 발생할 수도 있다. “네트워크가 올바르게 설정되어 있지 않다면 클럭 시그널이 손실될 수도 있습니다.  이런 경우가 발생하면 포커스라이트 레드넷과 레드와 같은 단테 장비들은 오디오를 자동으로 뮤트하고, 클럭이 다시 안정적으로 돌아오면 다시 오디오를 재생합니다. ”

 

단테 네트워크에서 클럭이 손실되는 경우와 같은 최악의 경우에도, 기존의 클럭 시스템보다는 그 피해가 적다. 후자의 경우에는 시스템 전체의 모든 장치들을 재 동기화해야 되는 번거로운 과정을 거쳐야 할 것이며, 디지털 글리치로 인해 분실된 오디오 또한 다시 복원할 수 없기 때문이다.