고조파벡토르려진음성부호화방법

 2020.9.3.

경애하는 김정은동지께서는 다음과 같이 말씀하시였다.


《체신부문앞에 나선 중대한 임무를 성과적으로 수행하기 위하여서는 정보화시대의 요구에 맞게 체신현대화를 보다 높은 단계에서 실현하여야 합니다.》


이동통신체계를 비롯한 무선통신망체계들에서는 음성통신이 지배적이고 보편적인 봉사로 되고있다. 일반적으로 사용되는 음성부호화방식은 부호려진선형예측부호화(LPC)방법으로서 부호화속도를 4kbit/s까지 보장할수 있고 부호화속도를 4kbit/s보다 작게 하면 음질이 저하되게 된다. 한편 다중대역려진부호화(MBE), 씨누스변환부호화(STC)와 같은 방법들에서는 스펙트르진폭과 위상을 따로따로 부호화하여 음질을 개선하지만 비트속도가 6~8kbit/s로 증가한다.


김일성종합대학 정보과학부에서는 고조파벡토르려진음성부호화방법을 리용하여 음성을 보다 낮은 비트속도로 부호화하면서 음질을 개선하였다.


이 방법에서는 음성신호를 두가지 형태의 토막, 즉 유성음토막과 무성음토막으로 분할하고 유성음토막에 대해서는 선형예측잔차신호의 고조파스펙트르진폭에 대한 파라메터표시를 리용하며 무성음토막에 대해서는 부호려진선형예측부호화알고리듬을 적용한다.


먼저 표본화된 음성입력을 일정한 길이와 겹침구간을 가진 흐레임들로 분할하고 매개 흐레임에 대하여 LPC해석을 진행한다. 다음에 LPC파라메터들을 선스펙트르쌍(LSP)파라메터로 변환하여 벡토르량자화한다. 그다음에는 량자화 된 LSP파라메터를 리용하여 입력자료를 역려파하며 LPC잔차신호를 계산한다. LPC잔차신호의 자기상관함수의 첨두값들로부터 열린고리방식으로 기본주파수성분(피치)추정을 진행하고 과거흐레임과 현재흐레임에서 추정된 피치들을 리용하여 피치추정의 믿음성을 제고한다.


LPC잔차신호에 대한 리산푸리에변환(DFT)을 진행하여 고조파스펙트르진폭추정을 진행한다. 또한 LPC잔차신호의 전력스펙트르를 리용하여 세밀피치추정을 진행하여 피치의 정확도를 높인다. 가변개수의 고조파들로 구성된 스펙트르포락을 벡토르량자화하기 위하여 고조파스펙트르벡토르는 대역제한보간방법으로 고정차원벡토르로 변환하고 그 다음에 고정차원스펙트르벡토르를 벡토르량자화한다.


유/무성판별에서는 LPC잔차신호의 표준화된 최대자기상관, 령교차의 개수, LPC잔차신호전력스펙트르의 고조파구조의 세기를 미리 설정된 값들과 비교하여 판별을 진행된다. 무성음토막인 경우에는 통계적부호책을 리용하여 벡토르려진부호화를 진행한다.


이와 같이 고조파벡토르려진음성부호화에서는 LSP, 유/무성정보, 피치, 고조파스펙트르포락정보들을 리용하여 극저비트속도(4.0kbit/s이하)에서도 음성의 자연성을 개선하며 통로대역이 제한되는 통신체계들에 효과적으로 적용할수 있다.