![[100일 프로젝트] Day 10 - PCM 오디오가 소리를 담는 방식](/posts/columns/36.png)
[100일 프로젝트] Day 10 - PCM 오디오가 소리를 담는 방식
샘플링레이트와 비트뎁스가 실제 파일 안에서 어떻게 엮일까요? PCM의 저장 구조, 비트레이트 계산, WAV/FLAC/손실압축의 차이를 입문자 기준으로 정리합니다.
오늘의 질문
이전 챕터들을 통해서 우리는 이제 샘플링레이트와 비트뎁스가 무엇인지 알았습니다.
그럼 이제 자연스럽게 이어지는 다음 질문이 생깁니다.
- 이 두 숫자는 실제 파일 안에서 어떻게 저장될까요?
- WAV와 FLAC는 무엇이 다르고, 무엇이 같을까요?
- 음원 스펙(16/44.1, 24/96)을 보면 용량과 품질을 어떻게 해석해야 할까요?
오늘 다룰 PCM(Pulse Code Modulation)은
디지털 오디오의 가장 기본적인 저장 방식이자, 이후 포맷/코덱 학습의 출발점입니다.
핵심 개념 3개
- PCM은 아날로그 신호를 시간축에 대응하는 숫자로 기록하는 방식입니다.
- PCM의 기본 품질은 샘플링레이트(시간축)와 비트뎁스(진폭축) + 채널 수로 결정됩니다.
- 파일 용량과 데이터율은 위 세 요소로 거의 결정되며, 포맷(WAV/FLAC)에 따라 저장 방식이 달라집니다.
공학적으로 이해하기
1) PCM은 파형을 숫자 배열로 바꿔 저장한다
PCM은 (1) 아날로그 신호를 아주 짧은 시간 간격으로 쪼개서 각각의 시점마다 소리 크기를 측정하고,
(2) 그 값을 정해진 비트 수의 숫자로 저장한 뒤, (3) 그 숫자를 시간 순서대로 나열합니다.
여기서 앞에서 배웠던 개념을 그대로 적용할 수 있습니다.
- 샘플링레이트: 1초에 몇 번 측정할지
- 비트뎁스: 측정한 크기를 몇 단계 정밀도로 기록할지
즉 PCM은 시간축을 일정한 간격으로 쪼갠 뒤 각 시간마다 특정 크기 값을 기록한
규칙적인 데이터 테이블에 가깝습니다.
2) 스테레오 PCM은 "프레임" 단위로 저장된다

모노와 스테레오, 요즘에는 애트모스 멀티 채널과 같은 용어들을 자주 보셨죠?
여기서 채널이란 서로 다른 음성 신호를 재생하는 스피커의 수를 말합니다.
- 모노: 한 시점에 샘플 1개
- 스테레오: 한 시점에 샘플 2개(L/R)
우리가 일반적으로 듣는 오디오 시스템은 좌우 채널이 구분된 스테레오 시스템입니다.
스테레오 PCM에서는 같은 시점의 L/R 샘플 묶음을 보통 프레임(frame)으로 봅니다.
예를 들어 44.1kHz 스테레오라면,
- 1초에 44,100개의 "L/R 묶음"이 있고,
- 각 묶음에서 채널당 비트뎁스만큼 데이터가 기록됩니다.
그래서 데이터율(비트레이트)을 대략 이렇게 계산할 수 있습니다.
- 비트레이트 = 샘플링레이트 x 비트뎁스 x 채널 수
자주 보는 값으로 계산해 보면,
- 16/44.1 스테레오: 44,100 x 16 x 2 = 1,411,200bps(약 1,411kbps)
- 24/96 스테레오: 96,000 x 24 x 2 = 4,608,000bps(약 4,608kbps)
여러분이 무손실 음원의 스펙이라면서 자주 보이는 숫자, 1,411kbps가 이렇게 계산된 결과값입니다.
같은 샘플링레이트라 하더라도 16비트와 24비트 음원의 비트레이트 차이는 굉장히 큽니다.
24비트 음원을 고음질 음원이라 부르는 이유입니다. 데이터율이 높다는 것은 그만큼 음원의 용량이 크다는 뜻이고요.
즉 스펙이 올라갈수록 파일 크기와 전송 부담이 함께 증가합니다.
3) WAV, FLAC, MP3를 섞어 보면 헷갈리는 이유
CD 음원의 16/44.1 스펙을 무손실 음원이라 부른다고 했습니다.
CD를 리핑해서 파일로 변환할 때, 변환된 파일의 확장자를 유심히 본 적 있으신가요?
만약 스펙을 줄여서 리핑하지 않았다면, 파일의 확장자는 .wav 또는 .flac, 애플 유저였다면 m4a 등이었을 겁니다.
초보자가 가장 자주 헷갈리는 지점 중 하나인데요. 다양한 확장자들, 무엇이 다를까요?
자주 사용하는 확장자들을 정리하면 다음과 같습니다.
- WAV: PCM 데이터를 압축하지 않고 그대로 담는 컨테이너
- FLAC: PCM 데이터를 "손실 없이" 압축한 코덱/포맷
- MP3/AAC: 청감 모델을 이용해 일부 정보를 버리는 "손실 압축" 코덱/포맷
WAV와 FLAC은 원 신호가 가졌던 데이터를 그대로 파일로 가져온 것입니다.
다만 FLAC은 해당 데이터를 압축해서 용량을 줄였다는 점이 다릅니다.
청감의 영역에서는 WAV 파일과 FLAC 파일의 소리가 다르다는 이야기도 등장합니다만,
그렇다 하더라도 이건 데이터 외적인 문제이고요.
- "FLAC은 PCM을 잃지 않고 줄인 것"
즉 같은 마스터 원본이라면, WAV와 FLAC은 디코딩 후 PCM 데이터가 동일해야 합니다.
반면 MP3/AAC는 용량을 줄이기 위해 정보 일부를 생략합니다.
이 부분은 다음 챕터에서 본격적으로 다루겠습니다.
4) PCM 품질 해석에서 놓치기 쉬운 조건 3가지

PCM 스펙을 읽을 때는 숫자만 보면 오해가 생깁니다.
아래 세 조건을 같이 봐야 정확합니다.
- 원본 마스터가 같은지
- 서로 다른 마스터 곧 별개의 음원과 다름 없습니다. 따라서 PCM 스펙이 같더라도 당연히 소리는 다를 수 있습니다.
- 재생 체인이 해당 스펙을 안정적으로 처리하는지
- DAC/앱/OS 설정에서 리샘플링이 걸리면 의도와 다른 경로가 생길 수 있습니다. 대표적으로 안드로이드 OS는 배터리 효율 등을 이유로 고음질 음원을 다운샘플링 처리해서 재생합니다.
- 제대로 마스터링된 음원인지
- 아무리 고음질 음원이라도 음원의 퀄리티가 떨어지는 것은 어떻게 손댈 방법이 없습니다. 오디오 시스템을 파악할 때에는 고스펙 음원이 아니라, 제대로 만들어진 음원을 사용하는 것이 좋습니다.
청취 경험/인문학적 관점
고음질 음원은 기록의 충실성을 높인 결과물일 뿐입니다.
그리고 제대로 작업한 앨범의 경우 16/44.1 스펙만 보장된다면
음질 차이를 논하는 것이 큰 의미가 없는 경우도 많습니다.
숫자는 말 그대로 숫자에 불과할 뿐, 최소한의 기준만 넘어선다면
그 다음 음악 감상은 청음 환경, 본인의 취향에 맞게 세팅된 시스템 등에 의해 만족도가 좌우됩니다.
실전 예시
예시 1) WAV와 FLAC 중 무엇을 보관용으로 쓸지 고민될 때
같은 16/44.1 마스터를 WAV와 FLAC 두 버전으로 받았다고 가정해 보겠습니다.
- WAV: 파일이 크지만 단순하고 호환성이 넓음
- FLAC: 손실 없이 용량 절감, 메타데이터 관리가 편함
보관/감상 목적이라면 FLAC이 실무적으로 유리한 경우가 많습니다.
중요한 점은 "FLAC이라서 품질이 떨어지는가"가 아니라,
"같은 원본 PCM을 손실 없이 담았는가"입니다.
다만, 주변 여러 오디오파일들과 이야기를 나누면서 WAV 또는 FLAC에 따라
같은 음원임에도 소리가 달라진다는 의견도 분명 있었습니다.
결국 음악 감상은 본인이 하는 것입니다.
본인의 귀를 믿으세요. 남들이 같다고 해서 그냥 넘어가지 말고,
남들이 다르다고 해서 다를 것이라 미리 짐작하지 마십시오.
예시 2) 스펙이 높은데도 체감 차이가 애매할 때
24/96 파일이 16/44.1보다 반드시 크게 좋아야 한다고 기대했는데,
실청에서는 차이가 작게 느껴질 수 있습니다.
사실 이것도 정상입니다. 앞서 인간의 가청 영역은 최대 20kHz 수준이라고 말했습니다.
그리고 16/44.1만 보장되더라도 가청 영역 수준은 모두 다 음원에 담을 수 있습니다.
다만, 잘 세팅된 환경, 시스템에서는 고음질 음원과의 음질 차이가 느껴지는 것도 맞습니다.
따라서 차이가 없다고 말하는 사람도 나름의 근거가 있고, 있다고 말하는 사람도 근거가 있습니다.
앞으로의 학습 흐름

오늘은 PCM이라는 기본적인 음악 저장 방식에서
샘플링레이트와 비트뎁스가 실제 데이터 구조로 묶이는 과정을 정리했습니다.
다음 글에서는 이 PCM 데이터를 어떻게 줄이는지,
즉 손실압축(MP3/AAC)이 어떤 원리로 작동하고 어떤 한계를 가지는지 살펴보겠습니다.
- Day 11: 손실압축(MP3/AAC) 원리와 한계
마무리
PCM은 디지털 오디오의 원본에 가까운 표현 방식입니다.
샘플링레이트와 비트뎁스를 따로 이해한 뒤 PCM으로 묶어 보면,
스펙표를 볼 때 훨씬 덜 흔들리고 정확한 판단이 가능해집니다.
그렇다고 단순히 숫자만 높은 음원을 맹신하진 마세요.
몇 년 전에는 '뻥튀기 음원' 논란도 있었을 만큼, 숫자는 말 그대로 숫자일 뿐입니다.
한때 오디오파일들의 국민 테스트 음원, 이글스의 '호텔 캘리포니아'는
16/44.1임에도 어떤 24비트 음원보다 훌륭한 음질을 들려 주기도 합니다.
이론과 경험의 적절한 균형이 오디오에서는 중요합니다.
댓글
댓글 작성은 회원만 가능합니다.
댓글 불러오는 중...