퀀텀/하이브리드 양자

6.3. 데이터를 0과 1로 직접 번역하는 방법-계산 기저 인코딩

친절샘 정이 2026. 5. 18. 13:10

데이터를 0과 1로 직접 번역하는 방법

계산 기저 인코딩


시작하기 전에 — 이런 장면을 상상해보자

모스 부호를 아는가.

전쟁 영화에서 군인이 손가락으로 똑똑 두드리며 신호를 보내는 것. 점(·)과 선(-)의 조합으로 모든 글자를 표현한다.

A = ·-
B = -···
C = -·-·
 

점과 선, 두 가지만으로 모든 알파벳을 표현한다.

계산 기저 인코딩이 이 모스 부호와 같다.

0과 1, 두 가지만으로 모든 데이터를 표현한다. 그리고 그 0과 1을 큐비트의 |0⟩과 |1⟩ 상태에 직접 집어넣는다.


세 가지 인코딩을 비교하자

지금까지 세 가지 인코딩을 배웠다. 오늘이 마지막이다.

세 가지를 짐 싸기로 비교하자.

진폭 인코딩 (초고밀도 압축가방):
짐 100만 개를 특수 기술로 가방 하나에 넣는다.
압축률 최고. 준비 과정 매우 복잡.

각도 인코딩 (나침반 가방):
짐 하나마다 방향(각도)으로 표현한다.
실용적이고 안정적. 현재 가장 많이 사용.

계산 기저 인코딩 (직접 번역 가방):
짐을 0과 1로 바꿔서 그대로 넣는다.
가장 단순하고 직관적. 1:1로 대응.
 
 

계산 기저 인코딩이 가장 단순하다. 가장 솔직하다. 있는 그대로 번역한다.


기본 원리: 1:1 직역

영어-한국어 사전 비유로 설명하자.

영어 단어를 한국어로 번역한다.

apple → 사과 banana → 바나나 cat → 고양이

1:1 대응이다. apple은 무조건 사과. 다른 뜻이 없다.

계산 기저 인코딩이 이것이다.

 
고전 비트 0 → 양자 상태 |0⟩
고전 비트 1 → 양자 상태 |1⟩
 

0은 무조건 |0⟩. 1은 무조건 |1⟩. 복잡한 계산 없이 직접 번역한다.


2부 — 실제로 어떻게 되는가

숫자 5를 양자에 넣고 싶다.

이진수 변환부터 시작한다.

이진수를 기억하는가. 수학 시간에 배운 것. 모든 숫자를 0과 1만으로 표현하는 것.

10진수 → 이진수:
0 → 000
1 → 001
2 → 010
3 → 011
4 → 100
5 → 101
6 → 110
7 → 111
 
 

5를 이진수로 바꾸면 101이다.

이제 101을 양자 상태로 바꾼다.

1 → |1⟩
0 → |0⟩
1 → |1⟩

5 = 101 → |1⟩|0⟩|1⟩ → |101⟩
 
 

큐비트 3개가 5라는 숫자를 담았다.

숫자 5가 양자 컴퓨터에 들어갔다.


더 큰 데이터는 어떻게 하는가

숫자 하나가 아니라 여러 숫자가 있다면.

학급 명단 비유로 설명하자.

반에 학생이 4명 있다.

학생 1번: 키 170
학생 2번: 키 155
학생 3번: 키 163
학생 4번: 키 178
 
 

이것을 양자에 넣으려면 어떻게 하는가.

방법이 있다. 양자의 중첩을 활용한다.

키 170 → 이진수 → |10101010⟩ (큐비트 여러 개)
키 155 → 이진수 → |10011011⟩
키 163 → 이진수 → |10100011⟩
키 178 → 이진수 → |10110010⟩
 
 

중첩 상태를 이용하면 이 네 가지를 동시에 하나의 양자 상태에 담을 수 있다.

|전체 데이터⟩ = 1/2 × (|170의 이진수⟩ + |155의 이진수⟩ + |163의 이진수⟩ + |178의 이진수⟩)
 
 

4개가 동시에 존재하는 중첩 상태. 양자만 할 수 있는 것이다.


세 가지 인코딩과 어떻게 다른가

같은 데이터를 세 가지 방법으로 표현하면 어떻게 다른지 보자.

지도 만들기 비유로 설명하자.

서울을 표현해야 한다.

계산 기저 인코딩 (지적도): 모든 건물, 도로, 구역을 0과 1로 그대로 기록한다. 있으면 1, 없으면 0. 정확하다. 단순하다. 그러나 엄청나게 많은 정보가 필요하다.

진폭 인코딩 (초압축 지도): 서울의 핵심 정보를 극도로 압축한다. 아주 작은 공간에 많은 정보를 넣는다. 압축하는 과정이 복잡하다.

각도 인코딩 (방향 지도): 각 지점을 방향과 거리로 표현한다. "북쪽으로 2km, 동쪽으로 1km." 직관적이고 안정적이다.

같은 데이터, 다른 표현:

데이터: 숫자 [3, 5, 7]

계산 기저: |011⟩, |101⟩, |111⟩ (이진수 그대로)
각도:      큐비트를 3도, 5도, 7도 회전
진폭:      진폭이 3, 5, 7에 비례하도록 설정
 
 

 어떤 데이터에 잘 맞는가

계산 기저 인코딩이 특별히 잘 맞는 데이터가 있다.

표 형식 데이터(Tabular Data).

표가 뭔가. 엑셀처럼 행과 열로 이루어진 데이터다.

학교 성적표 비유로 설명하자.

이름   수학  영어  과학  체육
철수   85   72   90   88
영희   92   88   85   75
민준   78   95   82   91
 
 

이런 데이터가 표 형식이다.

특징이 있다. 각 값이 명확하다. 85는 85다. 애매하지 않다. 이산적이다.

이런 데이터를 양자에 넣을 때 계산 기저 인코딩이 유리하다.

 

85 → 이진수 1010101 → |1010101⟩
72 → 이진수 1001000 → |1001000⟩
90 → 이진수 1011010 → |1011010⟩

 

있는 그대로 번역하면 된다. 복잡한 변환이 필요 없다.


QGAN과 함께 쓰이면

지난번에 배운 QGAN을 기억하는가. 새로운 데이터를 만들어내는 양자 AI.

표 형식 데이터를 QGAN으로 만들어내려면 계산 기저 인코딩이 필요하다.

카드 게임 비유로 설명하자.

카드가 있다. 각 카드에 숫자가 적혀있다.

카드 1: [나이 25, 수입 3000, 신용점수 700]
카드 2: [나이 42, 수입 5000, 신용점수 820]
카드 3: [나이 33, 수입 4200, 신용점수 750]
 
 

금융 데이터다. 이것을 QGAN에 넣어서 새로운 가상의 금융 데이터를 만들려 한다.

 
1단계: 각 숫자를 이진수로 변환
       25 → 11001
       3000 → 101110111000
       700 → 1010111100

2단계: 계산 기저 인코딩으로 양자에 넣는다
       |11001⟩|101110111000⟩|1010111100⟩

3단계: QGAN이 학습한다
       "이런 패턴의 데이터가 존재한다"

4단계: QGAN이 새 데이터를 만들어낸다
       [나이 38, 수입 4600, 신용점수 780]
       (실제로 없는 가상 데이터지만 패턴이 유사함)
 

계산 기저 인코딩의 장단점

공중전화 비유로 정리하자.

스마트폰이 없던 시절 공중전화가 있었다.

장점: 단순하다. 누구나 쓸 수 있다. 고장이 잘 안 난다. 원리가 명확하다.

단점: 기능이 제한적이다. 문자를 보낼 수 없다. 사진을 찍을 수 없다. 인터넷을 할 수 없다.

계산 기저 인코딩이 공중전화다.

장점:
가장 단순하다. 이해하기 쉽다.
오류가 적다. 안정적이다.
이산적 데이터(표 형식)에 자연스럽다.

단점:
압축이 안 된다. 데이터 크기만큼 큐비트가 필요하다.
데이터 100개면 큐비트 100개 × 이진수 자릿수 필요.
연속적인 데이터(사진, 음성)는 잘 안 맞는다.
 
 

전체를 한 번에 보자

세 가지 인코딩을 최종 비교하면 이렇다.

계산 기저 인코딩
─────────────────────────────────
방법: 데이터 → 이진수 → |0⟩|1⟩ 직접 대응
비유: 모스 부호 (0과 1로 직접 번역)
장점: 단순, 명확, 안정적
단점: 압축 없음, 큐비트 많이 필요
적합: 표 형식 데이터, 이산적 데이터

각도 인코딩
─────────────────────────────────
방법: 데이터 → 큐비트 회전 각도
비유: 나침반 (각도로 정보 표현)
장점: 안정적, 현재 가장 많이 사용
단점: 압축률 낮음
적합: 이미지, 시계열, 언어 데이터

진폭 인코딩
─────────────────────────────────
방법: 데이터 → 큐비트 진폭
비유: USB (초압축)
장점: 극한 압축, 지수적 효율
단점: 복잡, 오류 많음
적합: 초고차원 데이터
 

최종 정리

계산 기저 인코딩을 네 문장으로 압축하면 이렇다.

첫째, 데이터를 이진수로 바꾸고 그것을 큐비트 상태에 직접 집어넣는다. 5 → 101 → |101⟩. 모스 부호처럼 1:1로 번역한다.

둘째, 세 가지 인코딩 중 가장 단순하고 직관적이다. 공중전화처럼 단순하지만 안정적이다.

셋째, 성적표, 금융 데이터처럼 행과 열로 이루어진 표 형식 데이터에 특히 잘 맞는다.

넷째, QGAN과 결합해서 가상의 금융 데이터나 표 형식 합성 데이터를 만들어내는 데 활용된다.