데이터를 0과 1로 직접 번역하는 방법
계산 기저 인코딩
시작하기 전에 — 이런 장면을 상상해보자
모스 부호를 아는가.
전쟁 영화에서 군인이 손가락으로 똑똑 두드리며 신호를 보내는 것. 점(·)과 선(-)의 조합으로 모든 글자를 표현한다.
B = -···
C = -·-·
점과 선, 두 가지만으로 모든 알파벳을 표현한다.
계산 기저 인코딩이 이 모스 부호와 같다.
0과 1, 두 가지만으로 모든 데이터를 표현한다. 그리고 그 0과 1을 큐비트의 |0⟩과 |1⟩ 상태에 직접 집어넣는다.
세 가지 인코딩을 비교하자
지금까지 세 가지 인코딩을 배웠다. 오늘이 마지막이다.
세 가지를 짐 싸기로 비교하자.
짐 100만 개를 특수 기술로 가방 하나에 넣는다.
압축률 최고. 준비 과정 매우 복잡.
각도 인코딩 (나침반 가방):
짐 하나마다 방향(각도)으로 표현한다.
실용적이고 안정적. 현재 가장 많이 사용.
계산 기저 인코딩 (직접 번역 가방):
짐을 0과 1로 바꿔서 그대로 넣는다.
가장 단순하고 직관적. 1:1로 대응.
계산 기저 인코딩이 가장 단순하다. 가장 솔직하다. 있는 그대로 번역한다.
기본 원리: 1:1 직역
영어-한국어 사전 비유로 설명하자.
영어 단어를 한국어로 번역한다.
apple → 사과 banana → 바나나 cat → 고양이
1:1 대응이다. apple은 무조건 사과. 다른 뜻이 없다.
계산 기저 인코딩이 이것이다.
고전 비트 1 → 양자 상태 |1⟩
0은 무조건 |0⟩. 1은 무조건 |1⟩. 복잡한 계산 없이 직접 번역한다.
2부 — 실제로 어떻게 되는가
숫자 5를 양자에 넣고 싶다.
이진수 변환부터 시작한다.
이진수를 기억하는가. 수학 시간에 배운 것. 모든 숫자를 0과 1만으로 표현하는 것.
0 → 000
1 → 001
2 → 010
3 → 011
4 → 100
5 → 101
6 → 110
7 → 111
5를 이진수로 바꾸면 101이다.
이제 101을 양자 상태로 바꾼다.
0 → |0⟩
1 → |1⟩
5 = 101 → |1⟩|0⟩|1⟩ → |101⟩
큐비트 3개가 5라는 숫자를 담았다.
숫자 5가 양자 컴퓨터에 들어갔다.
더 큰 데이터는 어떻게 하는가
숫자 하나가 아니라 여러 숫자가 있다면.
학급 명단 비유로 설명하자.
반에 학생이 4명 있다.
학생 2번: 키 155
학생 3번: 키 163
학생 4번: 키 178
이것을 양자에 넣으려면 어떻게 하는가.
방법이 있다. 양자의 중첩을 활용한다.
키 155 → 이진수 → |10011011⟩
키 163 → 이진수 → |10100011⟩
키 178 → 이진수 → |10110010⟩
중첩 상태를 이용하면 이 네 가지를 동시에 하나의 양자 상태에 담을 수 있다.
4개가 동시에 존재하는 중첩 상태. 양자만 할 수 있는 것이다.
세 가지 인코딩과 어떻게 다른가
같은 데이터를 세 가지 방법으로 표현하면 어떻게 다른지 보자.
지도 만들기 비유로 설명하자.
서울을 표현해야 한다.
계산 기저 인코딩 (지적도): 모든 건물, 도로, 구역을 0과 1로 그대로 기록한다. 있으면 1, 없으면 0. 정확하다. 단순하다. 그러나 엄청나게 많은 정보가 필요하다.
진폭 인코딩 (초압축 지도): 서울의 핵심 정보를 극도로 압축한다. 아주 작은 공간에 많은 정보를 넣는다. 압축하는 과정이 복잡하다.
각도 인코딩 (방향 지도): 각 지점을 방향과 거리로 표현한다. "북쪽으로 2km, 동쪽으로 1km." 직관적이고 안정적이다.
데이터: 숫자 [3, 5, 7]
계산 기저: |011⟩, |101⟩, |111⟩ (이진수 그대로)
각도: 큐비트를 3도, 5도, 7도 회전
진폭: 진폭이 3, 5, 7에 비례하도록 설정
어떤 데이터에 잘 맞는가
계산 기저 인코딩이 특별히 잘 맞는 데이터가 있다.
표 형식 데이터(Tabular Data).
표가 뭔가. 엑셀처럼 행과 열로 이루어진 데이터다.
학교 성적표 비유로 설명하자.
철수 85 72 90 88
영희 92 88 85 75
민준 78 95 82 91
이런 데이터가 표 형식이다.
특징이 있다. 각 값이 명확하다. 85는 85다. 애매하지 않다. 이산적이다.
이런 데이터를 양자에 넣을 때 계산 기저 인코딩이 유리하다.
85 → 이진수 1010101 → |1010101⟩
72 → 이진수 1001000 → |1001000⟩
90 → 이진수 1011010 → |1011010⟩
있는 그대로 번역하면 된다. 복잡한 변환이 필요 없다.
QGAN과 함께 쓰이면
지난번에 배운 QGAN을 기억하는가. 새로운 데이터를 만들어내는 양자 AI.
표 형식 데이터를 QGAN으로 만들어내려면 계산 기저 인코딩이 필요하다.
카드 게임 비유로 설명하자.
카드가 있다. 각 카드에 숫자가 적혀있다.
카드 2: [나이 42, 수입 5000, 신용점수 820]
카드 3: [나이 33, 수입 4200, 신용점수 750]
금융 데이터다. 이것을 QGAN에 넣어서 새로운 가상의 금융 데이터를 만들려 한다.
25 → 11001
3000 → 101110111000
700 → 1010111100
2단계: 계산 기저 인코딩으로 양자에 넣는다
|11001⟩|101110111000⟩|1010111100⟩
3단계: QGAN이 학습한다
"이런 패턴의 데이터가 존재한다"
4단계: QGAN이 새 데이터를 만들어낸다
[나이 38, 수입 4600, 신용점수 780]
(실제로 없는 가상 데이터지만 패턴이 유사함)
계산 기저 인코딩의 장단점
공중전화 비유로 정리하자.
스마트폰이 없던 시절 공중전화가 있었다.
장점: 단순하다. 누구나 쓸 수 있다. 고장이 잘 안 난다. 원리가 명확하다.
단점: 기능이 제한적이다. 문자를 보낼 수 없다. 사진을 찍을 수 없다. 인터넷을 할 수 없다.
계산 기저 인코딩이 공중전화다.
가장 단순하다. 이해하기 쉽다.
오류가 적다. 안정적이다.
이산적 데이터(표 형식)에 자연스럽다.
단점:
압축이 안 된다. 데이터 크기만큼 큐비트가 필요하다.
데이터 100개면 큐비트 100개 × 이진수 자릿수 필요.
연속적인 데이터(사진, 음성)는 잘 안 맞는다.
전체를 한 번에 보자
세 가지 인코딩을 최종 비교하면 이렇다.
─────────────────────────────────
방법: 데이터 → 이진수 → |0⟩|1⟩ 직접 대응
비유: 모스 부호 (0과 1로 직접 번역)
장점: 단순, 명확, 안정적
단점: 압축 없음, 큐비트 많이 필요
적합: 표 형식 데이터, 이산적 데이터
각도 인코딩
─────────────────────────────────
방법: 데이터 → 큐비트 회전 각도
비유: 나침반 (각도로 정보 표현)
장점: 안정적, 현재 가장 많이 사용
단점: 압축률 낮음
적합: 이미지, 시계열, 언어 데이터
진폭 인코딩
─────────────────────────────────
방법: 데이터 → 큐비트 진폭
비유: USB (초압축)
장점: 극한 압축, 지수적 효율
단점: 복잡, 오류 많음
적합: 초고차원 데이터
최종 정리
계산 기저 인코딩을 네 문장으로 압축하면 이렇다.
첫째, 데이터를 이진수로 바꾸고 그것을 큐비트 상태에 직접 집어넣는다. 5 → 101 → |101⟩. 모스 부호처럼 1:1로 번역한다.
둘째, 세 가지 인코딩 중 가장 단순하고 직관적이다. 공중전화처럼 단순하지만 안정적이다.
셋째, 성적표, 금융 데이터처럼 행과 열로 이루어진 표 형식 데이터에 특히 잘 맞는다.
넷째, QGAN과 결합해서 가상의 금융 데이터나 표 형식 합성 데이터를 만들어내는 데 활용된다.
'퀀텀 > 하이브리드 양자' 카테고리의 다른 글
| 7. 1. 이미지를 양자 컴퓨터에 넣는 방법-양자 이미지 인코딩 (1) | 2026.05.18 |
|---|---|
| 6.2. 데이터를 각도로 변환해서 양자에 넣는 방법-각도 인코딩 (0) | 2026.05.18 |
| 6.1. 데이터를 양자 컴퓨터에 넣는 방법-진폭 인코딩 (0) | 2026.05.15 |
| 5.4. 잡음을 활용해서 새로운 것을 만드는 양자 AI - 양자 확산 모델(QDM) (0) | 2026.05.12 |
| 5.3. 양자 컴퓨터가 데이터를 압축하고 복원하는 방법 - 양자 오토인코더(QAE) (0) | 2026.05.12 |