퀀텀/하이브리드 양자

7. 1. 이미지를 양자 컴퓨터에 넣는 방법-양자 이미지 인코딩

친절샘 정이 2026. 5. 18. 13:56

이미지를 양자 컴퓨터에 넣는 방법

양자 이미지 인코딩


시작하기 전에 — 이런 장면을 상상해보자

교실 칠판에 그림을 그렸다.

이 그림을 친구에게 전달해야 한다. 방법이 여러 가지다.

방법 1: 사진을 찍어서 보낸다. 완벽하다. 그런데 파일이 크다.

방법 2: 그림을 설명한다. "왼쪽 위에 동그라미, 오른쪽에 세모..." 파일이 작다. 그런데 받는 사람이 완벽하게 복원하기 어렵다.

방법 3: 핵심만 설명한다. "고양이 그림이야." 아주 작다. 원본을 복원할 수 없지만 내용은 안다.

양자 컴퓨터에 이미지를 넣을 때 이 세 가지 방법 중 어느 것을 쓸지 선택해야 한다.


이미지 데이터가 왜 특별히 어려운가

지금까지 배운 데이터들과 이미지를 비교해보자.

데이터 크기 비교:

표 형식 데이터 (성적표):
행 100개 × 열 10개 = 1,000개 숫자
→ 다루기 쉽다

텍스트 데이터 (문장):
단어 수백 개
→ 적당히 어렵다

이미지 데이터 (사진):
가로 512픽셀 × 세로 512픽셀 = 262,144개 숫자
거기에 색깔(RGB) 3개 = 786,432개 숫자
→ 엄청나게 크다!
 
 

이미지 하나에 수십만~수백만 개의 숫자가 있다.

지금 양자 컴퓨터의 큐비트가 몇 개인가. 수십~수백 개.

수백만 개를 수백 개에 넣어야 한다. 어떻게?


두 가지 전략

이미지를 양자에 넣는 방법이 크게 두 가지다.

여행 가방 비유로 설명하자.

해외여행을 간다. 옷이 100벌이다. 가방이 작다.

전략 1 — 검색 가능 인코딩 (완전한 복원 가능): 옷을 진공 압축 팩에 넣는다. 100벌이 가방에 들어갔다. 여행지에서 팩을 열면 원래 옷 100벌이 나온다. 완벽히 복원된다.

이것이 FRQI 같은 방법이다. 이미지 정보를 압축해서 넣되, 나중에 다시 꺼낼 수 있다.

전략 2 — 표현 인코딩 (핵심만 가져가기): 100벌 중 핵심 10벌만 고른다. 나머지 90벌은 두고 간다. 가방이 가볍다. 여행지에서 꺼내면 10벌만 나온다. 원래 100벌은 복원 안 된다. 그러나 여행에 필요한 것은 다 있다.

이것이 PCA, CNN, 오토인코더 를 활용한 방법이다. 핵심 특징만 뽑아서 양자에 넣는다.


FRQI: 위치는 중첩으로, 색깔은 각도로

FRQI가 어떻게 작동하는지 보자.

미술관 작품 설명 비유로 설명하자.

미술관에 그림이 있다. 이 그림을 작은 카탈로그에 담아야 한다.

원시적인 방법 (큐비트 격자): 픽셀 하나하나를 큐비트 하나에 담는다. 픽셀이 100만 개면 큐비트도 100만 개 필요하다. 불가능하다.

FRQI 방법: 두 가지 정보를 따로 담는다.

정보 1 — 위치 (어디에 있는가):
중첩을 이용한다.
모든 픽셀 위치를 동시에 중첩 상태로 표현한다.
1만 개 위치를 한꺼번에 담는다.
→ 큐비트 14개면 된다 (2의 14제곱 = 16384 > 10000)

정보 2 — 밝기 (얼마나 밝은가):
각도 인코딩을 이용한다.
픽셀의 밝기를 각도로 표현한다.
어두우면 0도, 밝으면 90도.
→ 큐비트 1개에 담는다
 
 

위치는 중첩으로, 밝기는 각도로. 두 가지를 합친다.

결과:
10,000픽셀 이미지
원시 방법: 큐비트 10,000개 필요
FRQI: 큐비트 15개로 가능!

666배 압축!
 
 

그래도 부족하다: 현실적인 해결책들

FRQI도 좋지만 한계가 있다.

고해상도 사진(4K: 8백만 픽셀)은 FRQI로도 힘들다. 회로가 너무 깊어진다.

과학자들이 세 가지 현실적인 방법을 찾아냈다.


방법 1 — 패치 단위 분할: 조각으로 나눠서 처리

퍼즐 맞추기 비유로 설명하자.

1000조각짜리 퍼즐이 있다. 한 번에 다 분석할 수 없다.

10조각씩 묶는다. 한 묶음씩 분석한다. 결과를 합친다.

원래 이미지 (512×512 픽셀)
        ↓
2×2 패치로 나눈다 (65,536개 패치)
        ↓
패치 하나씩 양자에 넣어 처리
(4픽셀 = 관리 가능한 크기)
        ↓
패치 결과를 모아서 전체 이미지 분석
 
 

콴볼루셔널 신경망이 이 방법을 쓴다. 기억하는가. 이전에 배운 것!


방법 2 — 근사 상태 준비: 완벽하지 않아도 된다

그림 스케치 비유로 설명하자.

다빈치의 모나리자를 그대로 재현하려면 수백 시간이 걸린다.

대신 스케치를 그린다. 완벽하지 않지만 모나리자처럼 보인다. 30분이면 된다.

완벽한 FRQI 상태: 회로 깊이 매우 깊음 → 오류 많음
                  (모나리자 완벽 재현)

근사 FRQI 상태: 회로 깊이 얕음 → 오류 적음
                하이브리드 오토인코더나 PQC로 훈련
                (모나리자 스케치 수준)
 
 

95% 비슷하면 충분하다. 완벽을 포기하고 실용성을 얻는다.


방법 3 — 표현 인코딩: 고전 AI가 먼저 정리하고 양자에 넣는다

이것이 현재 가장 많이 쓰이는 방법이다.

음식 주문 비유로 설명하자.

레스토랑에 대가족이 갔다. 20명이다.

메뉴를 보고 각자 주문하면 웨이터가 혼란스럽다. 20개의 주문을 일일이 받는다.

대신 대표자 한 명이 정리한다. "우리 테이블은 스테이크 5개, 파스타 8개, 샐러드 7개." 웨이터에게 간단히 전달한다.

 
1단계: 고전 AI (대표자)가 정리한다

방법 A (PCA):
이미지의 주요 패턴을 수학적으로 추출
1,000개 특징 → 50개 핵심 특징

방법 B (CNN/VGG/ResNet):
딥러닝으로 이미지에서 중요한 특징 추출
"이 이미지에는 눈, 코, 입, 귀 패턴이 있다"
→ 50개 숫자로 표현

방법 C (오토인코더):
이미지를 압축해서 핵심만 남긴다
1,000,000픽셀 → 50개 숫자

2단계: 50개 숫자를 양자에 넣는다 (각도 인코딩)
큐비트 50개로 충분!
 

 이미지 종류마다 방법이 다르다

이미지가 어떤 종류냐에 따라 최적의 방법이 달라진다.


이미지 종류 1 — 일반 사진

학교 졸업사진 비유로 설명하자.

졸업사진을 양자 AI로 분석한다.

얼굴을 인식해야 한다. 표정을 분류해야 한다.

전략:
ResNet (유명한 고전 CNN)으로 얼굴 특징 추출
→ 양자에는 특징 벡터만 넣는다 (각도 인코딩)
→ 양자 분류기가 판별한다
 
 

이미지 종류 2 — 초분광 이미지

무지개 카메라 비유로 설명하자.

일반 카메라는 빨강, 초록, 파랑 3가지 색만 담는다.

초분광 카메라는 200가지 색의 파장을 담는다. 눈에 보이지 않는 적외선, 자외선까지.

이 카메라로 농작물을 찍으면 어떤 식물이 병들었는지, 수분이 부족한지 알 수 있다.

 
문제:
200개 채널 × 수백만 픽셀 = 엄청난 데이터

전략:
PCA로 200개 채널을 10개로 압축
→ 핵심 스펙트럼 정보만 남긴다
→ 진폭 인코딩으로 양자에 넣는다
→ 양자가 식물 상태를 분류한다
 

이미지 종류 3 — SAR (레이더 위성 이미지)

박쥐 초음파 비유로 설명하자.

박쥐는 어두운 밤에도 날 수 있다. 눈이 아니라 초음파를 쏘고 반사된 신호를 분석해서.

위성 레이더(SAR)도 비슷하다. 빛 대신 전파를 쏜다. 흐린 날에도, 밤에도 지구를 촬영할 수 있다.

그런데 이 데이터가 특별하다. 복소수로 이루어진다.

 
SAR 데이터의 각 픽셀:
실수부(Real): 전파의 강도 정보
허수부(Imaginary): 전파의 위상(타이밍) 정보

복소수 = 실수부 + i × 허수부
예: 3 + 4i
 

이것을 어떻게 양자에 넣는가. 두 가지 전략이 있다.

전략 A (전체 담기 — 진폭 인코딩):
실수부와 허수부를 모두 진폭으로 표현한다.
정보 손실이 없다. 그러나 회로가 복잡하다.

전략 B (강도만 담기 — 각도 인코딩):
√(실수부² + 허수부²)로 크기만 계산한다.
3 + 4i → √(9+16) = 5
숫자 5만 각도로 표현한다.
정보가 일부 손실된다. 그러나 단순하고 안정적이다.
 
 

어느 전략을 쓸지는 무엇을 분석하느냐에 따라 다르다.


전체 흐름을 한 번에 보자

위성 이미지로 홍수 피해 지역을 분석하는 사례로 전체를 정리하면 이렇다.

 
위성 이미지 입력
(수천만 픽셀의 SAR 이미지)
        ↓
전략 선택:
"전체를 처리하기엔 너무 크다"
        ↓
방법 1 적용: 패치로 나누기
64×64픽셀 패치들로 분할
        ↓
방법 2 적용: 고전 CNN이 특징 추출
"이 패치는 물 패턴 / 건물 패턴 / 산 패턴"
→ 패치당 숫자 32개로 압축
        ↓
방법 3 적용: 각도 인코딩으로 양자에 넣기
32개 숫자 → 큐비트 32개 각도 회전
        ↓
양자 AI가 분류
"이 패치 = 홍수 피해 지역"
        ↓
패치 결과를 합쳐서 전체 지도 완성
"이 지역이 침수됐다. 이쪽은 안전하다."
 

어떤 방법을 언제 쓰는가

도구 상자 비유로 정리하자.

목수가 도구 상자에 여러 도구를 가지고 있다. 상황마다 다른 도구를 쓴다.

FRQI (압축 + 복원 가능):
→ 언제: 이미지 정보를 완전히 보존해야 할 때
→ 예: 의료 이미지 분석 (놓치면 안 되는 정보가 있음)

패치 분할:
→ 언제: 이미지가 너무 클 때
→ 예: 고해상도 위성 사진, 4K 영상

고전 AI + 각도/진폭 인코딩:
→ 언제: 분류나 탐지가 목적일 때
→ 예: 암 탐지, 얼굴 인식, 물체 분류
→ 가장 많이 쓰임

근사 상태 준비:
→ 언제: 속도와 효율이 중요할 때
→ 예: 실시간 영상 처리
 
 

최종 정리

이미지 양자 인코딩을 네 문장으로 압축하면 이렇다.

첫째, 이미지는 수백만 픽셀이라 다른 데이터보다 훨씬 크다. 지금 양자 컴퓨터로 그대로 넣을 수 없다.

둘째, FRQI는 위치는 중첩으로, 밝기는 각도로 담아서 큐비트를 획기적으로 줄인다. 10,000픽셀을 15개 큐비트에 담을 수 있다.

셋째, 현실에서는 세 가지 방법을 조합한다. 조각내기, 근사하기, 핵심만 뽑아서 넣기.

넷째, 이미지 종류마다 전략이 다르다. 일반 사진은 CNN으로 특징 추출, 레이더 사진은 복소수 처리, 초분광은 PCA로 채널 압축.