퀀텀/하이브리드 양자

4.2 양자 컴퓨터가 사진에서 핵심을 뽑아내는 방법

친절샘 정이 2026. 5. 12. 15:10

양자 컴퓨터가 사진에서 핵심을 뽑아내는 방법

 QCNN 특징 추출과 풀링 이야기


시작하기 전에 — 이런 장면을 상상해보자

학교 신문 기자가 운동회를 취재한다.

운동회 사진이 1000장 찍혔다. 그 중에서 신문에 실을 사진 3장을 골라야 한다.

어떻게 고르는가.

1단계: 1000장을 훑어본다. 흔들린 사진, 초점이 안 맞은 사진을 버린다. 300장이 남았다.

2단계: 300장에서 비슷한 장면끼리 묶는다. 달리기 사진들, 응원 사진들, 시상식 사진들. 핵심 장면만 남긴다. 30장이 됐다.

3단계: 30장에서 가장 인상적인 3장을 고른다.

1000장 → 300장 → 30장 → 3장.

점점 줄이면서 핵심만 남겼다.

QCNN의 특징 추출과 풀링이 정확히 이 과정이다.


합성곱과 풀링이 뭔가

이 두 단어가 어렵게 느껴진다. 쉽게 정리하면 이렇다.

합성곱 (특징 추출): "이 데이터에서 중요한 패턴을 찾아내라." → 1000장 사진에서 좋은 사진을 걸러내는 것

풀링 (차원 축소): "찾아낸 것들을 압축해서 핵심만 남겨라." → 300장을 30장으로 줄이는 것

이 두 가지를 반복하면서 처음에 많고 복잡했던 데이터가 점점 작아지고 핵심만 남는다.

고전 CNN도 이것을 한다. QCNN은 이것을 양자로 한다. 무엇이 다른지 하나씩 보자.


고전 합성곱 vs 양자 합성곱

먼저 고전 CNN이 어떻게 특징을 추출하는지 보자.

돋보기 비유로 설명하자.

사진 위를 돋보기로 훑는다.

돋보기가 3x3 크기라고 하자. 사진의 왼쪽 위 모서리부터 시작한다. 3x3 영역을 들여다본다. "여기에 가로선이 있다. 없다. 점이 있다." 기록한다.

한 칸 오른쪽으로 이동한다. 또 3x3을 들여다본다. 기록한다.

이렇게 사진 전체를 훑는다. 이것이 고전 합성곱이다.

어떤 패턴이 어디에 있는지 찾는 것. 가로선, 세로선, 곡선, 점. 이런 것들이 어디에 있는지.

그런데 문제가 있다.

돋보기 하나가 3x3 = 9개 픽셀을 한 번에 본다.
→ 이웃한 픽셀들의 관계는 파악한다.
→ 멀리 있는 픽셀들의 관계는 파악하기 어렵다.
→ 여러 층을 거쳐야 겨우 전체 패턴을 파악한다.
→ 계산이 많아진다.
 
 

이제 양자 합성곱을 보자.

얽힘 그물 비유로 설명하자.

물고기를 잡을 때 낚싯대 하나로 한 마리씩 잡는 것과, 그물을 던져서 한 번에 여러 마리를 잡는 것의 차이다.

고전 합성곱이 낚싯대라면, 양자 합성곱은 그물이다.

양자 합성곱에서 일어나는 일을 보자.

인접한 큐비트 2~3개를 묶는다.
        ↓
얽힘 연산을 적용한다.
        ↓
이 큐비트들이 서로의 정보를 공유한다.
        ↓
개별적으로는 보이지 않던 복잡한 패턴이 드러난다.
 
 

얽힘이 핵심이다.

큐비트 A와 B가 얽히면, A의 상태가 B에 즉각 영향을 준다. 그 반대도 마찬가지다. 둘이 하나의 시스템처럼 작동한다.

이것이 의료 영상에서 무엇을 가능하게 하는가.

 
고전 CNN: 
픽셀 A를 보고 → 픽셀 B를 보고 → 둘의 관계를 나중에 계산
(순서대로 하나씩)

양자 합성곱:
픽셀 A와 B가 얽혀있다 → 둘의 관계가 처음부터 함께 포착됨
(동시에)
 

암세포의 미세한 패턴이 여러 픽셀에 걸쳐 있을 때, 고전은 나중에 연결하지만 양자는 처음부터 함께 본다.


고전 풀링 vs 양자 풀링

특징을 추출했다. 이제 핵심만 남기고 압축해야 한다.

고전 풀링을 먼저 보자.

사진 압축 비유로 설명하자.

4x4 사진이 있다. 이것을 2x2로 줄이고 싶다.

방법이 있다. 4x4를 2x2 블록 4개로 나눈다. 각 블록에서 가장 큰 값 하나만 남긴다. 나머지는 버린다.

원래 4x4:          줄어든 2x2:
4  7  2  1            7  8
3  8  6  5    →    5  9
2  1  4  9
6  3  5  2
 
 

각 블록에서 최댓값만 살아남았다. 7, 8, 5, 9.

사진이 절반으로 줄었다. 그런데 핵심 정보는 유지됐다.

이것이 고전 풀링이다.


이제 양자 풀링을 보자. 두 가지 방법이 있다.


양자 풀링 방법 1 — 측정 기반 풀링

투표 비유로 설명하자.

학급 회의를 한다. 30명이 의견을 냈다.

그 중 10명을 무작위로 고른다. 이 10명의 의견을 집계한다. "7명이 찬성, 3명이 반대."

이 결과를 바탕으로 나머지 20명에게 지시한다. "찬성이 많으니 이렇게 행동해라."

30명 → 10명 측정 → 나머지 20명 제어.

양자 풀링이 이것이다.

전체 큐비트 중 일부를 측정한다.
        ↓
측정 결과 (0 또는 1)를 본다.
        ↓
그 결과를 바탕으로 나머지 큐비트의 다음 연산을 제어한다.
        ↓
유효한 정보 차원이 줄어든다.
 
 

흥미로운 점이 있다. 큐비트를 측정하는 순간 양자 상태가 확정된다. 이 확정된 정보가 다음 연산의 방향을 결정한다. 측정 자체가 정보 압축 역할을 한다.


양자 풀링 방법 2 — 레지스터 축소

건물 층수 줄이기 비유로 설명하자.

10층 건물이 있다. 각 층에 사람들이 있다.

모든 층의 사람들을 한 층씩 통합한다.

1층과 2층을 합쳐서 새로운 1층을 만든다. 3층과 4층을 합쳐서 새로운 2층을 만든다. ...

10층 건물이 5층 건물이 됐다. 사람 수는 줄었지만 각 층의 핵심 사람들은 남아있다.

다시 반복한다. 5층 → 3층 → 2층 → 1층.

처음: 큐비트 8개 (레지스터 8개)
1번 풀링: 4개로 줄인다
2번 풀링: 2개로 줄인다
3번 풀링: 1개로 줄인다
최종: 큐비트 1개에 핵심 정보가 압축됨
 
 

의료 영상으로 치면 이렇다.

MRI 사진 전체 → 암 관련 특징만 → 핵심 패턴만 → 최종 판단
(수백만 픽셀)   (수천 개 특징)   (수십 개 패턴)  (1개 결론)
 
 

두 레이어가 함께 작동하면

합성곱과 풀링이 번갈아 가며 작동한다.

양파 껍질 비유로 설명하자.

양파를 생각해보자.

가장 바깥 껍질은 두껍고 거칠다. 핵심이 아니다. 껍질을 하나씩 벗긴다. 안으로 들어갈수록 더 부드럽고 핵심에 가까워진다. 가장 안쪽에 알맹이가 있다. 그것이 진짜 양파다.

QCNN이 데이터를 이렇게 처리한다.

1단계: 양자 합성곱
       데이터의 첫 번째 껍질을 본다.
       가장 바깥의 특징들을 추출한다.
       (가로선, 세로선, 기본 패턴)
        ↓
2단계: 양자 풀링
       첫 번째 껍질을 벗긴다.
       핵심만 남기고 압축한다.
        ↓
3단계: 양자 합성곱 (두 번째)
       더 안쪽 껍질을 본다.
       더 복잡한 특징들을 추출한다.
       (텍스처, 경계, 모양)
        ↓
4단계: 양자 풀링 (두 번째)
       또 압축한다.
        ↓
5단계: 반복...
        ↓
최종: 가장 안쪽 알맹이
      (암인지 아닌지 판단하는 핵심 특징)
 
 

왜 양자로 하면 더 좋은가

고전 CNN과 QCNN의 차이를 직접 비교해보자.

책 요약 비유로 설명하자.

500페이지 소설을 요약해야 한다.

요약가 A (고전 CNN): 페이지를 처음부터 끝까지 읽는다. 중요한 문장에 형광펜을 친다. 형광펜 친 문장들을 다시 읽으면서 더 중요한 것을 고른다. 이 과정을 여러 번 반복한다.

정확하다. 그런데 시간이 오래 걸린다. 특히 책이 두꺼워질수록 시간이 기하급수적으로 늘어난다.

요약가 B (QCNN): 책 전체를 한 번에 훑는다. 그런데 특별한 능력이 있다. 페이지들 사이의 연결 관계를 동시에 파악한다. 1페이지의 사건이 300페이지에 어떻게 영향을 미치는지 한 번에 본다. 핵심 줄거리를 바로 뽑아낸다.

파라미터(능력치)가 더 적게 필요하다. 그러나 더 복잡한 패턴을 잡아낸다.

실제 숫자로 보면 이렇다.

고전 CNN 파라미터: 수백만 개
QCNN 파라미터: 수십~수백 개

→ QCNN이 훨씬 적은 파라미터로 비슷하거나 더 좋은 성능
 
 

의료 영상에서 구체적으로 어떻게 쓰이는가

뇌 MRI를 분석한다고 하자.

탐정 수사 비유로 전체 과정을 보자.

MRI 사진 = 범죄 현장

1단계 — 첫 번째 양자 합성곱: 현장 전체를 빠르게 훑는다. 명백한 것들을 기록한다. "여기 뭔가 이상한 밀도가 있다. 저기 경계선이 불규칙하다."

큐비트들이 얽혀서 주변 픽셀들의 관계를 동시에 파악한다.

2단계 — 첫 번째 양자 풀링: 명백한 것들 중에서 가장 중요한 것만 남긴다. 암과 관계없는 일반적인 뇌 구조는 압축한다. 이상한 패턴들만 살린다.

큐비트 수가 반으로 줄어든다.

3단계 — 두 번째 양자 합성곱: 살아남은 이상한 패턴들을 더 깊이 분석한다. "이 경계선이 악성 종양의 특징과 맞는가. 이 밀도가 신경교종 패턴인가."

더 복잡한 특징들이 드러난다.

4단계 — 두 번째 양자 풀링: 또 압축한다. 핵심만 남긴다.

최종 단계 — 판정: 남은 큐비트 하나에서 결론이 나온다.

"해마 근처 2.1mm 영역에서 
악성 신경교종 패턴 감지.
확률 96.3%."
 
 

적은 파라미터가 왜 중요한가

파라미터가 적다는 것이 왜 좋은가.

자동차 연비 비유로 설명하자.

같은 거리를 가는 자동차 두 대가 있다.

자동차 A (고전 CNN): 기름 100리터 필요
자동차 B (QCNN): 기름 10리터 필요

둘 다 목적지에 도착한다.
 
 

기름이 적게 드는 것이 왜 중요한가.

의료 현장에서는 이렇다.

시골 병원: 컴퓨터가 좋지 않다.
→ 고전 CNN: 너무 무거워서 못 쓴다.
→ QCNN: 가볍게 작동한다.

데이터가 적다 (희귀 암):
→ 고전 CNN: 데이터 부족으로 학습이 안 된다.
→ QCNN: 적은 파라미터라 적은 데이터로도 학습된다.

빠른 진단이 필요하다 (응급실):
→ 고전 CNN: 계산이 오래 걸린다.
→ QCNN: 빠르게 처리한다.
 
 

적은 파라미터 = 가볍다 = 어디서든 쓸 수 있다 = 더 많은 환자를 구할 수 있다.


전체를 한 번에 보자

신문 기자 이야기로 전체를 정리하면 이렇다.

MRI 사진 입력
(운동회 사진 1000장)
        ↓
1번 양자 합성곱
(흔들린 사진 걸러내고 좋은 사진 표시)
큐비트들이 얽혀서 주변 픽셀 관계 동시 파악
        ↓
1번 양자 풀링
(1000장 → 300장으로 압축)
일부 큐비트 측정해서 핵심만 남기기
        ↓
2번 양자 합성곱
(300장에서 더 깊은 특징 추출)
더 복잡한 패턴 발견
        ↓
2번 양자 풀링
(300장 → 30장으로 압축)
        ↓
3번 반복...
        ↓
최종 결론
(30장 → 3장. 이 3장이 결정적 증거)
"이 부위가 암이다"
 
 

최종 정리

QCNN 특징 추출과 풀링을 네 문장으로 압축하면 이렇다.

첫째, 양자 합성곱은 얽힘을 이용해서 픽셀들의 관계를 동시에 파악한다. 고전이 하나씩 보는 것을 양자는 한꺼번에 본다.

둘째, 양자 풀링은 측정과 레지스터 축소로 데이터를 압축한다. 1000장을 30장으로, 8개 큐비트를 1개로. 핵심만 남긴다.

셋째, 이 두 과정을 반복하면 양파 껍질처럼 데이터가 벗겨지며 가장 안쪽 핵심 패턴이 드러난다.

넷째, 파라미터가 훨씬 적어서 가볍고 빠르다. 시골 병원에서도, 데이터가 적은 희귀 암에서도 쓸 수 있다.