양자 컴퓨터로 새로운 약을 설계하는 방법
분자 데이터 양자 처리 이야기
시작하기 전에 — 이런 장면을 상상해보자
자물쇠가 있다.
아주 복잡한 자물쇠다. 특정 모양의 열쇠만 딱 맞는다. 조금이라도 모양이 다르면 안 열린다.
암세포도 이런 자물쇠와 같다. 암세포를 죽이려면 딱 맞는 열쇠 모양의 분자가 필요하다. 그 분자가 암세포의 자물쇠에 딱 맞아야 한다.
신약 개발이란 이 열쇠를 찾는 과정이다.
문제가 있다. 가능한 열쇠의 모양이 얼마나 많은지 아는가.
10의 60제곱 개.
우주의 원자 수보다 많다. 하나씩 시도하면 우주의 나이가 지나도 못 찾는다.
양자 컴퓨터가 이 탐색을 혁명적으로 바꾼다.
0부 — SMILES가 뭔가
분자를 컴퓨터에게 설명하려면 어떻게 해야 하는가.
분자를 텍스트로 쓰는 방법이 있다. SMILES라고 한다.
화학 구조를 문자열로 표현하는 것이다.
예를 들어보자.
SMILES: O
에탄올 (술의 성분):
SMILES: CCO
(탄소-탄소-산소가 연결된 것)
아스피린 (진통제):
SMILES: CC(=O)Oc1ccccc1C(=O)O
(복잡한 고리 구조가 포함됨)
이 문자열 하나에 분자의 전체 구조가 담겨있다.
SMILES를 읽으면 분자가 어떻게 생겼는지 알 수 있다. 분자를 알면 어떤 성질을 가지는지 예측할 수 있다.
1부 — SMILES가 일반 텍스트와 다른 점
영어 문장과 SMILES를 비교해보자.
요리 레시피 vs 화학 구조 비유로 설명하자.
일반 텍스트 (요리 레시피):
토큰 나누기:
사과 / 를 / 씻어서 / 먹는다
→ 단어 단위로 나눈다
SMILES (화학 구조):
토큰 나누기:
C / C / (=O) / O / c1ccccc1 / C / (=O) / O
→ 화학적 의미 단위로 나눈다
C = 탄소 원자
(=O) = 이중 결합 산소
c1ccccc1 = 벤젠 고리 (6각형 구조)
일반 텍스트는 언어 규칙으로 나눈다.
SMILES는 화학 규칙으로 나눈다. 원자, 결합, 고리 구조 단위로.
2부 — 분자 정보가 얼마나 많은가
SMILES 문자열 하나에 얼마나 많은 정보가 담겨있는가.
여권 비유로 설명하자.
여권 하나에 정보가 가득하다.
분자도 마찬가지다.
1. 구조 정보:
원자들이 어떻게 연결되어 있는가
고리 구조가 있는가
가지가 있는가
2. 물리화학적 속성 (9가지!):
분자량: 얼마나 무거운가 (218.2 g/mol)
logP: 기름에 얼마나 잘 녹는가 (1.19)
수소 결합 수용체: 물과 얼마나 잘 반응하는가 (4개)
수소 결합 공여체: 2개
극성 표면적: 63.6 Ų
... 등등
아스피린 하나에 이 모든 정보가 있다.
이것들을 전부 양자 상태에 담아야 한다. 한꺼번에.
3부 — 양자 상태에 어떻게 담는가
다층 샌드위치 비유로 설명하자.
샌드위치를 만든다. 여러 층이 있다.
CC(=O)Oc1ccccc1C(=O)O 각 부분의 의미
↓
중간층 1: 위치 정보
이 원자가 몇 번째에 있는가
↓
중간층 2: 물리화학적 속성
분자량, logP, 수소 결합...9가지
↓
맨 아래: 빵 (최종 양자 상태)
세 가지 층이 합쳐져서 하나의 양자 상태가 된다.
이것이 다차원적 양자 임베딩이다. 분자의 모든 정보가 하나의 양자 상태에 동시에 담긴다.
4부 — 멀리 있는 원자가 서로 영향을 준다
여기서 중요한 문제가 있다.
3D 퍼즐 비유로 설명하자.
종이 위에 퍼즐 조각이 있다. 2차원으로 보면 A와 B가 멀리 떨어져있다.
그런데 이 종이를 3차원으로 구부리면 어떻게 되는가. A와 B가 가까워진다.
분자도 마찬가지다.
C-C-C-C-C-C-C-C-C-C-OH (10개 원자가 일렬로)
문자열에서는 첫 번째 C와 마지막 OH가 멀리 있다.
그런데 실제 3D 구조에서는:
분자가 구부러지면서 첫 번째 C와 OH가 가까워질 수 있다.
→ 서로 강하게 반응할 수 있다!
이것이 장거리 화학적 의존성이다. 문자열에서는 멀지만 실제로는 가까운 관계.
일반 AI는 이것을 파악하기 어렵다. 이것을 파악하려면 모든 원자 쌍을 비교해야 한다. 원자가 많을수록 비교 횟수가 폭발적으로 늘어난다.
5부 — 양자 어텐션이 해결한다
어텐션을 기억하는가. AI가 정보들 사이의 관계를 파악하는 방법.
모든 학생 서로 비교 비유로 설명하자.
반에 학생이 30명 있다. 모든 학생이 서로 얼마나 친한지 파악해야 한다.
1번과 2번 비교, 1번과 3번 비교, ... 1번과 30번 비교
2번과 3번 비교, 2번과 4번 비교, ... 2번과 30번 비교
...
→ 총 비교 횟수: 30 × 29 / 2 = 435번
학생이 두 배가 되면 비교 횟수는 네 배가 된다
수식으로 보면 O(n²d). n은 학생 수, d는 각 학생 정보의 크기.
양자 회로를 이용한다.
학생 정보의 크기(d)를 log 수준으로 줄인다.
→ O(n² × log d)
d=1000이면:
고전: n² × 1000번
양자: n² × 10번 (log₂1000 ≈ 10)
100배 빠르다!
분자 구조에서 모든 원자 쌍의 관계를 비교할 때, 양자 어텐션이 훨씬 효율적이다.
6부 — 원하는 분자를 설계한다: 조건부 생성
이것이 가장 중요한 부분이다.
단순히 분자를 이해하는 것이 아니다. 원하는 성질을 가진 새 분자를 만들어내는 것이다.
맞춤형 열쇠 제작 비유로 설명하자.
열쇠 공장이 있다.
고객이 주문한다. "이 자물쇠에 맞는 열쇠를 만들어주세요."
일반 공장 방법:
맞으면 그것이 답이다.
창고에 열쇠가 1억 개 있으면 최악의 경우 1억 번 시도.
스마트 공장 방법:
어떤 모양의 열쇠가 맞을지 조건을 파악한다.
그 조건을 만족하는 열쇠를 직접 설계한다.
처음부터 맞는 열쇠만 만든다.
QSMILES(양자 분자 생성)가 스마트 공장이다.
"독성이 없고, 물에 잘 녹고, 암세포에 결합하는 분자를 만들어라"
↓
조건을 양자 상태에 집어넣는다
독성 없음 → 물리화학적 속성값으로 표현
물에 잘 녹음 → logP 값으로 표현
암세포 결합 → 특정 구조 패턴으로 표현
↓
양자 AI가 조건을 만족하는 새 분자를 생성한다
→ 세상에 없던 새로운 SMILES 문자열이 나온다
→ 이것을 실제로 합성해서 테스트한다
7부 — 왜 양자가 더 잘 탐색하는가
보물찾기 비유로 설명하자.
거대한 정글에 보물이 숨겨있다.
일반 탐험가 (고전 AI): 한 명이 정글을 탐색한다. 왼쪽으로 가다가 막히면 돌아온다. 오른쪽으로 가다가 막히면 또 돌아온다. 하나씩 경로를 확인한다.
정글이 넓을수록 오래 걸린다.
양자 탐험가 (양자 AI): 중첩을 이용한다. 동시에 수천 개의 경로를 탐색한다. 막힌 경로는 자연스럽게 약해진다. 보물 방향으로 가는 경로가 강해진다.
고전 AI: 하나씩 탐색 → 우주 나이가 지나도 부족
양자 AI: 중첩으로 동시에 탐색 → 훨씬 빠르게 유망한 분자 발견
8부 — 실제 실험 결과
이것이 이론이 아닌 것을 증명한 실험이 있다.
QM9 데이터셋 실험:
134,000개의 실제 소분자 구조 데이터로 학습시켰다.
(적은 양이다. 가능한 분자 공간에 비하면 극히 일부)
결과:
→ 새로운 SMILES를 생성했다.
→ 실제로 존재 가능한 구조인가? YES
→ 원하는 물성 조건을 만족하는가? YES
→ 학습 데이터에 없던 참신한 분자인가? YES
결론:
적은 데이터로도 새로운 유효한 분자를 만들어낼 수 있다!
전체를 한 번에 보자
신약 개발 과정으로 전체를 정리하면 이렇다.
1단계: 분자 데이터 준비
알려진 항암제들의 SMILES 모음
각 분자의 9가지 물리화학적 속성 계산
2단계: 다차원 양자 임베딩
SMILES 토큰 + 위치 정보 + 9가지 속성
→ 하나의 풍부한 양자 상태로 통합
3단계: 양자 어텐션으로 학습
멀리 떨어진 원자들의 관계도 파악
고전보다 100배 효율적으로 계산
4단계: 조건 설정
"독성 없고, 물에 잘 녹고, 암세포에 결합하는 분자"
→ 이 조건을 양자 상태에 직접 주입
5단계: 새 분자 생성
양자 중첩으로 광범위한 화학 공간 탐색
조건을 만족하는 새 SMILES 생성
6단계: 검증 및 합성
생성된 SMILES를 실제 화학적으로 검증
유효한 것을 실험실에서 합성
→ 세상에 없던 새 항암제 후보물질 발견!
최종 정리
SMILES 분자 데이터 양자 처리를 네 문장으로 압축하면 이렇다.
첫째, SMILES는 분자 구조를 텍스트로 표현한 것이다. 일반 텍스트와 달리 화학 규칙으로 나누고, 구조 정보와 9가지 물성 정보를 한꺼번에 담는다.
둘째, 양자 어텐션으로 멀리 있는 원자들의 관계를 효율적으로 파악한다. 고전보다 100배 빠르게 분자 내 장거리 상호작용을 학습한다.
셋째, 원하는 성질을 조건으로 주면 그 조건을 만족하는 새 분자를 만들어낸다. 맞춤형 열쇠를 처음부터 설계하는 것처럼.
넷째, 양자의 중첩으로 10의 60제곱 개의 가능한 분자 중에서 유망한 것을 동시에 탐색한다. 보물찾기를 수천 명이 동시에 하는 것처럼.
'퀀텀 > 하이브리드 양자' 카테고리의 다른 글
| 7.5 적게 배우고 더 잘 아는 양자 AI (0) | 2026.06.08 |
|---|---|
| 7.4. 양자 AI가 더 많은 것을 표현할 수 있는 이유 (0) | 2026.06.08 |
| 7.2 언어를 양자 컴퓨터에 넣는 방법 (0) | 2026.05.30 |
| 7. 1. 이미지를 양자 컴퓨터에 넣는 방법-양자 이미지 인코딩 (1) | 2026.05.18 |
| 6.3. 데이터를 0과 1로 직접 번역하는 방법-계산 기저 인코딩 (0) | 2026.05.18 |