3단계: 의약화학 · 전합성 · AI 분자 설계

배경지식 — "분자도 언어를 한다"

유기화학을 이 단계까지 공부해 온 너는 이미 중요한 사실 하나를 알고 있다. 전자가 움직이면 반응이 일어난다. 1단계에서 배운 친핵체-친전자체 개념, 2단계에서 만난 입체화학의 거울상 이성질체 선택성—이 모든 것이 지금 배울 내용의 뿌리다. 이제 그 지식을 '살아있는 세포 안'으로 가져가보자.

인체를 하나의 도시라고 상상해보자. 그 도시에는 수만 개의 단백질이 있고, 각 단백질은 특정한 '일'을 한다. 효소는 반응을 촉진하고, 수용체는 신호를 전달하고, 이온 채널은 전기 신호를 조율한다. 이들은 모두 정밀하게 접힌 3차원 구조를 갖고 있으며, 그 표면 어딘가에 활성 부위(active site) 라고 불리는 구멍이 있다. 약물 분자가 하는 일은 간단하다—이 구멍에 딱 맞게 들어가는 것이다. 너무 단순하게 들리는가? 하지만 이 '딱 맞음'을 분자 수준에서 설계하는 것이 바로 수백 억 달러짜리 제약 산업 전체의 핵심이다.

여기서 잠깐, 2단계에서 배운 거울상 이성질체를 떠올려보자. 탈리도마이드(Thalidomide)라는 약이 1950년대에 입덧 완화제로 사용됐는데, R-이성질체는 진정 효과가 있었지만 S-이성질체는 태아 기형을 유발했다. 분자식과 연결 방식은 완전히 동일한데 단지 공간 배열만 달랐던 것이다. 이 비극은 입체화학이 생명과 직결된다는 것을 인류에게 가르쳐준 사건이었다. 이 배경이 머릿속에 있어야 의약화학이 왜 그토록 입체선택적 합성에 집착하는지 이해된다.

1단계에서 우리는 NMR과 IR로 분자의 구조를 읽었다. 그 스킬이 이제 다른 방향으로 쓰인다—약물과 단백질이 어떻게 결합하는지를 X선 결정학이나 cryo-EM으로 '찍어서' 분석하면, 그 3차원 구조가 합성 목표를 알려준다. 즉, 구조가 전략이 된다.

본 내용 1 — 의약화학: 약물은 어떻게 표적에 달라붙는가

약물-표적 상호작용(Drug-Target Interaction) 을 이해하려면 먼저 힘의 종류를 알아야 한다. 분자들이 서로 붙는 방식은 공유결합이 아니다. 공유결합은 너무 세서 한 번 붙으면 떨어지지 않는다—그건 약이 아니라 독이다. 약물은 비공유결합(non-covalent interactions) 을 통해 표적에 결합했다가, 필요에 따라 떨어진다. 그 종류는 크게 네 가지다.

수소결합(hydrogen bond) 은 가장 중요하다. N-H나 O-H가 근처의 N, O, F 원자와 형성하는 이 결합은 강도가 약 2~10 kJ/mol 수준이지만, 약물 하나가 활성 부위에서 여러 개를 동시에 형성하면 그 합은 결코 무시할 수 없다. 아스피린이 COX 효소에 결합할 때, 아세틸기의 카르보닐 산소가 효소의 세린(Ser530) 잔기와 공유결합을 형성하는 것은 예외적 경우이고, 대부분의 약물은 수소결합망을 통해 단백질 활성 부위를 '껴안는다'. 소수성 상호작용(hydrophobic interaction) 은 물을 싫어하는 지방족·방향족 부분이 단백질의 소수성 포켓 안으로 숨어들면서 생긴다—이것이 엔트로피적으로 유리한 이유는, 물 분자들이 그 소수성 표면을 덮지 않아도 되어 더 자유로워지기 때문이다. 반데르발스 힘(van der Waals force) 은 분자들이 매우 가까워질 때 생기는 순간 쌍극자 상호작용으로, 개별 기여는 미미하지만 약물이 포켓에 '꽉 차게' 맞을 때 전체 결합력에 상당히 기여한다. 마지막으로 이온 상호작용(ionic interaction) 은 양전하를 띤 아민기와 음전하를 띤 카르복실기 사이의 정전기적 인력이다.

[노트 기록] 비공유결합 4종: ① 수소결합 ② 소수성 상호작용 ③ 반데르발스 힘 ④ 이온 상호작용. 각각의 작용 원리와 강도 범위(kJ/mol)를 자신의 말로 정리하라.

이제 핵심 개념인 SAR(Structure-Activity Relationship, 구조-활성 관계) 로 넘어간다. SAR은 말 그대로 "분자의 어느 부분을 어떻게 바꾸면 약효가 어떻게 변하는가"를 체계적으로 탐구하는 것이다. 약물 개발자들은 리드 화합물(lead compound)—가능성이 있는 초기 후보 분자—을 찾은 다음, 그 분자의 작용기를 하나씩 바꿔가며 결합력, 선택성, 독성을 측정한다. 이 과정에서 등장하는 개념이 약효단(pharmacophore) 이다. 약효단이란 특정 생물학적 활성을 내는 데 필수적인 분자 내 화학적 특성들의 3차원 배열을 말한다. 수소결합 공여자, 수소결합 수용자, 소수성 부분, 이온화 가능한 기—이것들의 공간적 배치가 맞아야 표적에 결합한다.

Lipinski의 Rule of Five(리핀스키의 5법칙) 는 1997년에 Pfizer의 화학자 Christopher Lipinski가 경험적으로 도출한 규칙이다. 경구 투여(먹는) 약물이 되려면 분자가 장 세포막을 통과해야 하는데, 그러려면 ①분자량 ≤ 500 Da, ②수소결합 공여자 수 ≤ 5, ③수소결합 수용자 수 ≤ 10, ④logP(지용성 지수) ≤ 5라는 조건을 대체로 만족해야 한다는 것이다. 이 규칙은 절대적이지 않지만, 신약 후보를 걸러내는 최초의 체로 사용된다. 이것이 ADMET의 일부다—Absorption(흡수), Distribution(분포), Metabolism(대사), Excretion(배출), Toxicity(독성). 아무리 표적에 잘 결합해도 체내에서 바로 분해되거나 세포를 죽이면 약이 될 수 없다.

결합력은 수치로 표현된다. IC₅₀(반최대억제농도) 는 효소나 수용체의 활성을 50% 억제하는 데 필요한 약물 농도로, 낮을수록 좋다(더 적은 약으로 같은 효과). Kd(해리상수) 는 약물-단백질 복합체가 얼마나 쉽게 떨어지는지를 나타내며, 마찬가지로 낮을수록 결합력이 강하다. 예를 들어 항암제 이마티닙(Imatinib, 상품명 Gleevec)은 BCR-ABL 타이로신 키나아제에 대해 nM 수준의 IC₅₀을 보이는데, 이는 10억 분의 1 몰 농도에서도 반응한다는 뜻이다—이 수준의 선택성이 이마티닙을 혁명적 항암제로 만들었다.

본 내용 2 — 전합성(Total Synthesis): 자연을 흉내 내는 화학자

전합성이란 천연물 혹은 복잡한 표적 분자를 완전히 간단한 원료로부터 합성하는 것이다. '완전히'라는 단어가 핵심이다—아무 천연 분자도 중간체로 쓰지 않는다는 뜻이다. 이것은 화학자의 지적 능력을 가장 극단적으로 시험하는 분야로, Robert B. Woodward(우드워드)는 클로로필, 비타민 B12, 스트리크닌 등의 전합성으로 1965년 노벨 화학상을 받았다. 그의 제자 E.J. Corey는 역합성 분석(Retrosynthetic Analysis) 이라는 방법론을 체계화해 1990년 노벨상을 받았다.

1단계에서 배운 역합성 분석을 기억하는가? 목표 분자(target molecule)에서 거꾸로 거슬러 올라가며 합성 가능한 조각들로 분해하는 과정이었다. 그 과정에서 사용되는 기호가 이중 화살표(⟹) 인데, 이것은 "이 결합을 끊으면 이 두 조각이 된다"를 의미한다. 이때 끊는 결합을 분리자(disconnection), 생성된 조각을 합성 등가물(synthon) 이라 부른다.

복잡한 전합성의 전략은 크게 선형 합성(linear synthesis) 과 수렴 합성(convergent synthesis) 으로 나뉜다. 선형 합성은 A→B→C→D처럼 단계가 직렬로 연결되며, 각 단계 수율이 90%라도 10단계면 최종 수율은 0.9¹⁰ ≈ 35%가 된다. 반면 수렴 합성은 여러 조각을 병렬로 만들고 마지막에 조립하는 방식으로, 같은 총 단계수라도 최종 수율이 훨씬 높다. 이것이 수십 단계가 넘는 복잡한 전합성에서 수렴 전략이 선호되는 이유다.

전합성에서 피할 수 없는 기술이 보호기(protecting group) 다. 하나의 분자에 반응성 작용기가 여럿 있을 때, 원하지 않는 작용기를 일시적으로 덮어두고 싶은 작용기만 반응시킨 뒤 나중에 덮개를 제거한다. 대표적인 예로, 알코올을 TBS기(tert-butyldimethylsilyl ether)로 보호하면 강염기 조건에서도 알코올이 반응하지 않는다. 이 보호-탈보호 전략이 없으면 수십 단계 합성은 불가능하다. 2단계에서 배운 입체화학의 제어도 이 맥락에서 빛난다—각 단계에서 정확한 입체를 만들지 않으면, 최종 천연물과 다른 거울상 이성질체가 만들어지고, 그것은 전혀 다른(때로는 독성 있는) 물질이 된다.

E.J. Corey의 팀이 1969년 완성한 프로스타글란딘 E₂(PGE₂) 의 전합성은 이 모든 원리의 집약이다. 고리형 케톤을 출발물로 삼아 정밀한 입체 제어, 보호기 전략, 수렴 합성을 조합해 호르몬 분자를 만들어냈다. 현재 가장 복잡한 전합성 중 하나로 꼽히는 것은 K.C. Nicolaou 팀의 팍리탁셀(Taxol, 항암제) 전합성인데, 이것은 50단계가 넘는 경로를 요구했다.

[노트 기록] 역합성 분석의 3단계: ① 표적 분자의 핵심 결합(key bond) 식별 → ② 분리자(disconnection) 표시 → ③ 각 합성 등가물의 실제 시약으로의 전환. 수렴 합성이 선형 합성보다 수율에서 유리한 이유를 수식으로 표현해보라.

본 내용 3 — 자동화 합성 & AI 분자 설계: 로봇이 화학자가 되는 시대

지금까지 설명한 것은 화학자가 머릿속으로(그리고 손으로) 하는 일이었다. 이제 그 일을 컴퓨터와 로봇이 하는 시대를 살펴보자. 이 분야는 현재 진행 중인 혁명이다.

컴퓨터 보조 약물 설계(CADD, Computer-Aided Drug Design) 는 크게 두 가지로 나뉜다. 구조 기반 설계(Structure-Based Drug Design, SBDD) 는 단백질의 3D 구조를 알고 있을 때, 그 활성 부위에 맞는 분자를 컴퓨터로 찾거나 설계하는 방식이다. 리간드 기반 설계(Ligand-Based Drug Design, LBDD) 는 단백질 구조를 모를 때, 이미 알려진 활성 분자(리간드)들의 공통 특성을 추출해 새 후보를 예측하는 방식이다. 2021년 DeepMind의 AlphaFold2 는 단백질 서열로부터 3D 구조를 거의 실험 수준 정확도로 예측함으로써 SBDD의 적용 범위를 폭발적으로 확장했다—이전에는 X선 결정학으로 몇 년씩 걸리던 구조 결정이 몇 분으로 줄었다.

분자를 컴퓨터가 다루려면 텍스트 표현이 필요하다. 여기서 SMILES(Simplified Molecular Input Line Entry System) 가 등장한다. 아스피린(아세틸살리실산)을 SMILES로 쓰면 CC(=O)Oc1ccccc1C(=O)O가 된다. 이 문자열 표현을 AI가 학습하면, 분자를 마치 언어처럼 생성하고 변형할 수 있다. 실제로 생성형 AI(generative AI) 모델들—특히 Transformer 기반 모델—은 수백만 개의 SMILES를 학습해 새로운 약물 후보를 생성하는 데 사용된다. Insilico Medicine이 AI로 설계한 항섬유화 약물 INS018_055가 2023년 임상 2상에 진입한 것은, AI 설계 약물의 첫 번째 임상 성공 사례로 기록되고 있다.

합성 자동화의 측면에서는 화학 로봇(Chemputer) 이 핵심이다. 영국 Glasgow 대학의 Lee Cronin 그룹이 개발한 Chemputer는 프로그래밍 가능한 화학 로봇으로, 합성 경로를 코드로 입력하면 실제 반응을 자동으로 수행한다. 합성 경로 예측 소프트웨어로는 Merck의 SYNTHIA(구 Chematica) 가 있는데, 역합성 분석 알고리즘을 사용해 목표 분자의 합성 경로를 자동으로 제안한다. IBM의 RXN for Chemistry 는 자연어 처리(NLP)를 화학 반응에 적용한 모델로, 반응 조건과 기질을 입력하면 생성물을 예측하거나, 역으로 원하는 생성물의 합성 경로를 제안한다.

ADMET 예측 모델 은 이 자동화의 핵심 부품이다. 신약 개발에서 임상 실패의 약 40%가 ADMET 문제에서 비롯된다는 통계가 있다. 따라서 분자를 실제로 합성하기 전에, 컴퓨터로 그 분자의 흡수·분포·대사·배출·독성을 예측하면 막대한 비용과 시간을 절약할 수 있다. SwissADME, ADMETlab 같은 웹 도구들이 이를 무료로 제공하며, 딥러닝 기반 예측 모델들의 정확도는 빠르게 향상 중이다.

[노트 기록] AI 기반 신약 설계의 흐름: ① 타깃 단백질 구조 확보(AlphaFold or X선) → ② 가상 스크리닝(virtual screening) → ③ 생성형 AI로 신규 분자 제안 → ④ ADMET 예측 → ⑤ 합성 경로 자동 설계(SYNTHIA) → ⑥ Chemputer 자동 합성 → ⑦ 실험 검증. 이 파이프라인의 각 단계에서 인간 화학자는 어떤 판단을 내려야 하는지 생각해보라.

프로젝트 — 예제 중심 실전 문제

지금부터 40분간 다음 세 프로젝트를 풀어라. 정답은 없다—스스로 논리를 구성하는 것이 목표다. 각 문제는 위에서 배운 개념들을 직접 적용하는 것을 요구한다.

Project A — 약물-표적 상호작용 분석 (12~15분)

다음 상황을 읽고, 물음에 답하라.

어떤 연구팀이 COX-2 효소를 표적으로 하는 새로운 항염증제를 개발 중이다. 이들은 아래 두 후보 분자를 비교하고 있다.

분자 X: 분자량 310 Da, logP = 2.1, 수소결합 공여자 2개, 수소결합 수용자 4개, IC₅₀(COX-2) = 8 nM, IC₅₀(COX-1) = 2300 nM, 간 마이크로솜에서 반감기 12분.

분자 Y: 분자량 480 Da, logP = 4.8, 수소결합 공여자 3개, 수소결합 수용자 8개, IC₅₀(COX-2) = 1.2 nM, IC₅₀(COX-1) = 1.5 nM, 간 마이크로솜에서 반감기 95분.

(1) Lipinski의 Rule of Five를 기준으로 두 분자의 경구 흡수 가능성을 평가하라. 두 분자 모두 규칙을 만족하는가, 위반하는가, 만약 위반한다면 어느 규칙인가?

(2) COX-2와 COX-1에 대한 IC₅₀ 비율을 각 분자에 대해 계산하고, 이것이 염증 치료제로서의 선택성 관점에서 어떤 의미를 갖는지 논하라. (힌트: COX-2는 염증, COX-1은 위 점막 보호와 관련된다.)

(3) 분자 X의 간 마이크로솜 반감기가 12분이라는 것은 ADMET의 어느 부분에 해당하며, 이것이 임상적으로 어떤 문제를 야기하는가?

(4) 만약 네가 이 연구팀의 일원이라면 어느 분자를 우선 개발하겠는가? 단, 어느 하나가 '명확한 정답'이 아닐 수 있다. 분자 X와 Y 각각의 강점·약점을 논리적으로 나열하고 네 판단을 정당화하라.

Project B — 전합성 경로 설계 (15~18분)

다음은 단순화된 천연물 모델 분자 Z의 구조적 특징을 언어로 기술한 것이다. (실제 그림 대신 특성으로 제시한다.)

분자 Z의 특징: 6원 탄소 고리(사이클로헥산) 하나가 있으며, 그 고리의 3번과 4번 탄소에 각각 하이드록실기(-OH)가 있다. 이 두 OH는 트랜스 배열이다. 고리의 1번 탄소에 프로판산(-CH₂CH₂COOH) 사슬이 달려 있다. 전체 분자량은 약 200 Da이다.

(1) 이 분자를 역합성 분석(retrosynthetic analysis)하라. 가장 먼저 어느 결합을 끊겠는가? 그 이유를 전략적으로 설명하라. (힌트: 고리 외부 사슬과 고리 사이의 결합, 혹은 고리 내부의 결합 중 어느 것이 더 합성적으로 단순한 조각을 만드는가?)

(2) 트랜스 배열의 두 하이드록실기를 도입하기 위해 어떤 반응 전략을 사용할 수 있는가? 1단계와 2단계에서 배운 개념(예: 에폭사이드 개환, 에폭시화, 입체선택적 반응)을 활용해 제안하라.

(3) 이 합성 과정에서 보호기가 필요한 단계가 있는가? 있다면 어느 단계에서, 어떤 이유로 보호기를 사용해야 하는지 논하라.

(4) 선형 합성 경로를 5단계로 설계하라. 각 단계에서 어떤 반응이 일어나는지 (정확한 시약이 없어도) 반응의 '종류'를 명시하라. 예: "사이클로헥세논의 에폭시화→에폭사이드 trans-개환→…"

Project C — AI 기반 신약 후보 설계 시나리오 (10~12분)

다음 상황을 읽고 논리적으로 답하라.

2026년, 한 스타트업이 새로운 항생제를 개발하고자 한다. 표적 단백질은 FabI(Enoyl-ACP reductase) 로, 박테리아의 지방산 합성에 필수적이며 인간에게는 없는 효소다(즉, 선택성 문제가 크지 않다). 이 단백질의 3D 구조는 PDB(Protein Data Bank)에 공개되어 있다. 팀은 AI 파이프라인을 사용하기로 했다.

(1) 이 팀이 AI 기반 신약 설계 파이프라인을 구축할 때, 위 본문에서 배운 내용을 바탕으로 5단계의 순서를 제안하라. 각 단계에서 어떤 도구나 기술이 사용될 수 있는지 명시하라.

(2) SMILES 표기법을 처음 배운다고 가정하고, 아세트산(CH₃COOH)의 SMILES를 스스로 유추해보라. 힌트: C는 탄소, O는 산소, =는 이중결합, ( )는 가지를 의미한다.

(3) AI가 제안한 후보 분자 중 하나가 FabI에 대한 IC₅₀ = 3 nM으로 매우 우수하지만, ADMET 예측 결과 신장 독성 위험이 높고 수용성(solubility)이 극히 낮다. 이 분자를 어떻게 개선하겠는가? SAR 관점에서 어떤 작용기를 추가하거나 변경할 수 있는지, 그 화학적 이유와 함께 논하라.

(4) '자동화 합성 플랫폼(Chemputer 류)'이 인간 화학자를 완전히 대체할 수 있는가? 대체할 수 있다면 어느 영역에서, 대체할 수 없다면 어느 영역에서 인간이 여전히 필요한가? 너의 견해를 논리적 근거와 함께 서술하라.

평가 기준 안내

이 세 프로젝트는 50 + 30 + 20점 구조로 채점된다. 약물 설계 논리(Project A, C)가 50점으로 가장 비중이 크다—단순히 정답을 쓰는 것이 아니라, 왜 그런 판단을 내렸는지의 논리적 흐름이 채점의 핵심이다. 전합성 계획(Project B)은 30점으로, 역합성 분석의 전략적 타당성과 입체화학 논리가 평가된다. 마지막 연구 발표 형식의 서술(Project C-4)은 20점으로, 기술의 가능성과 한계를 균형 있게 논하는 비판적 사고가 중요하다. 이 자리에서 40분이 지나면, 스스로 채점 기준을 대조해보며 무엇을 놓쳤는지 점검하는 메타인지 훈련도 병행하라—그것 자체가 전문가로 가는 가장 빠른 길이다.

유기화학 및 분자 합성학