수사학 2단계: 스피치의 설계, 전달, 그리고 청중

I. 이론적 기초 — 왜 우리는 '구조'가 필요한가

1단계에서 우리는 설득의 세 기둥인 **에토스(신뢰), 파토스(감정), 로고스(논리)**를 배웠고, 툴민 모델을 통해 주장이 어떻게 근거와 보증을 통해 성립하는지 살펴봤다. 그런데 흥미로운 질문이 하나 생긴다. 아무리 훌륭한 논증을 갖추고, 신뢰도 있고, 감동적인 이야기도 있다고 해도 — 그것들을 아무 순서나 뒤죽박죽으로 쏟아낸다면 청중에게 제대로 전달될까? 이 질문에 답하기 위해서는 먼저 인간의 뇌가 정보를 어떻게 처리하는지 이해해야 한다.

인지심리학자 **존 스웰러(John Sweller)**는 1988년 「인지 부하 이론(Cognitive Load Theory)」을 발표하며, 우리의 **작업 기억(working memory)**은 동시에 처리할 수 있는 정보량이 극도로 제한되어 있다고 주장했다. 심리학자 **조지 밀러(George A. Miller)**는 1956년 논문 「마법의 숫자 7, 플러스 마이너스 2(The Magical Number Seven, Plus or Minus Two)」에서 인간이 한 번에 기억하고 처리할 수 있는 단위(청크·chunk)가 약 7개 내외라고 밝혔다. 이것이 왜 중요하냐면, 스피치는 '읽는 것'이 아니라 '듣는 것'이기 때문이다. 청중은 이해가 안 된 부분을 다시 읽을 수 없다. 스피커가 정보를 예측 가능한 구조 안에 담아줘야만 청중의 뇌가 그것을 효율적으로 처리하고 기억할 수 있다. 이것이 바로 스피치에 서론-본론-결론이라는 구조가 존재하는 인지과학적 이유다.

역사적으로도 이 통찰은 매우 오래됐다. 고대 로마의 웅변가 **키케로(Marcus Tullius Cicero)**는 그의 저서 『웅변론(De Oratore)』에서 훌륭한 연설가가 갖춰야 할 다섯 가지 기술을 제시했는데, 이를 **수사학의 5원칙(Five Canons of Rhetoric)**이라고 부른다. 첫 번째는 인벤티오(Inventio), 즉 무엇을 말할 것인가를 발견하는 과정이다. 두 번째는 디스포시티오(Dispositio), 즉 찾아낸 내용을 어떤 순서로 배열할 것인가 하는 구성이다. 세 번째는 엘로쿠티오(Elocutio), 즉 어떤 언어와 스타일로 표현할 것인가이고, 네 번째는 메모리아(Memoria), 즉 기억하는 것, 마지막 다섯 번째는 악티오(Actio), 즉 목소리와 몸짓으로 실제로 전달하는 것이다. 오늘 우리가 다루는 2단계의 내용이 정확히 이 다섯 기둥 전체를 관통한다는 사실이 흥미롭지 않은가?

[노트 기록] 키케로의 5원칙: Inventio(발견) → Dispositio(배열/구성) → Elocutio(표현/스타일) → Memoria(기억) → Actio(전달). 이 순서가 곧 스피치 준비의 순서이기도 하다.

II. 스피치의 구성 — 서론, 본론, 결론의 해부학

"서론-본론-결론"이라는 말을 들으면 어쩌면 너무 뻔하다고 느낄 수 있다. 그런데 여기서 핵심 질문을 던져보자: 각 파트가 정확히 어떤 '일'을 하는가? 이 질문에 제대로 답할 수 있어야 구조를 단순히 흉내 내는 것이 아니라 전략적으로 설계할 수 있다.

**서론(Introduction)**의 가장 첫 번째 임무는 청중의 주의를 낚아채는 것이다. 이것을 **훅(Hook)**이라고 부른다. 훅은 충격적인 통계일 수도 있고("여러분, 현재 이 순간 세계에서 매 3초마다 한 명의 어린이가 굶주림으로 사망합니다"), 도발적인 질문일 수도 있고, 짧은 이야기일 수도 있다. 1단계에서 배운 파토스가 바로 여기서 가장 먼저 작동한다. 훅으로 감정적 긴장감을 만들고 나면, 연설자는 두 번째 임무로 넘어가야 한다 — 에토스의 확립. "나는 왜 이 주제를 말할 자격이 있는가?"를 청중에게 납득시키는 것이다. 그리고 서론의 마지막은 프리뷰(Preview), 즉 "오늘 저는 세 가지를 이야기하겠습니다"처럼 본론에서 다룰 내용을 미리 예고하는 것이다. 이 예고가 있어야 청중의 뇌는 앞으로 들어올 정보를 위한 '폴더'를 미리 만들 수 있고, 인지 부하를 줄일 수 있다.

**본론(Body)**에서 가장 중요한 원칙은 하나의 주제에 하나의 메인 포인트를 대응시키는 것이다. 일반적으로 5분 스피치라면 2~3개의 메인 포인트가 적절하다. 각 메인 포인트는 주장-근거-예시 혹은 1단계에서 배운 툴민 모델의 구조를 따라야 한다. 그리고 포인트와 포인트 사이에는 반드시 **전환어(Transition)**가 있어야 한다 — "첫 번째 이유를 말씀드렸으니, 이제 두 번째로 더 심각한 문제를 살펴보겠습니다"와 같이. 전환어는 단순한 접속사가 아니라 청중에게 '지금 우리가 지도의 어디에 있는지'를 알려주는 내비게이션 역할을 한다.

**결론(Conclusion)**은 흔히 "요약하면..."으로 시작하는 단순 반복이라고 오해하는데, 그것은 결론의 최소한의 기능만 수행하는 것이다. 수사학적으로 강력한 결론은 세 가지를 해야 한다. 첫째, 메인 포인트를 재확인하되 단순 반복이 아니라 더 높은 차원에서 종합한다. 둘째, 청중에게 행동 촉구(Call to Action, CTA) — "여러분이 오늘 집에 가서 할 수 있는 한 가지가 있습니다"처럼 구체적인 다음 행동을 제시한다. 셋째, 서론의 훅으로 **돌아오는 것(Bookend technique)**이다. 서론에서 시작한 이야기나 질문을 결론에서 완성하거나 다시 언급하면, 스피치 전체가 하나의 완결된 원처럼 느껴지고 기억에 훨씬 오래 남는다.

더 발전된 구조로는 미국 퍼듀 대학의 수사학 교수 **앨런 먼로(Alan H. Monroe)**가 1935년 개발한 **먼로의 동기 부여 순서(Monroe's Motivated Sequence)**가 있다. 이 모델은 다섯 단계로 이루어진다: 주의 끌기(Attention) → 필요성 제시(Need) → 해결책 제시(Satisfaction) → 시각화(Visualization) → 행동 촉구(Action). 이 구조가 서론-본론-결론보다 강력한 이유는 청중의 심리적 흐름을 따라가기 때문이다. 먼저 관심을 잡고, 문제가 있다는 것을 느끼게 하고, 해결책을 제시하고, 해결됐을 때의 미래를 상상하게 만들고, 마지막으로 행동하게 한다. 이 모델은 TED 강연, 광고, 정치 연설에서 광범위하게 사용된다.

[노트 기록] 먼로의 동기 부여 순서: Attention(주의) → Need(필요) → Satisfaction(해결) → Visualization(시각화) → Action(행동). 이것이 서론-본론-결론의 고급 버전이다.

III. 전달력 — 말하는 것은 내용의 7%에 불과하다

이쯤에서 한 가지 도발적인 연구를 소개하겠다. UCLA의 심리학자 **앨버트 메라비언(Albert Mehrabian)**은 1967년 감정과 태도를 전달할 때 다음과 같은 비율이 적용된다는 연구 결과를 발표했다: 말의 내용(Words) 7%, 목소리(Tone & Voice) 38%, 신체 언어(Body Language) 55%. 이것이 흔히 '7-38-55 법칙'으로 알려진 것이다. 단, 중요한 주의사항 — 메라비언 자신도 강조했지만, 이 비율은 감정적 메시지, 특히 호감/비호감을 전달할 때에만 적용된다. 복잡한 정보를 전달할 때는 내용의 비율이 훨씬 커진다. 그럼에도 불구하고 이 연구가 시사하는 바는 명확하다: 청중은 당신이 무엇을 말하는지보다 어떻게 말하는지에 더 강렬하게 반응한다.

**발성(Voice)**을 먼저 살펴보자. 발성에는 네 가지 핵심 변수가 있다. 음량(Volume) — 너무 작으면 자신감이 없어 보이고, 너무 크면 공격적으로 느껴진다. 속도(Pace) — 분당 약 120150단어가 이상적인 대화 속도지만, 강조할 때는 의도적으로 느리게, 흥분이나 긴박함을 표현할 때는 빠르게 조절할 수 있다. 피치(Pitch) — 단조롭게 같은 톤으로 말하는 것을 '단조로운 음(monotone)'이라고 하는데, 이것은 청중을 졸리게 만드는 가장 빠른 방법이다. 중요한 단어에서 음정을 올리거나 내리는 **억양 변화(Inflection)**가 청중의 주의를 유지하는 열쇠다. 마지막으로 가장 강력하고 가장 많이 무시되는 도구 — 침묵(Pause). 베테랑 연설가들은 중요한 말 앞이나 뒤에 23초의 침묵을 의도적으로 배치한다. 이 침묵은 청중에게 "지금 이 말이 중요하니 주목하라"는 신호를 보내고, 방금 한 말이 뇌에 깊이 각인될 시간을 준다.

**제스처(Gesture)**는 단순히 손을 '어떻게 쓰는가'의 문제가 아니다. 심리학자 **에이미 커디(Amy Cuddy)**는 2012년 TED 강연 「Your Body Language May Shape Who You Are」에서 신체 자세가 청중의 인식뿐만 아니라 연설자 자신의 심리 상태도 바꾼다는 연구를 발표했다 (이후 일부 논쟁이 있었으나, 신체 언어가 인식에 영향을 준다는 기본 주장은 광범위하게 인정된다). 개방된 자세 — 팔을 열고, 몸을 청중을 향해 열어놓는 것 — 는 자신감과 신뢰성을 전달한다. 반면 팔짱을 끼거나, 연단 뒤에 숨거나, 끊임없이 옷을 만지작거리는 것은 긴장과 방어적 태도를 나타낸다. 키케로가 악티오(Actio)에서 강조했듯, 몸 전체가 말의 도구가 되어야 한다.

**아이컨택(Eye Contact)**은 에토스를 실시간으로 구축하는 가장 강력한 도구다. 청중의 눈을 피하는 연설자는 즉각적으로 신뢰성을 잃는다. 그러나 반대로 한 사람에게만 계속 시선을 고정하면 그 사람은 불편해지고 나머지 청중은 소외감을 느낀다. 효과적인 아이컨택의 기술은 3-5초 법칙 — 한 사람에게 약 3-5초 동안 시선을 맞춘 후, 다른 사람으로 자연스럽게 이동하는 것이다. 대규모 청중 앞에서는 청중을 여러 구역으로 나누고 구역별로 순환하며 시선을 분배한다. 이때 Z자 혹은 W자 패턴으로 시선을 이동하면 전체 청중을 고루 포괄할 수 있다.

[노트 기록] 발성 4요소: 음량(Volume) / 속도(Pace) / 피치·억양(Pitch & Inflection) / 침묵(Pause). 비언어 전달의 핵심: 개방된 제스처 + 3-5초 아이컨택 순환.

IV. 청중 분석과 맞춤 전략 — 같은 말도 다르게 해야 한다

자, 이제 훨씬 더 전략적인 영역으로 들어가보자. 아리스토텔레스는 『수사학(Rhetoric)』에서 이미 2400년 전에 이렇게 말했다: "설득은 청중에 의해 이루어진다." 즉, 연설자의 역할은 훌륭한 논증을 만드는 것이 아니라, 특정 청중이 설득될 수 있는 논증을 만드는 것이다. 이것이 청중 분석이 단순한 예의가 아니라 수사학의 핵심 기술인 이유다.

청중 분석은 두 가지 차원으로 이루어진다. 첫 번째는 인구통계학적 분석(Demographics) — 나이, 성별, 교육 수준, 직업, 문화적 배경 같은 측정 가능한 특성들이다. 고등학생 청중에게 말할 때와 50대 기업인 청중에게 말할 때는 어휘 선택, 예시, 유머의 종류가 완전히 달라야 한다. 두 번째는 심리통계학적 분석(Psychographics) — 가치관, 신념, 태도, 관심사 같은 내면의 특성들이다. 같은 환경 문제를 다루더라도, 경제적 이익을 중시하는 청중에게는 '녹색 경제의 기회'로 프레이밍하는 것이 효과적이고, 도덕적 가치를 중시하는 청중에게는 '다음 세대에 대한 책임'으로 프레이밍하는 것이 더 강력하다. 이것이 바로 1단계에서 배운 파토스가 청중마다 다르게 작동하는 이유다.

더 나아가, 청중의 **사전 태도(Prior Attitude)**를 파악하는 것도 중요하다. 수사학자들은 청중을 크게 세 유형으로 나눈다 — 우호적(Favorable), 중립적(Neutral), 적대적(Hostile). 우호적 청중에게는 더 강한 행동 촉구와 감정적 고조가 효과적이다. 중립적 청중에게는 명확한 로고스와 신뢰할 수 있는 에토스를 통해 입장을 형성시키는 것이 우선이다. 그리고 가장 어려운 경우인 적대적 청중에게는 — 공격적으로 논증을 밀어붙이면 역효과가 난다. 대신 공통 기반(Common Ground) 찾기부터 시작해야 한다. "우리가 의견은 다르지만, 우리 모두 이 지역사회를 더 좋게 만들고 싶다는 점에서는 같습니다"처럼.

[노트 기록] 청중 분석 두 축: Demographics(나이/성별/교육 등) + Psychographics(가치관/신념/관심사). 청중 사전 태도 3유형: 우호적 / 중립적 / 적대적 — 각각 다른 전략이 필요하다.

V. 즉흥 스피치와 준비된 스피치 — 두 세계의 다른 기술

수사학에는 두 종류의 스피치가 존재한다. **준비된 스피치(Prepared Speech)**와 **즉흥 스피치(Impromptu Speech)**다. 현실 세계에서는 둘 다 필요하다. 취업 면접에서 예상치 못한 질문을 받을 때, 회의에서 갑자기 의견을 말해야 할 때, 누군가를 소개해야 할 때 — 이 모든 것이 즉흥 스피치 상황이다.

즉흥 스피치에서 가장 많이 쓰이는 구조는 PREP 포뮬라다. P(Point) — 먼저 핵심 주장을 한 문장으로 말한다. R(Reason) — 그 이유를 설명한다. E(Example) — 구체적인 예시나 사례를 든다. P(Point) — 처음의 주장을 다시 한번 강조하며 마친다. 이 구조가 강력한 이유는 뇌가 아무런 준비 없이도 따라갈 수 있는 최소한의 논리적 골격을 제공하기 때문이다. 먼저 입장을 밝히고, 이유를 주고, 증거를 제시하고, 결론을 맺는다 — 이것은 1단계의 툴민 모델을 단순화한 형태이기도 하다.

준비된 스피치는 훨씬 정교한 설계가 가능하다. 서론-본론-결론의 구조, 먼로의 동기 부여 순서, 청중 분석에 기반한 맞춤 전략, 발성과 제스처의 세밀한 계획까지 모두 반영할 수 있다. 그러나 아이러니하게도, 완벽하게 준비된 스피치는 때로 자연스러움을 잃는다는 함정이 있다. 연설자가 외운 대본을 읽는 것처럼 느껴지면 청중과의 연결이 끊긴다. 최고의 준비된 스피치는 스크립트를 외우는 것이 아니라, 구조와 핵심 아이디어를 완전히 내재화하여 그 순간 살아있는 대화처럼 전달하는 것이다. 이것이 메모리아(Memoria) — 단순 암기가 아닌 '아는 것'의 의미다.

VI. 프로젝트 — 설계하고, 분석하고, 전달하라

이제 지금까지 배운 모든 것을 실제로 적용해볼 차례다. 아래 세 개의 프로젝트는 독립적으로도 할 수 있지만, 순서대로 진행하면 서로 연결되어 학습 효과가 배가된다. 각 프로젝트는 정답을 제시하지 않는다 — 너 스스로 생각하고 설계하는 것이 목적이다. 막힐 때 힌트를 찾으려 하지 말고, 먼저 왜 막히는지를 분석하는 것부터 시작해라.

[프로젝트 1] 스피치 해부: 명연설의 구조 분해

아래에 제시된 것은 2005년 스티브 잡스가 스탠퍼드 대학 졸업식에서 한 연설의 도입부를 한국어로 번역·요약한 것이다 (원문: Stanford News, 2005).

"오늘 저는 여러분에게 세 가지 이야기를 하겠습니다. 별것 아닌 이야기들입니다. 첫 번째는 점들을 연결하는 것에 관한 이야기입니다. 저는 리드 대학을 6개월 만에 자퇴했지만 18개월 동안 대학을 전전하며 강의를 청강했습니다. 당시에는 이유를 몰랐지만 — 나중에야 그 점들이 연결되었습니다. 만약 제가 그 캘리그래피 수업을 청강하지 않았더라면, 맥(Mac)에는 복수의 서체가 없었을 것이고, 우아한 폰트를 가진 첫 번째 컴퓨터도 없었을 것입니다."

이 도입부를 분석해라.

첫 번째로, 잡스가 사용한 **훅(Hook)**은 무엇인가? 그것이 어떻게 파토스, 에토스, 로고스 중 어느 요소를 먼저 활성화하는지 설명하라. 두 번째로, 그는 서론에서 프리뷰를 어떻게 처리했는가? 그 프리뷰가 청중의 인지 부하를 어떻게 줄이는지, 밀러의 7±2 법칙과 연결하여 설명하라. 세 번째로, 이 연설에서 잡스가 사용하는 **전환 구조(Transition)**를 찾아내고, 그것이 먼로의 동기 부여 순서(Attention-Need-Satisfaction-Visualization-Action) 중 어느 단계에 해당하는지 분류하라. 이 분류가 어렵게 느껴진다면, 먼저 잡스가 청중에게 무엇을 '느끼게' 하려 했는지부터 생각해보라. 마지막으로, 이 도입부를 들은 스탠퍼드 졸업생 청중은 Demographics와 Psychographics의 관점에서 어떤 특성을 가지는가? 잡스가 그 특성에 맞게 조정한 요소를 최소 두 가지 찾아내라.

[프로젝트 2] 즉흥 스피치 설계: PREP 포뮬라 실전

아래 세 가지 질문 중 하나를 골라라. 선택 기준은 단순하다 — 가장 불편하게 느껴지는 것을 골라라. 불편함이 성장의 위치를 알려준다.

질문 A: "한국의 수능 제도는 폐지되어야 한다. 찬성 혹은 반대?" 질문 B: "SNS는 청소년의 정신 건강에 해롭다. 찬성 혹은 반대?" 질문 C: "인공지능이 인간의 창의성을 대체할 수 있다. 찬성 혹은 반대?"

선택한 질문에 대해 PREP 포뮬라(Point-Reason-Example-Point)를 사용하여 60초 이내의 즉흥 스피치를 설계하라. 이때 단순히 대본을 쓰는 것이 아니라, 다음 사항을 포함한 설계 문서를 작성해야 한다: (1) 네 단계(P-R-E-P)를 각각 한 두 문장으로 채우라. (2) 청중이 10대 동급생이라고 가정할 때, 어떤 예시(E)가 가장 강력한 파토스를 만들 수 있는지 — 그리고 왜 그 예시를 골랐는지 Psychographics 관점에서 설명하라. (3) 만약 같은 주제를 50대 부모님 세대에게 말해야 한다면, P-R-E-P의 어느 부분을 어떻게 바꾸겠는가? 구체적으로 서술하라. (4) 이 스피치를 실제로 말한다고 가정했을 때, 가장 강조를 두어야 할 부분에서 어떤 발성 전략(음량, 속도, 침묵)을 사용하겠는가?

[프로젝트 3] 5분 스피치 설계 및 자기 평가 계획

이것이 오늘의 최종 프로젝트이자, 커리큘럼 2단계의 실무과제인 '5분 스피치'의 설계 단계다.

아래 주제 목록에서 하나를 선택하거나 스스로 주제를 설정해도 된다 (단, 스스로 설정할 경우, 청중이 고등학생 동급생이어야 한다).

"우리는 왜 실패를 두려워하는가"
"디지털 기기는 우리의 집중력을 파괴하고 있다"
"좋아하는 것을 직업으로 삼아야 한다"
"학교는 무엇을 위해 존재하는가"

주제를 선택했다면, 다음 순서로 설계 문서를 작성하라.

Part A — 청중 분석: 고등학생 동급생을 청중으로 분석하라. Demographics(나이, 경험, 공통 맥락)와 Psychographics(현재 관심사, 불안, 가치관)를 구체적으로 서술하고, 이 청중의 **사전 태도(우호적/중립적/적대적 중 어느 쪽에 가까운가?)**를 판단하고 그 이유를 설명하라.

Part B — 스피치 구조 설계: 먼로의 동기 부여 순서(Attention-Need-Satisfaction-Visualization-Action) 다섯 단계에 맞춰, 각 단계에서 무엇을 말할 것인지를 개요(Outline) 형태로 작성하라. 서론의 훅은 어떤 유형인가(충격적 통계/질문/이야기 등)? 본론의 메인 포인트는 몇 개이고, 각각의 툴민 구조(주장-근거-보증)는 무엇인가? 결론에서 Bookend technique을 어떻게 적용할 것인가?

Part C — 전달 전략: 이 스피치에서 가장 감정적으로 고조되어야 하는 순간은 언제인가? 그 순간에 어떤 발성 전략을 쓸 것인가? 제스처는 어떻게 사용할 계획인가? 아이컨택 패턴은 어떻게 분배할 것인가?

Part D — 자기 평가 루브릭 설계: 커리큘럼의 평가 기준(스피치 구성 30점, 전달력/표현력 45점, 자기 평가 성찰 25점)을 참고하여, 각 항목을 구체적인 세부 기준으로 분해하라. 예를 들어 '전달력 45점'은 발성(○점), 제스처(○점), 아이컨택(○점)으로 어떻게 배분하겠는가? 그리고 각각 '탁월/보통/미흡'을 어떤 행동으로 구분하겠는가? 이 루브릭을 실제 발표 후 자기 자신에게 적용할 예정이므로, 최대한 객관적이고 행동 중심적으로 만들어라.

세 프로젝트를 마쳤을 때, 너는 단순히 스피치 이론을 '아는' 것을 넘어 — 실제로 설계하고 분석하는 전문가의 사고방식을 연습하게 된다. 수사학은 결국 말하는 기술이 아니라 생각하는 기술이다. 어떻게 설계할 것인가, 누가 듣고 있는가, 어떤 도구를 언제 쓸 것인가 — 이 질문들에 답하는 과정이 바로 수사학자의 훈련이다.