← --library
이과 · 02이과

선형대수학 및 텐서 해석

Linear Algebra & Tensors

단계1단계2단계3단계4단계5

4단계: 텐서 대수, 리만 기하학, 그리고 휘어진 공간의 언어


1부: 이론적 기초 — 왜 행렬은 부족한가?

지금까지 걸어온 길을 잠깐 돌아보자. 1단계에서 우리는 벡터 공간이라는 무대를 세우고, 행렬이 그 위에서 공간을 늘리고 회전시키는 **선형 사상(linear map)**임을 배웠다. 2단계에서는 그 사상의 "고유한 방향"인 고유벡터를 추출했고, 3단계에서는 SVD를 통해 어떤 행렬도 세 개의 순수한 변환으로 분해할 수 있음을 알았다. 이 모든 것의 수학적 뼈대는 두 개의 인덱스 로 표현되는 행렬 였다. 그런데 이 세계가 갑자기 좁아지는 순간이 있다.

재료역학에서 3D 물체가 받는 응력(stress)을 생각해보자. "어느 방향의 면"에 "어느 방향의 힘"이 작용하는지를 동시에 표현해야 하므로, 각 점마다 개의 성분이 필요하다. 이것은 행렬로 쓸 수 있긴 하지만, 딥러닝의 합성곱 신경망(CNN)에서 데이터는 어떤가? [배치 크기, 채널 수, 높이, 너비]라는 4개의 인덱스를 가진 배열이 기본 단위다. tensor.shape = (32, 3, 224, 224)라면 이것은 행렬이 아니다. 그리고 아인슈타인의 일반 상대성 이론에서 시공간의 곡률을 기술하는 핵심 객체는 4개의 인덱스를 가진다. 이 모든 것들이 **텐서(Tensor)**다.

그런데 단순히 "고차원 배열"이면 텐서인가? 여기서 핵심 철학적 질문이 등장한다. 서울에서 중력장을 카르테시안 좌표 로 표현했다가 구면 좌표 로 바꾸면, 숫자들은 복잡하게 섞인다. 하지만 실제로 느끼는 중력—물컵이 떨어지는 현상—은 변하지 않는다. 텐서는 "좌표계와 무관한 물리적·기하학적 실체"를 포착하는 도구다. 단순 배열이 아니라, 좌표 변환에 따른 명확한 변환 법칙이 정의된 것만을 텐서라 부른다. 이 변환 법칙이 이번 4단계의 가장 중요한 뼈대다.

[노트 기록] 스칼라(0차) — 좌표 무관. 벡터(1차) — 변환 법칙 有. 행렬(2차) — 두 인덱스. n차 텐서 — 인덱스 n개 + 정해진 변환 법칙. "텐서는 몇 차인가?" = 인덱스 개수를 세어라.


2부: 반변과 공변 — 인덱스의 두 얼굴

여기서 처음으로 고등학교 수학에서 보지 못한 개념이 등장한다. 인덱스에는 두 종류가 있다. **위첨자(superscript)**로 쓰는 것과 **아래첨자(subscript)**로 쓰는 것이 있고, 이 둘은 좌표 변환 시 서로 반대 방향으로 변환된다.

직관부터 잡아보자. 기저 벡터 로 이루어진 좌표계에서 기저를 2배 늘린다고 상상하라. 같은 점을 가리키는 벡터의 성분은 어떻게 되는가? 기저가 2배 커졌으니 성분은 배로 줄어든다 — 기저와 반대 방향으로 변환된다. 이것이 반변(contravariant) 성분이고 위첨자 로 표현한다. 반면 기저 변환과 같은 방향으로 변환되는 것들이 있는데, 이것이 공변(covariant) 성분이고 아래첨자 로 표현한다. 좌표 변환 가 주어질 때:

이 두 변환이 서로 역(inverse) 관계에 있음에 주목하라. 반변은 야코비안 를 곱하고, 공변은 그 역인 를 곱한다. 마치 분수에서 분자와 분모가 서로 상쇄되듯, 반변 인덱스와 공변 인덱스가 짝을 이루면 좌표계에 무관한 스칼라가 만들어진다. 이 개념을 체계화한 인물이 **그레고리오 리치(Ricci)와 툴리오 레비-치비타(Levi-Civita)*였으며, 1900년대 초 아인슈타인이 이를 상대성 이론의 핵심 언어로 채택했다("The Absolute Differential Calculus", Levi-Civita, 1927*).

[노트 기록] 위↑ = 반변(contravariant) : 변환행렬 . 아래↓ = 공변(covariant) : 변환행렬 . 반변 × 공변 수축 = 스칼라 (좌표 무관).


3부: 아인슈타인 합 규칙과 텐서 대수

1905년 아인슈타인은 수식을 극적으로 단순화하는 합 규칙을 도입했다. 규칙은 하나다. 같은 인덱스가 위(반변)와 아래(공변) 쌍으로 등장하면, 그 인덱스에 대해 자동으로 합산한다. 예를 들어 와 같고, 기호를 쓰지 않아도 된다. 행렬 곱 는 성분별로 와 동일하다. 아인슈타인 표기법이 훨씬 간결하다.

텐서끼리의 연산에는 세 가지 핵심이 있다. 첫째, 덧셈은 같은 차수와 같은 인덱스 구조를 가진 텐서끼리만 가능하다. 둘째, **텐서 곱(outer product)**은 두 텐서를 결합해 더 높은 차수의 텐서를 만든다 — 의 텐서 곱은 로, 2차 텐서 두 개가 4차 텐서가 된다. 셋째, **수축(contraction)**은 반대로 하나의 위 인덱스와 하나의 아래 인덱스를 같게 설정하고 합산하여 차수를 2 낮추는 연산이다 — 에서 에 대해 합산하면 , 4차 텐서에서 2차 텐서로 줄어든다. 딥러닝 프레임워크의 torch.einsum('ij,jk->ik', A, B)가 바로 이 수축 연산의 구현이다.

**다중 선형 사상(multilinear map)**이라는 관점에서 보면 텐서의 본질이 드러난다. 행렬 는 벡터 하나를 받아 벡터 하나를 내놓는 선형 사상이다. 형 텐서 는 공변 벡터 개와 반변 벡터 개를 받아 스칼라를 내놓는 다중 선형 사상이다. "다중"이란 각 인수에 대해 독립적으로 선형이라는 뜻이다. 2단계에서 배운 내적이 이므로, 계량 텐서 는 정확히 형 다중 선형 사상이다.

[노트 기록] 아인슈타인 합 규칙: 위아래 같은 인덱스 → 자동 합산. 수축: 차수 2 감소. 텐서 = 반변 인덱스 개 + 공변 인덱스 개 → 총 차수 .


4부: 리만 계량 — 휘어진 공간의 자(尺)

1단계부터 3단계까지 우리가 다룬 벡터 공간은 모두 편평한(flat) 공간이었다. 피타고라스 정리 이 성립하는 유클리드 공간. 그런데 지구 표면은 편평하지 않다. 서울에서 뉴욕까지의 최단 경로는 직선이 아니라 대원(great circle)이다. 아인슈타인은 더 나아가, 태양 근처에서 3차원 공간 자체가 휘어져 있고 그 휘어짐이 중력이라는 것을 보였다. 휘어진 공간을 다루려면, 우선 거리를 측정할 수 있어야 한다. 이것을 가능하게 해주는 것이 리만 계량 텐서(Riemannian metric tensor) 다.

1854년 베른하르트 리만(Bernhard Riemann)이 괴팅겐 대학 교수 취임 강연("Über die Hypothesen, welche der Geometrie zu Grunde liegen")에서 도입한 이 개념은 현대 기하학의 출발점이다. 계량 텐서는 두 점 사이의 무한소 거리 를 이렇게 정의한다:

아인슈타인 합 규칙에 의해 이것은 를 의미한다. 유클리드 공간에서는 (크로네커 델타, 즉 단위행렬)이므로 , 피타고라스 정리 그대로다. 반지름 의 구면에서 구면 좌표 를 쓰면 이므로, 계량 텐서는 , , 이다. 여기서 가 위치 에 따라 변한다는 점에 주목하라 — 적도 에서 이지만, 극점 에서는 이다. 계량 텐서가 공간의 각 점마다 다른 값을 가지며, 그 변화 자체가 공간의 휘어짐을 반영한다.

계량 텐서는 또한 반변 인덱스와 공변 인덱스를 서로 올리고 내리는 역할도 한다. (인덱스 올리기), (인덱스 내리기). 여기서 의 역행렬이다. 2단계에서 배운 내적이 사실은 계량 텐서 였음을 이제 알 수 있다.

[노트 기록] 리만 계량: . 평탄 공간: . 구면: , . 인덱스 올리기/내리기: 또는 곱하기.


5부: 크리스토펠 기호 — 휘어진 공간의 방향 안내자

계량 텐서를 손에 넣었으니, 이제 "휘어진 공간에서 어떻게 미분하는가?"라는 문제에 부딪힌다. 평탄한 공간에서는 그냥 편미분 를 계산하면 된다. 그런데 휘어진 공간에서 이 방법은 근본적인 문제가 생긴다. 편미분 텐서가 아니기 때문이다 — 좌표 변환 시 텐서의 변환 법칙을 따르지 않는다. 좌표계가 바뀔 때 두 번째 편미분 항이 추가로 등장해 변환 법칙이 깨진다.

이것을 구체적으로 느껴보자. 구면 위에서 적도를 따라 동쪽을 가리키는 벡터장을 생각하라. 이 벡터들은 물리적으로 변하지 않지만, 구면 좌표로 보면 극점 근처에서 수치가 변한다. 이 수치의 변화는 벡터 자체의 변화가 아니라 좌표계의 휘어짐 때문이다. 편미분은 벡터의 진짜 변화와 좌표계의 곡률 효과를 구분하지 못한다. 이 문제를 해결하기 위해 크리스토펠 기호(Christoffel symbol) 를 도입한다. 이것은 텐서가 아니지만(좌표 변환 시 텐서 법칙을 따르지 않는다!), 좌표계의 휘어짐을 보정하는 역할을 한다. 계량 텐서의 편미분으로부터 다음과 같이 계산된다:

이 식의 결정적 성질에 주목하라. — 아래 두 인덱스에 대해 대칭이다. 3차원 공간에서 크리스토펠 기호의 전체 성분 수는 개지만, 이 대칭성 덕분에 독립 성분은 개로 줄어든다. 계산량 절감의 핵심 눈치밥 스킬이 바로 이 대칭성 활용이다 — 계산 전에 대칭성으로 0이 되거나 같아지는 성분을 먼저 파악하라.

[노트 기록] . 대칭성: → 독립 성분 절반 감소. 크리스토펠 기호는 텐서가 아님.


6부: 공변 미분 — 휘어진 공간에서의 진짜 미분

크리스토펠 기호를 이용해 드디어 휘어진 공간에서도 좌표계에 무관한 미분을 정의할 수 있다. 이것이 공변 미분(covariant derivative) 다. 반변 벡터 에 대해서는:

공변 벡터 에 대해서는:

부호가 반대인 것에 주목하라! 반변은 , 공변은 다. 이것은 앞에서 배운 인덱스 올리기/내리기와 일관성을 유지하기 위한 것으로, 처음에는 외워야 하지만 곧 자연스러워진다. 편평한 공간에서 카르테시안 좌표를 쓰면 이므로 , 즉 그냥 편미분으로 환원된다.

공변 미분으로부터 측지선(geodesic) 방정식이 나온다. 휘어진 공간에서의 "최단 경로"는 다음 방정식을 만족한다: . 지구 표면에서의 대원, 태양 근처에서 빛이 휘는 경로, 이 모든 것이 이 방정식의 해다. 그리고 **평행 이동(parallel transport)**은 경로를 따라 공변 미분이 0이 되도록 벡터를 이동시키는 것이다: . 편평한 공간에서는 방향을 유지하며 이동하는 것이지만, 구면 위에서는 출발점으로 돌아왔을 때 벡터 방향이 바뀌어 있다. 이 각도 변화가 바로 곡률이다. 우리는 이제 핵심에 도달했다.

[노트 기록] (반변, +), (공변, −). 측지선: .


7부: 리만 곡률 텐서 — 공간의 굴곡을 수치화하다

드디어 4단계의 최종 개념이다. 리만 곡률 텐서(Riemann curvature tensor) 는 공간이 얼마나 휘어져 있는지를 정량적으로 측정하는 4차 텐서다. 이것의 철학적 동기를 먼저 파악하자.

편평한 공간에서 이중 편미분의 순서를 바꿔도 결과가 같다: . 그런데 공변 미분에서는 다르다. 두 방향으로 공변 미분한 순서를 바꾸면:

이 **교환자(commutator)**가 0이 아닐 때 공간이 휘어져 있다는 신호다. 그리고 그 "0이 아닌 정도"를 리만 텐서가 측정한다. 명시적 공식은:

이 식은 크리스토펠 기호의 편미분과 크리스토펠 기호끼리의 곱으로 구성된다. 크리스토펠 기호가 계량 텐서의 1차 미분이므로, 리만 텐서는 계량 텐서의 2차 미분을 담고 있다. 아인슈타인 장 방정식에서 중력(공간의 곡률)이 계량 텐서의 2차 미분으로 표현된다는 것이 여기서 직접 보인다.

이제 리만 텐서의 대칭성을 살펴보자. 인덱스 내리기를 적용하면 인데, 이 완전 공변 형식에서 다음 대칭성들이 성립한다:

이 대칭성들이 왜 결정적인가? 표면상 차원에서 리만 텐서 성분 수는 개인데, 대칭성을 모두 적용하면 독립 성분 수는 개로 급감한다. (구면): 1개, : 6개, (4차원 시공간): 20개. 아인슈타인의 일반 상대성 이론에서 이 20개가 리치 텐서 (10개)와 와일 텐서 (10개)로 분리되는데, 와일 텐서가 바로 블랙홀 주변을 여행하는 중력파를 기술한다.

[노트 기록] . 독립 성분: . n=4: 20개.


8부: 아인슈타인 방정식과 딥러닝으로의 연결

리만 텐서를 첫 번째와 세 번째 인덱스에서 수축시키면 리치 텐서(Ricci tensor) 를 얻는다. 이것을 계량 텐서로 한 번 더 수축시키면 리치 스칼라 , 하나의 수가 된다. 아인슈타인의 장 방정식은:

좌변 는 공간의 기하학(곡률), 우변 는 에너지와 운동량 분포다. "물질이 공간을 휘게 하고, 휘어진 공간이 물질의 운동을 결정한다" — 이것이 수식 하나에 담긴 아인슈타인의 통찰이다. 이 방정식이 10개의 독립 방정식인 것은 가 대칭 텐서 ()이기 때문이다 (4×4 대칭 행렬의 독립 성분 = 10).

딥러닝과의 연결도 빠뜨릴 수 없다. 신경망의 가중치 공간(parameter space)을 리만 다양체로 보면, **자연 경사법(Natural Gradient, Amari, 1998)**은 피셔 정보 행렬(Fisher Information Matrix)을 계량 텐서 로 사용하여 이 공간의 곡률을 고려한 최적화를 수행한다. 3단계에서 배운 내적 구조가 사실은 리만 기하학의 특수한 경우였음을 이제 알 수 있다.


프로젝트: 예제 문제 (정답 없음 — 스스로 40분)

막히는 부분이 가장 중요한 학습 지점이다. 손으로 직접 계산하라.

[문제 1: 텐서 차수 판별 — 5분]

다음 각 객체가 몇 차 텐서인지 판별하고, 구조를 명시하라.

(a) 전자기장 텐서 — 인덱스 개수와 위치를 보고 판단하라. 성분 수는?

(b) 크리스토펠 기호 — 표기상 3개의 인덱스를 가진다. 그런데 이것이 텐서인가? 힌트: 텐서의 정의는 변환 법칙을 따르는 것이다. 좌표 변환 시 2차 미분 항이 추가로 등장한다면?

(c) 딥러닝 이미지 텐서 shape (32, 3, 224, 224) — 몇 차 텐서인가? 전체 성분 수를 계산하라.

(d) 리치 스칼라 — 몇 차 텐서인가? 아인슈타인 합 규칙으로 수축이 몇 번 이루어졌는가?

[문제 2: 아인슈타인 합 규칙 연습 — 8분]

아인슈타인 합 규칙을 사용하여 다음 식을 기호를 이용해 완전히 전개하고, 각 식의 결과 텐서 차수를 판별하라. 2차원 공간 () 에서 진행하라.

(a) — 결과는 몇 차 텐서인가?

(b) (, 유클리드 공간) — 이것이 벡터의 크기의 제곱과 어떻게 연결되는가?

(c) — 수축이 두 번 일어난다. 결과의 차수는?

(d) 에서 어느 인덱스가 묶인(dummy) 인덱스이고 어느 것이 자유(free) 인덱스인가? 결과 텐서의 차수는?

[문제 3: 계량 텐서와 거리 계산 — 10분]

단위 구면 (): , , .

(a) 적도 ()에서 만큼 떨어진 두 점 사이의 호의 길이를 로 계산하라. (는 고정이므로 임에 주의.)

(b) 북위 60° ()에서 같은 이동의 호의 길이를 계산하고 (a)와 비교하라. 왜 차이가 나는가? 지구 위에서 같은 경도 차이가 위도에 따라 실제 거리가 다른 이유와 연결해서 생각하라.

(c) 를 구하라 (의 역행렬. 2×2 대각 행렬의 역행렬 공식: 대각 성분의 역수를 취하면 된다).

(d) , 인 공변 벡터의 반변 성분 , 를 이용해 구하라.

[문제 4: 크리스토펠 기호 계산 — 12분]

단위 구면의 계량 텐서로 크리스토펠 기호를 계산하라. 공식: .

계산 전에 먼저 이것을 스스로 파악하라: 2차원이고 대칭성 를 활용하면 독립 성분이 몇 개인가? (전체 성분 개, 대칭성 적용 후.)

(a) 를 계산하라. 에 대해 어떻게 변하는지 살펴라.

(b) 를 계산하라. 공식에서 어떤 항들만 살아남는지 먼저 파악하라.

(c) 를 계산하라. 힌트: 이므로

(d) 0이 아닌 크리스토펠 기호를 모두 나열하고, 물리적으로 해석하라. 특히 가 적도에서 왜 0이 아닌지, 극점에서 어떻게 되는지 생각해보라.

[문제 5: 리만 텐서 대칭성과 독립 성분 — 5분]

(a) (구면)에서 로 독립 성분 수를 계산하라. 결과가 1이 나온다. 이 1개의 독립 성분이 가우스 곡률(Gaussian curvature)이다. 단위 구면의 가우스 곡률은 1이고, 평면은 0이다. 이 차이가 무엇을 의미하는가?

(b) , 에서 각각 계산하라.

(c) 만약 계량 텐서가 모든 점에서 상수라면 (), 크리스토펠 기호와 리만 텐서는 어떻게 되는가? 이 경우 공간이 평탄하다는 것과 어떻게 연결되는가?

(d) 아인슈타인 장 방정식 에서, 진공 (물질 없음, )이면 이다. 이것이 (평탄 공간)을 의미하는가? 힌트: 이면 리치 텐서가 0인 것이지, 리만 텐서가 0인 것은 아니다. 이 차이가 와일 텐서와 어떻게 연결되는가?


마지막으로 스스로 점검할 질문. 풀고 난 후 다음을 자신에게 물어라. "크리스토펠 기호를 구하면 리만 텐서를 구할 수 있고, 리만 텐서를 수축하면 아인슈타인 방정식의 좌변을 얻는다. 그렇다면 계량 텐서 하나에서 출발하여 아인슈타인 방정식까지 가는 전체 경로를 지금 설명할 수 있는가?" 이 질문에 막힘없이 답할 수 있다면 4단계를 통과한 것이다. 참고 교재로는 Gravitation (Misner, Thorne, Wheeler, 1973)의 Part III, 그리고 딥러닝 연결에 관심 있다면 Amari의 Information Geometry and Its Applications (2016)를 권한다.

← 단계 3단계 5