자연 과학 Natural Science/수학 Mathematics

미분법(微分法, Differentiation)

Jobs 9 2024. 10. 9. 06:46
반응형

미적분(微積分)

  1. Differential and Integral Calculus
  2. Infinitesimal Calculus
  3. Calculus

미적분은 위와 같이 사용할 수 있다. 미적분은 미분과 적분을 합쳐서 부르는 표현인데, 미분과 적분은 각각 아래와 같이 쓴다.

  • 미분 : Differential, Differentiation
  • 적분 : Integral

“미분 : 작게 나눈 부분의 변화율을 구하는 것”

미적분은 뉴턴이 자연 현상을 수학 공식으로 설명하기 위해서 만든 것이다. 미분의 미(微)는 “미세하게 작다”라는 뜻을 가지고 있다. 그래서, 미분은 “작게 나누다.”라는 뜻으로, 어떤 함수에서 아주 작은 구간을 나누어서 변화율을 연구하는 수학

 

“적분 : 아주 작은 구간을 합쳐서 쌓는 것”

적분의 적(積) 자는 “누적하여 쌓다.”라는 뜻으로 쓰인다. 그래서, 적분은 “작게 나누어진 것을 합쳐서 쌓는다.”라는 뜻으로 어떤 함수에서 아주 작은 구간들을 합쳐서 쌓으면 일어나는 현상을 연구하는 수학

 

 

 

 

 

미분법(微分法, Differentiation)

 

미분이라는 단어는 영어 differentiation의 번역어이며, 점↔선↔면↔입체가 미적분과 유사한 관계임에서 착안하여 만들어진 단어이다. 즉 어떤 면을 미세하게 층층이 쪼개었을 때, 각각의 층을 '미세한 부분'이라고 하여 '미분'이라고 부른 것이 어원이다. 영어 differentiation이나 differential은 '차이를 두다'라는 뜻의 differentiate에서 파생되었다. 

미분을 알기 위해서는 우선 몇 가지 개념에 대한 이해가 필요하다. 아래는 뉴턴이 최초로 미적분을 발명하고 거의 비슷한 시기에 라이프니츠가 최초로 정립한 미분계수의 정의와 평균변화율과 순간변화율 개념을 기술하고 있다. 나아가 이는 롤, 가우스, 코시, 로피탈, 리만, 바이어슈트라스 등 여러 인물들이 만들어 놓은 이론과 정리들의 기본 원리가 되는 개념이다. 

 
[그림 1] 미분법은 기울기 구하기(출처: wikipedia.org)
 
미분을 하는 이유는 해당 곡선의 기울기(slope)를 알기 위해서이다. [그림 1]을 보면 기울기가 (+)이면 녹색이 되고 (-)이면 빨간색이 된다. 기울기가 0이면 검정색이 된다. 이런 특성은 미분법을 통해 쉽게 알 수 있다. 따라서, 미분법을 이해하려면 먼저 기울기부터 정의해야 한다. 기울기는 1차 함수인 y = ax+b와 같이 변화율을 이용하여 식 (1)과 같이 정의한다.
 
   
                               (1)
 
식 (1)에서 x1이 x2로 가까이 가면 식 (1)은 미분 혹은 미분값으로 정의할 수 있다.
 
   
                                (2)
 
다만 심각하게 주의해야 할 용어가 있다. 미분소(微分素, differential)와 미분법이다. 미분소를 생각하기 전에 먼저 차분(差分, difference)을 생각하자. 차분은 두값을 뺀 차이를 뜻한다. 즉, x2와 x1 사이의 간격을 의미하므로 식 (3)으로 정의한다.
 
   
                                 (3)
 
위의 차분에서 x1이 x2로 한없이 가까이 가는 경우를 미분소라 한다. 즉, 미분소는 차분의 극한(限, limit)으로 생각할 수 있다.
 
   
                                  (4)
 
차분의 극한 개념으로 위의 식 (2)를 보면 x와 y에 대한 미분소의 비율로써 미분값 dy/dx를 정의할 수 있다. 미분법은 이런 미분값을 얻기 위한 과정이다. 미분을 발명한 뉴턴Isaac Newton(1643–1727)은 미분 기호를 y˙로 표기했다. 식 (2)와 같은 표현은 라이프니츠Gottfried Wilhelm Leibniz(1646–1716)가 제안했다. 미분의 또 다른 기호로 오일러Leonhard Euler(1707–1783)가 만든 y′도 쓰인다. 여러 번 미분하는 고계 미분 혹은 고차 미분(higher-order differentiation)은 y¨,y⃛,⋯, d2y/dx2,d3y/dx3,d4y/dx4,⋯, 혹은 y″,y‴,y⁗,⋯처럼 쓴다.[고차 미분이란 용어도 쓰지만, 미분 방정식의 계층수(order)란 이름과 맞추기 위해 고계 미분을 선택] 혹은 n번 미분한 결과를 y(n)으로 표시하기도 한다. 미분 연산으로 구한 함수는 도함수(導函數, derivative)라고 부르고, 주로 f′(x), f(1)(x), Df(x) 등으로 기호화한다. 여기서 D 혹은 Dx는 x에 대한 미분 연산자(differential operator)이며 고계 미분은 Dn 혹은 Dxn이 된다.
식 (2)처럼 미분을 정의할 때, 수학적으로 민감한 혹은 애매한 부분이 있다. 한없이 가까이 간다는 극한은 수학적으로 어떻게 생각해야 하는가? 또한, 식 (4)의 값은 실상 0으로 수렴한다. 분모가 0이 되는 식 (2)의 값은 정말로 존재하는가? 한없이 가까이 감을 수학적으로 명확히 정의하기는 매우 어렵다. 코쉬Augustin-Louis Cauchy(1789–1857)가 극한을 정의하기 위해 사용한 ϵ–δ 정의가 필수적이다. 물론 ϵ–δ 정의는 수학도에게 악명 높은 방법론이다. 하지만 다른 방법이 있는가? 명확성을 유지하면서도 더 직관적으로 극한을 정의할 수 있다면 빨리 수학 논문지에 논문을 쓰기 바란다. 쉽지 않은 일이니까! 미분값의 존재성은 평균값의 정리와 밀접히 연관되어 있다. 대부분의 고등학생들은 미적분에 대한 고등학교 수학 내용을 매우 힘들어 한다. 그 중에서도 제일 이해가 어려운 부분은 평균값의 정리이다. 학생들은 아마 이런 생각을 할 수도 있다. '내가 수학자가 될 것도 아닌데 도대체 이 개념을 왜 공부하지? 잘 모르겠다. 그냥 외우자.' 이런 생각이 머리속을 지배하는 순간, 미분은 매우 지겨운 수학 분야가 된다. 하지만 코쉬도 우리와 같은 평범한(?) 사람이다.[코쉬는 오일러에 이어 인류 역사상 2번째로 많은 논문을 쓴 대학자이다.] 천재라서 자고 있어났는데 ϵ–δ 정의가 그냥 생각난다? 이런 상상은 그만하자. 코쉬가 수년을 고민해서 얻은 결과물이 부등식을 이용해서 극한을 정의하는 방식이기 때문이다. 다만 지금은 표준이 된 ∀ϵ, ∃δ, |x−c|<δ ⇒ |f(x)−L|<ϵ이라고 명확히 쓰지 못하고, 코쉬는 문장을 이용해 자신의 극한 개념을 다소 모호하게 설명했다. 이러한 이유로 미분의 역사는 뉴턴Isaac Newton(1643–1727)과 라이프니츠Gottfried Wilhelm Leibniz(1646–1716)가 시작했지만, 명확한 개념을 가지고 이 문제를 고민한 사람은 미분의 발명 후 150년 즈음 지나서 활동한 코쉬이다. 코쉬가 평생 이룬 업적을 고교 2학년생이 몇 시간 수업을 듣고 이해한다면 이 사건이 진정 기적이지 않을까? 수학이라는 학문은 겸손한 마음으로 접근해야 한다. 물론 모든 내용을 의심하면서 인내를 가지고 접근하자. 기울기를 구하기 위해 사용한 미분법은 어디에 유용하게 사용할 수 있나?

 

  • 첫째, 함수의 꼭대기값을 찾기 위해 사용할 수 있다.

[그림 1]에서 기울기가 증가하면 녹색이 되고 감소하면 빨간색이 된다. 이 개념을 함수값 관점으로 보자. 기울기가 녹색인 방향으로 가면 함수값이 증가하고 기울기가 빨간색인 방향으로 가면 함수값이 감소한다. 즉, [그림 1]에서 함수의 꼭대기값을 찾기 위해 기울기가 녹색인 방향으로 가면 잘 가고 있으니 계속 가면 되고, 기울기가 빨간색인 방향으로 가면 틀린 방향이므로 반대 방향으로 가야 꼭대기를 찾아갈 수 있다. 움직인 결과로서 기울기가 0[검정색]이 되면 꼭대기값에 왔으므로 정지하면 된다. 이런 방법으로 함수의 특정 근방에서 최대값을 찾는 방법이 뉴턴 최적화(最適化, Newton optimization)이다. 따라서, 함수를 미분하면 근방에 위치한 함수의 꼭대기값을 쉽게 찾아갈 수 있다. 이런 미분 개념과 벡터(vector)를 융합하면 함수의 최대값을 찾아가기 위한 방향을 미분 기반 벡터 연산(구배, 勾配, gradient)으로 결정할 수 있다.

  • 둘째, 일반적인 함수에 대한 1차 근사(一次近似, linear approximation)를 명확히 할 수 있다.
식 (1)과 (2)의 표현처럼 미분은 특정점 근방의 성질을 기울기 특성[y = ax+b]으로 표현할 수 있기 때문에 함수 자체의 복잡한 특성을 보지 않고 선형으로 모형화해 함수의 일반적인 특성을 명확하게 기술할 수 있다. 또한, 함수가 가진 미분값의 상관 관계를 이용한 방정식이 미분 방정식(微分方程式, differential equation)이다. 대부분의 물리방정식은 미분 방정식을 이용하여 기술한다.
 
 
[알기 쉬운 미분법 소개]
 
극한의 성질과 식 (2)를 이용하면 미분의 규칙을 손쉽게 증명할 수 있다.
 
[선형 사상(線型寫像, linear mapping)]
 
   
                                  (5)
 
[증명]
식 (5)의 좌변을 식 (6)과 같이 차분한 후 Δx→0이 되게하면 식 (5)가 증명된다.
 
   
          (6)
______________________________
 
[곱셈의 미분: 라이프니츠 규칙(Leibniz rule)]
 
   
                                  (7)
 
[증명]
 
          (8)
______________________________
 
[나눗셈의 미분]
 
   
                                  (9)
 
[증명]
 
   
          (10)
______________________________
 
나눗셈의 미분은 식 (7)에 나온 곱셈의 미분과 1/g(x)의 미분을 이용해서 쉽게 수행할 수 있다. 함수 g(x)의 역수(multiplicative inverse or reciprocal)인 1/g(x)에 대한 미분은 통분 과정을 거쳐 [1/g(x+Δx)−1/g(x)]/Δx = [g(x)−g(x+Δx)]/[Δxg(x)g(x+Δx)]와 같이 쉽게 유도된다.
 
[합성 함수의 미분: 연쇄 법칙 혹은 규칙(chain rule)]
 
   
                                  (11)
 
[증명]
 
   
                                  (12)
______________________________
 
식 (11)의 증명에서 f(x) = C인 상수 함수라면 다소 문제가 있다. 식 (12)의 분자[= Δg[f(x)]], 분모[= Δf(x)]가 모두 0이 되므로 식 (12)의 우변은 불능이 된다. 다만 f(x) = C는 x값을 C로만 보내는 함수이므로 g[f(x)] = g(C)가 된다. 이런 함수는 우리가 고려하는 합성 함수가 아니므로, f(x) = C를 미분을 위한 합성 함수에서 제외하고 단순한 상수로 취급해서 미분값을 0으로 둔다. 
 

[역함수(逆函數, inverse function)의 미분]

함수 y = f(x)의 역함수 x = f−1(y)를 미분할 때는 dy/dx의 역수를 이용한다.
 
   
                                  (13)
 
[증명]
식 (12)와 유사한 방식으로 차분해서 식 (13)을 증명한다.
______________________________

기본적인 미분 규칙을 이용하면, 다양한 함수의 미분 공식을 간단히 증명할 수 있다.
 

   1. 기본(basics)   
 
[초등 함수]
 
   
               (1.1)
 
멱함수(冪函數, power)의 미분은 이항 정리를 이용한다.
 
 
   
               (1.2)
 
지수 함수(exponential function)의 미분은 오일러의 수를 이용한다.
 
   
               (1.3)
로그 함수(logarithmic function)의 미분은 오일러의 수를 이용한다.

   
               (1.4)
삼각 함수(trigonometric function) 미분은 삼각 함수 합차 공식을 이용한다.

[우함수와 기함수]
함수 관계가 f(−t) = f(t)를 만족해서 y축에 대해 대칭인 함수를 우함수(偶函數, even function) 혹은 짝함수라 한다. 비슷하게 원점 대칭 조건인 f(−t) = −f(t)를 만족하는 함수를 기함수(奇函數, odd function) 혹은 홀함수라 정의한다. 일반적인 모든 함수는 다음처럼 우함수와 기함수의 합으로 분해된다.
 
   
                   (1.5)
 
우함수 fe(x)의 미분은 기함수 특성을 가지고 기함수 fo(x)의 미분은 우함수 성질이 있다.
 
[증명]
   
          (1.6)
______________________________
 
식 (1.5)에 나온 기함수의 정의에 따라 항상 fo(0) = 0이며, 우함수의 미분은 dfe(x)/dx|x=0 = 0이 성립한다. 또한 우함수와 기함수의 성질은 테일러 급수(Taylor series)의 짝수와 홀수 차수 조건과도 연결된다.
 

   2. 고계 미분(higher-order differentiation)   
 
[1차 함수의 역수(multiplicative inverse or reciprocal)]
 
   
              (2.1)
 
[2차 함수의 역수]
 
   
          (2.2)
 
여기서 nCk는 조합(combination)이다.

 

[증명]
복소수 영역에서 2차 함수의 역수를 부분 분수 분해(partial fraction decomposition)한다.
 
   
              (2.3)

 

식 (2.3)의 결과에 식 (2.1)을 적용해서 정리한다.
 
   
              (2.4)
 

마지막으로 식 (2.4)의 거듭제곱 식을 이항 정리(binomial theorem)로 전개해서 식 (2.2)를 얻는다.

______________________________
 
식 (2.2)는 로렌츠–코쉬 함수(Lorentz–Cauchy function) 혹은 룽에 함수(Runge function)라고 한다. 특이하게도 룽에 함수는 미분을 할수록 고계 미분이 발산한다. 고계 미분의 발산 성질은 보간법(interpolation method)의 맹점중 하나인 룽에 현상(Runge's Phenomenon)을 만든다.
 
[일반 라이프니츠 규칙(general Leibniz rule)]
 
   
              (2.5)
 
[증명]
이항 정리(binomial theorem)에 나오는 (f+g)n의 전개처럼 곱의 미분을 n번 적용한다.
______________________________
 
일반 라이프니츠 규칙의 증명에도 쓰이는 이항 정리는 정말 수학의 감초와 같다. 이항 정리를 재발견하고 첨단화시킨 파스칼Blaise Pascal(1623–1662)에게 경의를 표한다.
 
[다항식(polynomial)]
 
   
              (2.6)
 
   
              (2.7)
 
여기서 n≥0, m≥0, m≤n이다.
 
[증명]
식 (2.6)은 식 (1.1)을 n번 단순 미분해서 쉽게 구한다. 식 (2.7)은 유도가 매우 까다로워서, 보통 (x2−a2) = (x−a)(x+a)로 인수 분해해서 식 (2.5)를 적용한다.
 
   
          (2.8)
______________________________
 
버금 르장드르 함수(associated Legendre function)의 성질을 증명할 때에 식 (2.7)은 유용하게 쓰인다. 식 (2.6)에서 지수가 정수 n에서 실수 ν로 바뀌면, 감마 함수(gamma function) Γ(ν)를 도입해서 공식을 살짝 바꾼다.
 
   
              (2.9)
 

더 나아가서 ν를 복소수(complex number)로 취급해도 식 (2.9)는 잘 성립한다.

반응형