這篇文章是我學習 MIT 18.01SC Session 1Session 2 做的學習筆記,希望能夠幫助閱眾更容易地吸收課程中的內容。

這篇主要會輔助說明課程中導數的用途(查資料歸納出來的),並說明 EXAMPLE 2 裡提到要用二項式定理細部來看是怎麼來的。 EXAMPLE 1 因為課程講義和課程影片中就蠻清楚了,就不多做筆記了。

這篇文章會涉及到

  • 導數(derivative)
  • 二項式定理(binomial theorem)

基礎知識需求

前言

關於導數 (derivative) 的概念 18.01SC 講的簡明扼要,但又舉了很多深度的例子啟發思考。切得更細,以及更多小練習題,可以看 Khan Academy - Differential Calculus 下的 Unit: Derivatives: definition and basic rules,從 Average vs. instantaneous rate of change 這段到 Derivative definition 該段的 Formal definition of the derivative as a limit。

TL;DR

首先你需要先有一個非線性方程式才能推導它的導數。

導數公式:

$$ m = \underbrace{f'(x_0)}_{\text{derivative of } f \text{ at } x_0} = \lim_{\Delta x \to 0} \frac{\Delta f}{\Delta x} = \lim_{\Delta x \to 0} \underbrace{\frac{f(x_0 + \Delta x) - f(x_0)}{\Delta x}}_{\text{difference quotient}} $$

(來源:18.01SC Session 1 Clip 5 Notes)

這個 m 就是線性方程式中

$$y = m(x + b)$$

裡的 m (斜率);導數可以用來帶出非線性函式中的特定點的切線斜率。

Notations

導數有幾種數學的符號表示法,這個在 Session 2 Clip 3 的 Notes 裡有整理出來。這邊就簡單列舉,因為在這篇文章後面 – 課程中 \(y = x^n\) 的例子會這邊提到的別名寫法。

  • \(Delta y = \Delta f = f(x) - f(x_0) = f(x_0 + \Delta x) - f(x_0)\)

  • Difference quotient:

    $$ \frac{\Delta y}{\Delta x} = \frac{\Delta f}{\Delta x} $$
  • 假設 \(\Delta x \to 0\),difference quotient 可以寫成:

    • \(\frac{\Delta y}{\Delta x} \to \frac{dy}{dx}\)
    • \(\frac{df}{dx} \frac{d}{dx}f\)
    • Leibniz’ notation: \(\frac{d}{dx}y\)
    • Newton’s notation: \(\frac{\Delta f}{\Delta x} \to f'(x_0)\)
    • 其他的註記方式: \(f'\) 和 \(D f\).

從線性到非線性

舉例來說,汽車的起步加速能力可以看從時速0到100公里需要多少秒數。

想像y軸是速度,x軸是經過的秒數,第1秒10km/h、第2秒20km/h…線性的穩定增加,這樣的條件出來的函式圖應該是一條直線(如圖1):

linear equation (圖1:線性增加)

要求這條線的斜率只要找線上任意兩點

$$ (x_0, y_0), (x, y) $$

然後計算

$$ m = \frac{y - y_0}{x - x_0} = \frac{\Delta y}{\Delta x} $$

m 就會是斜率,比如

$$ (x_0, y_0) = (1, 10), \quad (x, y) = (2, 20) $$

代入公式得出

$$ m = \frac{20 - 10}{2 - 1} = 10 $$

因此這條線的線性方程式就會是

$$ y = f(x) = 10x $$

但通常時速不會是每秒穩定增加的,而是非線性的(如圖2),可以想像是起步比較慢,但後續會增加得愈來愈快:

nonlinear equation (圖2:非線性增加)

可以發現上面求斜率的公式在這條(曲)線上,會有困難,切線延伸出去會變成割線,這時要找某個點的斜率就需要使用導數公式。導數公式的概念是:當割線無限接近我們要找的那的點

$$ (x_0, y_0) $$

就會是切線,也就拿的到斜率,而這個無限接近指的便是

$$ \lim_{\Delta x \to 0} $$

微分的概念。

18.01SC Session 1 提供了視覺化切線與割線、非線性函式,與導數的小工具(Mathlet)

二項式定理

Session 2 Clip 4的例子 – 非線性函式:

$$ y = x^n $$

n 為正整數(非零自然數),透過導數公式展開會變成:

$$ f'(x^n) = \frac{\Delta y}{\Delta x} = \frac{f(x_0 + \Delta x) - f(x_0)}{\Delta x} = \frac{(x_0 + \Delta x)^n - x_0^n}{\Delta x} $$

然後要讓 \(\Delta x\) 不出現在分母,才能假設它是 0,不然除以 0 會是未定義。首先要看到式子中的這個部份

$$ (x + \Delta x)^n $$

可以用 二項式定理(binomial theorem)

參考 math is fun,這個網站寫了循序漸進,淺白易懂的解釋這個公式是合理的,而且還會看到帕斯卡三角形(Pascal triangle)的應用,終於知道這個常見於題目中的數陣可以做什麼了。

$$ (a+b)^n = \sum_{k=0}^{n} \binom{n}{k}a^{n-k}b^k $$

我們可以把 a 和 b 換成 x 和 Delta x,從課程中的筆記可以看到單純展開會是這樣:

$$ (x + \Delta x)^n = (x + \Delta x)(x + \Delta x)...(x + \Delta x) \quad \text{n times} $$

但是,參考維基百科 binomial theorem - geometrical explanation 這項,再把這個公式乘開來一些:

$$ (x + \Delta x)^n = x^n + nx^{n-1}\Delta x + \binom{n}{2} x^{n-2} (\Delta x)^2 + ... $$

維基百科還有提供一張很棒且有趣的幾何圖幫助了解

這樣就接近到課程中提到的 junk 是怎麼來的了,因為

$$ \binom{n}{2} x^{n-2} (\Delta x)^2 + ... $$

會假設 \((\Delta x)^2\) 極度接近0,可以被忽略;於是課程中寫成 \(O((\Delta x)^2)\),指的就是餘下後面會乘到 \((\Delta x)^2\) , \((\Delta x)^3\) …到 \((\Delta x)^n\) 的部份,所以是:

$$ x^n + n(\Delta x)x^{n-1} + O((\Delta x)^2) $$

所以關於 \(y = f(x) = x^n\) 的導數會是:

$$ \frac{\Delta y}{\Delta x} = \frac{(x + \Delta x)^n - x^n}{\Delta x} = \frac{(x^n + n(\Delta x)(x^{n-1}) + O(\Delta x)^2) - x^n}{\Delta x} $$
  • 看向第三個公式,分子的部分頭跟尾的 \(x^n - x^n\) 相消,再把 \(\Delta x\) 從 \(n(\Delta x)(x^{n-1}) + O(\Delta x)^2)\) 提取出來並跟分母抵銷,就會變成
$$ nx^{n-1} + O(\Delta x) $$

再來,這個導數要解,就要回到前面提的,假設 \(Delta x\) 無限接近 0

$$ \lim_{\Delta x \to 0} $$

於是

$$ \lim_{\Delta x \to 0} \frac{\Delta y}{\Delta x} = nx^{n-1} $$

所以:

$$ \frac{d}{dx}x^n = nx^{n-1} $$

這個結果也會是個公式,課程中提及叫:power rule,用於求多項式 (polynomials) 的導數:

$$ \frac{d}{dx}(x^2 + 3x^{10}) = \frac{d}{dx}(2x^{2-1} + 3 \times 10x^{10-1}) = 2x + 30x^9 $$

比較淺白的例子及應用練習可以看上面提到的 Khan Academy 同一個單元的 Power rule 段落。