|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Änderungsrate
Anhand dieser Zeichnung erkennt man, dass - mathematisch gesehen - die Darstellung der ansteigenden Straße auf dem Verkehrsschild nicht korrekt ist. Die auf dem Schild dargestellte Steigung beträgt nämlich nicht nur 12/100, sondern ungefähr 4/7, was rund 57% entspricht.
Bezeichnet man den Höhenunterschied mit ∆y und die in horizontaler Richtung zurückgelegte Strecke mit ∆x, dann gilt für die Steigung m: m = ∆y/∆x. Das Verhältnis ∆y/∆x gibt an, um wieviele Meter die Höhe bei konstant ansteigender Straße wächst, und zwar relativ zu ∆x. Bei der oben abgebildeten Straße ist m = 6m/50m = 12m/100m = 12/100 = 12%. Lässt sich die Abhängigkeit irgendeiner Größe y von einer anderen Größe x mithilfe einer Geraden beschreiben (man sagt dann: y hängt linear von x ab), dann gilt y = m·x + c. Der Steigungsfaktor m gibt an, wie stark
sich y in Abhängigkeit von x ändert:
Der Begriff der Steigung lässt sich verallgemeinern: Sei f eine auf [a, b]
⊂
ℝ definierte Funktion. (f(x1) − f(x0))/(x1 − x0) Änderungsrate (oder Differenzenquotient) von f im Intervall [x0, x1]. Diese Definition ist nur dann sinnvoll, wenn sich die Funktionswerte von f innerhalb des Intervalls [a, b] nirgendwo sprunghaft ändern. Mit anderen Worten: die Funktion muss stetig sein. (f(x1) − f(x0))/(x1 − x0) ist gleich der Steigung m der Geraden durch die Punkte (x0|f(x0) und (x1|f(x1). Durch diese Gerade wird eine lineare Funktion g definiert. Falls nun der Abstand zwischen x0 und x1 nicht zu groß ist, kann die Funktion f auf dem Intervall [x0, x1] durch die lineare Funktion g näherungsweise ersetzt werden. Diese Approximation ist um so besser, je kleiner (x1 − x0) gewählt wird.
Aus g(x0) = mx0 + c folgt
c = g(x0) − mx0. f(x) ≈ m·(x − x0) + f(x0) für x ∈ [x0, x1]. Für das zuletzt gezeichnete x-y-Diagramm kann man konkrete Interpretationen (er)finden. Beispielsweise lassen wir zwei Autos auf einer schnurgeraden Straße fahren, die zwei Fahrspuren hat. Beide Autos sollen zur selben Zeit x0 und an der gleichen Stelle y0 starten und später (zur Zeit x1) gleichzeitig an einer bestimmten Stelle y1 ankommen. Die folgende Zeichnung zeigt beide Autos von oben gesehen zur Startzeit.
Das blaue Auto fährt zunächst langsam los und wird dann immer schneller, das heißt, die Geschwindigkeit des blauen Autos nimmt während der Fahrt zu. Dagegen fährt das schwarze Auto während der gesamten Fahrt gleichförmig, das heißt, die Geschwindigkeit des schwarzen Autos bleibt durchgehend konstant.
Die Änderungsrate (y1 − y0)/(x1 − x0) liefert in diesem Beispiel sowohl den konstanten Wert der Geschwindigkeit des schwarzen Autos als auch den Wert der Durchschnittsgeschwindigkeit des blauen Autos auf der Fahrt von y0 nach y1. Diese Aussage bleibt auch dann richtig, wenn sich die Geschwindigkeit des blauen Autos zwischendurch sehr stark ändert. Wesentlich ist einzig und allein, dass beide Autos zusammen losfahren und zusammen ankommen.
Mit Hilfe der oben definierten Änderungsrate (y1 − y0)/(x1 − x0) kann man also in Bezug auf ein ausgewähltes Intervall [x0, x1] die durchschnittliche Änderung der Funktionswerte einer gegebenen Funktion bestimmen. Sei irgendeine reellwertige Funktion f auf einem Intervall [a, b] ⊂ ℝ gegeben. Kann man das lokale Änderungsverhalten von f an beliebig gewählten Stellen x0 ∈ [a, b] berechnen? Mit anderen Worten: Gibt es eine Methode, momentane Änderungsraten von f an denjenigen Stellen zu bestimmen, wo f definiert ist? Möglicherweise ist es besser verständlich, wenn diese Fragestellung physikalisch formuliert wird, so wie es Sir Isaac Newton (1643 - 1727) getan hat: Gegeben sei ein Körper, der sich nicht gleichförmig bewegt. Gibt es dann eine Methode, die momentane Geschwindigkeit des Körpers zu einem bestimmten Zeitpunkt t0 zu bestimmen?
Experimentell betrachtet ist die Sache leicht: Man nehme einen Zeitpunkt kurz vor t0 und einen Zeitpunkt kurz nach t0, messe die im Zeitintervall ∆t vom bewegten Körper zurückgelegte Strecke ∆s und hat dann mit v = ∆s/∆t die gesuchte Geschwindigkeit zur Zeit t0, und zwar um so genauer, je kleiner ∆t gewählt wird. Dieses Messverfahren ist aber in seiner Genauigkeit begrenzt, denn man kann in der Praxis das Zeitintervall ∆t nicht beliebig klein wählen. Kann der Prozess des Immer-kleiner-Werdens von ∆t bzw. von ∆s theoretisch weiter geführt werden mit dem Ziel, Momentangeschwindigkeiten nicht nur (mit einer unter Umständen kleinen, aber immer bestehenden Messungenauigkeit) zu messen, sondern (exakt) zu berechnen? Für Gottfried Wilhelm Leibniz (1646 - 1716) war die Frage nach der Berechnung einer Momentangeschwindigkeit gleichbedeutend mit dem Problem, die Steigung der Tangente an einer t-s-Kurve im Punkt (t0|s0) zu bestimmen. Die nachfolgende Bildsequenz (die nur bei aktiviertem JavaScript funktioniert) zeigt auf anschauliche Weise, warum das Newton'sche Geschwindigkeitsproblem und das Leibniz'sche Tangentenproblem gleichwertig sind. Im hier dargestellten Beispiel gilt t0 = 1 und s0 = 1 (Einheiten müssen uns an dieser Stelle nicht interessieren). Die Idee, das lokale Änderungsverhalten einer Funktion mit Hilfe eines solchen "Funktionenmikroskops" zu untersuchen, stammt von Arnold Kirsch (→ Einführung in Maple, Übung Funktionenmikroskop). Die sukzessive Vergrößerung des abgebildeten Funktionsgraphen um den Punkt (1|1) herum liefert bei genügend starker Vergrößerung fast die Tangente am Funktionsgraphen im Punkt (1|1)! Das Problem, die momentane Änderungsrate der hier gegebenen Funktion an der Stelle 1 zu bestimmen, läuft also anscheinend darauf hinaus, die Steigung der Tangente an dieser Stelle zu berechnen. Doch der bloße Augenschein allein kann trügen! Dies zeigt das folgende Beispiel aufeinander folgender Treppenkurven, die allesamt die Länge 2 besitzen. Die Folge dieser Treppenkurve nähert sich augenscheinlich beliebig dicht der Quadratdiagonalen, deren Länge der Quadratwurzel aus 2 entspricht. Es gilt aber
Sei eine Funktion f auf einem Intervall [a, b] ⊂ ℝ definiert und a < x0 < b. Wenn die Tangente an der durch y = f(x) definierten Kurve im Punkt P(x0|f(x0) in eindeutiger Weise existiert, dann gilt für die Steigung m dieser Tangente:
Hierbei ist Q(x1|f(x1) irgendein von P verschiedener Punkt auf dem Graphen von f. Die hier angegebene Formel besagt, dass die Tangentensteigung m, das heißt die „Steigung des Schaubildes der Funktion f an der Stelle x0“ um so genauer durch den Differenzenquotienten (f(x1) − f(x0))/(x1 − x0) bestimmt werden kann, je näher der Punkt Q an P heranrückt. Anders ausgedrückt: Wenn x1 gegen x0 strebt, dann strebt der Differenzenquotient gegen die Tangentensteigung m. Für diesen Grenzwert, der Ableitung (oder Differentialquotient) der Funktion f an der Stelle x0 genannt wird, gibt es unterschiedliche Bezeichnungen. Heute wird meistens die erstmals von Joseph Louis Lagrange (1736 - 1813) vorgeschlagene Bezeichnung f´(x0) oder die von Augustin Louis Cauchy (1789 - 1857) eingeführte Bezeichnung Df(x0) verwendet. Leibniz benutzte für den Differentialquotienten die Abkürzung dy/dx (gesprochen: „dy nach dx“), die vor allem in der Physik sehr gebräuchlich ist.
Existiert die Ableitung der Funktion f an jeder Stelle x ∈ [a, b], kann man für alle diese x zusammenfassend schreiben: Durch die Zuordnung x ↦ f´(x) für alle x ∈ [a, b] wird auf [a, b] die Funktion f´ definiert: die Ableitungsfunktion von f. Das Berechnen der Ableitung einer Funktion f nennt man Differenzieren von f (vgl. Einführung in Maple, Übung Differenzieren von Funktionen und Funktionstermen). Dies alles ist recht anschaulich und nachvollziehbar, doch das Ganze hat einen ganz beträchtlichen Haken: Die hier benutzten Begriffe „um so genauer“, „strebt gegen“, „Grenzwert“ (und so weiter) sind alles andere als präzise und ohne Weiteres im mathematischen Sinn nicht definiert. Die Schlüsselbegriffe für das mathematische Verständnis der Grundlagen dieser Dinge heißen Betrag und Folge. Die Menge der reellen Zahlen
ist mit der auf dieser Menge definierten Relation „≤“
linear geordnet.
x ≤ y und
y ≤ z Im Falle dass x ≤ y und x ǂ y schreibt man x < y. Dadurch dass die reellen Zahlen linear geordnet sind, gilt für ℝ die so genannte Trichotomieeigenschaft, das heißt: für zwei reelle Zahlen x und y gilt genau eine der drei Beziehungen x < y, x = y, x > y. Beweis:
Es ist noch zu zeigen, dass nur höchstens eine der drei Beziehungen
gelten kann.
Sei nun x < y, das heißt x ≤ y und x ǂ
y. Aufgrund der Trichotomieeigenschaft der reellen Zahlen ist die folgende Definition sinnvoll: Für alle x ∈ ℝ ist der Absolutbetrag von x (kurz: Betrag von x) erklärt durch
Eine reelle Zahl x mit x > 0 heißt positiv. Ist x < 0, heißt x negativ. Einige der für ℝ im Kapitel Zahlenmengen bewiesenen Gesetze und Rechenregeln sollen zur besseren Übersicht hier zusammenfassend hingeschrieben werden: Eigenschaften der rellen Zahlen (I)+ x + (y + z) = (x + y) + z für
alle x, y, z ∈ ℝ. (Assoziativität bezüglich „+“)
(II)+ Es existiert 0 ∈ ℝ mit 0 + x = x für alle x ∈ ℝ. (Existenz eines neutralen Elementes bezüglich „+“) (III)+ Zu jedem x ∈ ℝ gibt es ein x* ∈ ℝ mit x* + x = 0. (x* heißt Inverses zu x bezüglich „+“.) (IV)+ x + y = y + x für alle x, y ∈ ℝ. (Kommutativität bezüglich „+“) (I)* x·(y·z) = (x·y)·z für alle
x, y, z ∈ ℝ. (Assoziativität
bezüglich „·“)
(II)* Es existiert 1 ∈ ℝ mit 1·x = x für alle x ∈ ℝ. (Existenz eines neutralen Elementes bezüglich „+“) (III)* Zu jedem x ∈ ℝ \ {0} gibt es ein x* ∈ ℝ mit x*·x = 1. (x* heißt Inverses zu x bezüglich „·“.) (IV)* x·y = y·x für alle x, y ∈ ℝ. (Kommutativität bezüglich „·“) x·(y + z) = (x·y) + (x·z) für alle x, y, z
∈ ℝ.
Die Eigenschaften G+, G·, D und N machen ℝ zu einem Körper. (T) x ≤ y und y ≤ z
⇒ x ≤ z für alle x, y, z ∈ ℝ (Transitivität bezüglich „≤“).(I) x ≤ y und y ≤ x ⇒ x = y
für alle x, y ∈ ℝ (Identitivität bezüglich „≤“).(R) x ≤ x für alle x ∈ ℝ (Reflexivität bezüglich „≤“). (O) x, y ∈ ℝ ⇒
x ≤ y oder y ≤ x Für alle x, y ∈ ℝ gilt genau eine der drei Beziehungen: x < y, x = y, x > y (Trichotomieeigenschaft von ℝ). (M1) |y − x| = 0 ⇔
y = x für alle x, y
∈ ℝ.
(M2) |y − x| = |x − y| für alle x, y ∈ ℝ. (M3) |y − x| ≤ |y − z| + |z − x| für alle x, y, z ∈ ℝ (Dreiecksungleichung). |y − x| heißt Abstand zwischen x und y. Es gelten für alle x, y, x*, y*, z ∈ ℝ folgende Regeln:
Beweis der ersten Aussage: Die zweite Aussage folgt auf analoge Art. Beweis der dritten Aussage: Beweis der vierten Aussage:
Eine reelle Zahl x ist genau dann positiv, wenn (−x) negativ ist. |x| ≥ 0 Beweis: zu zeigen: (−x) < 0 zu zeigen: |x| ≥ 0.
Üblicherweise schreibt man für das Negative einer reellen Zahl statt (−x)
nur −x. |x| ≤ ε ⇔ −ε ≤ x ≤ ε Beweis: Aus dem vorstehenden Satz folgt auch |x| < ε ⇔ −ε < x < ε Außerdem gilt für alle x, y ∈ ℝ
|xy| = |x|·|y| Beweis der ersten Aussage: Beweis der zweiten Aussage: Eine Funktion f: ℕ → ℝ nennt man eine Zahlenfolge. Das n-te Folgenglied einer solchen Zahlenfolge wird mit "xn", die gesamte Folge mit "(xn)" oder genauer mit "(xn)n=0..∞" bezeichnet. Eine Folge reeller Zahlen (xn) heißt Cauchyfolge, falls Folgendes gilt: |xm − xn)| < ε für alle m, n ≥ N Eine Folge reeller Zahlen (xn) heißt konvergent, falls es eine Zahl x ∈ ℝ gibt, so dass (xn − x) eine Nullfolge ist, das heißt: zu jeder positiven Zahl ε ∈ ℝ gibt es ein N ∈ ℕ, so dass |xn − x)| < ε für alle n ≥ N. x heißt Grenzwert der Folge (xn) und man schreibt abkürzend xn → x (n → ∞). Der Grenzwert einer konvergenten Zahlenfolge ist stets eindeutig bestimmt. Beweis: Das Cauchy'sche Konvergenzkriterium besagt, dass eine reelle Zahlenfolge (xn)
genau dann konvergent ist, wenn sie eine Cauchyfolge ist (→ Beweis). Damit wird die Menge der reellen Zahlen zu einem vollständigen metrischen
Raum. Ein metrischer Raum (M, d) heißt vollständig, wenn es zu jeder Cauchyfolge (xn) in M ein x ∈ M gibt, so dass (xn) gegen x konvergiert. Sehr wichtig sind die sogenannten Grenzwertsätze für Folgen: Seien (xn) und (yn) zwei konvergente Zahlenfolgen mit xn
→ x und yn
→ y (n
→ ∞). (xn + yn)
→ x + y (n
→ ∞) Falls xn ǂ 0 für alle n ∈ ℕ und x ǂ 0, so ist auch die Folge (1/xn) konvergent und es gilt (1/xn) → 1/x (n → ∞). Beweis der ersten Aussage: Beweis der dritten Aussage: Jede beschränkte unendliche reelle Zahlenfolge enthält
mindestens eine konvergente Teilfolge. Der Begriff der Konvergenz einer Folge wird möglicherweise etwas anschaulicher mithilfe der Begriffe Umgebung und Häufungswert. Sei ε eine positive reelle Zahl und x0 ∈ ℝ. Dann heißt die Menge Uε(x0) = {x ∈ ℝ: |x − x0| < ε} ε-Umgebung von x0. Eine Menge U ⊂ ℝ heißt Umgebung von
x0
∈ ℝ, wenn U eine ε-Umgebung von x0 enthält. p ∈ ℝ heißt Häufungswert der Menge M ⊂ ℝ, wenn in jeder Umgebung U(p) unendlich viele Elemente von M liegen. p ∈ ℝ heißt Häufungswert der Zahlenfolge (xn), wenn in jeder Umgebung von p unendlich viele Folgenglieder dieser Folge liegen. Eine Zahlenfolge (xn) ist also genau dann konvergent, wenn sie beschränkt ist und genau einen Häufungswert hat. Dieser Häufungswert ist dann notwendigerweise der Grenzwert dieser Folge. Die Zahlenfolge (xn) konvergiert genau dann gegen x, wenn in jeder Umgebung von x fast alle Glieder der Folge liegen, das heißt: alle Folgenglieder mit höchstens endlich vielen Ausnahmen. Beweis: "⇐": x
∈ ℝ habe die Eigenschaft, dass in jeder Umgebung U(x) fast alle
Folgenglieder der Folge (xn) liegen. Nach Voraussetzung ist x ein Häufungswert von (xn). Die Folge (xn) ist somit beschränkt und hat nur einen einzigen
Häufungswert, Aus diesem Konvergenzkriterium folgt insbesondere, dass jede Teilfolge einer gegen x konvergenten Zahlenfolge (xn) ebenfalls konvergent ist und gegen x strebt.
Sei M ⊂ ℝ und x0 ein Häufungswert
von M. |x − x0| < δ ⇒ |f(x) − a| < ε In diesem Fall schreibt man f(x) → a (x → x0) und sagt: „f(x) konvergiert gegen a für x gegen x0“. Sei M ⊂ ℝ und x0 ein Häufungswert
von M, a
∈ ℝ und f eine auf M definierte reellwertige Funktion. Beweis: "⇐": Es gelte nun f(xn) → a
(n → ∞) für
jede Folge (xn), die gegen x0 konvergiert. Sei M ⊂ ℝ, x0
∈ ℝ und f eine auf M definierte reellwertige Funktion. |x − x0| < δ ⇒ |f(x) − f(x0)| < ε f heißt stetig auf M, wenn für alle x ∈ M f stetig in x ist. Sei M ⊂ ℝ, x0 ein Häufungswert von
M und f eine auf M definierte reellwertige Funktion. Aus dem eben bewiesenen Satz folgt das
sogenannte Folgenkriterium: Eine Menge M ⊂ ℝ heißt zulässig, wenn jedes Element x ∈ M Häufungspunkt von M ist. Sei nun f eine auf einer zulässigen Menge M definierte
reellwertige Funktion und x0
∈ M.
f heißt differenzierbar auf M, wenn für alle x ∈ M f differenzierbar in x ist. Die Funktion Δ ist durch die Bedingungen (D1) und (D2) eindeutig bestimmt. Beweis: Der Funktionswert Δ(x0) heißt Ableitung
(oder Differentialquotient) von f in x0 Vor allem in der Physik ist auch die Bezeichnung
üblich. Ist eine Funktion f auf ganz M differenzierbar, dann heißt die auf M definierte Funktion f´, die jedem x ∈ M die Ableitung von f in x zuordnet, Ableitungsfunktion von f auf M (oder kurz: Ableitung von f). Eine Funktion Δ, die nur die Eigenschaft (D2) hat, lässt sich immer finden. Das heißt, dass im Hinblick auf die Differenzierbarkeit einer Funktion f in x0 die Stetigkeit von Δ in x0 die wesentliche Forderung ist! So wie die Stetigkeit ist auch die Differenzierbarkeit von f eine lokale Eigenschaft. Stimmen zwei Funktionen f1 und f2 in einer Umgebung von x0 überein, so ist entweder keine der beiden in x0 differenzierbar oder aber beide sind dort differenzierbar und es gilt f1´(x0) = f2´(x0). Falls eine Funktion Δ mit den Eigenschaften (D1) und (D2) existiert, so konvergiert der Differenzenquotient Δ(x) = (f(x) − f(x0))/(x − x0) mit x ǂ x0 aufgrund des Folgenkriteriums gegen f´(x0), wenn x gegen x0 strebt. Als Formel geschrieben:
Das ist die Formel, die oben bereits auf anschauliche Art vorgestellt wurde. Sei M ⊂ ℝ zulässig und f eine auf M
definierte Funktion. Beweis: Die Aussage des Satzes ist bewiesen, wenn sowohl das Produkt als auch die Summe zweier stetiger Funktionen wieder stetig ist. Dies folgt aber unmittelbar aus dem Folgenkriterium zusammen mit den Grenzwertsätzen für Folgen. Demzufolge kann eine in x0 nicht stetige Funktion dort auch nicht differenzierbar sein. Eine differenzierbare Funktion f kann oft (aber nicht immer!) mehrmals differenziert werden. Man schreibt dann f(0) = f, f(1) =f´, f(2) = f´´, ... , f(n) = f(n-1)´ für n ≥ 1 Sei M ⊂ ℝ zulässig, x0
∈ M, k
∈ ℝ sowie f und g zwei auf M definierte Funktionen. (f + g)´(x0) = f´(x0)
+ g´(x0) Ist f(x0) ǂ 0, dann ist auch 1/f in x0 differenzierbar und es gilt (1/f)´(x0) = − f´(x0)/f(x0)2 Ist g(x0) ǂ 0, dann ist auch f/g in x0 differenzierbar und es gilt (f/g)´(x0) = (f´(x0)·g(x0) − f(x0)·g´(x0))/g(x0)2 Beweis: Damit hat man (f + g)(x) = f(x) + g(x) = (f + g)(x0)
+ (x − x0)·(Δf + Δg)(x); Mit Δf ist auch k·Δf in x0
stetig und es gilt (k·f)(x) = (k·f)(x0) + (x − x0)·(k·Δf)(x) für alle x ∈ M, (f·g)(x) Wenn f(x0) ǂ 0, dann gibt
es auf Grund der Stetigkeit von f in x0 ein ε > 0, Wegen f/g = f · 1/g folgt die Quotientenregel unmittelbar aus dem Vorhergehenden. Seien M und N zulässige Mengen. f sei eine auf M und g eine
auf N definierte Funktion. (g◦f)(x) =def g(f(x)) für alle x ∈ M. Seien f: M → ℝ und g: N →
ℝ miteinander verkettete Funktionen mit f(M) ⊂
N. (g◦f)´(x0) = g´(f(x0))·f´(x0) Beweis: Hieraus folgt Die auf M durch Δ(x) = Δf(x)·Δg(f(x))
definierte Funktion Δ ist stetig in x0. Sei f: ℝ → ℝ eine Potenzfunktion, das heißt, f(x) = a·xn für x ∈ ℝ mit a ∈ ℝ und n ∈ ℕ*. Dann gilt f´(x) = a·n·x(n−1) für x ∈ ℝ. Beweis (mit vollständiger Induktion): Wegen der Summenregel folgt unmittelbar die Ableitung einer ganzrationalen Funktion: (an·xn + an-1·xn-1 + ... + a1·x + a0)´ = an·n·xn-1 + an-1·(n-1)·xn-2 + ... + a1 Die folgende Tabelle gibt einen Überblick über die Ableitungen einiger wichtiger Funktionen.
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|