Archiv pro štítek: derivace

Polarizace a spin částice (2. část)

Vítám vás u pokračování tématu o polarizaci a spinu částic. V prvním díle jsme zlehka naznačili matematický aparát a obecné principy, v tomto článku jich dále budeme využívat, proto pokud budete potřebovat, velmi doporučuji otevřít si první článek a v případě matematických nejasností zde se na něho odkazovat, mělo by tam být vysvětleno vše důležité.

Co je to spin?

Bohužel, u fyziky malých částic, jak jsme řekli dříve, poměrně slušně selhávají makroskopické představy o principech, stejně tak i jakákoliv snaha vysvětlit, k čemu spin částice připodobnit. Velmi blízce by se dal spin připodobnit jako moment hybnosti částice, ale ne v tom významu, že s ním můžeme zacházet libovolně jak chceme, ve své podstatě se jedná o experimentálně ověřenou hodnotu, která byla “tak nějak” potřeba přidat do co nejcelkovějšího modelu chování částic.[1]Pro další informace rozhodně doporučuji tento popis experimentu: ElektronovySpin.pdf. Říká nám zjednoduše, kolikrát musíme danou částici otočit, aby se nám jevila opět stejně. Pokud máme spin 1, poté musíme částici otočit o celých 360 stupňů, pokud 2, stačí 180 stupňů. Spin dané částice je (jeho velikost) přesně dána a nelze tuto hodnotu změnit. Navíc tyto hodnoty mohou nabývat pouze celočíselných a nebo polovičních násobků \(\hbar\)[2]Redukované planckovy konstanty, tedy \(\hbar=\frac{h}{2\pi}\)., tedy spiny můžeme mít \(\left(1,\frac{1}{2},-\frac{1}{2},-1,\frac{3}{2},\ldots\right)\) a tak podobně.

Směr spinu částice (nikoliv jeho hodnotu) můžeme měnit např. magnetickým polem, kterým částice prochází. Budeme-li se pohybovat v běžných třech osách pohybu (pravolevá, hornodolní a předozadní), můžeme jednoduše spin označit jako horní, dolní, pravý, levý atd. Pro tato označování je zaběhnuté používání písmenek z anglických slov toto popisující, toho se budeme držet i zde — tedy u jako upd jako down atd. Pokud si nyní představíme spin jako rotaci, tato rotace bude mít nějakou osu[3]Opět — osu bude mít pouze v makroskopickém světě, v případě spinu hovořit o ose rotace je chybné.. Stačí nám tedy pro popis spinu jako takového pouze znázornění směru této osy, a to je právě výše zmíněné u nebo d.

Tak nějak asi tušíme, že se spinem to bude velmi podobné jako s polarizací částice. Budeme-li mít např. nějaký experiment, který nám říká, jestli měřená částice má spin u nebo d, pokud do tohoto experimentu pošleme u částici, řekne nám, že máme spin u a naopak. Stejně jako u polarizace, pokud pošleme do experimentu částici, která má spin natočený pod nějakým úhlem, dosáhneme určitého poměru ud v tomto experimentu (při větším počtu částic, třeba 100 částic, tedy získáme třeba 60 % částic s u a 40 % s d.)

Bra-ketovým zápisem (pro oživení doporučuji 1. díl seriálu) tedy můžeme daný spin částice zapsat jako:

$$|p_s\rangle=\alpha|\mathrm{u}\rangle+\beta|\mathrm{d}\rangle$$

Tedy že daný spin \(p_s\) bude součtem amplitud pravděpodobností pro ud. Abychom z amplitudy pravděpodobnosti dostali přímo pravděpodobnost, musíme “umocnit na druhou” — jenže pozor, toto platí pouze pro \(\mathbb{R}\). Pro \(\mathbb{C}\) budeme muset použít součin dvou komplexně konjugovaných čísel, tedy \(\alpha\alpha^*\)[4]Komplexně konjugované číslo, pro zopakování, je číslo, které má stejnou reálnou část, ale opačnou imaginární. Sami vidíme, že u reálných čísel se jedná opravdu o “umocnění na druhou”. Samozřejmě rovnou vidíme, že pravděpodobnosti budou muset být:

$$\alpha\alpha^*+\beta\beta^*=1$$

Také rovnou vidíme následující možnosti[5]vše vztaženo k experimentu, kdy měříme “je to u?:

$$
p_{u}=1|\mathrm{u}\rangle+0|\mathrm{d}\rangle\\
p_{d}=0|\mathrm{u}\rangle+1|\mathrm{d}\rangle\\
p_{r}=\frac{1}{\sqrt{2}}|\mathrm{u}\rangle+\frac{1}{\sqrt{2}}|\mathrm{d}\rangle
$$

Co však značí přímo \(\mathrm{u}\) a \(\mathrm{d}\)? Jedná se o dva ortonormální vektory[6]Velmi podobné ortogonálním, jen mají jednotkovou velikost. Ortogonální vektory nám říkají, že pokud je jeden “něčím”, pak ten druhý je vším jen ne “něčím”, tedy např. pokud jeden vektor popisuje stav u, poté ortogonální popisuje stav přesně ne-u, tedy d 🙂 (Ano, tyto  vektory jsou tedy lineárně nezávislé a tvoří bázi prostoru, ale lineární algebru nechme na jindy.) , velmi podobně jako v případě polarizace. Musíme se ještě podívat na jeden “zvláštní typ” polarizace, tedy kruhovou polarizaci.

Kruhová polarizace

Jak asi víme, světlo je označováno jako elektromagnetické vlnění, což značí přesně to, co to je — obsahuje jak “elektrickou” tak “magnetickou” část. Představíme-li si světelný paprsek, který putuje prostorem nějakým přímým směrem:

Světelný paprsek
Světelný paprsek

Tento světelný paprsek je tvořen dvěma kolmými vlněními — elektrickým a magnetickým. Ty se mohou vyskytovat pouze jako “kolmé” veličiny na směr šíření paprsku, budou se tedy pohybovat v rovině:

Elektromagnateické vlnění se může rozkmitat pouze v této rovině, která je kolmá na směr šíření vlny.
Elektromagnetické vlnění se může rozkmitat pouze v této rovině, která je kolmá na směr šíření vlny.

Vlnění se tedy může rozkmitávat pouze po této plošce. Vlnění elektrické a magnetické je na sebe vzájemně kolmé, tedy:

Kruhova polarizace -- vlnění E & B
Kruhova polarizace — vlnění E & B

Nutno podotknouti, že obrázek je velmi silně mimo proporce, elektrická část vlnění je totiž mnohem silnější než magnetická, ale teď nám jde spíše o zobrazení principu než o správné proporce grafu 🙂

Nicméně k výpočtům samotným. Pokud budeme předpokládat, že \(E\) a \(B\) jsou kolmé a jsou to klasické vlny (sinusovky), označíme-li souřadné osy takto:

Označení os
Označení os

Tedy že vlna se pohybuje po ose \(z\), poté můžeme psát pro intenzity:

$$
E_x=E_{E_{max}}\sin(k\mathbb{\mathrm{z}}+\omega t)\\
E_y=E_{B_{max}}\cos(k\mathbb{\mathrm{z}}+\omega t)
$$

Budeme-li naší rovinou posouvat po ose \(z\), uvidíme, že se nám budou prakticky střídat dvě základní polarizace — tam, kde bude hodnota \(E_E\) maximální, tam bude hodnota \(E_B\) minimální a naopak. Budou se prakticky neustále dohánět, bude to právě vypadat, jako kdyby se vektor polarizace neustále otáčel; proto kruhová polarizace.

Zkusme se nyní podívat na bra-ketový zápis takového jevu a jak vůbec na to. Budeme předpokládat, že pro naši polarizaci bude platit něco jako (předpokládejme, že \(p_{kr}\) bude znamenat “Polarizace kruhová doprava”, tedy ve směru hodinových ručiček, ale pro začátek je to vlastně jedno):

$$|p_{kr}>=\alpha|\mathrm{x}\rangle+\beta|\mathrm{y}\rangle$$

Což by značilo, že musí existovat taková pravděpodobnost, kdy \(\alpha^2+\beta^2=1\). V čem je tady problém? Vidíme, že obě čísla budou kladná, pokud je zvolíme z \(\mathbb{R}\)[7]Protože 2. mocnina čehokoliv z $latex\mathbb{R}$ bude kladné číslo.. Proto musíme začít pokukovat po oblasti $latex\mathbb{C}$, tedy komplexních číslech. Pokud bychom zvolili:

$$1|x\rangle+i|y\rangle$$

Mohli bychom namítat, že to přece nefunguje, protože \(1^2+i^2=1-1=0\neq1\). Jenže! V prvním článku jsme si řekli, že abychom se dostali z pravděpodobnostních amplitud do přímé pravděpodobnosti, musíme nikoliv pouze umocnit, ale vynásobit komplexně konjugovaným číslem, tedy výpočet bude:

$$\alpha\alpha^*+\beta\beta^*=1$$

A to už fungovat bude:

$$1\cdot 1^*+i\cdot i^*=1\cdot 1 + i\cdot (-i) = 2$$

To sice taktéž není \(0\), ale už se blížíme k cíli, musíme pouze nanormovat jednotlivé operandy, stejně jako jsme dělali v prvním článku:

$$
\frac{1}{\sqrt{2}}\frac{1^*}{\sqrt{2}}+\frac{i}{\sqrt{2}}\frac{i^*}{\sqrt{2}}=
\frac{1}{2}+\frac{1}{2}=1
$$

Vektor kruhové polarizace vpravo \(p_{kr+}\) a vlevo \(p_{kr-}\) tedy můžeme napsat jako:

$$
|p_{kr+}\rangle=\begin{pmatrix}\frac{1}{\sqrt{2}}\\\frac{i}{\sqrt{2}}\end{pmatrix}\\
|p_{kr-}\rangle=\begin{pmatrix}\frac{1}{\sqrt{2}}\\\frac{-i}{\sqrt{2}}\end{pmatrix}
$$

Zkusme nyní klasický pokus s částicí s jednou a filtrem s druhou polarizací a ověřme, jestli pro danou polarizaci platí předpokladané, tedy že částice neprojde. Připravme čáscici s polarizací v protisměru hodinových ručiček a přožeňme ji filtrem, který propouští pouze částice s polarizací ve směru hod. ručiček. Uvědomme si taktéž, že původní předpis pro řešení spočívá v použití prvního vektoru v konjugované formě!:

$$
\langle{}p_{kr-}|p_{kr+}\rangle=
\begin{pmatrix}\frac{1}{\sqrt{2}} & \frac{i}{\sqrt{2}}\end{pmatrix}
\begin{pmatrix}\frac{1}{\sqrt{2}}\\\frac{i}{\sqrt{2}}\end{pmatrix}=
\frac{1}{\sqrt{2}}\frac{1}{\sqrt{2}}+\frac{i}{\sqrt{2}}\frac{i}{\sqrt{2}}=
\frac{1}{2}+\frac{-1}{2}=0
$$

Stejně tak, pokud použijeme přesně inverzní zadání, tedy:

$$
\langle{}p_{kr+}|p_{kr-}\rangle=
\begin{pmatrix}\frac{1}{\sqrt{2}} & \frac{-i}{\sqrt{2}}\end{pmatrix}
\begin{pmatrix}\frac{1}{\sqrt{2}}\\\frac{-i}{\sqrt{2}}\end{pmatrix}=
\frac{1}{\sqrt{2}}\frac{1}{\sqrt{2}}+\frac{-i}{\sqrt{2}}\frac{-i}{\sqrt{2}}=
\frac{1}{2}+\frac{(-i)^2}{2}=\frac{1}{2}-\frac{1}{2}=0
$$

Zkusme nyní ještě pokus s kruhově polarizovaným světlem a polarizačním filtrem pod nějakým obecným úhlem \(\phi\):

$$
\langle{}\phi|p_{kr+}\rangle=
\begin{pmatrix}\cos\left(\phi\right) & \sin\left(\phi\right)\end{pmatrix}
\begin{pmatrix}\frac{1}{\sqrt{2}} \\ \frac{i}{\sqrt{2}}\end{pmatrix}=
\cos(\phi)\frac{1}{\sqrt{2}}+\sin(\phi)\frac{i}{\sqrt{2}}
$$

Abychom z tuté pravděpodobnostní amplitudy dostali pravděpodobnost, musíme samozřejmě:

$$
\left(\langle{}\phi|p_{kr+}\rangle\right)^2=
\left(\frac{1}{\sqrt{2}}\cos(\phi)+\frac{i}{\sqrt{2}}\sin(\phi)\right)^2=\\=
\left(\frac{1}{\sqrt{2}}\cos(\phi)+\frac{i}{\sqrt{2}}\sin(\phi)\right)\left(\frac{1}{\sqrt{2}}\cos(\phi)+\frac{-i}{\sqrt{2}}\sin(\phi)\right)=\\=
\left(\frac{1}{2}\cos^2(\phi)-\frac{i^2}{2}\sin^2(\phi)\right)=
\left(\frac{1}{2}\cos^2(\phi)+\frac{1}{2}\sin^2(\phi)\right)=
\frac{1}{2}\left(\cos^2(\phi)+\sin^2(\phi)\right)=\frac{1}{2}
$$

Využijme ještě testu s hermitovským operátorem, který můžeme definovat takto[8]Viz https://www.eng.tau.ac.il/~shtaif/PolarizationClass.pdf.[9]Co to je, jsme řešili v minulém článku.:

$$
\begin{pmatrix}
0 & -i \\
i & 0
\end{pmatrix}
$$

A tedy jestli vyhovuje výrazu:

$$
\begin{pmatrix}
0 & -i \\
i & 0
\end{pmatrix}
\begin{pmatrix}
\frac{1}{\sqrt{2}} \\
\frac{i}{\sqrt{2}}
\end{pmatrix}
=
\lambda
\begin{pmatrix}
\frac{1}{\sqrt{2}} \\
\frac{i}{\sqrt{2}}
\end{pmatrix}
$$

Roznásobíme-li tedy:

$$
\begin{pmatrix}
0 & -i \\
i & 0
\end{pmatrix}
\begin{pmatrix}
\frac{1}{\sqrt{2}} \\
\frac{i}{\sqrt{2}}
\end{pmatrix}
=
\begin{pmatrix}
0\frac{1}{\sqrt{2}} – i\frac{i}{\sqrt{2}} \\
i\frac{1}{\sqrt{2}}+0\frac{i}{\sqrt{2}}
\end{pmatrix}
=
\begin{pmatrix}
\frac{1}{\sqrt{2}} \\
\frac{i}{\sqrt{2}}
\end{pmatrix}
$$

A tedy vidíme, že vlastní vektor odpovídá měřenému a předpokládanému, a tedy \(\lambda=1\).

Třípolarizátorový paradox

Tento paradox[10]Viz http://www.informationphilosopher.com/solutions/experiments/dirac_3-polarizers/[11]Viz http://alienryderflex.com/polarizer/[12]Viz polarize.pdf ukazuje zajímavou věc, která vypadá dost nemyslitelně; vezmeme-li dva polarizátory[13]Polarizační filtry…, které nastavíme kolmo na sebe (jejich roviny polarizace), ukazáali jsme si, že pravděpodobnost průchodu částice je \(0\). Nicméně, zařadíme-li mezi dva takové filtry třetí polarizátor pod nějakým úhlem, např. 45°, bude pravděpodobnost průchodu částice \(P: \left(0;1\right)\). Jak je toto možné? Využijme již známého matematického aparátu.

Víme už, že pravděpodobnost průchodu fotonem polarizačním filtrem o obecném úhlu \(\phi\) je \(p_{45}=\cos^2(\phi)=\cos^2(45)=\frac{1}{2}\). Připravíme-li proto polarizovaný proud částic, který pošleme 1. polarizátorem se stejným úhlem polarizace, tento nám daný paprsek nezmění (v rámci intenzity) a bude neustále \(100\%\) pravděpodobnost, že paprsek projde. Po 2. polarizátoru bude pravděpodobnost poloviční, tedy \(\frac{1}{2}\). No a po třetím, který je opět o oněch 45° otočen, bude pravděpodobnost:

$$
p_{II}=p_{45}\cos^2(45)=\frac{1}{2}\cdot\frac{1}{2}=\frac{1}{4}=25\ \%
$$

Pravděpodobnost průchodu takové částice je tedy \(45\ \%\). Ale pozor! Jde o světlo, které už máme polarizované, pokud do prvního polarizátoru pošleme nějaké obecné nepolarizované světlo, uvidíme, že už po prvním filtru budeme mít mnohem menší pravděpodobnost průchodu částice, konkrétně \(\frac{1}{2}\), pokud tedy bychom měřili nějakou intenzitu mezi vstupujícím světlem a výstupním světlem, dostaneme se ještě na polovinu z oněch \(25\ \%\), tedy na \(12,5\ \%\).

Samozřejmě bychom mohli dopočítat přes vlastní vektor, ale když jsme si už ukázali výstupy z této metody, můžeme jen vhodně zkombinovat výstupy, nicméně však by to vyšlo naprosto stejně 🙂

Definice matic pro výpočet

Stejně jako u polarizace, i zde můžeme využít hermitovských operátorů a dosazovat do rovnice. Polarizace a spin se budou chovat prakticky totožně[14]Až na pár velmi podstatných rozdílů, které si samozřejmě záhy ukážeme. (matematicky), budeme-li detekovat částice s nějakým spinem a do tohoto detektoru budeme posílat částice se spinem jiným či “pod nějakým úhlem”, výsledné výpočty budou téměř stejné[15]Tedy proporčně budou jako \(\cos^2(\phi)\), nicméně lehko odlišné..

Matice, které ve výpočtu používáme se jmenují Pauliho matice[16]Podle fyzika Pauliho, který za svůj vylučovací princip dostal Nobelovu cenu za fyziku. a mají tvar[17]Viz http://planetmath.org/PauliMatrices pro směry up/downright/leftin/out jako:

$$
\mathrm{\hat{H}}_{u/d}=\sigma_z=
\begin{pmatrix}
1  & 0\\
0 & -1\\
\end{pmatrix}\\
\mathrm{\hat{H}}_{r/l}=\sigma_x=
\begin{pmatrix}
0 & 1\\
1 & 0\\
\end{pmatrix}\\
\mathrm{\hat{H}}_{i/o}=\sigma_y=
\begin{pmatrix}
0 & -i\\
i & 0\\
\end{pmatrix}
$$

Vidíte, že jsem označil jednotlivé matice jako \(\sigma_z\) a podobně — jednoduše matice, která má osu \(z\) je označená jako \(\sigma_z\) atd. 🙂 První matice, up/down tedy má osu \(z\) a proto je označená \(\sigma_z\). Podívejme se však na tutu matici trošku podrobněji. Proč jsou zvolené zrovna tyto hodnoty?

Víme, že (chceme, aby…) bude platit:

$$
\begin{pmatrix}
a & b \\
c & d
\end{pmatrix}
\begin{pmatrix}
1 \\ 0
\end{pmatrix}
=
1
\begin{pmatrix}
1\\0
\end{pmatrix}
$$

Z toho můžeme velmi snadno určit neznámou matici (byť to na první pohled nevypadá). Napišme si, co víme, že bude platit za vztahy podle toho, jak bychom matici roznásobovali. První vztah tedy bude:

$$a \cdot 1 + b \cdot 0 = 1 $$

Z toho je naprosto jasně vidět, že ať bude \(b\) cokoliv, \(a\) musí být \(1\), aby byl součet čehokoliv a nuly jednička. Tedy vidíme, že \(a=1\). Pro druhý řádek máme:

$$ c \cdot 1 + b \cdot 0 = 0$$

Tedy vidíme, že \(c=0\). Nojo, ale co teď? 🙂 Pořád nám chybí dva výrazy, tak si pomůžeme tím, že známe dva vlastní vektory pro ud spin, použijeme prostě jen “ten druhý” vlastní vektor (jestli jste první použili ten či onen je jedno, samozřejmě 🙂 ):

$$
\begin{pmatrix}
a & b \\
c & d
\end{pmatrix}
\begin{pmatrix}
0 \\ 1
\end{pmatrix}
=
-1
\begin{pmatrix}
0\\1
\end{pmatrix}
$$

A opět stejným způsobem:

$$ a \cdot 0 + b \cdot 1 = 0$$

Tedy vidíme, že \(b=0\). No a pro poslední možnost:

$$ c \cdot 0 + d \cdot 1 = -1$$

No a tady vidíme, že \(d=-1\). Celková matice je tedy:

$$
\sigma_z
=
\begin{pmatrix}
1 & 0 \\
0 & -1 \\
\end{pmatrix}
$$

A taková matice je Hermitovská (viz předchozí článek).  Stejným způsobem dokážeme odvodit i ostatní matice, samozřejmě tam vždy použijeme trošku jiný trik, ale v principu je to pořád to samé, vyřešit nějak chytře rovnici o 4 neznámých:

$$
\begin{pmatrix}
a & b \\ c & d
\end{pmatrix}
\begin{pmatrix}
\frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{2}}
\end{pmatrix}
=
1
\begin{pmatrix}
\frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{2}}
\end{pmatrix}
$$

$$
\begin{pmatrix}
a & b \\ c & d
\end{pmatrix}
\begin{pmatrix}
\frac{1}{\sqrt{2}} \\ -\frac{1}{\sqrt{2}}
\end{pmatrix}
=
-1
\begin{pmatrix}
\frac{1}{\sqrt{2}} \\ -\frac{1}{\sqrt{2}}
\end{pmatrix}
$$

Pro zjednodušení budu předpokládat, že rovnici s maticemi mohu vynásobit libovolným číslem na obou stranách a rovnost zůstane zachována (chci se prostě zbavit neustálého obludného psaní \(\frac{1}{\sqrt{2}}\)). Mohu tedy říci, že:

$$
\begin{matrix}
a \cdot 1 &+& b \cdot 1 &= &1 \\
c \cdot 1 &+& d \cdot 1 &= &1 \\
a \cdot 1 &-& b \cdot 1 &= &-1 \\
c \cdot 1 &-& d \cdot 1 &= &1
\end{matrix}
$$

Nyní jen jednoduše sečtěme rovnice spolu, hned první a třetí rovnici, vznikne nám \(a+a = 0\), tedy je jasně vidět, že \(a=0\). Poté sečtěme 2. a 4. rovnici, tedy uvidíme \(b+b = 2\), tedy \(b=1\). Když toto vidíme, ve 4. rovnici rovnou vidíme, že \(1-d=1\), tedy \(d = 0\). No a stejně pokud vidíme z 2. rovnice \(c=1\). Tedy matice bude:

$$
\sigma_x
=
\begin{pmatrix}
0 & 1 \\ 1 & 0
\end{pmatrix}
$$

Nakonec se podívejme na výpočet \(\sigma_y\). Víme, že musí platit následující vztahy:

$$
\begin{pmatrix}
a & b \\ c & d
\end{pmatrix}
\begin{pmatrix}
\frac{1}{\sqrt{2}} \\ \frac{i}{\sqrt{2}}
\end{pmatrix}
=
+1
\begin{pmatrix}
\frac{1}{\sqrt{2}} \\ \frac{i}{\sqrt{2}}
\end{pmatrix}
$$

$$
\begin{pmatrix}
a & b \\ c & d
\end{pmatrix}
\begin{pmatrix}
\frac{1}{\sqrt{2}} \\ -\frac{i}{\sqrt{2}}
\end{pmatrix}
=
-1
\begin{pmatrix}
\frac{1}{\sqrt{2}} \\ -\frac{i}{\sqrt{2}}
\end{pmatrix}
$$

Udělejme to stejné, co jsme dělali výše:

$$
\begin{matrix}
a  &+& b i &= &1 \\
c  &+& d i &= &i \\
a &-& b i &= &-1 \\
c &-& d i &= &1
\end{matrix}
$$

Pokud sečteme 1. a 2. rovnici, vidíme, že \(2a = 0\), tedy že \(a=0\). Pokud je \(a=0\), poté musí platit, že \(bi=1\), a tedy \(b=\frac{1}{i}=-i\). Nyní sečtěme 2. a 4. rovnici, vyjde, že \(2c=2i\), tedy \(c=i\). A samozřejmě tím pádem vidíme, že \(d=0\).

Spin obecně v obecném úhlu

Těchto matic můžeme využít při určení obecných pravidel, jak se chová spin, pokud “nevíme, co měříme”, ale prostě “to měříme”. Máme-li však nějakou částici (obecně) a nastavíme-li naše měřící zařízení “do obecného úhlu” vůči spinu této částice (protže netušíme, jak to může dopadnout). Označíme-li tedy obecně nějaký náš vektor \(\mathrm{\mathbb{\vec{u}}}\) jako vektor, poté můžeme psát složkově:

$$
\vec{u}=u_x + u_y + u_z
$$

A protože vektor bude (chceme, aby byl…) jednotkový, poté bude platit pythagoras:

$$
u^2_x+u^2_y+u^2_z=1
$$

Zpět ale k rovnici výše, kde jsem rozepsal pro jednotlivé souřadné osy. Asi vidíte, kam tím mířím a proč jsem tak udělal; vektory prostě lze klasicky lineárně sčítat, no a protože operátory už máme odvozené, můžeme jich rovnou využít v obecném zápisu:

$$
u_x\hat{\sigma_x}+u_y\hat{\sigma_y}+u_z\hat{\sigma_z}=\hat{\sigma_u}
$$

Tuto lineární superpozici snadno vyřešíme, obecně to vypadá takto:

$$
A\begin{pmatrix}a & b \\ c & d\end{pmatrix}+
B\begin{pmatrix}a & b \\ c & d\end{pmatrix}+
C\begin{pmatrix}a & b \\ c & d\end{pmatrix}
=
\begin{pmatrix}
Aa+Ba+Ca & Ab+Bb+Cb \\ Ac+Bc+Cc & Ad+Bd+Cd
\end{pmatrix}
$$

Takže:

$$
\hat\sigma_u =
u_x
\begin{pmatrix}
0 & 1 \\ 1 & 0
\end{pmatrix}
+
u_y
\begin{pmatrix}
0 & -i \\ i & 0
\end{pmatrix}
+
u_z
\begin{pmatrix}
1 & 0 \\ 0 & -1
\end{pmatrix}
=
\begin{pmatrix}
u_z & u_x-iu_y \\
u_x+iu_y & -u_z
\end{pmatrix}
$$

Rovnou z této matice (doufám!) vidíme, že je hermitovská. Proto můžeme \(\hat{\sigma_u}\) použít jako operátor ve známém:

$$
\hat{\sigma_u}\begin{pmatrix}\alpha\\\beta\end{pmatrix}=\lambda\begin{pmatrix}\alpha\\\beta\end{pmatrix}$$

A samozřejmě můžeme psát:

$$
\hat{\sigma_u}\begin{pmatrix}\alpha\\\beta\end{pmatrix}=+1\begin{pmatrix}\alpha\\\beta\end{pmatrix}$$

Nyní si budeme ještě muset lehce pohrát s normalizací vektoru \(\begin{pmatrix}\alpha\\\beta\end{pmatrix}\), protože jinak by nám opět vycházely divné hodtnoty pravděpodobností, typu 400 % a tak. Jak provést tedy normalizaci?

Abychom mohli takovou věc udělat obecně, musíme udělat opět takový malý trik. Není to nic nelegálního, ale hodně nám to zjednoduší práci. Pokud víme, že vlastní vektor bude vypadat tak, jak jsem psal v předchozí větě, stejně tak, pokud vím, že pokud chci, aby byl normalizovaný, bude jednotkový a tím pádem mohu předpokládat, že i nějaký jiný vektor, který místo něho použijeme (substitucí), bude-li jednotkový a bude mít stejné vlastnosti, bude použitelný stejně jako vektor původní. Tedy pokud prohlásíme, že:

$$
\begin{pmatrix}\alpha\\\beta\end{pmatrix}=\begin{pmatrix}1\\\alpha_0\end{pmatrix}
$$

a budeme-li dále pracovat s tímto vektorem, uvidíme, že si dost ulehčíme práci a zpětně se dostaneme tam, kde jsme začali, ale budeme mít vyřešenou normalizaci. Co je tedy tato hodnota \(\alpha_0\)? Pojďme se podívat, jak toto odvodit. Víme, že budeme-li předopkládat, že vektor \(\begin{pmatrix}1\\\alpha_0\end{pmatrix}\) bude normalizován, bude se chovat jako kterékoliv jiné vlastní vektory[18]to neznamená, že je to postačující podmínka takové funkce a bude platit:

$$
\begin{pmatrix}
u_z & u_x-iu_y \\
u_x + iu_y & -u_z
\end{pmatrix}
\begin{pmatrix}
1\\\alpha_0
\end{pmatrix}
=
+1
\begin{pmatrix}
1\\\alpha_0
\end{pmatrix}
$$

Zkusme vytvořit první rovnici:

$$
u_z + \alpha_0(u_x-iu_y) =1
$$

Z toho jasně dokážeme vyjádřit \({}\alpha_0{}\): 🙂

$$
\alpha_0(u_x-iu_y)=1-u_z
\alpha_0=\frac{1-u_z}{u_x-iu_y}
$$

A můžeme dosadit:

$$
\begin{pmatrix}
1\\\alpha_0
\end{pmatrix}
=
\begin{pmatrix}
1\\\frac{1-u_z}{u_x-iu_y}
\end{pmatrix}
$$

Nicméně tento vektor tedy nejspíše pořád nebude (s největší pravděpodobností) normalizován. A s tím si musíme poradit. Musí tedy současně platit dva následující vtazhy:

$$
|\phi\rangle=
\begin{pmatrix}
1\\\alpha_0
\end{pmatrix}
\\
\phi\phi^*=1
$$

Musí tedy platit:

$$
\begin{pmatrix}
1 &\alpha_0
\end{pmatrix}
\begin{pmatrix}
1\\\alpha_0
\end{pmatrix}
=
1
$$

Budeme chvilku předpokládat, že stále “nejsme normalizováni”. Zvolme si za normalizační konstantu například \(\nu\). Potom bude platit, že normalizovaný vztah výše bude vypadat jako:

$$
|\phi\rangle=
\nu\begin{pmatrix}
1\\\alpha_0
\end{pmatrix}
$$

Můžeme tedy psát:

$$
\nu
\begin{pmatrix}
1 & \alpha_0
\end{pmatrix}
\nu
\begin{pmatrix}
1 \\ \alpha_0
\end{pmatrix}
=
1
$$

a to řešit jako

$$
\nu^2
\left(
1+\color{red}{\alpha_0^*}\color{green}{\alpha_0}
\right)
= 1
$$

To vyřešíme (dosadíme za \(\alpha_0\)):

$$
\nu^2
\left[
1+
\color{red}{
\left(
\frac{1-u_z}{u_x+iu_y}
\right)
}
\color{green}{
\left(
\frac{1-u_z}{u_x-iu_y}
\right)
}
\right]
=1
$$

A teď nastane opravdový “hustý trik” 🙂 Víme, nejprve roznásobíme (to trik ještě není):

$$
\nu^2
\left[
1+
\left(
\frac{\left(1-u_z\right)^2}{u_x^2+u_y^2}
\right)
\right]
=1
$$

A nyní nastane velký trik. Víme, že nahoře jsme pro připomenutí psali, že u jednotkového vektoru bude platit pythagorské:

$$
\color{pink}{u_x^2+u_y^2}+u_z^2=1
$$

Barevně máme označenou část, kterou však máme ve jmenovateli! Můžeme tedy místo jmenovatele psát:

$$
u_x^2+u_y^2=1-u_z^2
$$

A to nám (jak vidíte) hodně zjednoduší práci 🙂

$$
\nu^2
\left[
1+
\left(
\frac{\left(1-u_z\right)^2}{1-u_z^2}
\right)
\right]
=1
$$

Nyní můžeme rozložit jmenovatele a zkrátit:

$$
\nu^2
\left[
1+
\left(
\frac{\left(1-u_z\right)^2}{\left(1-u_z\right)\left(1+u_z\right)}
\right)
\right]
=1
$$

$$
\nu^2
\left[
1+
\frac{\left(1-u_z\right)}{\left(1+u_z\right)}
\right]
=1
$$

$$
\nu^2
\left[
\frac{\left(1+u_z\right)}{\left(1+u_z\right)}
+
\frac{\left(1-u_z\right)}{\left(1+u_z\right)}
\right]
=1
$$

$$
\nu^2
\left[
\frac{2}{\left(1+u_z\right)}
\right]
=1
$$

Z toho už snadno odvodíme \(\nu\) jako:

$$
\nu^2=
\frac{1+u_z}{2}
$$

a tedy:

$$
\nu = \sqrt{\frac{1+u_z}{2}}
$$

A tím máme normalizační faktor vyřešený. Jako zkoušku si klidně (můžete sami) dosaďte za \(u_x=1\) a ostatní prvky dejte nulové, vyjdou vám vlastní vektory, které už jsme používali. Pouze dosaďte do:

$$
|\phi\rangle=
\sqrt{\frac{1+u_z}{2}}
\begin{pmatrix}
1 \\
\frac{1-u_z}{u_x-iu_y}
\end{pmatrix}
$$

Uvidíte, že to bude vycházet 🙂

Tolik asi k normalizaci. Pokud bychom obecně připravili nějakou částici v obecném stavu a úhlu, měřili ji v jiném obecném úhlu, vyjde nám pravděpodobnost \(P=\cos^2\frac{\phi}{2}\) (využijeme při tom výpočtů, které už jsme si tady ukazovali, nic jiného). Tento článek už je poměrně dlouhý, proto ho zde nyní utněme (v nejlepším přestat, že 🙂 ) a příště se věnujme dalším věcem a zákonitostem, které s polarizacemi a spinem souvisejí.

 

Poznámky pod čarou   [ + ]

1. Pro další informace rozhodně doporučuji tento popis experimentu: ElektronovySpin.pdf.
2. Redukované planckovy konstanty, tedy \(\hbar=\frac{h}{2\pi}\).
3. Opět — osu bude mít pouze v makroskopickém světě, v případě spinu hovořit o ose rotace je chybné.
4. Komplexně konjugované číslo, pro zopakování, je číslo, které má stejnou reálnou část, ale opačnou imaginární. Sami vidíme, že u reálných čísel se jedná opravdu o “umocnění na druhou”.
5. vše vztaženo k experimentu, kdy měříme “je to u?
6. Velmi podobné ortogonálním, jen mají jednotkovou velikost. Ortogonální vektory nám říkají, že pokud je jeden “něčím”, pak ten druhý je vším jen ne “něčím”, tedy např. pokud jeden vektor popisuje stav u, poté ortogonální popisuje stav přesně ne-u, tedy d 🙂 (Ano, tyto  vektory jsou tedy lineárně nezávislé a tvoří bázi prostoru, ale lineární algebru nechme na jindy.)
7. Protože 2. mocnina čehokoliv z $latex\mathbb{R}$ bude kladné číslo.
8. Viz https://www.eng.tau.ac.il/~shtaif/PolarizationClass.pdf.
9. Co to je, jsme řešili v minulém článku.
10. Viz http://www.informationphilosopher.com/solutions/experiments/dirac_3-polarizers/
11. Viz http://alienryderflex.com/polarizer/
12. Viz polarize.pdf
13. Polarizační filtry…
14. Až na pár velmi podstatných rozdílů, které si samozřejmě záhy ukážeme.
15. Tedy proporčně budou jako \(\cos^2(\phi)\), nicméně lehko odlišné.
16. Podle fyzika Pauliho, který za svůj vylučovací princip dostal Nobelovu cenu za fyziku.
17. Viz http://planetmath.org/PauliMatrices
18. to neznamená, že je to postačující podmínka takové funkce

Limity

Naprosto zákaldní matematickou znalostí jsou limity — ať už pro pochopení derivací či integrací, tak často i pro pochopení některých průběhů funkcí.

Zápis limity

Limita má specifický matematický zápis, naprosto obecně vypadá např. takto:

$$ \lim_{x\to L} f(x) $$

Tento zápis nám doslova říká “vezměte \(x\) a nastavujte mu tak velkou hodnotu, aby se co nejblíže přiblížila k hodnotě \(L\) a sledujte při tom, co funkce závislá na \(x\) dělá.”

Několik příkladů k úplnému pochopení:

$$ \lim_{x\to 0} x = 0$$

To je snad jasné — pokud budu \(x\) přibližovat nule, potom se… \(x\) bude přibližovat nule 🙂 Přitvrdíme…

$$ \lim_{x\to 0} 15x = 0$$

Zde samozřejmě platí totéž, co výše — i kdybych to násobil libovolným reálným číslem, pořád budu mít výsledek nulový. Prostřednictvím limit však můžeme zapisovat i výrazy, které bychom jinak v matematice nazvali jako “chybné” či “nedávající smysl”. Nula zapsaná “s plusem” znamená, že se k dotyčné nule postupně přibližuji zprava, tedy z kladnější části číselné osy — proto plus. U druhého znaménka to platí přesně opačně.

$$ \lim_{x\to0^+} \frac{1}{x} = \infty $$

$$ \lim_{x\to0^-} \frac{1}{x} = -\infty $$

nevlastních limit[1]to jsou takové, které nemají “normální” výsledek můžeme takto tvrdit, že výsledek tzv. roste nade všechny meze. Podobně (přesně inverzně) to platí i u vlastních limit v nevlastním bodě:

$$ \lim_{x\to \infty} \frac{1}{x} = 0$$

Limitní aritmetika

Když teď už víme, jak fungují limity, můžeme se podívat na pár příkladů, které se v praxi často objevují. Začněme polynomem:

$$ \lim_{x\to \infty} \frac{2x^3 – 6x^2-145x + 17}{3x^3 – 2x^2 – 6} $$

Pokud bychom měli určovat třeba vlastnosti tohoto polynomu, budeme hledat kořeny rovnice v čitateli, kořeny rovnice ve jmenovateli, abychom omezili dělení nulou a podobně. Nicméně tady nás zajímá jediné — jak se bude daný výraz chovat, pokud \(x\) budeme zvětšovat až k nekonečnu.

Nyní však musíme udělat drobnou odbočku a ukázat si pár elementárních znalostí — např. jak se budou chovat různé poměry a zlomky limitně:

$$ \lim_{x\to \infty} \frac{1}{x} = 0$$

To už známe. Nicméně pokud zde bude takovýto poměr?

$$ \lim_{x\to \infty} \frac{x}{x} = ?$$

Víme, že dělit nulu nulou, stejně jako nekonečno nekonečněm (což je vlastně totéž, pokud mluvíme o limitách), je trošku nekošer, co se matematiky týče. Ale hleďte! Zde se řeší limity, zde nám věci, jako že bude mít polynom ve jmenovateli nulu, vlastně nevadí! Můžeme tedy dotyčný zlomek s klidným svědomím zkrátit a vyjde:

 $$ \lim_{x\to \infty} \frac{x}{x} = \lim_{x\to \infty} \frac{1}{1} = 1$$

Vyřadili jsme tím “ze hry” tedy jakékoliv \(x\) a výsledek na něm vůbec nezávisí. A co třeba následující?

$$ \lim_{x\to \infty} \frac{x^n}{x^n} $$

Můžeme prostě pokrátit stejně, jako v případě výše, výsledek je tedy opět jednička. Případně můžeme rozložit na :

$$ \lim_{x\to \infty} \frac{x^n}{x^n} = \lim_{x\to \infty} \frac{x}{x} \frac{x^{n-1}}{x^{n-1}} $$

a takto to řešit do nekonečna 😉 S stejně tak logicky odvodíme, že:

$$ \lim_{x\to \infty} \frac{nx}{mx}$$

bude rovno \(\frac{n}{m}\) — protože “cokoliv” krát jedna je “cokoliv” 😉

Zkusme nyní další případ:

$$ \lim_{x\to \infty} \frac{x^2}{x} = ?$$

V matematice (ono i ve fyzice, ale v matematice obzvlášť) platí, že pokud neznáte řešení komplexního problému, dekomponujte ho na řadu “menších” problémů, které nezávisle řešit umíte. Což můžeme udělat i zde. Výše uvedené tedy můžeme přepsat jako součin:

$$\lim_{x\to \infty} \frac{x^2}{x} = \lim_{x\to \infty} x \frac{x}{x}$$

Druhý zlomek už řešit umíme, to víme, že je \(1\), takže:

$$ \lim_{x\to \infty} \frac{x^2}{x} = \lim_{x\to \infty} x = \infty$$

Vidíme tedy, že pokud je v čitateli vyšší mocnina než ve jmenovateli, zlomek vystřelí do nekonečných výšin. A co pokud je to opačně? Samozřejmě už správně tušíte:

$$ \lim_{x\to \infty} \frac{x}{x^2} = \lim_{x\to \infty} \frac{1}{x} \cdot \frac{x}{x} = \lim_{x\to \infty} \frac{1}{x} = 0$$

Je to prosté! 🙂 Vraťme se nyní tedy k našemu původnímu příkladu:

$$ \lim_{x\to \infty} \frac{2x^3 – 6x^2-145x + 17}{3x^3 – 2x^2 – 6} $$

A rozepišme si zlomek na 3 zlomky:

$$ \lim_{x\to \infty} \frac{2x^3 – 6x^2-145x + 17}{3x^3 – 2x^2 – 6} = $$

$$ = \lim_{x\to \infty} \frac{2x^3}{3x^3 – 2x^2 – 6}  + \lim_{x\to \infty} \frac{ – 6x^2}{3x^3 – 2x^2 – 6} + \lim_{x\to \infty} \frac{-145x}{3x^3 – 2x^2 – 6} +\lim_{x\to \infty} \frac{17}{3x^3 – 2x^2 – 6} $$

Když se nyní podíváme na poslední tři limity, už vidíme, kam směřují — řekli jsme, že pokud je mocnina čitatele menší než jmenovatele, zlomek bude limitovat k nule. Můžeme tedy velmi snadno všechny tyto tři limity položit rovny nule a zbyde tak pouze zlomek se stejnou mocninou.

A co jsme si dále ukázali — že limita \(\frac{x^n}{x^n}\) je rovna jedné! Čili rovnou krásně vidíme, že výsledek limity bude \(\frac{2}{3}\).

Zajímavé poměry

U polynomu je tedy snad už jasné, nicméně pojďme se podívat na další “moc hezké” limity. Například tato:

$$ \lim_{x\to0} \frac{\sin(x)}{x}$$

Podíváme-li se na graf takové funkce, vidíme (chceme vidět), že limita bude rovná jedničce. Graficky tedy můžeme toto tvrdit, nicméně, jak to doopravdy spočítat?

Na pomoc si vezmeme tzv. L’Hospitalovo pravidlo, tedy pravidlo, které říká následující:

$$ \lim_{x\to0}\frac{f_1(x)}{f_2(x)} = \lim_{x\to0}\frac{f_1^\prime(x)}{f_2^\prime(x)}$$

Tedy že limita poměru funkcí je limitou poměru derivací těchto funkcí. O derivacích si můžete přečíst v článku o kinematice, zde tedy použiji pouze rychlou derivaci:

$$ \lim_{x\to0}\frac{\sin(x)}{x} = \lim_{x\to0}\frac{\sin(x)^\prime}{x^\prime} = \lim_{x\to0}\frac{\cos(x)}{1}$$

A to už je snané — budeme-li do \(\cos(x)\) za \(x\) dosazovat nulu, bude se cosinus blížit k jedničce. Ve jmenovateli máme jedničku — výsledný poměr je tedy jednička 🙂

Poznámky pod čarou   [ + ]

1. to jsou takové, které nemají “normální” výsledek

Entropie a termodynamické zákony

V článku o odvození rovnice ideálního plynu jsme nakousli několik termodynamických zákonitostí, nicméně bylo by dobré, abychom se na termodynamiku podívali i trochu obecněji a do hloubky.

Rovnici idálního plynu jsme si již odvodili, nyní však pro připomenutí:

$$PV=nRT$$

kde \(P\) odpovídá tlaku plynu, \(V\) jeho objemu, \(n\) molárnímu množství plynu, \(R\) je plynová konstanta a \(T\) odpovídá teplotě plynu.

Dále využijeme 1. termodynamického zákona, který nám stručně říká, že změna vnitřní energie nějaké soustavy odpovídá součtu změn práce a přijatého tepla, tedy[1]Další informace kupříkladu na http://fyzika.jreichl.com/main.article/view/581-prvni-termodynamicky-zakon :

$$\mathrm{d}u = \mathrm{d}w + \mathrm{d}q$$

 Využijme těchto znalostí při prohlídce obyčejného pístu a válce:

píst bez popisků

 Zeleně je zobrazen nějaký (ideální) plyn, šedivě potom píst, černé jsou kontury. Představme si nyní situaci, kdy plyn trošku “přimáčkneme”:

píst síla a vzdálenost

Pokud budeme působit nějakou silou \(F\) na danou plochu \(A\), víme, že tvoříme nějaký tlak, konkrétně tedy \(P = \frac{F}{A}\). Taktéž víme, že práce \(w\) odpovídá síle \(F\) po nějaké dráze \(l\), tedy \(W = F \cdot l\).

Budeme-li se zajímat pouze o drobnou změnu práce, tedy \(\mathrm{d}w\), poté můžeme psát:

$$\mathrm{d}w = F \cdot \mathrm{d}l$$

 Výše jsme si řekli, že \(P = \frac{F}{A}\), tedy \(F = P A\), můžeme tedy dosadit:

$$\mathrm{d}w = P A \cdot \mathrm{d}l$$

Nu a do jsme se učili už na základní škole o ploše a výšce? Vynásobíme-li je, dostaneme objem! Takže vzhůru do toho:

$$\mathrm{d}w = P \cdot \mathrm{d}V$$

Správněji tedy \(\mathrm{d}w = {- P} \cdot \mathrm{d}V\), protože \(\mathrm{d}l\) zde objem snižuje a ne zvyšuje (tedy správně bychom od začátku měli psát \({-\mathrm{d}l}\), ale je doufám jasné, kde se vzalo. Také vidíme důležitý závěr: Pokud se nezmění objem, není práce[2]Zde by to chtělo podotknout, že mluvíme samozřejmě o fyzikální práci. Takže pokud jste nezaměstnaní a zhubnete, práci nedostanete 🙂 .

 První termodynamický zákon tedy můžeme přepsat jako:

$$\mathrm{d}u = \mathrm{d}q – P \mathrm{d}V$$

Můžeme tedy tvrdit, že energie je funkcí teploty a objemu[3]Proč ne tlaku? Tlak je totiž definován pomocí těchto dvou veličin (není to nezávislá veličina). Proto tedypouze teplota a objem.:

$$u = f(T, V)$$

 konkrétněji tedy:

$$\mathrm{d}u = \left(\frac{\partial u}{\partial T}\right)_{V} \mathrm{d}T + \left(\frac{\partial u}{\partial V}\right)_{T} \mathrm{d}V $$

To znamená, že změna energie se dá popsat jako parciální derivace energie vzhledem k teplotě, pokud zachováme konstantní objem, krát změna teploty, plus parciální derivace energie vzhledem k objemu, pokud zachováme konstantní teplotu, krát změna objemu.

Nicméně — podívejme se nyní na druhou část zlomku. Pokud je objem konstantní, poté \(\mathrm{d}V\) je nulové (změna \(V\) je nulová), proto nám tedy celá druhá část zlomku vypadne a můžeme psát:

$$\mathrm{d}u = \mathrm{d}q + \mathrm{d}w = \mathrm{d}q + 0 = \mathrm{d}q = \left(\frac{\partial u}{\partial T}\right)_{V} \mathrm{d}T$$

Poslední části “před” \(\mathrm{d}T\), tedy \(\left(\frac{\partial u}{\partial T}\right)_{V} = C_V\) říkáme tepelná kapacita při konstantním objemu. Tedy:

$$\mathrm{d}u = \mathrm{d}q = C_V \mathrm{d}T$$

To vše jsme si definovali, abychom si mohli definovat následující termín:

Entropie

Než tak však učiníme, definujme si ještě tzv. entalpii. Označíme ji velkým písmenem \(H\) a bude pro ni platit[4]Více informací: http://scienceworld.wolfram.com/physics/Enthalpy.html:

$$ H = u + P V $$

Entalpie je tedy funkcí teploty a tlaku, tedy \(H = f(T, P)\). Podle prvního termodynamického zákona[5]dále jen TZ1 jsme si ukázali:

$$ \mathrm{d}u = \mathrm{d}q + \mathrm{d}w = \mathrm{d}q – P \mathrm{d}V$$

Můžeme tedy trošku popřeházet písmenka, aby:

$$ \mathrm{d}u + P \mathrm{d}V = \mathrm{d}q$$

a tedy

$$ \mathrm{d} (u+PV) = \mathrm{d}q $$

čili

$$ \mathrm{d}H = \mathrm{d}q $$

Vidíme, že tedy entalpie je funkcí teploty a tlaku, tedy \(H(T,P)\). A můžeme samozřejmě opět vytvořit parciální derivace:

$$ \mathrm{d}H = \left(\frac{\partial H}{\partial T}\right)_P \mathrm{d}T + \left(\frac{\partial H}{\partial P}\right)_T \mathrm{d}P = \mathrm{d}q$$

Nu a opět, pokud uvažujeme konstantní tlak, celé \(\mathrm{d}P\) bude nulové, čili:

$$ \mathrm{d}H = \left(\frac{\partial H}{\partial T}\right)_P \mathrm{d}T = \mathrm{d}q$$

Části \(\left(\frac{\partial H}{\partial T}\right)_P\) říkáme tepelná kapacita při konstantním tlaku. A můžeme si (po přeházení písmenek) ukázat, že:

$$ \mathrm{d}q = C_p \mathrm{d}T$$

Shrňme si nyní, co víme: Víme \(C_p\), \(C_V\), známe vzorec pro entalpii. Zkusme si s ním nyní trošku pohrát:

$$ H = u + PV $$

$$ \left(\frac{\partial H}{\partial T}\right)_p = \left(\frac{\partial u}{\partial T}\right)_p + \left(\frac{\partial PV}{\partial T}\right)_p $$

Vidíme, že pokud bychom derivovali (parciálně) při konstantním tlaku, poslední část, kde bychom derivovali i tlak samotný, by se převedla na \(\left(\frac{P \mathrm{d}V}{\mathrm{d}T}\right)_p\), tedy:

$$ \left(\frac{\partial H}{\partial T}\right)_p = \left(\frac{\partial u}{\partial T}\right)_p + \left(\frac{P \mathrm{d}V}{\mathrm{d}T}\right)_p $$

Vrátíme-li se na chvilku zpět k rovnici ideálního plynu, tedy \(PV = nRT\), pokud trošku přeházíme písmenka a vyjádříme jako diferenciály:

$$ \frac{\mathrm{d}V}{\mathrm{d}T} = \frac{nR}{P} $$

Pro zjednodušení předpokládejme, že \(n=1\), čili:

$$ \frac{\mathrm{d}V}{\mathrm{d}T} = \frac{R}{P} $$

a tedy

$$ \frac{P \mathrm{d}V}{\mathrm{d}T} = R $$

Vidíme, že to je to, co nám vyšlo výše jako jeden z členů součtu — můžeme tedy dosadit do vzorce výše to, co už známe:

$$ C_p = \left(\frac{\partial u}{\partial T}\right)_p + R $$

Nicméně abychom “minimalizovali” i tento vzorec, museli bychom mít konstantní jinou veličinu. Pokud máme konstantní tlak, tak změna objemu podle teploty není to, co  by se nám zrovna hodilo. Ale už jsme “skoro” tam, musíme akorát udělat malý trik. Využijeme “řetězového zákona”[6]Nevím, jak to lépe přeložit, každopádně další informace o tom zde: http://en.wikipedia.org/wiki/Triple_product_rule.. A ten nám neříká nic jiného, že naši parciální derivaci při konstantním tlaku můžeme rozepsat následovně:

$$ \left(\frac{\partial u}{\partial T}\right)_p = \left(\frac{\partial u}{\partial T}\right)_V + \left[\left(\frac{\partial u}{\partial V}\right)_T\right] \left(\frac{\partial V}{\partial T}\right)_p $$

Podívejme se nyní na třetí závorku, resp. druhou, jdeme-li od rovnítka vpravo (zvýraznil jsem ji hranatými závorkami). Ta operuje se změnou energie při konstantní teplotě. Nicméně výše jsme si řekli, že pokud je konstantní teplota, nejde žádná energie dovnitř ani ven[7]Tzn. jedná se o dokonalý stroj, který převádí tepelnou energii na energii pohybu pístu třeba — sice je to ideální zařízení, ale nám se to teď dost hodí.. Změna energie je tedy nulová — čímž i součin je nulový a celá poslední část vzorce “vypadne”.

Položíme proto rovnost:

$$ \left(\frac{\partial u}{\partial T}\right)_p = \left(\frac{\partial u}{\partial T}\right)_V $$

čímž si značně zjednodušíme práci s výrazem výše. Můžeme totiž poslední část nazvat \(C_V\), čili tepelnou kapacitu při konstantním objemu. A tedy samozřejmě pak platí, že:

$$ C_p = C_V + R $$


Podívejme se nyní, co tedy již víme:

$$ \mathrm{d}u = \mathrm{d}q + \mathrm{d}w = \mathrm{d}q + p\mathrm{d}V = C_V \mathrm{d}T $$

Na tom dále vystavíme[8]a již brzy se dostaneme ke slíbené entropii, slibuji 🙂 , nicméně musíme se podívat na další “kus” informací ze světa termodynamiky — různé procesy. Určitě jste o nich už někdy slyšeli, ale pro zopakování si napíšeme malý seznam:

  • isotermický děj je takový, během kterého zůstává stejná teplota
  • isobarický děj je takový děj, během něhož zůstává konstantní tlak
  • isochodirký děj takový, kdy zůstává konstantní objem
  • isentalpický děj — zůstává zachována entalpie

Kromě těchto tří existují ještě isentropický  děj, kde zůstává zachována entropie. Zatím však nevíme, co to je, nebudu ho tam uvádět[9]A samozřejmě až budete vědět, co to je a jak je definováno, můžete si to tam virtuálně přiřadit. Zbývá však jeden, na který se ještě musíme podívat — děj adiabatický.

Adiabatický děj

Adiabatický děj je takový, během něhož zůstává celkové teplo[10]pozor, nokoliv teplota!! děje konstantní. Samozřejmě se může měnit leccos ostatního, včetně teploty, ale teplo systému je konstantní. Jak je to možné?

Můžeme náš testovací systém třeba dokonale (či co nejdokonaleji) odizolovat od okolního světa. Důležité je, že žádné teplo nejde ani dovnitř, ani ven. Můžeme tedy tvrdit, že \(\mathrm{d}q = 0\). Podívejme se ještě jednou na vztah:

$$\mathrm{d}u=\mathrm{d}q-p\mathrm{d}V=C_V\mathrm{d}T$$

Řekli jsme si, že \(\mathrm{d}q=0\), čili můžeme tento člen s klidným svědomím vypustit:

$$\mathrm{d}u={-p}\mathrm{d}V=C_V\mathrm{d}T$$

Tlak \(p\) si můžeme vyjádřit z nám již známého $pV=nRT$:

$$ p=\frac{nRT}{V} $$

A můžeme tedy dosadit:

$$\mathrm{d}u = {-\frac{nRT}{V}}\mathrm{d}V = C_V \mathrm{d}T$$

a po trošku úpravách[11]Jen přeházíme “sem a tam” přes rovnítko různé proměnné tak, aby nám na jedné straně u sebe zbyly diferenciály a proměnné teploty, na druhé objemu. získáme:

$$ {-nR}\frac{\mathrm{d}V}{V}=\frac{C_V\mathrm{d}T}{T} $$

Samozřejmě budeme považovat opět \(n=1\)[12]molární množství látky, takže se to celé zjednoduší na:

$$ {-R}\frac{\mathrm{d}V}{V}=\frac{C_V\mathrm{d}T}{T} $$

Menší už to snad ani nemůže být, máme připraveno na integrování. Integrování je matematická operace inverzní k derivování (a parciálnímu derivování), pokud bude zájem, o těchto metodách zvlášť napíšu článek. Napíšeme tedy:

$$ {-R}\int_{V_1}^{V_2}\frac{\mathrm{d}V}{V} = {C_V}\int_{T_1}^{T_2}\frac{\mathrm{d}T}{T}$$

a zintegrujeme. Funkce \(\frac{1}{x}\) se zintegruje na \(ln(x) +C\), tedy rozintegrované bude:

$$ {-R}\left[\ln(V)\right]_{V_1}^{V_2} = C_V \left[\ln(T)\right]_{T_1}^{T_2}$$

Po dosazení[13]Jak na to se dozvíte v tom slibovaném článku o integrálech, ale když se na to zakoukáte, vymyslíte to 🙂 bude:

$$ {-R}\left(\ln(V_2)-\ln(V_1)\right) = C_V \left( \ln(T_2)-\ln(T_1)\right) $$

Podle pravidel o logaritmování tedy:

$$ {-R}\ln\frac{V_2}{V_1} = C_V \ln \frac{T_2}{T_1}$$

A abychom se zbavili “mínus” před \(R\), stačí si představit, jak by to vypadalo, pokud bych se ho zbavil již výše, než jsem použil pravidla o logaritmování — otočilo by se pouze pořadí, tedy:

$$ {R}\ln\frac{V_1}{V_2} = C_V \ln \frac{T_2}{T_1}$$

Dále použiji pravidla o logaritmování součinu, který se v logaritmu převede na mocninu. Takže vzhůru do toho:

$$ \ln\left(\frac{V_1}{V_2}\right)^{R} = \ln \left( \frac{T_2}{T_1} \right)^{C_V}$$

Pokud se podíváme, je jasné, že aby toto platilo, musí se “vnitřky závorek” mezi sebou rovnat (závorka vpravo a závorka vlevo). Můžeme tedy napsat:

$$ \ln\left(\frac{V_1}{V_2}\right)^{\frac{R}{C_V}} = \ln \left( \frac{T_2}{T_1} \right)$$

A tedy i:

$$\left(\frac{V_1}{V_2}\right)^{\frac{R}{C_V}} =  \frac{T_2}{T_1}$$

Vzpomeňme si nyní na vztah:

$$C_P = C_V + R$$

Není vám to povědomé? 🙂 Z toho přece můžeme snadno vyjádřit \(R\):

$$R = C_P – C_V$$

a tedy (celý vztah podělíme \(C_V\))

$$ \frac{R}{C_V} = \frac{C_P}{C_V} – \frac{C_V}{C_V}$$

A to samozřejmě můžeme pokrátit na

$$ \frac{R}{C_V} = \frac{C_P}{C_V} – 1$$

Abychom si trošku zjednodušili práci (dobře, abych si ji zjednodušil já, nebaví mě psát v \(\LaTeX\)u zlomky 😀 ), nazvu pro teď výraz \(\frac{C_V}{C_P}=\xi\)[14]Tuten paznak se čte jako “ksí”. Pak samozřejmě platí, že:

$$ \frac{R}{C_V} =\xi-1$$

Samozřejmě tedy můžeme původní vztah přepsat jako:

$$\left(\frac{V_1}{V_2}\right)^{\xi-1} =\frac{T_2}{T_1} $$

Vraťme se nyní zpět k rovnici ideálního plynu:

$$ PV = nRT$$

a vyjádřeme si \(T\), položmě \(n=1\) jako před tím:

$$ T = \frac{PV}{R}$$

Dosaďme nyní do nově vzniknuvšího vztahu:

$$\left(\frac{V_1}{V_2}\right)^{\xi-1} =\frac{\frac{P_2V_2}{R}}{\frac{P_1V_1}{R}} $$

Samozřejmě můžeme s klidným svědomím pokrátit \(R\):

$$\left(\frac{V_1}{V_2}\right)^{\xi-1} =\frac{{P_2V_2}}{{P_1V_1}} $$

Nyní se můžeme snadno zbavit \(V_1\) a \(V_2\) — přendáme je na druhou stranu, čili:

$$\frac{V_1}{V_2} \left(\frac{V_1}{V_2}\right)^{\xi-1} =\frac{P_2}{P_1} $$

což samozřejmě přepíšeme na:

$$\left(\frac{V_1}{V_2}\right)^{\xi}=\frac{P_2}{P_1} $$

Z toho snadno vyjádříme:

$$P_1V_1^{\xi}=P_2V_2^{\xi} $$

Vidíme, že pokud se musí rovnat levá a pravá strana rovnice, musí být konstantní obecný výraz \(\left(PV\right)^\xi\).

Zpátky však k entropii!

Nyní, když už rozumíme adiabatickému ději, máme téměř všechny důležité informace k tomu, abychom mohli vyjádřit a pochopit i termín entropie. Začněme se tedy věnovat tepelným procesům, konkrétně tzv. Carnotovu [15]Informace např. zde: http://www-history.mcs.st-andrews.ac.uk/Biographies/Carnot_Sadi.html cyklu[16]Moc hezké informace a interaktivní aplety mají třeba zde: http://hyperphysics.phy-astr.gsu.edu/hbase/thermo/carnot.html.

Carnot si položil jednoduchou otázku: Existuje-li nějaký tepelný zdroj, tak máme-li nějakou možnost vzít nějaký přístroj (obecně tepelný stroj), který je schopen teplo tohoto zdroje převádět na práci, pokud možno 100% efektivně. A ukázalo se, že nikoliv[17]Dnes nám to už může přijít jako samozřejmost, ale stejně po světě běhá spoustu lidí, co si myslí, že vynalezlo perpetum mobile, což jeho existenci přímo jako důsledek tohoto zjištění vyvrací.

Vezmeme-li tedy nějaký tepelný zdroj:

Carnotuv cyklus -- tepelný zdroj

Přidáme stroj, který má toto teplo zpracovávat:

Carnotuv cyklus -- tepelný stroj

Tak se ptáme, jestli existuje takový stroj, který je schopen 100% přenést veškeré teplo na práci, tedy že pracuje se 100% účinností:

Carnotuv cyklus -- existuje takovy stroj

Ukázalo se však, že takový stroj může existovat pouze v ideálních podmínkách, nicméně ty nejsou dosažitelné. Každý takový stroj totiž operuje i se zbytkovým teplem, které je předáváno dál okolí:

Carnotuv cyklus -- zbytkové teplo

Nyní si vše ukažme trošku exaktněji:

Ze “situačního plánku” vidíme, že výstupní práce \(W\) bude rovna rozdílu \(W=Q_1 – Q2\). Víme taktéž, že efektivita nějaké soustavy se dá velmi obecně vyjádřit jako \(\frac{ven}{dovnitř}\). Tedy:

$$\eta = \frac{W}{Q_1} = \frac{Q_1 – Q_2}{Q_1} = 1-\frac{Q_2}{Q_1}$$

A nyní si položmě otázku, kdy může být \(\eta\) rovno jedné — čili 100% účinnost. Buď bychom museli mít nekonečně velké teplo \(Q_1\), abychom minimalizovali zlomek jmenovatelem, anebo bychom museli mít absolutní nulu \(Q_2\), čímž bychom minimalizovali zlomek čitatelem. Druhého jmenovaného jsme přece jen blíže dosáhnout, ale přesto toho nejsme schopni dosáhnout absolutně.

Abychom si však popsali takový proces cyklicky, je potřeba použít tzv. Carnotova cyklu, což je teplený cyklus, kde někdy měníme stavy adiabaticky a někdy isotermicky. To opakujeme pořád dokola a sledujeme vstupy a výstupy, čímž jsme schopni opět spočítat efektivitu takové soustavy.

Představme si tedy znovu náš zelený píst ze začátku článku, kde se budeme snažit vyvolat adiabatické a isotermické změny. Abychom to však vzali trošku “profesionálně”, experimenty si necháme třeba do laboratoře, my si vše popíšeme krásně grafem, konkrétně tzv. PV grafem. Jak písmenka napovídají, \(P\) odpovídá tlaku a \(V\) odpovídá objemu:

pv graf

Vynesme si nyní na ně několik bodů (samozřejmě postupně): Nejdříve začněme nějakým výchozím stavem, nazvěme si ho třeba \(A\):

pv graf -- A

Od tohoto bodu se isotermicky budeme pohybovat k bodu B:

pv graf -- AB

Během tohoto procesu vidíme, že se zvyšuje objem, avšak protože se jedná o isotermický děj, zůstává konstantní teplota, nazvěme ji \(T_1\). Musíme tedy do systému dodávat nějaké teplo, aby byla soustava vyrovnána, což také děláme. Dále přejděme k bodu \(C\), ke kterému se dostaneme adiabatickou cestou (žádné teplo dovnitř ani ven):

 pv graf -- BC2

Protože se pohybujeme po adiabatě, žádné teplo nedodáváme ani nebereme, objem se příliš nemění, ale snižuje se tlak — konáme práci. V další iteraci se dostáváme do bodu \(D\) — opět jako isotermický děj:

pv graf -- CD

No a protože platí totéž, co pro \(AB\) posun, tedy že se mění objem, ale teplota zůstává konstantní, musíme nějaké teplo odevzdávat, čili zde vidíme “vznik” \(Q_2\).  Nakonec nám zbývá poslední adiabatický děj, totiž \(DA\)[18]A ne, není to Dragon Age! 🙂 :

pv graf -- DA

Jsme tedy opět “na začátku” našeho cyklu a ten se pořád dokola opakuje. Vyjádříme-li si nyní z nám již velmi dobře známé rovnice ideálního plynu tlak, dostaneme:

$$ PV = nRT $$

$$ P = \frac{nRT}{V}$$

Dále víme, že \(\mathrm{d}u = \mathrm{d}q – P\mathrm{d}V\), jenže co vyjadřuje \(\mathrm{d}u\)? Vyjadřuje “změnu množství tepla” (či vnitřní energie systému). Když se však na cyklus podíváte, začali jsme v bodě \(A\), a ve stejném jsme vlastně i skončili. Nedodali jsme proto žádnou energii navíc, všechna byla vyzářena v podobě ztrát či tak podobně — můžeme tedy s klidným srdcem položit \(\mathrm{d}u = 0\) a potom už je snadné psát:

$$ 0 = \mathrm{d}q – P\mathrm{d}V$$

$$\mathrm{d}q = P\mathrm{d}V$$

Můžeme integrovat, pro každou teplotu musíme zvlášť:

$$ Q_1 = \int_{V_A}^{V_B} nRT_1 \frac{\mathrm{d}V}{V}=nRT_1\ln\frac{V_B}{V_A}$$

$$ Q_2 = – \int_{V_C}^{V_D} nRT_2 \frac{\mathrm{d}V}{V}=- nRT_2\ln\frac{V_D}{V_C}$$

Minus u \(Q_2\) značí, že teplo “dáváme ven”, tzn. ubývá (a proto mínus). Dříve jsme si vyjádřili, že \(\eta\), tedy účinnost systému, se dá zapsat jako:

$$ \eta = 1-\frac{Q2}{Q1}$$

A nezbývá, než dosadit nově zjištěná “kvé”:

$$ \eta = 1-\frac{nRT_2\ln\frac{V_C}{V_D}}{nRT_1\ln\frac{V_B}{V_A}} = 1 – \frac{T_2\ln\frac{V_C}{V_D}}{T_1\ln\frac{V_B}{V_A}}$$

Jak to zjednodušit? Dokažme, že část zlomku, kde porovnáváme logaritmy, je konstantní, konkrétně je rovna jedné.

Víme už, že:

$$ \frac{T_2}{T_1} = \left(\frac{V_1}{V_2}\right)^{\xi-1}$$

A po přeházení proměnných tedy:

$$T_2V_2^{\xi-1} = T_1V_1^{\xi-1}$$

Z grafu Carnotova cyklu můžeme dále určit, že pro dané objemy a tedy i krajní body vpravo a vlevo můžeme dát do rovnosti (tohle je trošku těžší krok na představivost, ale podívejte se pořádně na graf, vyplyne to z toho 🙂 ):

Pro body “vpravo”:

$$T_1V_B^{\xi-1} = T_2V_C^{\xi-1}$$

Pro body “vlevo”:

$$ T_1V_A^{\xi-1} = T_2V_D^{\xi-1}$$

Tuto soustavu tedy můžeme přepsat jako:

$$\frac{T_1V_B^{\xi-1}}{T_1V_A^{\xi-1}} = \frac{T_2V_C^{\xi-1}}{T_2V_D^{\xi-1}}$$

Můžeme pokrátit teploty a získáme:

$$\left(\frac{V_B}{V_A}\right)^{\xi-1} = \left(\frac{V_C}{V_D}\right)^{\xi-1}$$

A tedy vidíme, že obsahy závorek musí být stejné, aby rovnost platila. Vrátíme-li se proto k původnímu vzorci pro \(\eta\):

$$ \eta = 1-\frac{nRT_2\ln\frac{V_C}{V_D}}{nRT_1\ln\frac{V_B}{V_A}} = 1 – \frac{T_2\ln\frac{V_C}{V_D}}{T_1\ln\frac{V_B}{V_A}}$$

Vidíme, že můžeme s klidem poměr logaritmů pokrátit, protože se prostě jedná jedné. Zbyde nám tedy:

$$\eta = 1-\frac{Q_2}{Q_1} = 1-\frac{T_2}{T_1}$$

A z toho jasně plyne, že:

$$\frac{Q_2}{Q_1} = \frac{T_2}{T_1}$$

Trošku popřehazujeme písmenka, a získáme:

$$\frac{Q_2}{T_2} = \frac{Q_1}{T_1}$$

kde poměr \(\frac{Q}{T}\) je konstantní a nazveme ho (hurá potlesk) entropie. Tu dále budeme označovat jako \(S\).

Neklesavost entropie

Určitě jste někde (nedivil bych se, kdyby v nějakém sci-fi) slyšeli, že entropie vesmíru stále stoupá. Co si pod tím představit? Proč? Jak? Dokažme si nyní na našem malém experimentu s Carnotovým cyklem a tepelným strojem, co to znamená a kde se něco takového vzalo.

Výše jsme si vyjádřili dva vztahy:

$$ \eta_{max} = 1-\frac{T_2}{T_1}$$

a

$$ \eta_{max} = \frac{W}{Q_1}$$

Není nic lehčího, než je spojit přes \(\eta\) dohromady:

$$\frac{W}{Q_1}=1-\frac{T_2}{T_1}$$

a tedy:

$$ W \leq Q_1 \left(1-\frac{T_2}{T_1}\right)$$

Proč jsem přidal “nerovná se”? Přesně ze stejného důvodu, proč jsem k \(\eta\) přidal index “max” — jedná se totiž o výpočty s maximální účinností, nikoliv absolutní. Proto práce bude vždy maximálně taková, jaká je — případně může být jen nižší.

Dále víme, že \(W = Q_1 – Q_2\). Můžeme tedy psát:

$$ Q_1 – Q_2 \leq Q_1 \left(1-\frac{T_2}{T_1}\right)$$

Roznásobíme:

$$ Q_1 – Q_2 \leq Q_1-\frac{Q_1 T_2}{T_1}$$

a vidíme, že \(Q_1\) můžeme z rovnice s klidnou duší vyhodit:

$$- Q_2 \leq -\frac{Q_1 T_2}{T_1}$$

Otočíme:

$$ Q_2 \geq \frac{Q_1 T_2}{T_1}$$

Přeházíme písmenka:

$$ \frac{Q_2}{T_2} \geq \frac{Q_1}{T_1}$$

A to je vše 🙂 Vidíme, že po skončení procesu bude entropie vždy ne menší, tedy stejná či větší, než před začátkem takového procesu. A to je důvod, proč entropie neustále roste — protože prostě nemůže být menší.

To by pro začátek s termodynamikou stačilo, příště se zase podíváme na nějaké částice, tak se těšte 😉 Zde si též můžete stáhnout mé poznámky k článku, ze kterých jsem vycházel (pokud to po mně přečtete) 🙂

Poznámky pod čarou   [ + ]

1. Další informace kupříkladu na http://fyzika.jreichl.com/main.article/view/581-prvni-termodynamicky-zakon
2. Zde by to chtělo podotknout, že mluvíme samozřejmě o fyzikální práci. Takže pokud jste nezaměstnaní a zhubnete, práci nedostanete 🙂
3. Proč ne tlaku? Tlak je totiž definován pomocí těchto dvou veličin (není to nezávislá veličina). Proto tedypouze teplota a objem.
4. Více informací: http://scienceworld.wolfram.com/physics/Enthalpy.html
5. dále jen TZ1
6. Nevím, jak to lépe přeložit, každopádně další informace o tom zde: http://en.wikipedia.org/wiki/Triple_product_rule.
7. Tzn. jedná se o dokonalý stroj, který převádí tepelnou energii na energii pohybu pístu třeba — sice je to ideální zařízení, ale nám se to teď dost hodí.
8. a již brzy se dostaneme ke slíbené entropii, slibuji 🙂
9. A samozřejmě až budete vědět, co to je a jak je definováno, můžete si to tam virtuálně přiřadit
10. pozor, nokoliv teplota!!
11. Jen přeházíme “sem a tam” přes rovnítko různé proměnné tak, aby nám na jedné straně u sebe zbyly diferenciály a proměnné teploty, na druhé objemu.
12. molární množství látky
13. Jak na to se dozvíte v tom slibovaném článku o integrálech, ale když se na to zakoukáte, vymyslíte to 🙂
14. Tuten paznak se čte jako “ksí”
15. Informace např. zde: http://www-history.mcs.st-andrews.ac.uk/Biographies/Carnot_Sadi.html
16. Moc hezké informace a interaktivní aplety mají třeba zde: http://hyperphysics.phy-astr.gsu.edu/hbase/thermo/carnot.html
17. Dnes nám to už může přijít jako samozřejmost, ale stejně po světě běhá spoustu lidí, co si myslí, že vynalezlo perpetum mobile, což jeho existenci přímo jako důsledek tohoto zjištění vyvrací.
18. A ne, není to Dragon Age! 🙂