Archiv pro rubriku: Teoretické články

Polarizace a spin částice (2. část)

Vítám vás u pokračování tématu o polarizaci a spinu částic. V prvním díle jsme zlehka naznačili matematický aparát a obecné principy, v tomto článku jich dále budeme využívat, proto pokud budete potřebovat, velmi doporučuji otevřít si první článek a v případě matematických nejasností zde se na něho odkazovat, mělo by tam být vysvětleno vše důležité.

Co je to spin?

Bohužel, u fyziky malých částic, jak jsme řekli dříve, poměrně slušně selhávají makroskopické představy o principech, stejně tak i jakákoliv snaha vysvětlit, k čemu spin částice připodobnit. Velmi blízce by se dal spin připodobnit jako moment hybnosti částice, ale ne v tom významu, že s ním můžeme zacházet libovolně jak chceme, ve své podstatě se jedná o experimentálně ověřenou hodnotu, která byla “tak nějak” potřeba přidat do co nejcelkovějšího modelu chování částic.[1]Pro další informace rozhodně doporučuji tento popis experimentu: ElektronovySpin.pdf. Říká nám zjednoduše, kolikrát musíme danou částici otočit, aby se nám jevila opět stejně. Pokud máme spin 1, poté musíme částici otočit o celých 360 stupňů, pokud 2, stačí 180 stupňů. Spin dané částice je (jeho velikost) přesně dána a nelze tuto hodnotu změnit. Navíc tyto hodnoty mohou nabývat pouze celočíselných a nebo polovičních násobků \(\hbar\)[2]Redukované planckovy konstanty, tedy \(\hbar=\frac{h}{2\pi}\)., tedy spiny můžeme mít \(\left(1,\frac{1}{2},-\frac{1}{2},-1,\frac{3}{2},\ldots\right)\) a tak podobně.

Směr spinu částice (nikoliv jeho hodnotu) můžeme měnit např. magnetickým polem, kterým částice prochází. Budeme-li se pohybovat v běžných třech osách pohybu (pravolevá, hornodolní a předozadní), můžeme jednoduše spin označit jako horní, dolní, pravý, levý atd. Pro tato označování je zaběhnuté používání písmenek z anglických slov toto popisující, toho se budeme držet i zde — tedy u jako upd jako down atd. Pokud si nyní představíme spin jako rotaci, tato rotace bude mít nějakou osu[3]Opět — osu bude mít pouze v makroskopickém světě, v případě spinu hovořit o ose rotace je chybné.. Stačí nám tedy pro popis spinu jako takového pouze znázornění směru této osy, a to je právě výše zmíněné u nebo d.

Tak nějak asi tušíme, že se spinem to bude velmi podobné jako s polarizací částice. Budeme-li mít např. nějaký experiment, který nám říká, jestli měřená částice má spin u nebo d, pokud do tohoto experimentu pošleme u částici, řekne nám, že máme spin u a naopak. Stejně jako u polarizace, pokud pošleme do experimentu částici, která má spin natočený pod nějakým úhlem, dosáhneme určitého poměru ud v tomto experimentu (při větším počtu částic, třeba 100 částic, tedy získáme třeba 60 % částic s u a 40 % s d.)

Bra-ketovým zápisem (pro oživení doporučuji 1. díl seriálu) tedy můžeme daný spin částice zapsat jako:

$$|p_s\rangle=\alpha|\mathrm{u}\rangle+\beta|\mathrm{d}\rangle$$

Tedy že daný spin \(p_s\) bude součtem amplitud pravděpodobností pro ud. Abychom z amplitudy pravděpodobnosti dostali přímo pravděpodobnost, musíme “umocnit na druhou” — jenže pozor, toto platí pouze pro \(\mathbb{R}\). Pro \(\mathbb{C}\) budeme muset použít součin dvou komplexně konjugovaných čísel, tedy \(\alpha\alpha^*\)[4]Komplexně konjugované číslo, pro zopakování, je číslo, které má stejnou reálnou část, ale opačnou imaginární. Sami vidíme, že u reálných čísel se jedná opravdu o “umocnění na druhou”. Samozřejmě rovnou vidíme, že pravděpodobnosti budou muset být:

$$\alpha\alpha^*+\beta\beta^*=1$$

Také rovnou vidíme následující možnosti[5]vše vztaženo k experimentu, kdy měříme “je to u?:

$$
p_{u}=1|\mathrm{u}\rangle+0|\mathrm{d}\rangle\\
p_{d}=0|\mathrm{u}\rangle+1|\mathrm{d}\rangle\\
p_{r}=\frac{1}{\sqrt{2}}|\mathrm{u}\rangle+\frac{1}{\sqrt{2}}|\mathrm{d}\rangle
$$

Co však značí přímo \(\mathrm{u}\) a \(\mathrm{d}\)? Jedná se o dva ortonormální vektory[6]Velmi podobné ortogonálním, jen mají jednotkovou velikost. Ortogonální vektory nám říkají, že pokud je jeden “něčím”, pak ten druhý je vším jen ne “něčím”, tedy např. pokud jeden vektor popisuje stav u, poté ortogonální popisuje stav přesně ne-u, tedy d 🙂 (Ano, tyto  vektory jsou tedy lineárně nezávislé a tvoří bázi prostoru, ale lineární algebru nechme na jindy.) , velmi podobně jako v případě polarizace. Musíme se ještě podívat na jeden “zvláštní typ” polarizace, tedy kruhovou polarizaci.

Kruhová polarizace

Jak asi víme, světlo je označováno jako elektromagnetické vlnění, což značí přesně to, co to je — obsahuje jak “elektrickou” tak “magnetickou” část. Představíme-li si světelný paprsek, který putuje prostorem nějakým přímým směrem:

Světelný paprsek
Světelný paprsek

Tento světelný paprsek je tvořen dvěma kolmými vlněními — elektrickým a magnetickým. Ty se mohou vyskytovat pouze jako “kolmé” veličiny na směr šíření paprsku, budou se tedy pohybovat v rovině:

Elektromagnateické vlnění se může rozkmitat pouze v této rovině, která je kolmá na směr šíření vlny.
Elektromagnetické vlnění se může rozkmitat pouze v této rovině, která je kolmá na směr šíření vlny.

Vlnění se tedy může rozkmitávat pouze po této plošce. Vlnění elektrické a magnetické je na sebe vzájemně kolmé, tedy:

Kruhova polarizace -- vlnění E & B
Kruhova polarizace — vlnění E & B

Nutno podotknouti, že obrázek je velmi silně mimo proporce, elektrická část vlnění je totiž mnohem silnější než magnetická, ale teď nám jde spíše o zobrazení principu než o správné proporce grafu 🙂

Nicméně k výpočtům samotným. Pokud budeme předpokládat, že \(E\) a \(B\) jsou kolmé a jsou to klasické vlny (sinusovky), označíme-li souřadné osy takto:

Označení os
Označení os

Tedy že vlna se pohybuje po ose \(z\), poté můžeme psát pro intenzity:

$$
E_x=E_{E_{max}}\sin(k\mathbb{\mathrm{z}}+\omega t)\\
E_y=E_{B_{max}}\cos(k\mathbb{\mathrm{z}}+\omega t)
$$

Budeme-li naší rovinou posouvat po ose \(z\), uvidíme, že se nám budou prakticky střídat dvě základní polarizace — tam, kde bude hodnota \(E_E\) maximální, tam bude hodnota \(E_B\) minimální a naopak. Budou se prakticky neustále dohánět, bude to právě vypadat, jako kdyby se vektor polarizace neustále otáčel; proto kruhová polarizace.

Zkusme se nyní podívat na bra-ketový zápis takového jevu a jak vůbec na to. Budeme předpokládat, že pro naši polarizaci bude platit něco jako (předpokládejme, že \(p_{kr}\) bude znamenat “Polarizace kruhová doprava”, tedy ve směru hodinových ručiček, ale pro začátek je to vlastně jedno):

$$|p_{kr}>=\alpha|\mathrm{x}\rangle+\beta|\mathrm{y}\rangle$$

Což by značilo, že musí existovat taková pravděpodobnost, kdy \(\alpha^2+\beta^2=1\). V čem je tady problém? Vidíme, že obě čísla budou kladná, pokud je zvolíme z \(\mathbb{R}\)[7]Protože 2. mocnina čehokoliv z $latex\mathbb{R}$ bude kladné číslo.. Proto musíme začít pokukovat po oblasti $latex\mathbb{C}$, tedy komplexních číslech. Pokud bychom zvolili:

$$1|x\rangle+i|y\rangle$$

Mohli bychom namítat, že to přece nefunguje, protože \(1^2+i^2=1-1=0\neq1\). Jenže! V prvním článku jsme si řekli, že abychom se dostali z pravděpodobnostních amplitud do přímé pravděpodobnosti, musíme nikoliv pouze umocnit, ale vynásobit komplexně konjugovaným číslem, tedy výpočet bude:

$$\alpha\alpha^*+\beta\beta^*=1$$

A to už fungovat bude:

$$1\cdot 1^*+i\cdot i^*=1\cdot 1 + i\cdot (-i) = 2$$

To sice taktéž není \(0\), ale už se blížíme k cíli, musíme pouze nanormovat jednotlivé operandy, stejně jako jsme dělali v prvním článku:

$$
\frac{1}{\sqrt{2}}\frac{1^*}{\sqrt{2}}+\frac{i}{\sqrt{2}}\frac{i^*}{\sqrt{2}}=
\frac{1}{2}+\frac{1}{2}=1
$$

Vektor kruhové polarizace vpravo \(p_{kr+}\) a vlevo \(p_{kr-}\) tedy můžeme napsat jako:

$$
|p_{kr+}\rangle=\begin{pmatrix}\frac{1}{\sqrt{2}}\\\frac{i}{\sqrt{2}}\end{pmatrix}\\
|p_{kr-}\rangle=\begin{pmatrix}\frac{1}{\sqrt{2}}\\\frac{-i}{\sqrt{2}}\end{pmatrix}
$$

Zkusme nyní klasický pokus s částicí s jednou a filtrem s druhou polarizací a ověřme, jestli pro danou polarizaci platí předpokladané, tedy že částice neprojde. Připravme čáscici s polarizací v protisměru hodinových ručiček a přožeňme ji filtrem, který propouští pouze částice s polarizací ve směru hod. ručiček. Uvědomme si taktéž, že původní předpis pro řešení spočívá v použití prvního vektoru v konjugované formě!:

$$
\langle{}p_{kr-}|p_{kr+}\rangle=
\begin{pmatrix}\frac{1}{\sqrt{2}} & \frac{i}{\sqrt{2}}\end{pmatrix}
\begin{pmatrix}\frac{1}{\sqrt{2}}\\\frac{i}{\sqrt{2}}\end{pmatrix}=
\frac{1}{\sqrt{2}}\frac{1}{\sqrt{2}}+\frac{i}{\sqrt{2}}\frac{i}{\sqrt{2}}=
\frac{1}{2}+\frac{-1}{2}=0
$$

Stejně tak, pokud použijeme přesně inverzní zadání, tedy:

$$
\langle{}p_{kr+}|p_{kr-}\rangle=
\begin{pmatrix}\frac{1}{\sqrt{2}} & \frac{-i}{\sqrt{2}}\end{pmatrix}
\begin{pmatrix}\frac{1}{\sqrt{2}}\\\frac{-i}{\sqrt{2}}\end{pmatrix}=
\frac{1}{\sqrt{2}}\frac{1}{\sqrt{2}}+\frac{-i}{\sqrt{2}}\frac{-i}{\sqrt{2}}=
\frac{1}{2}+\frac{(-i)^2}{2}=\frac{1}{2}-\frac{1}{2}=0
$$

Zkusme nyní ještě pokus s kruhově polarizovaným světlem a polarizačním filtrem pod nějakým obecným úhlem \(\phi\):

$$
\langle{}\phi|p_{kr+}\rangle=
\begin{pmatrix}\cos\left(\phi\right) & \sin\left(\phi\right)\end{pmatrix}
\begin{pmatrix}\frac{1}{\sqrt{2}} \\ \frac{i}{\sqrt{2}}\end{pmatrix}=
\cos(\phi)\frac{1}{\sqrt{2}}+\sin(\phi)\frac{i}{\sqrt{2}}
$$

Abychom z tuté pravděpodobnostní amplitudy dostali pravděpodobnost, musíme samozřejmě:

$$
\left(\langle{}\phi|p_{kr+}\rangle\right)^2=
\left(\frac{1}{\sqrt{2}}\cos(\phi)+\frac{i}{\sqrt{2}}\sin(\phi)\right)^2=\\=
\left(\frac{1}{\sqrt{2}}\cos(\phi)+\frac{i}{\sqrt{2}}\sin(\phi)\right)\left(\frac{1}{\sqrt{2}}\cos(\phi)+\frac{-i}{\sqrt{2}}\sin(\phi)\right)=\\=
\left(\frac{1}{2}\cos^2(\phi)-\frac{i^2}{2}\sin^2(\phi)\right)=
\left(\frac{1}{2}\cos^2(\phi)+\frac{1}{2}\sin^2(\phi)\right)=
\frac{1}{2}\left(\cos^2(\phi)+\sin^2(\phi)\right)=\frac{1}{2}
$$

Využijme ještě testu s hermitovským operátorem, který můžeme definovat takto[8]Viz https://www.eng.tau.ac.il/~shtaif/PolarizationClass.pdf.[9]Co to je, jsme řešili v minulém článku.:

$$
\begin{pmatrix}
0 & -i \\
i & 0
\end{pmatrix}
$$

A tedy jestli vyhovuje výrazu:

$$
\begin{pmatrix}
0 & -i \\
i & 0
\end{pmatrix}
\begin{pmatrix}
\frac{1}{\sqrt{2}} \\
\frac{i}{\sqrt{2}}
\end{pmatrix}
=
\lambda
\begin{pmatrix}
\frac{1}{\sqrt{2}} \\
\frac{i}{\sqrt{2}}
\end{pmatrix}
$$

Roznásobíme-li tedy:

$$
\begin{pmatrix}
0 & -i \\
i & 0
\end{pmatrix}
\begin{pmatrix}
\frac{1}{\sqrt{2}} \\
\frac{i}{\sqrt{2}}
\end{pmatrix}
=
\begin{pmatrix}
0\frac{1}{\sqrt{2}} – i\frac{i}{\sqrt{2}} \\
i\frac{1}{\sqrt{2}}+0\frac{i}{\sqrt{2}}
\end{pmatrix}
=
\begin{pmatrix}
\frac{1}{\sqrt{2}} \\
\frac{i}{\sqrt{2}}
\end{pmatrix}
$$

A tedy vidíme, že vlastní vektor odpovídá měřenému a předpokládanému, a tedy \(\lambda=1\).

Třípolarizátorový paradox

Tento paradox[10]Viz http://www.informationphilosopher.com/solutions/experiments/dirac_3-polarizers/[11]Viz http://alienryderflex.com/polarizer/[12]Viz polarize.pdf ukazuje zajímavou věc, která vypadá dost nemyslitelně; vezmeme-li dva polarizátory[13]Polarizační filtry…, které nastavíme kolmo na sebe (jejich roviny polarizace), ukazáali jsme si, že pravděpodobnost průchodu částice je \(0\). Nicméně, zařadíme-li mezi dva takové filtry třetí polarizátor pod nějakým úhlem, např. 45°, bude pravděpodobnost průchodu částice \(P: \left(0;1\right)\). Jak je toto možné? Využijme již známého matematického aparátu.

Víme už, že pravděpodobnost průchodu fotonem polarizačním filtrem o obecném úhlu \(\phi\) je \(p_{45}=\cos^2(\phi)=\cos^2(45)=\frac{1}{2}\). Připravíme-li proto polarizovaný proud částic, který pošleme 1. polarizátorem se stejným úhlem polarizace, tento nám daný paprsek nezmění (v rámci intenzity) a bude neustále \(100\%\) pravděpodobnost, že paprsek projde. Po 2. polarizátoru bude pravděpodobnost poloviční, tedy \(\frac{1}{2}\). No a po třetím, který je opět o oněch 45° otočen, bude pravděpodobnost:

$$
p_{II}=p_{45}\cos^2(45)=\frac{1}{2}\cdot\frac{1}{2}=\frac{1}{4}=25\ \%
$$

Pravděpodobnost průchodu takové částice je tedy \(45\ \%\). Ale pozor! Jde o světlo, které už máme polarizované, pokud do prvního polarizátoru pošleme nějaké obecné nepolarizované světlo, uvidíme, že už po prvním filtru budeme mít mnohem menší pravděpodobnost průchodu částice, konkrétně \(\frac{1}{2}\), pokud tedy bychom měřili nějakou intenzitu mezi vstupujícím světlem a výstupním světlem, dostaneme se ještě na polovinu z oněch \(25\ \%\), tedy na \(12,5\ \%\).

Samozřejmě bychom mohli dopočítat přes vlastní vektor, ale když jsme si už ukázali výstupy z této metody, můžeme jen vhodně zkombinovat výstupy, nicméně však by to vyšlo naprosto stejně 🙂

Definice matic pro výpočet

Stejně jako u polarizace, i zde můžeme využít hermitovských operátorů a dosazovat do rovnice. Polarizace a spin se budou chovat prakticky totožně[14]Až na pár velmi podstatných rozdílů, které si samozřejmě záhy ukážeme. (matematicky), budeme-li detekovat částice s nějakým spinem a do tohoto detektoru budeme posílat částice se spinem jiným či “pod nějakým úhlem”, výsledné výpočty budou téměř stejné[15]Tedy proporčně budou jako \(\cos^2(\phi)\), nicméně lehko odlišné..

Matice, které ve výpočtu používáme se jmenují Pauliho matice[16]Podle fyzika Pauliho, který za svůj vylučovací princip dostal Nobelovu cenu za fyziku. a mají tvar[17]Viz http://planetmath.org/PauliMatrices pro směry up/downright/leftin/out jako:

$$
\mathrm{\hat{H}}_{u/d}=\sigma_z=
\begin{pmatrix}
1  & 0\\
0 & -1\\
\end{pmatrix}\\
\mathrm{\hat{H}}_{r/l}=\sigma_x=
\begin{pmatrix}
0 & 1\\
1 & 0\\
\end{pmatrix}\\
\mathrm{\hat{H}}_{i/o}=\sigma_y=
\begin{pmatrix}
0 & -i\\
i & 0\\
\end{pmatrix}
$$

Vidíte, že jsem označil jednotlivé matice jako \(\sigma_z\) a podobně — jednoduše matice, která má osu \(z\) je označená jako \(\sigma_z\) atd. 🙂 První matice, up/down tedy má osu \(z\) a proto je označená \(\sigma_z\). Podívejme se však na tutu matici trošku podrobněji. Proč jsou zvolené zrovna tyto hodnoty?

Víme, že (chceme, aby…) bude platit:

$$
\begin{pmatrix}
a & b \\
c & d
\end{pmatrix}
\begin{pmatrix}
1 \\ 0
\end{pmatrix}
=
1
\begin{pmatrix}
1\\0
\end{pmatrix}
$$

Z toho můžeme velmi snadno určit neznámou matici (byť to na první pohled nevypadá). Napišme si, co víme, že bude platit za vztahy podle toho, jak bychom matici roznásobovali. První vztah tedy bude:

$$a \cdot 1 + b \cdot 0 = 1 $$

Z toho je naprosto jasně vidět, že ať bude \(b\) cokoliv, \(a\) musí být \(1\), aby byl součet čehokoliv a nuly jednička. Tedy vidíme, že \(a=1\). Pro druhý řádek máme:

$$ c \cdot 1 + b \cdot 0 = 0$$

Tedy vidíme, že \(c=0\). Nojo, ale co teď? 🙂 Pořád nám chybí dva výrazy, tak si pomůžeme tím, že známe dva vlastní vektory pro ud spin, použijeme prostě jen “ten druhý” vlastní vektor (jestli jste první použili ten či onen je jedno, samozřejmě 🙂 ):

$$
\begin{pmatrix}
a & b \\
c & d
\end{pmatrix}
\begin{pmatrix}
0 \\ 1
\end{pmatrix}
=
-1
\begin{pmatrix}
0\\1
\end{pmatrix}
$$

A opět stejným způsobem:

$$ a \cdot 0 + b \cdot 1 = 0$$

Tedy vidíme, že \(b=0\). No a pro poslední možnost:

$$ c \cdot 0 + d \cdot 1 = -1$$

No a tady vidíme, že \(d=-1\). Celková matice je tedy:

$$
\sigma_z
=
\begin{pmatrix}
1 & 0 \\
0 & -1 \\
\end{pmatrix}
$$

A taková matice je Hermitovská (viz předchozí článek).  Stejným způsobem dokážeme odvodit i ostatní matice, samozřejmě tam vždy použijeme trošku jiný trik, ale v principu je to pořád to samé, vyřešit nějak chytře rovnici o 4 neznámých:

$$
\begin{pmatrix}
a & b \\ c & d
\end{pmatrix}
\begin{pmatrix}
\frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{2}}
\end{pmatrix}
=
1
\begin{pmatrix}
\frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{2}}
\end{pmatrix}
$$

$$
\begin{pmatrix}
a & b \\ c & d
\end{pmatrix}
\begin{pmatrix}
\frac{1}{\sqrt{2}} \\ -\frac{1}{\sqrt{2}}
\end{pmatrix}
=
-1
\begin{pmatrix}
\frac{1}{\sqrt{2}} \\ -\frac{1}{\sqrt{2}}
\end{pmatrix}
$$

Pro zjednodušení budu předpokládat, že rovnici s maticemi mohu vynásobit libovolným číslem na obou stranách a rovnost zůstane zachována (chci se prostě zbavit neustálého obludného psaní \(\frac{1}{\sqrt{2}}\)). Mohu tedy říci, že:

$$
\begin{matrix}
a \cdot 1 &+& b \cdot 1 &= &1 \\
c \cdot 1 &+& d \cdot 1 &= &1 \\
a \cdot 1 &-& b \cdot 1 &= &-1 \\
c \cdot 1 &-& d \cdot 1 &= &1
\end{matrix}
$$

Nyní jen jednoduše sečtěme rovnice spolu, hned první a třetí rovnici, vznikne nám \(a+a = 0\), tedy je jasně vidět, že \(a=0\). Poté sečtěme 2. a 4. rovnici, tedy uvidíme \(b+b = 2\), tedy \(b=1\). Když toto vidíme, ve 4. rovnici rovnou vidíme, že \(1-d=1\), tedy \(d = 0\). No a stejně pokud vidíme z 2. rovnice \(c=1\). Tedy matice bude:

$$
\sigma_x
=
\begin{pmatrix}
0 & 1 \\ 1 & 0
\end{pmatrix}
$$

Nakonec se podívejme na výpočet \(\sigma_y\). Víme, že musí platit následující vztahy:

$$
\begin{pmatrix}
a & b \\ c & d
\end{pmatrix}
\begin{pmatrix}
\frac{1}{\sqrt{2}} \\ \frac{i}{\sqrt{2}}
\end{pmatrix}
=
+1
\begin{pmatrix}
\frac{1}{\sqrt{2}} \\ \frac{i}{\sqrt{2}}
\end{pmatrix}
$$

$$
\begin{pmatrix}
a & b \\ c & d
\end{pmatrix}
\begin{pmatrix}
\frac{1}{\sqrt{2}} \\ -\frac{i}{\sqrt{2}}
\end{pmatrix}
=
-1
\begin{pmatrix}
\frac{1}{\sqrt{2}} \\ -\frac{i}{\sqrt{2}}
\end{pmatrix}
$$

Udělejme to stejné, co jsme dělali výše:

$$
\begin{matrix}
a  &+& b i &= &1 \\
c  &+& d i &= &i \\
a &-& b i &= &-1 \\
c &-& d i &= &1
\end{matrix}
$$

Pokud sečteme 1. a 2. rovnici, vidíme, že \(2a = 0\), tedy že \(a=0\). Pokud je \(a=0\), poté musí platit, že \(bi=1\), a tedy \(b=\frac{1}{i}=-i\). Nyní sečtěme 2. a 4. rovnici, vyjde, že \(2c=2i\), tedy \(c=i\). A samozřejmě tím pádem vidíme, že \(d=0\).

Spin obecně v obecném úhlu

Těchto matic můžeme využít při určení obecných pravidel, jak se chová spin, pokud “nevíme, co měříme”, ale prostě “to měříme”. Máme-li však nějakou částici (obecně) a nastavíme-li naše měřící zařízení “do obecného úhlu” vůči spinu této částice (protže netušíme, jak to může dopadnout). Označíme-li tedy obecně nějaký náš vektor \(\mathrm{\mathbb{\vec{u}}}\) jako vektor, poté můžeme psát složkově:

$$
\vec{u}=u_x + u_y + u_z
$$

A protože vektor bude (chceme, aby byl…) jednotkový, poté bude platit pythagoras:

$$
u^2_x+u^2_y+u^2_z=1
$$

Zpět ale k rovnici výše, kde jsem rozepsal pro jednotlivé souřadné osy. Asi vidíte, kam tím mířím a proč jsem tak udělal; vektory prostě lze klasicky lineárně sčítat, no a protože operátory už máme odvozené, můžeme jich rovnou využít v obecném zápisu:

$$
u_x\hat{\sigma_x}+u_y\hat{\sigma_y}+u_z\hat{\sigma_z}=\hat{\sigma_u}
$$

Tuto lineární superpozici snadno vyřešíme, obecně to vypadá takto:

$$
A\begin{pmatrix}a & b \\ c & d\end{pmatrix}+
B\begin{pmatrix}a & b \\ c & d\end{pmatrix}+
C\begin{pmatrix}a & b \\ c & d\end{pmatrix}
=
\begin{pmatrix}
Aa+Ba+Ca & Ab+Bb+Cb \\ Ac+Bc+Cc & Ad+Bd+Cd
\end{pmatrix}
$$

Takže:

$$
\hat\sigma_u =
u_x
\begin{pmatrix}
0 & 1 \\ 1 & 0
\end{pmatrix}
+
u_y
\begin{pmatrix}
0 & -i \\ i & 0
\end{pmatrix}
+
u_z
\begin{pmatrix}
1 & 0 \\ 0 & -1
\end{pmatrix}
=
\begin{pmatrix}
u_z & u_x-iu_y \\
u_x+iu_y & -u_z
\end{pmatrix}
$$

Rovnou z této matice (doufám!) vidíme, že je hermitovská. Proto můžeme \(\hat{\sigma_u}\) použít jako operátor ve známém:

$$
\hat{\sigma_u}\begin{pmatrix}\alpha\\\beta\end{pmatrix}=\lambda\begin{pmatrix}\alpha\\\beta\end{pmatrix}$$

A samozřejmě můžeme psát:

$$
\hat{\sigma_u}\begin{pmatrix}\alpha\\\beta\end{pmatrix}=+1\begin{pmatrix}\alpha\\\beta\end{pmatrix}$$

Nyní si budeme ještě muset lehce pohrát s normalizací vektoru \(\begin{pmatrix}\alpha\\\beta\end{pmatrix}\), protože jinak by nám opět vycházely divné hodtnoty pravděpodobností, typu 400 % a tak. Jak provést tedy normalizaci?

Abychom mohli takovou věc udělat obecně, musíme udělat opět takový malý trik. Není to nic nelegálního, ale hodně nám to zjednoduší práci. Pokud víme, že vlastní vektor bude vypadat tak, jak jsem psal v předchozí větě, stejně tak, pokud vím, že pokud chci, aby byl normalizovaný, bude jednotkový a tím pádem mohu předpokládat, že i nějaký jiný vektor, který místo něho použijeme (substitucí), bude-li jednotkový a bude mít stejné vlastnosti, bude použitelný stejně jako vektor původní. Tedy pokud prohlásíme, že:

$$
\begin{pmatrix}\alpha\\\beta\end{pmatrix}=\begin{pmatrix}1\\\alpha_0\end{pmatrix}
$$

a budeme-li dále pracovat s tímto vektorem, uvidíme, že si dost ulehčíme práci a zpětně se dostaneme tam, kde jsme začali, ale budeme mít vyřešenou normalizaci. Co je tedy tato hodnota \(\alpha_0\)? Pojďme se podívat, jak toto odvodit. Víme, že budeme-li předopkládat, že vektor \(\begin{pmatrix}1\\\alpha_0\end{pmatrix}\) bude normalizován, bude se chovat jako kterékoliv jiné vlastní vektory[18]to neznamená, že je to postačující podmínka takové funkce a bude platit:

$$
\begin{pmatrix}
u_z & u_x-iu_y \\
u_x + iu_y & -u_z
\end{pmatrix}
\begin{pmatrix}
1\\\alpha_0
\end{pmatrix}
=
+1
\begin{pmatrix}
1\\\alpha_0
\end{pmatrix}
$$

Zkusme vytvořit první rovnici:

$$
u_z + \alpha_0(u_x-iu_y) =1
$$

Z toho jasně dokážeme vyjádřit \({}\alpha_0{}\): 🙂

$$
\alpha_0(u_x-iu_y)=1-u_z
\alpha_0=\frac{1-u_z}{u_x-iu_y}
$$

A můžeme dosadit:

$$
\begin{pmatrix}
1\\\alpha_0
\end{pmatrix}
=
\begin{pmatrix}
1\\\frac{1-u_z}{u_x-iu_y}
\end{pmatrix}
$$

Nicméně tento vektor tedy nejspíše pořád nebude (s největší pravděpodobností) normalizován. A s tím si musíme poradit. Musí tedy současně platit dva následující vtazhy:

$$
|\phi\rangle=
\begin{pmatrix}
1\\\alpha_0
\end{pmatrix}
\\
\phi\phi^*=1
$$

Musí tedy platit:

$$
\begin{pmatrix}
1 &\alpha_0
\end{pmatrix}
\begin{pmatrix}
1\\\alpha_0
\end{pmatrix}
=
1
$$

Budeme chvilku předpokládat, že stále “nejsme normalizováni”. Zvolme si za normalizační konstantu například \(\nu\). Potom bude platit, že normalizovaný vztah výše bude vypadat jako:

$$
|\phi\rangle=
\nu\begin{pmatrix}
1\\\alpha_0
\end{pmatrix}
$$

Můžeme tedy psát:

$$
\nu
\begin{pmatrix}
1 & \alpha_0
\end{pmatrix}
\nu
\begin{pmatrix}
1 \\ \alpha_0
\end{pmatrix}
=
1
$$

a to řešit jako

$$
\nu^2
\left(
1+\color{red}{\alpha_0^*}\color{green}{\alpha_0}
\right)
= 1
$$

To vyřešíme (dosadíme za \(\alpha_0\)):

$$
\nu^2
\left[
1+
\color{red}{
\left(
\frac{1-u_z}{u_x+iu_y}
\right)
}
\color{green}{
\left(
\frac{1-u_z}{u_x-iu_y}
\right)
}
\right]
=1
$$

A teď nastane opravdový “hustý trik” 🙂 Víme, nejprve roznásobíme (to trik ještě není):

$$
\nu^2
\left[
1+
\left(
\frac{\left(1-u_z\right)^2}{u_x^2+u_y^2}
\right)
\right]
=1
$$

A nyní nastane velký trik. Víme, že nahoře jsme pro připomenutí psali, že u jednotkového vektoru bude platit pythagorské:

$$
\color{pink}{u_x^2+u_y^2}+u_z^2=1
$$

Barevně máme označenou část, kterou však máme ve jmenovateli! Můžeme tedy místo jmenovatele psát:

$$
u_x^2+u_y^2=1-u_z^2
$$

A to nám (jak vidíte) hodně zjednoduší práci 🙂

$$
\nu^2
\left[
1+
\left(
\frac{\left(1-u_z\right)^2}{1-u_z^2}
\right)
\right]
=1
$$

Nyní můžeme rozložit jmenovatele a zkrátit:

$$
\nu^2
\left[
1+
\left(
\frac{\left(1-u_z\right)^2}{\left(1-u_z\right)\left(1+u_z\right)}
\right)
\right]
=1
$$

$$
\nu^2
\left[
1+
\frac{\left(1-u_z\right)}{\left(1+u_z\right)}
\right]
=1
$$

$$
\nu^2
\left[
\frac{\left(1+u_z\right)}{\left(1+u_z\right)}
+
\frac{\left(1-u_z\right)}{\left(1+u_z\right)}
\right]
=1
$$

$$
\nu^2
\left[
\frac{2}{\left(1+u_z\right)}
\right]
=1
$$

Z toho už snadno odvodíme \(\nu\) jako:

$$
\nu^2=
\frac{1+u_z}{2}
$$

a tedy:

$$
\nu = \sqrt{\frac{1+u_z}{2}}
$$

A tím máme normalizační faktor vyřešený. Jako zkoušku si klidně (můžete sami) dosaďte za \(u_x=1\) a ostatní prvky dejte nulové, vyjdou vám vlastní vektory, které už jsme používali. Pouze dosaďte do:

$$
|\phi\rangle=
\sqrt{\frac{1+u_z}{2}}
\begin{pmatrix}
1 \\
\frac{1-u_z}{u_x-iu_y}
\end{pmatrix}
$$

Uvidíte, že to bude vycházet 🙂

Tolik asi k normalizaci. Pokud bychom obecně připravili nějakou částici v obecném stavu a úhlu, měřili ji v jiném obecném úhlu, vyjde nám pravděpodobnost \(P=\cos^2\frac{\phi}{2}\) (využijeme při tom výpočtů, které už jsme si tady ukazovali, nic jiného). Tento článek už je poměrně dlouhý, proto ho zde nyní utněme (v nejlepším přestat, že 🙂 ) a příště se věnujme dalším věcem a zákonitostem, které s polarizacemi a spinem souvisejí.

 

Poznámky pod čarou   [ + ]

1. Pro další informace rozhodně doporučuji tento popis experimentu: ElektronovySpin.pdf.
2. Redukované planckovy konstanty, tedy \(\hbar=\frac{h}{2\pi}\).
3. Opět — osu bude mít pouze v makroskopickém světě, v případě spinu hovořit o ose rotace je chybné.
4. Komplexně konjugované číslo, pro zopakování, je číslo, které má stejnou reálnou část, ale opačnou imaginární. Sami vidíme, že u reálných čísel se jedná opravdu o “umocnění na druhou”.
5. vše vztaženo k experimentu, kdy měříme “je to u?
6. Velmi podobné ortogonálním, jen mají jednotkovou velikost. Ortogonální vektory nám říkají, že pokud je jeden “něčím”, pak ten druhý je vším jen ne “něčím”, tedy např. pokud jeden vektor popisuje stav u, poté ortogonální popisuje stav přesně ne-u, tedy d 🙂 (Ano, tyto  vektory jsou tedy lineárně nezávislé a tvoří bázi prostoru, ale lineární algebru nechme na jindy.)
7. Protože 2. mocnina čehokoliv z $latex\mathbb{R}$ bude kladné číslo.
8. Viz https://www.eng.tau.ac.il/~shtaif/PolarizationClass.pdf.
9. Co to je, jsme řešili v minulém článku.
10. Viz http://www.informationphilosopher.com/solutions/experiments/dirac_3-polarizers/
11. Viz http://alienryderflex.com/polarizer/
12. Viz polarize.pdf
13. Polarizační filtry…
14. Až na pár velmi podstatných rozdílů, které si samozřejmě záhy ukážeme.
15. Tedy proporčně budou jako \(\cos^2(\phi)\), nicméně lehko odlišné.
16. Podle fyzika Pauliho, který za svůj vylučovací princip dostal Nobelovu cenu za fyziku.
17. Viz http://planetmath.org/PauliMatrices
18. to neznamená, že je to postačující podmínka takové funkce

Polarizace a spin částice (1. část)

V minulém článku o Entropii a termodynamice jsem vám slíbil, že se zase vrátíme zpět k “nějakým částicím”. Nevrátíme se však k nějakým konkrétním, vrátíme se totiž pouze k jedné z jejich vlastností — spinu.

Ohledně spinu existuje takový problém — on se (jako vlastnost) dá jen velmi těžko představit. Můžu samozřejmě používat různých analogií, ale jak si ukážeme, když se trošku ponoříme do problematiky, dost těchto analogií (buďme upřímní — všechny) ukážou dříve či později nějaký zásadní smrtelný problém. Jak už je však zvykem, než se dáme do samých popisů spinů částic a jak s nimi fungovat, musíme si připravit lehké matematické podhoubí, abychom pochopili zákonitosti[1]Protože pokud chceme pochopit spin, musíme pochopit i ten zbytek..

Matematické základy

Budeme hojně využívat matic, vektorůkomplexních čísel. Bližší popis vektorových a maticových základních operací je mimo rozsah článku, v případě, že byste nevěděli “která bije”, o matematických operacích s vektory a maticemi doporučím některý z článků či prezentací volně ležících na internetu:

Primární studium — tedy zjistit jak co funguje:

Další materiály (sekundární studium):

Bohužel je pro pochopení článku bezpodnínečně nutné, abyste alespoň zákaldní operace s vektory znali. Není potřeba žádných “hlubokých” znalostí, ale vysvětlovat co je to vektor či matice je bohužel mimo rozsah tohoto článku.

Nyní tedy jen stručně — jedna ze zákaldních operací, kterou budeme potřebovat, je maticový součin:

$$ \begin{pmatrix}a & b\end{pmatrix} \begin{pmatrix}c\\d\end{pmatrix}=a\cdot c + b \cdot d$$

$$\begin{pmatrix}a_{11} & a_{12} \\ a_{21} & a_{22}\end{pmatrix} \begin{pmatrix}b_1 \\ b_2\end{pmatrix} = \begin{pmatrix}a_{11}b_1 + a_{12}b_2 \\ a_{21}b_1 + a_{22}b_2\end{pmatrix}$$

Ohledně komplexních čísel budeme muset znát pojem komplexně sdružené číslo, což je takové číslo, jehož imaginární složka je převrácená. Označujeme “hvězdičkou”:

$$ X = a + \mathrm{i}b$$

$$ X^{*} = a – \mathrm{i}b$$

Diracova notace, systém bra-ket

Nyní, když víme, co budeme potřebovat jako teoretický základ, můžeme se s chutí vrhnout na to, co slibuje samotný podnadpis, tedy  na tzv. Diracovo[2]či Diracovou, ale to se mi dost příčí notaci, nebo-li systém bra-ket.

Jak jste si zajisté všimli, slovo “bra” a “ket” dohromady v angličtině dají slovo “bra/c/ket” — tedy “závorky” 🙂 Velmi roztomilé. Každopádně systém je tvořen dvěma vektory:

Vektor bra (ano, podprsenka…), který vypadá následovně:

$$\langle{}a | = \begin{pmatrix}a_1 & a_2\end{pmatrix}^*$$

Tedy jedná se o řádkový vektor, kde jsou čísla navíc komplexně sdružená. U reálných hodnot toto samozřejmě nemá vliv (pokud komplexně sdružíte reálné číslo, získáte to samé reálné číslo), nicméně v případě s výpočty v komplexní rovině na to nesmíte zapomenout.

Vektor ket vypadá takto:

$$ |a\rangle = \begin{pmatrix}a_1 \\ a_2\end{pmatrix}$$

Samozřejmě bych mohl zobecnit do \(n\) dimenzí, ale pro zjednodušení teď uvažujme pouze dvě. S více dimenzemi se setkáme později, až se toto budeme snažit prakticky ukázat na polarizaci fotonu a elektronu.

S těmito vektory můžete provádět veškeré operace, na které jste zvyklí od běžných vektorů — např. součet dvou ket vektorů:

$$|a\rangle +|b\rangle= \begin{pmatrix}a_1 \\ a_2\end{pmatrix} + \begin{pmatrix}b_1 \\ b_2\end{pmatrix} = \begin{pmatrix}a_1+b_1\\a_2+b_2\end{pmatrix}$$

Co je pro nás však důležité (z hlediska fyziky), pokud vynásobíme bra vektor vektorem ket. Tedy:

$$\langle{}a|b\rangle$$

Toto můžeme pojmenovat jako skalární součin[3]Pro potřeby tohoto článku budu označovat takto, nicméně skalární součin normálně funguje bez komplexně sdružených čísel, takže toto ve své podstatě není “až tak” běžný skalární součin. Správně bych měl třeba nazývat konjugovaný sk. součin, ale jsem moc líný to psát takto dlouhé — proto odteď budu psát pouze “skalární součin”. Děkuji za pochopení. a velmi dobře ho známe z běžných výpočtů s vektory[4]Pro další informace doporučuji bezvadný zdroj všech možných matematických informací — web MatFyzu :-): http://wiki.matfyz.cz/index.php?title=16._Formalizmus_kvantov%C3%A9_teorie.

Můžeme tedy psát (pro dvourozměrný prostor):

$$\langle{}a|b\rangle = \begin{pmatrix} a_1^* & a_2^* \end{pmatrix} \begin{pmatrix} b_1 \\ b_2 \end{pmatrix} = a_1^*b_1+a_2^*b_2$$

Výsledkem je tedy číslo, nikoliv vektor. Zkusíme-li nyní udělt komplexně sdruženou variantu toho součinu:

$$\langle{}a|b\rangle^* = a_1b_1^* + a_2b_2^*$$

Nyní už asi vidíme, že pokud bych otočil vektory:

$$\langle{}b|a\rangle = a_1b_1^* + a_2b_2^*$$

dostaneme totéž. Můžeme tedy s klidným svědomím psát:

$$\langle{}a|b\rangle = \langle{}b|a\rangle^*$$

Než budeme pokračovat dále, musíme se lehce zaměřit na matice a operace nad nimi. Pro ilustraci použiji 3×3 matice, ale samozřejmě bude fungovat v libovolných dimenzích. Začněme tedy popisem matice — jak jistě víte, matice má hlavní diagonálu:

$$A_{ij} = \begin{pmatrix}a_{11} & … & … \\ … & a_{22} & … \\ …  & … & a_{33}\end{pmatrix}$$

A můžeme z matice udělat matici transponovanou, jednoduše to znamená, že přehodíme (zrcadlově) podle osy hlavní diagonály hodnoty. Jinými slovy přehodíme řádky a sloupce. Značíme indexem \(T\):

$$\begin{pmatrix}a_{11} & a_{12} \\ a_{21} & a_{22}\end{pmatrix}^T = \begin{pmatrix} a_{11} & a_{21} \\ a_{12} & a_{22}\end{pmatrix}$$

Samozřejmě platí, že transponujeme-li dvakrát za sebou stejnou matici, získáme zpět tu první.

Dále je snad samozřejmé, že pokud budeme chtít komplexně sdružené hodnoty z matice, musíme udělat všechny komplexně sdružené hodnoty všech prvků:

$$\begin{pmatrix}a_{11} & a_{12} \\ a_{21} & a_{22}\end{pmatrix}^* = \begin{pmatrix}a_{11}^* & a_{12}^* \\ a_{21}^* & a_{22}^*\end{pmatrix}$$

Samozřejmě můžeme výše uvedené dvě matice “zkombinovat” — tedy transponovat a ještě převést na komplexně sdružené hodnoty. Takovou matici značíme “křížkem” (v angličtině dagger — čili dýka):

$$\begin{pmatrix}a_{11} & a_{12} \\ a_{21} & a_{22}\end{pmatrix}^\dagger = \begin{pmatrix} a_{11}^* & a_{21}^* \\ a_{12}^* & a_{22}^*\end{pmatrix}$$

Nyní prozkoumejme, co se stane, pokud použijeme např. následující matici:

$$\begin{pmatrix}1 & 2+i3 \\ 2-i3 & 4\end{pmatrix}^\dagger$$

Pokud uděláme “křížkovanou matici”, zjistíme, že se bude rovnat sama sobě, tedy:

$$\begin{pmatrix}1 & 2+i3 \\ 2-i3 & 4\end{pmatrix}^\dagger = \begin{pmatrix}1 & 2+i3 \\ 2-i3 & 4\end{pmatrix}$$

Pokud něco takového nastane, můžeme o naší matici tvrdit, že je hermitovská.

Zkusme nyní, co se stane, zkusíme-li vynásobit matici a ket vektor:

$$A|b\rangle=\begin{pmatrix} a_{11} & a_{12} \\ a_{21} & a_{22}\end{pmatrix} \begin{pmatrix} v_1 \\ v_2\end{pmatrix}$$

a dostaneme:

$$A|b\rangle=\begin{pmatrix} a_{11} & a_{12} \\ a_{21} & a_{22}\end{pmatrix} \begin{pmatrix} v_1 \\ v_2\end{pmatrix} = \begin{pmatrix} a_{11}v_1 + a_{12}v_2 \\ a_{21}v_1 + a_{22}v_2 \end{pmatrix}$$

Abychom tady pořád jen nepísmenkovali, zkusme si to ukázat prakticky na příkladu:

$$\begin{pmatrix}1 & 1+i \\ 1-i & 2 \end{pmatrix} \begin{pmatrix}1 \\ 0 \end{pmatrix} = \begin{pmatrix}1 \cdot 1 + (1+i) \cdot 0 \\ (1-i) \cdot 1 + 2 \cdot 0\end{pmatrix} = \begin{pmatrix}1\\ 1-i\end{pmatrix}$$

Zpátky k fyzice

Po krátké cestě do útrob matematiky se opět můžeme vrátit k fyzice a k tomu, k čemu všechny tyto matematické věci využijeme. Po cestě samozřejmě přidáme ještě nějaké další, ale výše uvedené jsou takovou “matematickou startovací čárou” pro pochopení věcí dalších.

Budeme se bavit o polarizaci částic, konkrétně světla, tedy fotonů. Co je to vlastně polarizace? K čemu slouží? Nejjednoduššeji si ji lze představit prostřednictvím obrázku. Mějme nějaký zdroj nepolarizovaného světla — např. žárovku, LED[5]Nikdy prosím nepište LED diodu, to je jazykově špatně., něco takového.

zdroj světlaZ tohoto zdroje se šíří nepolarizované světlo, tzn. že nemá žádnou “polaritu”. Tím je myšleno, že jeho vlny jdou “ve všech směrech” současně. Neplést s nehomogenním světelným zdrojem, což je zdroj, který vysílá světlo “na všech frekvencích”. Světelný zdroj tedy může být polarizovaný homogenní, nepolarizovaný homogenní, polarizovaný nehomogenní a nepolarizovaný nehomogenní.

Abychom takové světlo “zpolarizovali”, potřebujeme nějaký polarizátor, případně polarizační filtr. Polarizační filtr je zařízení, které propustí světlo pouze které má nějakou konkrétní polarizaci. Pro zjednodušení si nyní určeme tři základní směry:

  • doprava doleva se budeme pohybovat po ose \(x\).  Světlo polarizovaní po ose \(x\) bude světlo s horizontální polarizací
  • nahoru dolů se budeme pohybovat po ose \(y\). Světlo takto polarizované bude mít vertikální polarizaci.
  • dopředu a dozadu se nacházíme na ose \(z\). Světlo takto polarizované bude mít taktéž horizontální polarizaci.

Pro zjednodušení však nejdříve budeme uvažovat pouze dva směry, tedy doprava/doleva a nahoru/dolů. Přidejme proto do našeho situačního plánku takový polarizační filtr a pošleme skrz něho paprsek světla:

paprsek

Tento paprsek bude mít po průchodu takovým polarizátorem vertikální polarizaci, tedy bude mít polarizaci po ose \(y\). Pokud bychom nyní zkoušeli, co se s takovým paprskem dále stane, zařadíme-li do něho další polarizátor, zjistíme, že zařadíme-li další vertikální \(y\) polarizátor, světlo neztratí nic ze své intenzity[6]samozřejmě v ideálních podmínkách s ideálními filtry atd. a bude mít intenzitu 100 % intenzity před druhým filtrem:

dvojitá polarizace stejným směrem

Naopak pokud druhý filtr otočíme o 90 °, bude výstupem 0% intenzita — všechno světlo se během sekundární polarizace ztratí:

dvojitá polarizace různým směrem

Pokud budeme s druhým filtrem různě otáčet, dostane se nám různé vělkých intenzit na výstupu takové kaskády; tyto intenzity budou dokonce záviset přímo na rozdílu úhlu těchto filtrů, konrétně faktorem \(\cos^2(\alpha)\). Nicméně zde končí běžný “makroskopický” svět našich dobře nám známých představ.

Když si totiž uvědomíme, že intenzita světla odpovídá \(I = \mathrm{k}E^2\), potom by mohlo vypadat, že s klesající intenzitou bude klesat i energie záření — a tím podle známého \(E=hf\) by měla klesat i frekvence záření. Nicméně to se neděje. A již za okamžik si vysvětlíme proč — jedná se totiž o kvantové jevy, které jsou pro člověka, který je zvyklý na běžné makroskopické jevy, poměrně nepřirozené.

Je nutné nad světlem (byť polarizovaným) uvažovat jako nad proudem částic. Druhý polarizátor nedělá nic jiného, než že propustí ty fotony, které splňují podmínky propuštění a “zamítne” fotony, které nesplňují takové podmínky. Avšak ty fotony, které propustí, těm energii nemění. Nenastává tedy změna energie fotonu, pouze množství fotonů, které se propustí. A to je dost zásadní rozdíl.

Pojďme se nyní podívat, jak funguje světlo jako proud částic. Využijme k tomu výše uvedených dvou polarizačních filtrů. Již jsme si představili braket vektory, nyní je můžeme využít prakticky. Trošku “ze vzduchu” nyní vypustím jeden důležitý vztah — který shodou okolností krásně popisuje kvantové jevy:

$$H|a\rangle=\lambda|a\rangle$$

Rovnice[7]Někdo v tom zajisté uvidí emotikonu vyjadřující předek autobusu 🙂 vyjadřuje, jakým způsobem se chovají částice v mikrosvětě. Zkusme nyní pomocí této rovnice vyjádřiv výše uvedené situace s dvěma polarizačními filtry. Ze začátku budu házet trochu “náhodné” hodnoty do matic, prosím zatím mi důvěřujte, postupně se dostanu i k jejich vyjádření, nyní však chci, abychom se podívali prakticky na využití rovnice.

Co jednotlivé komponenty rovnice znamenají? Nyní jen stručně:

  • \(\langle{}H|\) vyjadřuje matici[8]o které se časem dozvíme, že je Hermitovská, která vyjadřuje nějaké “hodnoty v experimentu”.
  • \(|a\rangle\) je tzv. vlastní vektor, který určuje stav systému.
  • \(\lambda\) je tv. vlastní číslo, které určuje výstup z experimentu.
  • \(|a\rangle\) je opět ten stejný vlastní vektor, jako o několik bodů výše. Všimněme si, že tento vektor je opravdu stejný jako na začátku reakce.

Pokud budeme tedy uvažovat vertikálně polarizované světlo (či proud částic obecně) a přiřadíme následující vektory:

  • horizontální polarizace: \(|x\rangle= \begin{pmatrix}1\\0\end{pmatrix}\)
  • vertikální polarizace: \(|y\rangle= \begin{pmatrix}0\\1\end{pmatrix}\)

Můžeme se ptát následujícím bra-ketovým zápisem:

$$\langle{}x|y\rangle$$

Tedy slovy: Jaká je pravděpodobnostní amplituda, že připravíme-li částici, která bude mít \(y\) polarizaci, projde taková částice filtrem s \(x\) polarizací? Samozřejmě se můžeme ptát pak i obecně na libovolný úhel, ale o tom až později.

Proč však pouze “pravděpodobností amplituda”? Protože abychom získali pravděpodobnost, musíme použít:

$$\langle{}x|y\rangle\langle{}y|x\rangle$$

Nicméně jak jsme ukázali výše, toto se dá zapsat i jako:

$$\langle{}x|y\rangle\langle{}x|y\rangle^*$$

Využijeme tedy komplexně sdružených čísel. Budeme-li však uvažovat pouze reálná čísla, kde je imaginární složka nulová, můžeme pak s klidným svědomím psát, že pravděpodobnost takového jevu je:

$$\langle{}x|y\rangle^2$$

Zpět k praktickému příkladu — jaká je tedy pravděpodobnost, že horizontálně polarizovaná částice projde filtrem s vertikální polarizací?

$$ \langle{}x|y\rangle^2 = \begin{pmatrix}1 & 0\end{pmatrix}^* \begin{pmatrix}0\\1\end{pmatrix} = 0$$

Výpočet tedy odpovídá realitě, protože pro kolmé roviny polarizace částice a polarizačního filtru, je pravděpodobnost opravdu nulová.

Stejně tak zjistíme, že pro stejnou polarizaci částice i směr filtru dostaneme:

$$ \langle{}x|y\rangle^2 = \begin{pmatrix}1 & 0\end{pmatrix}^* \begin{pmatrix}1\\0\end{pmatrix} = 1$$

Čili opět odpovídající stav realitě — v takovém případě máme 100% pravděpodobnost, že taková částice projde.

Vraťme se nyní k našemu (starému známému) \(H|a\rangle=\lambda|a\rangle\).

Nyní opět “vystřelím” do vzduchu a napíšu, jak takové \(H\) vypadá, vysvětlení však přijde později (odvození). Myslím si, že pro pochopení toho, jak to odvodit, je dobré nejdříve vědět, jak tato “věc” funguje. Potom už je odvození otázka chvilky 🙂

Řekněme, že tato Hermitovská matice má tvar \(\begin{pmatrix}1&0\\0&-1\end{pmatrix}\).

Potom, co uděláme \(H|x\rangle=\lambda|x\rangle\)  zjistíme, že:

$$\begin{pmatrix}1 & 0\\0 & -1\end{pmatrix}\begin{pmatrix}1\\0\end{pmatrix}$$

můžeme vyřešit jako:

$$\begin{pmatrix}1 & 0\\0 & -1\end{pmatrix}\begin{pmatrix}1\\0\end{pmatrix}=\begin{pmatrix}1\cdot1 + 0\cdot 0 \\ 0 \cdot 1 – 1 \cdot 0\end{pmatrix} = \begin{pmatrix}1 \\ 0\end{pmatrix}$$

Podíváme-li se na výše uvedenou formuli:

$$\color{blue}H|\color{red}a\rangle=\color{pink}\lambda|\color{red}a\rangle$$

a zapíšeme-li maticově tedy jako:

$$\color{blue}{\begin{pmatrix}1 & 0\\0 & -1\end{pmatrix}}\color{red}{\begin{pmatrix}1\\0\end{pmatrix}}=\color{red}{\begin{pmatrix}1 \\ 0\end{pmatrix}}$$

a tedy pouze doplníme \(\color{pink}\lambda\) a získáme:

$$\color{blue}{\begin{pmatrix}1 & 0\\0 & -1\end{pmatrix}}\color{red}{\begin{pmatrix}1\\0\end{pmatrix}}=\color{pink}\lambda\color{red}{\begin{pmatrix}1 \\ 0\end{pmatrix}}$$

Vidíme, že \(\lambda=1\). Nyní se zkusme podívat, co se stane, pokud použijeme ket \(|y\rangle\):

$$\color{blue}{\begin{pmatrix}1 & 0\\0 & -1\end{pmatrix}}\color{red}{\begin{pmatrix}0\\1\end{pmatrix}}=\color{pink}\lambda\color{red}{\begin{pmatrix}0 \\ 1\end{pmatrix}}$$

Spočítáme-li součin hermitovské matice a ketu na levé straně rovnice, dostaneme:

$$\begin{pmatrix}1 & 0\\0 & -1\end{pmatrix}\begin{pmatrix}0\\1\end{pmatrix}=\begin{pmatrix}1\cdot0 + 0\cdot 1 \\ 0 \cdot 0 – 1 \cdot 1\end{pmatrix} = \begin{pmatrix}0 \\ -1\end{pmatrix}$$

Abychom tedy dostali stejný vlasní vektor vpravo i vlevo, vlastní číslo \(\lambda\) musí být \(\color{pink}{\lambda=-1}\) a tedy:

$$\color{blue}{\begin{pmatrix}1 & 0\\0 & -1\end{pmatrix}}\color{red}{\begin{pmatrix}0\\1\end{pmatrix}}=\color{pink}{-1}\color{red}{\begin{pmatrix}0 \\ 1\end{pmatrix}}$$

Co nám tedy hodnota \(\lambda\) říká? Prakticky si ji můžeme představit jako “krabičku”[9]Prostě blackbox 🙂 , která nám nějakým indikátorem (třeba LED) říká, jestli to, co nastavujeme (stav systému, tedy ket) je v experimentu (zde bra) potvrzeno (\(\lambda\)) či nikoliv.

Polarizace s obecným úhlem

Zkusme se nyní podívat na situaci, kdy máme nějakým směrem (ať už horizontálně či vertikálně) polarizovaný paprdek svěla a proženeme ho polarizátorem, který je natočený nějakým obecným úhlem \(\phi\).

Začněme nejdříve trošku “méně obecnou” variantou, vlastně docela dost konkrétní — nastavme polarizační filtr pod úhlem 45 °. Jenže — vyvstává problém, jak vektorově reprezentovat možnost natočení pod tímto úhlem. Nabízí se (ne až tak špatné) řešení, které má však své drobné úskalí, jež ale velmi záhy překonáme a vyřešíme.

Představme si tedy nyní situaci, kdy máme vertikálně polarizovaný paprsek světla a postavíme před něho polarizátor v úhlu 45 ° “doprava” — tedy jako lomítko “/” 🙂 Jakým způsobem tedy reprezentovat toto “lomítko?” Dalo by se říci (přiblížit se cíli), že pokud je polarizátor pod takovýmto úhlem, je nastaven vlastně “někde akorát mezi” — tedy ani ne moc horizontálně, ale ani ne moc vertikálně.

Mohli bychom tedy zkusit vyslovit hypotézu, že výsledná polarizace bude něco jako součet horizontálního a vertikálního polarizátoru — tedy něco jako \(|x\rangle + |y\rangle\). To je poměrně dobrá myšlenka, ale přivádí nám některá úskalí, která si nyní ukážeme.

Víme, že vlastní vektory jsou vektory[10]Už jen proto, že se tak jmenují, ale hlavně se tak i chovají 🙂 , takže s nimi můžeme dělat i běžné vektorové operace, jako třeba součet:

$$\color{blue}{|x\rangle} + \color{violet}{|y\rangle} =
\color{blue}{\begin{pmatrix} 1 \\ 0 \end{pmatrix}}+\color{violet}{\begin{pmatrix} 0 \\ 1\end{pmatrix}}
=\begin{pmatrix} 1 \\ 1 \end{pmatrix}$$

Nyní však experiment — pokud vezmeme světlo polarizované pod úhlem 45 ° a proženeme ho filrem pod stejným úhlem, musí nám vyjít, že máme opět 100 % světla, která jsme tam vpustili, i na druhé straně, tedy označíme-li takový polarizační filtr jako \(|/\rangle\) a zdroj světla jako \(\langle/|\), dostaneme:

$$\left(|\langle{}/|/\rangle{}|\right)^2=\left(\begin{pmatrix}1 & 1\end{pmatrix}\begin{pmatrix} 1 \\ 1 \end{pmatrix}\right)^2 = 2^2 = 4$$

Čili, jak vidíme, vyjde nám 400% pravděpodobnost, že foton projde. To je sice dost působivé, nicméně potřebovali bychom (tak nějak logicky) dostat, že nám prostě vyjde 100 %. A toho docílíme metodou normalizace.

Nejjednoduššeji bychom řekli, že chceme ze čtyřky udělat jedničku, takže prostě podělíme čtyřmi a máme jedničku — ve své podstatě vlastně ano, ale pokud bychom si chvilku s vektry hráli a zjišťovali, čím vstup podělit, aby na výstupu bylo 4krát menší číslo, přišli bychom na vztah:

$$\frac{|x\rangle + |y\rangle}{\sqrt{2}}$$

Zkusme nyní ověřit:

$$\begin{pmatrix}\frac{1}{\sqrt{2}} & \frac{1}{\sqrt{2}}\end{pmatrix}\begin{pmatrix}\frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{2}}\end{pmatrix}=\frac{1}{\sqrt{2}}\cdot\frac{1}{\sqrt{2}} + \frac{1}{\sqrt{2}}\cdot\frac{1}{\sqrt{2}} = \frac{1}{2} + \frac{1}{2} = 1$$

Skvělé! Takže máme předpis, který pro takovou polarizaci můžeme použít. Zcela intuitivně též odhadneme, jak bude vypadat vzorec pro polarizační filtr o 45 ° na druhou stranu, tedy jako lomítko “\” — vertikální složka (tedy \(|x\rangle\)) zůstane stejná, horizontální složka bude opačná (tedy \(-|y\rangle\)):

$$\frac{|x\rangle – |y\rangle}{\sqrt{2}}=\begin{pmatrix}\frac{1}{\sqrt{2}} \\ -\frac{1}{\sqrt{2}}\end{pmatrix}$$

Nyní tedy zkusme, jak by dopadlo, pokud bychom vzali polarizované světlo ve směru “opačného lomítka \” a pustili ho přes filtr “běžného lomítka /?”  Víme, že výsledek musí být nulový, ověřme proto funkci:

$$
|\left\langle\color{red}/|\color{violet}\setminus\right\rangle|^2=
\left(
\color{red}{\begin{pmatrix}\frac{1}{\sqrt{2}} & \frac{1}{\sqrt{2}}\end{pmatrix}}
\color{violet}{\begin{pmatrix}\frac{1}{\sqrt{2}}\\-\frac{1}{\sqrt{2}}\end{pmatrix}}
\right)^2=
\left(
\color{red}{\frac{1}{\sqrt{2}}}\cdot\color{violet}{\frac{1}{\sqrt{2}}}-
\color{red}{\frac{1}{\sqrt{2}}}\cdot\color{violet}{\frac{1}{\sqrt{2}}}
\right)^2=0
$$

Nyní, když víme, že naše vektory pro zápis polarizačního filtru jsou funkční, můžeme opět stejně, jako jsme měli výše, provést pokus s Hermitovskou maticí[11]tentokrát trochu jinou, později se opravdu dostanu k odvození toho, proč zrovna takovou 🙂 :

$$
H|/\rangle=\lambda|/\rangle
\\
\begin{pmatrix}
0 & 1 \\
1 & 0
\end{pmatrix}
\cdot
\begin{pmatrix}
\frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{2}}
\end{pmatrix}
=
\begin{pmatrix}
\frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{2}}
\end{pmatrix}
=
\lambda\cdot
\begin{pmatrix}
\frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{2}}
\end{pmatrix}
$$

Vidíme tedy, že vlastní vektory se opět rovnají, a tedy \(\lambda=1\) taktéž.

Krátké shrnutí

Shrňme si nyní v krátkosti, jak vypadají jednotlivé vektory pro různé úhly polarizace:

  • Vertikální polarizace, tedy “|” : \(0|x\rangle+1|y\rangle=\begin{pmatrix}0 \\ 1\end{pmatrix}\)
  • Horizontální polarizace, tedy “–” : \(1|x\rangle+0|y\rangle=\begin{pmatrix}1 \\ 0\end{pmatrix}\)
  • Šikmá polarizace “/” : \(\frac{1}{\sqrt{2}}|x\rangle+\frac{1}{\sqrt{2}}|y\rangle=\begin{pmatrix}\frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{2}}\end{pmatrix} \)
  • Šikmá polarizace “\” : \(\frac{1}{\sqrt{2}}|x\rangle-\frac{1}{\sqrt{2}}|y\rangle=\begin{pmatrix}\frac{1}{\sqrt{2}} \\ -\frac{1}{\sqrt{2}}\end{pmatrix} \)[12]Ve své podstatě je téměř jedno, jestli dáte do záporu \(x\) nebo \(y\), protože výsledek bude prakticky stejný — stejně jako je jedno, jestli uděláte při např. vertikální polarizaci opačně \(y\), pro světlo je to jedno 🙂

Možná už je trošku z tohoto shrnutí vidět, co vlastně reprezentují jednotlivá čísla zapsaná v těchto takto zapsaných vlastních vektorech. Jedná se (opět, narazili jsme na to ze začátku textu) o pravděpodobnostní amplitudu, což je neměřitelná veličina, která právě v kvantovém světě popisuje krásně tyto jevy. Pokud umocníme absolutní hodnotu této veličiny na druhou, dostaneme pravděpodobnost, jakou projde částice filtrem právě s takovou pravděpodobnostní amplitudou.

Jak je to tedy s obecným vztahem pro obecný úhel?

Podívejme se nyní na to, jak bychom obecně vyjádřili vlastní vektor pro obecný úhel. Podíváme-li se na běžný graf, kde jsem zakreslil nějaký obecný jednotkový vektor pod úhlem \(\phi\)…

Základní diagram obecného vektoru
Základní diagram obecného vektoru

Dá nám smysl, že tento jednotkový vektor vytkne na ose \(x\) právě \(\cos{\phi}\) a na ose \(y\) právě \(\sin{\phi}\) jednotek těchto os.  Zkusme tedy předpokládat, že bychom mohli tvrdit následující (což vypadá poměrně logicky):

$$
|\phi\rangle=
\begin{pmatrix}
\cos{\phi}\\\sin{\phi}
\end{pmatrix}
=
\cos{\phi}|x\rangle + \sin{\phi}|y\rangle
$$

Stejně jako u všech vektorů, pokud chceme vytvořit kolmý vektor (v tomto případě dokonce ortogonální, tedy takový, který má přesně opačné vlastnosti jako první vektor[13]Či lidově — vše, co je tuto, přesně není tamto 😀 ), uděláme “trik” s prohozením a otočením, tedy obecně vektor \(\begin{pmatrix}x \\ y\end{pmatrix}\) převedeme na \(\begin{pmatrix}y \\ -x\end{pmatrix}\). Nazvěme si tedy náš první vektor kupříkladu \(\phi_{\alpha}\) a náš druhý \(\phi_{\beta}\):

$$
\phi_{\alpha}=
\begin{pmatrix}
\cos{\phi}\\\sin{\phi}
\end{pmatrix}
$$

$$
\phi_{\beta}=
\begin{pmatrix}
\sin{\phi}\\-\cos{\phi}
\end{pmatrix}
$$

Ověřme nyní hypotézu o průchodu dvěma polarizátory (případně hypotézu o průchodu polarizovaných fotonů kolmo orientovaným polarizátorem):

$$
\left\langle \phi_{\alpha}|\phi_{\beta}\right\rangle=
\begin{pmatrix}
\cos{\phi} & \sin{\phi}
\end{pmatrix}
\begin{pmatrix}
\sin{\phi} \\ -\cos{\phi}
\end{pmatrix}
=
\cos{\phi}\sin{\phi}-\sin{\phi}\cos{\phi}
=
0
$$

Tedy potvrzeno 🙂 Zkusme pro jistotu ještě dvě stejnosměrné polarizace:

$$
\left\langle \phi_{\alpha}|\phi_{\alpha}\right\rangle=
\begin{pmatrix}
\cos{\phi} & \sin{\phi}
\end{pmatrix}
\begin{pmatrix}
\cos{\phi} \\ \sin{\phi}
\end{pmatrix}
=
\cos{\phi}\cos{\phi}+\sin{\phi}\sin{\phi}
=
\cos^2{\phi}+\sin^2{\phi}
=
1
$$

Nyní se podívejme, jaká pravděpodobnost průchodu částice bude, pokud připravíme částici s obecnou polarizací pod úhlem \(\phi\) a polarizační filtr nastavíme horizontálně:

$$
\left(
|
\left\langle x | \phi \right\rangle
|
\right)^2
=
\left(
\begin{pmatrix}
1 & 0
\end{pmatrix}
\begin{pmatrix}
\cos{\phi} \\ \sin{\phi}
\end{pmatrix}
\right)^2
=
\left(
1\cdot\cos{\phi} + 0\cdot\sin{\phi}
\right)^2
=
\cos^2{\phi}
$$

No, tak výborně 🙂 Stejným způsobem bychom mohli spočítat pravděpodobnost průchodu, pokud není polarizační filtr nastaven horizontálně, ale vertikálně, vyjde to prostě stejně. Nyní tedy nezbývá než udělat naprosto obecný případ.

Mějme tedy zdroj nějakého světla, který proženeme dvěma polarizačními filtry, každý nastaven pod určitým obecným úhlem, první např. pod úhlem \(\phi_\alpha \) a druhý pod úhlem \(\phi_\beta\). Podrobme naše výpočty tomuto testu. Nejprve tedy připravíme světelný paprsek filtrem \(\phi_\alpha\), poté pokračujeme dále k filtru \(\phi_\beta\):

$$
\left|
\left\langle\beta|\alpha\right\rangle
\right|^2
=
\left(
\begin{pmatrix}
\cos\beta & \sin\beta
\end{pmatrix}
\begin{pmatrix}
\cos\alpha \\ \sin\alpha
\end{pmatrix}
\right)^2
=
\left(
\cos\beta\cos\alpha + \sin\beta\sin\alpha
\right)^2
=
\cos(\alpha-\beta)^2
$$

Možná se budete divit, jak jsem se dostal k poslednímu kroku — je to nějaký vzoreček, stejně jako \(\cos^x+\sin^2x=1\), platí i tento vzoreček 🙂 Dále — proč tam není rozdíl úhlů třeba opačný — opět, je to jedno, protože platí \(\cos{x}=\cos{-x}\).

Tím jsme si tedy potvrdili funkci těchto “stavebních bloků”. Vraťme se nyní na chvilku k původnímu vzorci:

$$ H|a\rangle=\lambda|a\rangle$$

A právě k Hermitovské matici \(\hat{H}\). Výše jsme si ukázali nějaké příklady na tuto matici, nicméně zkusme ji nyní trošku zobecnit. Nejprve napíšu, jak “to s ní vypadá” a poté rozebereme, co se s takovou maticí dá dále dělat 🙂

$$
\hat{H}=
\begin{pmatrix}
\cos2\phi & \sin2\phi \\
\sin2\phi & -\cos2\phi
\end{pmatrix}
$$

Existují dva “vzorečky”, které zde využijeme:

$$\cos2\phi=\cos^2\phi-\sin^2\phi$$

$$\sin2\phi=2\sin\phi\cos\phi$$

Těch zde využijeme a přepíšeme do matice. Pro zjednodušení teď vynechám neustálé psaní \(\phi\) a \(2\phi\):

$$
\hat{H}=
\begin{pmatrix}
\cos2\phi & \sin2\phi \\
\sin2\phi & -\cos2\phi
\end{pmatrix}
=
\begin{pmatrix}
\cos^2-\sin^2 & 2\cos\sin \\
2\cos\sin & \sin^2 – \cos^2
\end{pmatrix}
$$

Použijeme-li tedy předpisu \(\hat{H}|\phi\rangle=\lambda|\phi\rangle\) a použijeme-li v něm nám již známé prvky, dostaneme:

$$
\hat{H}|\phi\rangle=\lambda|\phi\rangle
\\
\begin{pmatrix}
\cos^2-\sin^2 & 2\cos\sin \\
2\cos\sin & \sin^2 – \cos^2
\end{pmatrix}
\begin{pmatrix}
\cos \\ \sin
\end{pmatrix}
=
\lambda
\begin{pmatrix}
\cos \\ \sin
\end{pmatrix}
$$

Mělo by tedy platit, že produkt na levé straně bude stejný jako vektor na pravé straně. Udělejme tedy několik základních algebraických úprav:

$$
\begin{pmatrix}
\cos^2-\sin^2 & 2\sin\cos \\
2\sin\cos & \sin^2-\cos^2
\end{pmatrix}
\begin{pmatrix}
\cos \\ \sin
\end{pmatrix}
=
\begin{pmatrix}
\cos^3-\sin^2\cos+2\sin^2cos \\
2\cos^2\sin + \sin^3 – \cos^2\sin
\end{pmatrix}
= \\ =
\begin{pmatrix}
\cos^3+\sin^2\cos \\
\cos^2\sin + \sin^3
\end{pmatrix}
=
\begin{pmatrix}
\cos\left(\cos^2+\sin^2\right) \\
\sin\left(\cos^2+\sin^2\right)
\end{pmatrix}
=
\begin{pmatrix}
\cos \\
\sin
\end{pmatrix}
$$

Vidíme tedy, že produkt na levé straně je opravdu stejný, jako vektor na straně pravé, vlastní číslo je tedy \(\lambda=1\) 🙂 Stejně tak to bude fungovat i pokud použijeme vektoru ortogonálního, tedy \(\begin{pmatrix}-\sin \\ \cos\end{pmatrix}\), jen samozřejmě vyjde \(\lambda=-1\) dle očekávání — kolmý filtr na rovinu polarizace nepropustí nic.

Další pokračování článku

V dalším pokračování článku, která vydám v nedaleké budoucnosti, se budeme věnovat zvláštnímu typu polarizace, tedy kruhové polarizaci, potom spinu částice a dalším zajímavostem, tak se těšte 🙂

Poznámky pod čarou   [ + ]

1. Protože pokud chceme pochopit spin, musíme pochopit i ten zbytek.
2. či Diracovou, ale to se mi dost příčí
3. Pro potřeby tohoto článku budu označovat takto, nicméně skalární součin normálně funguje bez komplexně sdružených čísel, takže toto ve své podstatě není “až tak” běžný skalární součin. Správně bych měl třeba nazývat konjugovaný sk. součin, ale jsem moc líný to psát takto dlouhé — proto odteď budu psát pouze “skalární součin”. Děkuji za pochopení.
4. Pro další informace doporučuji bezvadný zdroj všech možných matematických informací — web MatFyzu :-): http://wiki.matfyz.cz/index.php?title=16._Formalizmus_kvantov%C3%A9_teorie
5. Nikdy prosím nepište LED diodu, to je jazykově špatně.
6. samozřejmě v ideálních podmínkách s ideálními filtry atd.
7. Někdo v tom zajisté uvidí emotikonu vyjadřující předek autobusu 🙂
8. o které se časem dozvíme, že je Hermitovská
9. Prostě blackbox 🙂
10. Už jen proto, že se tak jmenují, ale hlavně se tak i chovají 🙂
11. tentokrát trochu jinou, později se opravdu dostanu k odvození toho, proč zrovna takovou 🙂
12. Ve své podstatě je téměř jedno, jestli dáte do záporu \(x\) nebo \(y\), protože výsledek bude prakticky stejný — stejně jako je jedno, jestli uděláte při např. vertikální polarizaci opačně \(y\), pro světlo je to jedno 🙂
13. Či lidově — vše, co je tuto, přesně není tamto 😀

Temná energie

Abychom se mohli podívat na temnou energii, musíme uvést alespoň pár věcí na pravou míru. Nejprve — co to vůbec taková temná energie je a jakým způsobem vůbec víme, že něco takového s nejvyšší pravděpodobností bude existovat.

Když E. Hubble v roce 1923 rozšířil hranice nám známého vesmíru a potvrdil (pozorováním a měřením vzdáleností), že mlhovina v Andromedě není jen nějaká další mlhovina, ale celá galaxie, která je navíc několikrát větší než naše Galaxie, nutně narazil na pár poznatků, které doslova otřásly dosavadní vědeckou komunitou a přidaly další pilíře poznání vesmíru a tedy i světa kolem nás.

Jedním z těchto pilířů bylo i objevení faktu, že vesmír se rozpíná. Všiml si totiž, že vzdálenější galaxie se od té naší vzdalují rychleji než ty bližší a usoudil z toho, že prostor doslova “vzniká” mezi těmito galaxiemi .

Z tohoto poznání plyne ještě jedna zajímavost — pokud se vesmír rozpíná a budeme-li předpokládat, že tomu tak vždy bylo, zcela logicky musel existovat bod v časoprostoru, kdy vesmír byl nekonečně malý.  K tomuto bodu poznání se dnešní vědci a teoretičtí fyzikové neustále blíží, na základě různých pozorování a měření jsou schopni neustále blíže se přiblížit bodu, kdy byl vesmír pouze tzv. singularitou (anebo byl doopravdy? Někteří totiž tvrdí, že se nejednalo o pravou singularitu, ale pouze o velmi zhuštěný vesmír).

Nyní se již však vrhněme na samotné odvození.

Hubbleova konstanta

Velmi často budeme operovat s tzv. Hubbleovo konstantou, musíme tedy vědět, co to je 🙂 Představme si, že máme třeba balónek, na kterém máme nakresleny tečky[1]jedná se o klasický příklad s populárně naučnou metodou, jak ukázat rozpínání vesmíru, ale použijeme ji jako základ i tady. Když se tento balónek bude roztahovat (tedy nafukovat) a budeme-li předpokládat, že balónek je z dokonale elasticky homogenního materiálu[2]tedy takového, který se rozpíná všude stejně, potom se všechny tečky budou oddalovat naprosto stejně. Udělejme si “grafický” příklad na několika takových tečkách, pro zjednodušení budeme uvažovat pouze jednu souřadnou osu, jako kdybychom tečky nakreslili třeba na gumičku, kterou bychom roztahovali (výsledek by byl samozřejmě stejný):

Grafická reprezentace roztahující se gumičky
Grafická reprezentace roztahující se gumičky

Pokud bychom popsali takto gumičku čísly a začali ji roztahovat, samozřejmě se jednotlivá čísla a proužky od sebe začnou vzdalovat:

Roztahující se gumička
Roztahující se gumička

Jakým způsobem můžeme něco takového vyjádřit matematicky? Jednoduše. Označme si, že vzdálenost \(D\) bude závislá na součinu souřadnic \(\Delta x\) a vzdálenosti mezi těmito souřadnicemi \(a(t)\) [3]časová závislost vzdálenost mezi šouřadnicemi je nutná, protože budeme řešit rozpínání v čase:

$$\begin{equation}\label{\eqref}D = \Delta x \cdot a(t)\end{equation}$$

Zderivujeme-li tento výraz podle času:

$$\frac{\mathrm{d}D}{\mathrm{d}t} = \Delta x \frac{\mathrm{d}a(t)}{\mathrm{d}t}$$

A uděláme-li malý matematický “trik”, tedy že vynásobíme celou rovnici jedničkou (tedy rovnice se nezmění), kde však jednička bude \(\frac{a}{a}\), dostaneme:

$$\frac{\mathrm{d}D}{\mathrm{d}t} = \Delta x \frac{\mathrm{d}a(t)}{\mathrm{d}t} \cdot \frac{a}{a}$$

A vidíme, že některé věci už známe — tedy uvnitř se nám znovu ukázala vzdálenost \(D = \Delta x \cdot a(t)\), kterou si můžeme vyjádřit:

$$\frac{\mathrm{d}D}{\mathrm{d}t} = D \frac{\mathrm{d}a(t)}{a \cdot \mathrm{d}t}$$

Nyní trošku odbočme — abychom se v tom lépe vyznali, zaveďme fyzikální zápis derivace tečkou, tedy že:

$$\frac{\mathrm{d}X}{\mathrm{d}t} = \dot X$$

Výše uvedený vzorec tak můžeme zjednodušit na:

$$\dot D = D \frac{\dot a}{a}$$

A samozřejmě si musíme uvědomit, že \(\dot D = v\) — rychlost, potom:

$$v = D \frac{\dot a}{a}$$

Důležitý je poslední zlomek, tedy \(\frac{\dot a}{a}\) — ten si označme jako \(H\) a je to právě Hubbleova konstanta, tedy:

$$v = D \frac{\dot a}{a}= D H$$

Z toho jasně můžeme vidět vztah: Pokud totiž víme, jakou rychlostí se od sebe vzdalují galaxie ve vesmíru (tedy \(v\)), můžeme jasně říci, jak jsou od sebe vzdáleny, \(D\) 🙂 A samozřejmě i opačně, tedy čím vzdálenější od sebe objekty jsou, tím rychleji se budou pohybovat. Nutno ještě říci, že Hubbleova konstanta \(H\) je takovou konstantou “napůl” — je totiž konstantní všude ve vesmíru v prostoru, ale nikoliv v čase, prostě s časem se mění. Je tedy fixní pouze v prostoru, nikoliv v čase.

Představme si tedy nějaký výsek vesmíru, kde vidíme jednotlivé galaxie[4]ponechme teď stranou, že bychom je nejspíše samotným okem neviděli tak, jak jsou na obrázku reprezentovány tečkami:

Galaxie jako tečky
Galaxie jako tečky

Zvolme si jednu tečku jako “naši Galaxii” a označme ji třeba nějakou barvou:

Naše Galaxie označena červěně
Naše Galaxie označena červěně

Tečku s Galaxií[5]Možná by bylo vhodné dát na pravou míru označování vesmírných objektů, je v tom, myslím si, dost velký nepořádek. Pokud napíši “Galaxie” s velkým “G”, myslím tím naši galaxii, ve které se nachází Sluneční soustava. Pokud se řekne “Mléčná dráha”, jedná se o pruh více viditelných hvězd na noční obloze, tyto termíny se poměrně zhusta zaměňují, celý název je Galaxie v Mléčné dráze, zkráceně Galaxie. Pokud píši “galaxie”, tedy s malým “g”, myslím tím jakákoliv jiná galaxie než Galaxie 🙂 Doufám, že už v tom nebude zmatek. rovnou prohlásím za střed vztažné soustavy, tedy tečka se nikam nebude hýbat a budu ji považovat za takový “nulový bod” se souřadnicemi [0, 0, 0, 0, …] (podle toho, kolik rozměrů budu potřebovat). Vybereme-li si teď libovolnou jinou galaxii a budeme-li měřit vzdálenost od Galaxie, naměříme vzdálenost \(D\).

Vzdálenost a vektor rychlosti
Vzdálenost a vektor rychlosti

Na obrázku vidíme zeleně zobrazenou vzdálenost a fialově vektor rychlosti. Newtonův teorém[6]Newton, Isaac (1687). Philosophiae Naturalis Principia Mathematica. London. pp. Theorem XXXI. nám říká, že na libovolný objekt, který se nachází na povrchu koule, jejímž středem bude naše Galaxie, bude působit gravitace celé hmoty v kouli obsažené a že body a hmota mimo tuto kouli se “anuluje” (gravitačně samozřejmě):

Hmoty, Newtonovy zákony
Hmoty, Newtonovy zákony

Pokud je množství hmota uvnitř koule rovno \(M\), galaxie, kterou měříme má hmotu \(m\), můžeme psát staré známé:

$$F = \kappa \frac{M m}{D^2}$$

A samozřejmě můžeme poté vyjádřit potenciální energii takové galaxie, protože víme, že:

$$E_p = \int_{\infty}^{D} F \mathrm{d}D$$

a tedy můžeme dosadit:

$$E_p = \int_{\infty}^{D} F \mathrm{d}D = \int_{\infty}^{D} \kappa\frac{Mm}{D^2} \mathrm{d}D = -\kappa\frac{Mm}{D}$$

Samozřejmě celková energie \(E\) takové galaxie bude součtem kinetické a potenciální energie:

$$ E = E_k + E_p$$

čili

$$ E = \frac{1}{2}mv^2 -\kappa\frac{Mm}{D}$$

Energie musí zůstat konstantní, protože platí zákon o zachování energie, tedy:

$$ E = \frac{1}{2}mv^2 – \kappa\frac{Mm}{D} = k$$

Trošku si pohrajeme s tímto vzorcem, vynásobíme nejdříve obě strany dvojkou, abychom se zbavili té dvojky vlevo:

$$ E = mv^2 – 2\kappa\frac{Mm}{D} = 2k$$

a podělíme celou rovnici \(m\):

$$ E = v^2 – 2\kappa\frac{M}{D} = \frac{2k}{m} = k$$

a vidíme, že vpravo máme pořád konstantu 🙂 Sice bude jiná, než \(k\) před tím, ale pořád bude konstantní, tedy budeme psát stále \(k\) 😉 Zkusme nyní dosadit dříve ukázané hodnoty, tedy \(D = \Delta x \cdot a(t)\) a \(v = \Delta x \cdot \dot a(t)\) do tohoto vzorce:

$$ \Delta x^2 \cdot \dot a(t)^2 – 2\kappa\frac{M}{\Delta x \cdot a(t)} = k $$

Pokud si uvědomíme, že hustota tělesa či soustavy těles se snadno spočte jako:

$$ \rho  = \frac{M}{V}$$

kde \(\rho\) odpovídá hustotě, \(M\) odpovídá hmotě systému a \(V\) odpovídá objemu. Objem koule (viz dříve, kdy jsem psal o Newtonově gravitačním zákonu) se spočítá samozřejmě jako:

$$V = \frac{4}{3}\pi D^3$$

Můžeme tedy upravit vzorec pro hustotu a vyjádřit \(M\) jako:

$$M = \frac{4}{3} \pi D^3 \rho(t)$$

Protože se \(\rho(t)\) mění v čase (jak se vesmír rozpíná), musíme s ním tak i počítat a uvést ho jako proměnný v čase. Toto \(M\) dosadit do vzorce s konstantou, který jsme odvodili výše, pro připomenutí:

 $$ \Delta x^2 \cdot \dot a(t)^2 – 2\kappa\frac{M}{\Delta x \cdot a(t)} = k $$

Dosadíme-li tedy \(M\) do tohoto vzorce, poté:

 $$ \Delta x^2 \cdot \dot a(t)^2 – 2\kappa\frac{\frac{4}{3}\pi D^3 \rho(t)}{\Delta x \cdot a(t)} = k $$

Rozepíšeme-li zmíněné \(D\) na to, co jsme psali výše, tedy \(D = \Delta x a(t)\), potom dostaneme:

$$ \Delta x^2 \dot a(t)^2 – 2\kappa\frac{\frac{4}{3}\pi {\color{red}{\Delta x^3a(t)^3}} \rho(t)}{\color{red}{\Delta x a(t)}} = k $$

Červeně jsem zvýraznil to, co můžeme zkrátit, proto to zkraťme:

$$ \Delta x^2 \dot a(t)^2 – 2\kappa \frac{4}{3}\pi \Delta x^\color{red}{2} a(t)^\color{red}{2} \rho(t) = k $$

Teď se nelekejte, nastane velký trik. Budeme totiž zjednodušovat. Aby nám dimenzionálně seděly proměnné, muselo by platit, že máme \(\Delta x^2\) vlevo i vpravo, ale vpravo vidíme pouze konstantu. Nicméně protože víme, že to musí dimenzionálně sedět[7]Aby nám rovnice dimenzionálně seděla, musíme mít prostě srovnané dimenze jednotlivých členů. Protože předpokládáme, že to počítáme správně, budeme se muset držet i tohoto zákona. V uvedené rovnici vidíme, že máme srovnané dimenzionálně pouze dva členy, tedy ten s derivací a ten druhý bez derivace. V konstantě tudíž musíme předpokládat, že se nějaký prvek ze stejné dimenze taktéž bude nacházet a tím pádem můžeme pokrátit., víme i, že v té konstantě musí být nějakým způsobem \(\Delta x^2\) obsaženo a můžeme proto \(\Delta x\) pokrátit, tedy:

$$ \color{red}{\Delta x^2} \dot a(t)^2 – \color{green}{2}\kappa \frac{\color{green}{4}}{3}\pi \color{red}{\Delta x^{2}} a(t)^{2} \rho(t) = k $$

$$ \dot a(t)^2 – \kappa \frac{\color{green}{8}}{3}\pi a(t)^{2} \rho(t) = k $$

Zde se \(k\) samozřejmě bude lišit od \(k\) před krácením, ale je to pořád nějaká konstanta, i když je jiná. Co v ní je nás vlastně ani moc v tento moment nezajímá. Zeleně jsem ještě zvýraznil malé zjednodušení.

Nyní můžeme celou rovnici podělit \(a(t)^2\) a dostat tedy:

$$ \frac{\dot a(t)^2}{\color{red}{a(t)^2}} – \kappa \frac{8}{3}\pi\frac{a(t)^{2} \rho(t)}{\color{red}{a(t)^2}} = \frac{k}{\color{red}{a(t)^2}} $$

a dostaneme tak (po přeházení členů):

$$ \color{green}{\frac{\dot a(t)^2}{a(t)^2}} = \color{red}{\frac{8}{3}\pi\kappa \rho(t)} – \color{blue}{\frac{k}{a(t)^2}}$$

Toto je zjednodušená varianta Friedman-Walker-Robertsonovy rovnice[8]Na wiki např.:
https://en.wikipedia.org/wiki/Friedmann%E2%80%93Lema%C3%AEtre%E2%80%93Robertson%E2%80%93Walker_metric
[9]odkaz na PDF s dalšími hrátkami s rovnicemi:
http://www.ita.uni-heidelberg.de/~dullemond/lectures/cosmology_2011/Chapter_4.pdf
[10]Dále už jen FWRr., na které si nyní ukažme další zajímavé souvislosti.

Rozdělme nyní rovnici na 3 části, které jsem zvýraznil v textu barevně. Začněme červeným prvkem \(\frac{8}{3}\pi\kappa\rho(t)\). Co o něm můžeme z hlediska “kladnosti a zápornosti” prohlásit? Všechny členy uvnitř jsou vždy kladné (buď jsou to konstanty, čísla anebo \(\rho(t)\), které je vždy kladné, protože hustota je vždy kladná) — a tedy celý tento červený prvek je vždy kladný.

Nyní se podívejme na modrý člen \(-\frac{k}{a(t)^2}\), kde už to začíná býti trošku zajímavé. Pokud bychom řekli, že konstanta \(-k\)[11]Jinými slovy se touto konstantou označuje tzv. křivost vesmíru bude vždy kladná (ano, i s tím minus), poté to znamená, že součet dvou členů v pravé části rovnice bude vždy kladný a to by znamenalo, že vesmír se bude neustále rozpínat. V levé části rovnice máme totiž Hubbleovu konstantu (na druhou), která nám říká, jak moc se vesmír rozpíná. Protože by toto číslo v čase bylo vždy kladné, znamenalo by to logicky, že by se tak vesmír neustále rozpínal “do nekonečna”. Tento stav označujeme jako tzv. otevřený vesmír. Bude-li naopak konstanta \(-k\) záporná (tedy samotné \(k\) bude kladné), poté by to mohlo znamenat (pokud by byla absolutní hodnota členu větší než toho červeného), že se vesmír v čase smršťuje, tedy tzv. uzavřený vesmír. No a nakonec varianta, kdy se konstanta bude rovnat nule, to znamená, že se sice vesmír rozpíná, ale konverguje asymptoticky k určitému bodu, kdy už se více rozpínat nebude (tento bod se nachází časově v nekonečnu). Této variantě říkáme plochý vesmír.

Pojďme se těmto variantám věnovat trošku detailněji. Vezměme si nějaký úsek vesmíru a pro zjednodušení použijme krychlovou výseč (šlo by to i s kulovou a jakoukoliv jinou, ale chci minimalizovat množství písmenek). Krychle má rozměr strany \(a\) a hmota v ní obsažená je opět \(M\), prostě:

Klasická krychle
Klasická krychle

Víme, že objem krychle \(V = a^3\) a tedy snadno odvodíme, že hustota \(\rho = \frac{M}{a^3}\). Této znalosti můžeme využit a můžeme dosadit do FWRr a dostaneme:

$$ \frac{\dot a(t)^2}{a(t)^2} = \frac{8}{3}\pi\kappa \color{red}{\frac{M}{a(t)^3}} – \frac{k}{a(t)^2}$$

Na základě pozorování a měření je zjištěno, že vesmír se s největší pravděpodobností chová jako plochý, tedy můžeme výraz zjednodušit na:

$$\frac{\dot a(t)^2}{a(t)^2} = \frac{8}{3}\pi\kappa \color{red}{\frac{M}{a(t)^3}}$$

Nyní bychom tedy chtěli vyřešit takovou rovnici pro \(a(t)\), což je dost netriviální záležitost. Nejjednodušší metodou tedy je učinit odhad, který se pokusíme napasovat do našeho výrazu.

Řekněme tedy, že obecně se bude \(a(t)\) rovnat polynomu \(Ct^p\), kde \(C\) je nějaká konstanta, \(t\) označuje čas a \(p\) je obecná mocnina:

$$a(t) = C t^p$$

Ještě si samozřejmě musíme spočítat hodnotu první derivace \(\dot a(t)\), tedy:

$$\dot a(t) = p C t^{p-1}$$

(použil jsem klasická pravidla pro derivování polynomu). Čemu je tedy rovna Hubbleova konstanta?

$$H = \frac{\dot a(t)}{a(t)} = \frac{p\color{red}{C}t^{p-1}}{\color{red}{C}t^p} = \frac{p\color{brown}{t^{p-1}}}{\color{brown}{t^p}}=\frac{p}{\color{brown}{t}}$$

Červeně a poté hnědě jsem zvýraznil krácení ve výrazu. Nyní již můžeme dosadit do FWRr:

$$ \frac{p^2}{t^2} = \frac{8}{3}\pi\kappa \frac{M}{\color{red}{a(t)^3}}$$

Ještě můžeme dosadit za červeně označené \(a(t) = Ct^p\):

$$ \frac{p^2}{t^{\color{blue}2}} = \frac{8}{3}\pi\kappa \frac{M}{C^3t^{\color{blue}{3p}}}$$

Nyní je opět čas oprášit naše známé dimenze — aby nám rovnice seděla, musí nám hlavně sedět dimenze. A co vidíme? Zvýrazněné modré exponenty nám musí sedět, tedy pokud máme na levé straně rovnice \(t^2\), musíme ho mít i na straně pravé. Je tedy jasné, že \(p=\frac{2}{3}\). Můžeme tedy napsat, že \(a(t)=Ct^{\frac{2}{3}}\).

Taková funkce má průběh:

Závislost a na t
Závislost a na t

Jak vidíme z tohoto excelového grafu, průběh funkce je krásně zaoblen a neustále se zpomaluje růst. Tento graf nám ukazuje rozpínání vesmíru, pokud ho uvažujeme jako hmotový. Tedy takový, kde převažuje množství hmoty  (proto jsme počítali s \(M\)). Nicméně ne vždy tomu tak bylo, v prvopočátcích vesmíru vzniklo velké množství hmoty a antihmoty. Pokud dáme k sobě dvě vzájemné antičástice, dokonale anihilují a vznikne foton — tedy se vyzáří “čistá” energie.  Veškerá hmota a antihmota tedy anihilovala a vyzářilo se tak obrovské množství pravděpodobně vysoceenergetických fotonů — a zbylo také malé množství hmoty — hmoty, která je vším, co v dnešním vesmíru pozorujeme. Do důsledku by tak šlo říci, že vše, co jsme a vše co vidíme je jen důsledkem nepatrné asymetrie v prvopočátcích vesmíru 🙂

Představme si tedy znovu náš “krychlový výsek” vesmíru se stranou \(a\), ale tentokrát v něm nebude hmota \(M\), ale fotony. Pro zopakování uvedu, že energii fotonu můžeme vyjádřit jako \(E = h f\), resp. \(E = \frac{hc}{\lambda}\)[12]Viz článek Malý nenásilný úvod do fyziky černých děr na mém hlavním blogu. Pokud se vesmír rozpíná a bude se rozpínat i náš krychlový výsek, bude se i zvětšovat vlnová délka \(\lambda\) takových fotonů, tedy samozřejmě energie takových fotonů bude klesat. Pozorováním tzv. kosmického záření (cosmic microwave background radiation) v pásmu mikrovln (což je o dost jinde, než byly asi původní gamapaprsky) se přesvědčujeme, že tato “radiační” fáze vesmíru nejspíše proběhla. Pozorováním těchto vesmírných paprsků tak vlastně koukáme na “vesmírnou archeologii”, vidíme, co se událo před spoustou miliard let jako pozůstatek kdysi ohromné zářivé energie.

Jak jsme si řekli, energie fotonu \(E\) proporčně odpovídá tedy převrácené hodnotě vlnové délky, tedy \(\frac{1}{\lambda}\), což současně odpovídá zvětšujícím se rozměrům, tedy \(\frac{1}{a}\). Můžeme tedy tvrdit, že:

$$ E = \frac{N}{a}$$

tedy že energie fotonů proporčně (přes konstantu \(N\)) odpovídá takto roměru \(a\). Energetická hustota “zářícího vesmíru” (povšimněte si, že se opět snažíme vyjádřit hustotu) tak bude odpovídat:

$$ \rho_E = \frac{N}{a} \frac{1}{V} = \frac{N}{a} \frac{1}{a^3} = \frac{N}{a^4}$$

Pro připomenutí, hustota hmotného vesmíru byla \(E = \frac{M}{a^3}\). Zkusme si dané dva průběhy graficky načrtnout:

Průběhy funkcí M/a^3 a N/a^4
Průběhy funkcí M/a^3 a N/a^4

Energetickou hustotu můžeme dosadit do FWRr, akorát místo hmotové hustoty dáme právě tuto energetickou:

$$ \frac{\dot a(t)^2}{a(t)^2} = \frac{8}{3}\pi\kappa \frac{N}{a(t)^4}$$

Pokud provedeme stejný odhad jako minule, dostaneme:

$$ \frac{p^2}{t^\color{blue}2} = \frac{8}{3}\pi\kappa \frac{N}{C^4 t^{\color{blue}{4p}}}$$

a aby nám opět seděly dimenze, vidíme, že \(p=\frac{1}{2}\).

Vraťme se nyní ke grafům; načrtněme si, jak by vypadaly průběhy velikostí vesmíru v závislosti na čase. Budeme-li uvažovat čistě radiační vesmír, ten se zpočátku velmi rychle rozpínal (jedná se o 4. mocninu), ale pak už dále “moc neroste”, tedy asi jako takto žlutě obarvený průběh:

Radiační vesmír
Radiační vesmír

Nicméně pokud se podíváte výše na graf \(\rho\) vs \(a\), uvidíte bod, ve kterém se dva průběhy protnou. V tomto momentě začal namísto “radiačního vesmíru”[13]tuty pojmy nemám úplně rád, prostě radiation dominant universematter dominant universe, tedy vesmír s převahou záření a vesmír s převahou hmoty převažovat právě ten hmotový. Měřením bylo zjištěno, že tento stav se stal relativně velmi brzy po vzniku vesmíru, věří se, že někdy kolem 10 000 let po tzv. Velkém třesku.

V tomto momentě tedy začne převažovat hmotový vesmír, který stoupá mnohem rychleji, alespoň zpočátku:

Radiační a hmotový vesmír
Radiační a hmotový vesmír

Takto bychom se po zelené křivce postupně dostávali do stavu, kdy by se rozpínání vesmíru postupně zpomalovalo, nicméně pozorujeme, že tomu tak není, pozorovaný stav je naznačen růžovým průběhem:

Rozpínání vesmíru -- co doopravdy pozorujeme
Rozpínání vesmíru — co doopravdy pozorujeme

A musí tedy nutně existovat nějaká další síla či energie, která toto způsobuje. Pojďme si shrnout základní znalosti, které jsme si odvodili:

  • Pro vesmír s převládající hmotou
    • Hustota: \(\rho = \frac{M}{a^3}\)
    • Vesmír se rozpíná v čase podle: \(a \sim t^{\frac{2}{3}}\)
  • Pro vesmír s převládájícím zářením
    • Hustota záření: \(\rho = \frac{N}{a^4}\)
    • Vesmír se rozpíná v čase podle: \(a \sim t^{\frac{1}{2}}\)

Podívejme se na tuto problematiku ještě z hlediska termodynamiky. Vrhněme se nejdříve na vesmír s převládající hmotou. Pokud si opět uděláme nějakou krychlovou výseč, ve které si představíme galaxie, pro připomenutí obrázek:

Klasická krychle
Klasická krychle

Pak se ptáme, jakým tlakem bude hmota a galaxie působit na desky krychle? Tlak bude nulový, protože galaxie se prostě nechovají jako částice, které skáčí tam a zpět, prostě “tam jsou” a v klidu “nic nedělají”[14]samozřejmě pro zjednodušení. Můžeme tedy psát, že:

$$P = 0$$

Trošku složitější to bude ve vesmíru s převládající radiací. Pro zjednodušení si představme jednodimenzionální pohyb částice (fotonu), který cestuje rychlostí \(c\) mezi krajními body, jejichž vzdálenost je \(L\).

Foton cestuje mezi krajními body.
Foton cestuje mezi krajními body.

Jaký je tlak \(P\) na jednu či druhou krajní pozici? Víme, že tlak se dá vyjádřit jako:

$$ P = \frac{F}{A}$$

kde \(F\) je síla a \(A\) je plocha, na kterou síla působí. Síla na konci dráhy, bude vyjádřena jako změna momentu hybnosti, tedy:

$$ F = \frac{\mathrm{d}p}{\mathrm{d}t}$$

Jak je velké \(\mathrm{d}p\)? Musíme si uvědomit, že se nejedná o pohyb částice, který u hranice zastaví, ale stejnou rychlostí se bude pohybovat na druhou stranu. Změna hybnosi částice tak bude dvojnásobná, tedy \(\mathrm{d}p = 2p\). Jak bude velké \(\mathrm{d}t\)? Čas dostaneme podělením vzdálenosti rychlostí pohybu, tedy \(t=\frac{2L}{c}\) — opět, dvojnásobná vzdálenost, páč částice cestuje tam i zpět. Toto můžeme dosadit do vzorce pro sílu a získáme:

$$ F = \frac{\mathrm{d}p}{\mathrm{d}t} = {\color{red}{2}p} \frac{c}{\color{red}{2}L} = \frac{pc}{L}$$

Ale pozor, výraz \(pc\) už je nám povědomý, jedná se totiž o energii částice \(E = pc\). Můžeme tedy psát:

$$F = \frac{E}{L}$$

Což by krásně fungovalo v jednom rozměru, ale musíme si uvědomit, že máme v našem případě (použili jsme krychli) rozměry 3. Foton tedy může cestovat jak tam a zpět po ose \(x\), \(y\) a nebo i \(z\). Pokud do naší kdychle zakreslím pohyb jednoho nějakého “testovacího” fotonu po ose x, bude to vypadat následovně:

Foton a pohyb v jedné ose
Foton a pohyb v jedné ose

Vyznačil jsem plochu \(\mathrm{d}A\), na kterou bude takový foton působit. Víme, že tlak je:

$$ P = \frac{F}{A}$$

a tedy v našem případě:

$$ P = \frac{F}{L\mathrm{d}A}$$

a co je délka krát plocha? To je objem 🙂 Tedy:

$$ P = \frac{E}{V} = \rho$$

Současně je to i hustota energie \(\rho\), i když ne zcela přesně. Musíme si totiž uvědomit, že foton se pohybuje po komponentech všech os, budeme navíc uvažovat, že zcela náhodně a tedy do všech stejně, bude tedy tlak pouze třetinový:

$$P = \frac{\rho}{3}$$

Můžeme tak zobecnit, že tlak se bude rovnat:

$$ P = w\rho$$

kde \(w\) je právě nějaká konstanta — pro hmotový vesmír bude nulová, pro radiační bude právě tato jedna třetina.

Nyní si představme, že máme píst (hranatý krychlový třeba) s nějakým plynem a umožníme mu, aby se trochu zvětšil objem — prostě tak, jak píst normálně funguje. Tedy víme, že práce takového děje bude:

$$ W = F \mathrm{d}d$$

kde \(d\) je nějaká vzdálenost pohybu pístu. Víme též, že \( F = P A\), tedy můžeme psát, že:

$$ W = P A \mathrm{d}d$$

No a opět — co je součet plochy a dráhy — objem, tedy v našem případě tedy:

$$ W = P \mathrm{d}V$$

No a jak tutu práci částice konají? Tím, že musí nějakou svoji energii obětovat. Energie přímo souvisí s teplotou, tedy můžeme psát, že změna energie vyvolává změnu objemu:

$$ \mathrm{d}E = -P\mathrm{d}V$$

Také víme, že celková energie odpovídá součinu energetické hustoty s objemem:

$$ E = \rho V$$

a tedy že

$$ \mathrm{d}E = \rho \mathrm{d}V + V\mathrm{d}\rho$$

Výše jsme si ukázali, že

$$ \mathrm{d}E = -P\mathrm{d}V$$

a tedy můžeme psát:

$$ \rho \mathrm{d}V + V\mathrm{d}\rho = -P\mathrm{d}V$$

Vyjádříme:

$$ V \mathrm{d}\rho = -(P+\rho)\mathrm{d}V$$

a protože jsme si řekli, že \(P = w\rho\), můžeme dosadit:

$$ V \mathrm{d}\rho = -(w\rho +\rho)\mathrm{d}V$$

$$ V \mathrm{d}\rho = -(w + 1)\rho\mathrm{d}V$$

a tedy můžeme popřehazovat:

$$ \frac{\mathrm{d}\rho}{\rho} = -(w+1)\frac{\mathrm{d}V}{V}$$

Vyřešíme jako logaritmickou rovnici:

$$ \mathrm{d}\log\rho = -(w+1)\mathrm{d}\log V$$

diferenciálů se zbavíme:

$$ \log\rho = -(w+1)\log V$$

$$ \log \rho = \log V^{-(w+1)}$$

a tedy můžeme zpětně odlogaritmovat:

$$ \rho = \frac{C}{V^{(w+1)}}$$

Samozřejmě víme, že \(V = a^3\) a můžeme dosadit:

$$ \rho = \frac{C}{a^{3(w+1)}}$$

 Pokud víme, že pro hmotově převažující vesmír platí, že \(w=0\), potom snadno ověříme, že:

$$ \rho = \frac{C}{a^3}$$

Což je potvrzením toho, co jsme již napsali výše 😉 A samozřejmě i funguje, pokud dosadíme za \(w=\frac{1}{3}\) pro vesmír s převažujícím zářením:

$$ \rho = \frac{C}{a^4}$$

Můžeme dosadit znovu do FWRr (ano, vítej zpět!), tedy:

$$ \frac{\dot a(t)^2}{a(t)^2} = \frac{8}{3}\pi\kappa \rho = \frac{8}{3}\pi\kappa \frac{C}{a^{3(w+1)}}$$

Takže jsme se dostali znovu termodynamickou oklikou tam, kde už jsme byli před tím — ale tentokrát to máme krásně zobecněno a navíc máme možnost hrátek s \(w\). Co by se stalo, pokud bychom \(w=-1\)? 🙂

V jmenovateli bychom na pravé straně bychom dostali dělení “jedničkou” (cokoliv na nultou je jedna) a tedy bychom dostali konstantní výraz!

$$ \frac{\dot a(t)^2}{a(t)^2} = \frac{8}{3}\pi\kappa \frac{C}{a^0} = \frac{8}{3}\pi\kappa \rho_0 $$

Takovou konstantu označujeme \(\rho_0\). Takovéto pravé straně rovnice říkáme kosmologická konstanta a můžeme tedy psát:

$$ \frac{\dot a(t)}{a(t)} = H = \sqrt{\frac{8}{3}\pi\kappa\rho_0} $$

obě strany roznásobíme \(a(t)\) a dostaneme:

$$ \dot a(t) = a(t)\sqrt{\frac{8}{3}\pi\kappa\rho_0} $$

A řešením takové rovnice (diferenciální) je exponenciální funkce:

$$ a = Ce^{\sqrt{\frac{8}{3}\pi\kappa\rho_0}t}$$

A protože je to klasická exponenciální rovnice, která je velmi prudce a neustále rosoucí, i vesmír se rozpíná stále rychleji — což je přesně to, co se doopravdy pozoruje a jak se vesmír jeví, že se chová. Co způsobuje tuto akceleraci? Právě temná energie, což je hypotetická energie vakua a energie, kterou sdílí veškerá hmota.

Vzpomínátel-li na tento obrázek, kde jsme řešili závislost energetické hustoty na rozměrech:

Průběhy funkcí M/a^3 a N/a^4
Průběhy funkcí M/a^3 a N/a^4

Můžeme graf obohoatit ještě o naši kosmologickou konstantu:

Průběhy hustot energií, včetně kosmologické konstanty
Průběhy hustot energií, včetně kosmologické konstanty

A tam vidíme jasně, že nejprve se předběhly grafy radiačního vesmíru a hmotového, ale pak i vesmíru, který se rozpíná pomocí temné energie. A to je přesně to, co jsme v obrázku s rozměry vesmíru v závislosti na čase kreslili:

Rozpínání vesmíru -- co doopravdy pozorujeme
Rozpínání vesmíru — co doopravdy pozorujeme

Co je tato temná enrgie? To vlastně nevíme. Víme jen, jak se projevuje a jaké má vlastnosti. Její původ je nám ale zatím skrytý. Pokud se vesmír takto “urychluje” s rozpínáním, jednou samozřejmě se dostaneme do bodu, kdy se z rychlosti:

$$ v = H D$$

stane jednoduše

$$ c= H D$$

a tedy všechny galaxie a objekty, které budou vzdálenější než \(D\) se pro nás stanou neviditelné, neexistující. V současnosti se uvádí, že velikost pozorovatelného vesmíru je 10–12 miliard světelných let. Tedy už velkou část vesmíru nevidíme. A BUDE HŮŘ! 😀

Užívejte dne a věřím, že vás tento článek obohatil 😉

Poznámky pod čarou   [ + ]

1. jedná se o klasický příklad s populárně naučnou metodou, jak ukázat rozpínání vesmíru, ale použijeme ji jako základ i tady
2. tedy takového, který se rozpíná všude stejně
3. časová závislost vzdálenost mezi šouřadnicemi je nutná, protože budeme řešit rozpínání v čase
4. ponechme teď stranou, že bychom je nejspíše samotným okem neviděli
5. Možná by bylo vhodné dát na pravou míru označování vesmírných objektů, je v tom, myslím si, dost velký nepořádek. Pokud napíši “Galaxie” s velkým “G”, myslím tím naši galaxii, ve které se nachází Sluneční soustava. Pokud se řekne “Mléčná dráha”, jedná se o pruh více viditelných hvězd na noční obloze, tyto termíny se poměrně zhusta zaměňují, celý název je Galaxie v Mléčné dráze, zkráceně Galaxie. Pokud píši “galaxie”, tedy s malým “g”, myslím tím jakákoliv jiná galaxie než Galaxie 🙂 Doufám, že už v tom nebude zmatek.
6. Newton, Isaac (1687). Philosophiae Naturalis Principia Mathematica. London. pp. Theorem XXXI.
7. Aby nám rovnice dimenzionálně seděla, musíme mít prostě srovnané dimenze jednotlivých členů. Protože předpokládáme, že to počítáme správně, budeme se muset držet i tohoto zákona. V uvedené rovnici vidíme, že máme srovnané dimenzionálně pouze dva členy, tedy ten s derivací a ten druhý bez derivace. V konstantě tudíž musíme předpokládat, že se nějaký prvek ze stejné dimenze taktéž bude nacházet a tím pádem můžeme pokrátit.
8. Na wiki např.:
https://en.wikipedia.org/wiki/Friedmann%E2%80%93Lema%C3%AEtre%E2%80%93Robertson%E2%80%93Walker_metric
9. odkaz na PDF s dalšími hrátkami s rovnicemi:
http://www.ita.uni-heidelberg.de/~dullemond/lectures/cosmology_2011/Chapter_4.pdf
10. Dále už jen FWRr.
11. Jinými slovy se touto konstantou označuje tzv. křivost vesmíru
12. Viz článek Malý nenásilný úvod do fyziky černých děr na mém hlavním blogu.
13. tuty pojmy nemám úplně rád, prostě radiation dominant universematter dominant universe, tedy vesmír s převahou záření a vesmír s převahou hmoty
14. samozřejmě pro zjednodušení

Entropie a termodynamické zákony

V článku o odvození rovnice ideálního plynu jsme nakousli několik termodynamických zákonitostí, nicméně bylo by dobré, abychom se na termodynamiku podívali i trochu obecněji a do hloubky.

Rovnici idálního plynu jsme si již odvodili, nyní však pro připomenutí:

$$PV=nRT$$

kde \(P\) odpovídá tlaku plynu, \(V\) jeho objemu, \(n\) molárnímu množství plynu, \(R\) je plynová konstanta a \(T\) odpovídá teplotě plynu.

Dále využijeme 1. termodynamického zákona, který nám stručně říká, že změna vnitřní energie nějaké soustavy odpovídá součtu změn práce a přijatého tepla, tedy[1]Další informace kupříkladu na http://fyzika.jreichl.com/main.article/view/581-prvni-termodynamicky-zakon :

$$\mathrm{d}u = \mathrm{d}w + \mathrm{d}q$$

 Využijme těchto znalostí při prohlídce obyčejného pístu a válce:

píst bez popisků

 Zeleně je zobrazen nějaký (ideální) plyn, šedivě potom píst, černé jsou kontury. Představme si nyní situaci, kdy plyn trošku “přimáčkneme”:

píst síla a vzdálenost

Pokud budeme působit nějakou silou \(F\) na danou plochu \(A\), víme, že tvoříme nějaký tlak, konkrétně tedy \(P = \frac{F}{A}\). Taktéž víme, že práce \(w\) odpovídá síle \(F\) po nějaké dráze \(l\), tedy \(W = F \cdot l\).

Budeme-li se zajímat pouze o drobnou změnu práce, tedy \(\mathrm{d}w\), poté můžeme psát:

$$\mathrm{d}w = F \cdot \mathrm{d}l$$

 Výše jsme si řekli, že \(P = \frac{F}{A}\), tedy \(F = P A\), můžeme tedy dosadit:

$$\mathrm{d}w = P A \cdot \mathrm{d}l$$

Nu a do jsme se učili už na základní škole o ploše a výšce? Vynásobíme-li je, dostaneme objem! Takže vzhůru do toho:

$$\mathrm{d}w = P \cdot \mathrm{d}V$$

Správněji tedy \(\mathrm{d}w = {- P} \cdot \mathrm{d}V\), protože \(\mathrm{d}l\) zde objem snižuje a ne zvyšuje (tedy správně bychom od začátku měli psát \({-\mathrm{d}l}\), ale je doufám jasné, kde se vzalo. Také vidíme důležitý závěr: Pokud se nezmění objem, není práce[2]Zde by to chtělo podotknout, že mluvíme samozřejmě o fyzikální práci. Takže pokud jste nezaměstnaní a zhubnete, práci nedostanete 🙂 .

 První termodynamický zákon tedy můžeme přepsat jako:

$$\mathrm{d}u = \mathrm{d}q – P \mathrm{d}V$$

Můžeme tedy tvrdit, že energie je funkcí teploty a objemu[3]Proč ne tlaku? Tlak je totiž definován pomocí těchto dvou veličin (není to nezávislá veličina). Proto tedypouze teplota a objem.:

$$u = f(T, V)$$

 konkrétněji tedy:

$$\mathrm{d}u = \left(\frac{\partial u}{\partial T}\right)_{V} \mathrm{d}T + \left(\frac{\partial u}{\partial V}\right)_{T} \mathrm{d}V $$

To znamená, že změna energie se dá popsat jako parciální derivace energie vzhledem k teplotě, pokud zachováme konstantní objem, krát změna teploty, plus parciální derivace energie vzhledem k objemu, pokud zachováme konstantní teplotu, krát změna objemu.

Nicméně — podívejme se nyní na druhou část zlomku. Pokud je objem konstantní, poté \(\mathrm{d}V\) je nulové (změna \(V\) je nulová), proto nám tedy celá druhá část zlomku vypadne a můžeme psát:

$$\mathrm{d}u = \mathrm{d}q + \mathrm{d}w = \mathrm{d}q + 0 = \mathrm{d}q = \left(\frac{\partial u}{\partial T}\right)_{V} \mathrm{d}T$$

Poslední části “před” \(\mathrm{d}T\), tedy \(\left(\frac{\partial u}{\partial T}\right)_{V} = C_V\) říkáme tepelná kapacita při konstantním objemu. Tedy:

$$\mathrm{d}u = \mathrm{d}q = C_V \mathrm{d}T$$

To vše jsme si definovali, abychom si mohli definovat následující termín:

Entropie

Než tak však učiníme, definujme si ještě tzv. entalpii. Označíme ji velkým písmenem \(H\) a bude pro ni platit[4]Více informací: http://scienceworld.wolfram.com/physics/Enthalpy.html:

$$ H = u + P V $$

Entalpie je tedy funkcí teploty a tlaku, tedy \(H = f(T, P)\). Podle prvního termodynamického zákona[5]dále jen TZ1 jsme si ukázali:

$$ \mathrm{d}u = \mathrm{d}q + \mathrm{d}w = \mathrm{d}q – P \mathrm{d}V$$

Můžeme tedy trošku popřeházet písmenka, aby:

$$ \mathrm{d}u + P \mathrm{d}V = \mathrm{d}q$$

a tedy

$$ \mathrm{d} (u+PV) = \mathrm{d}q $$

čili

$$ \mathrm{d}H = \mathrm{d}q $$

Vidíme, že tedy entalpie je funkcí teploty a tlaku, tedy \(H(T,P)\). A můžeme samozřejmě opět vytvořit parciální derivace:

$$ \mathrm{d}H = \left(\frac{\partial H}{\partial T}\right)_P \mathrm{d}T + \left(\frac{\partial H}{\partial P}\right)_T \mathrm{d}P = \mathrm{d}q$$

Nu a opět, pokud uvažujeme konstantní tlak, celé \(\mathrm{d}P\) bude nulové, čili:

$$ \mathrm{d}H = \left(\frac{\partial H}{\partial T}\right)_P \mathrm{d}T = \mathrm{d}q$$

Části \(\left(\frac{\partial H}{\partial T}\right)_P\) říkáme tepelná kapacita při konstantním tlaku. A můžeme si (po přeházení písmenek) ukázat, že:

$$ \mathrm{d}q = C_p \mathrm{d}T$$

Shrňme si nyní, co víme: Víme \(C_p\), \(C_V\), známe vzorec pro entalpii. Zkusme si s ním nyní trošku pohrát:

$$ H = u + PV $$

$$ \left(\frac{\partial H}{\partial T}\right)_p = \left(\frac{\partial u}{\partial T}\right)_p + \left(\frac{\partial PV}{\partial T}\right)_p $$

Vidíme, že pokud bychom derivovali (parciálně) při konstantním tlaku, poslední část, kde bychom derivovali i tlak samotný, by se převedla na \(\left(\frac{P \mathrm{d}V}{\mathrm{d}T}\right)_p\), tedy:

$$ \left(\frac{\partial H}{\partial T}\right)_p = \left(\frac{\partial u}{\partial T}\right)_p + \left(\frac{P \mathrm{d}V}{\mathrm{d}T}\right)_p $$

Vrátíme-li se na chvilku zpět k rovnici ideálního plynu, tedy \(PV = nRT\), pokud trošku přeházíme písmenka a vyjádříme jako diferenciály:

$$ \frac{\mathrm{d}V}{\mathrm{d}T} = \frac{nR}{P} $$

Pro zjednodušení předpokládejme, že \(n=1\), čili:

$$ \frac{\mathrm{d}V}{\mathrm{d}T} = \frac{R}{P} $$

a tedy

$$ \frac{P \mathrm{d}V}{\mathrm{d}T} = R $$

Vidíme, že to je to, co nám vyšlo výše jako jeden z členů součtu — můžeme tedy dosadit do vzorce výše to, co už známe:

$$ C_p = \left(\frac{\partial u}{\partial T}\right)_p + R $$

Nicméně abychom “minimalizovali” i tento vzorec, museli bychom mít konstantní jinou veličinu. Pokud máme konstantní tlak, tak změna objemu podle teploty není to, co  by se nám zrovna hodilo. Ale už jsme “skoro” tam, musíme akorát udělat malý trik. Využijeme “řetězového zákona”[6]Nevím, jak to lépe přeložit, každopádně další informace o tom zde: http://en.wikipedia.org/wiki/Triple_product_rule.. A ten nám neříká nic jiného, že naši parciální derivaci při konstantním tlaku můžeme rozepsat následovně:

$$ \left(\frac{\partial u}{\partial T}\right)_p = \left(\frac{\partial u}{\partial T}\right)_V + \left[\left(\frac{\partial u}{\partial V}\right)_T\right] \left(\frac{\partial V}{\partial T}\right)_p $$

Podívejme se nyní na třetí závorku, resp. druhou, jdeme-li od rovnítka vpravo (zvýraznil jsem ji hranatými závorkami). Ta operuje se změnou energie při konstantní teplotě. Nicméně výše jsme si řekli, že pokud je konstantní teplota, nejde žádná energie dovnitř ani ven[7]Tzn. jedná se o dokonalý stroj, který převádí tepelnou energii na energii pohybu pístu třeba — sice je to ideální zařízení, ale nám se to teď dost hodí.. Změna energie je tedy nulová — čímž i součin je nulový a celá poslední část vzorce “vypadne”.

Položíme proto rovnost:

$$ \left(\frac{\partial u}{\partial T}\right)_p = \left(\frac{\partial u}{\partial T}\right)_V $$

čímž si značně zjednodušíme práci s výrazem výše. Můžeme totiž poslední část nazvat \(C_V\), čili tepelnou kapacitu při konstantním objemu. A tedy samozřejmě pak platí, že:

$$ C_p = C_V + R $$


Podívejme se nyní, co tedy již víme:

$$ \mathrm{d}u = \mathrm{d}q + \mathrm{d}w = \mathrm{d}q + p\mathrm{d}V = C_V \mathrm{d}T $$

Na tom dále vystavíme[8]a již brzy se dostaneme ke slíbené entropii, slibuji 🙂 , nicméně musíme se podívat na další “kus” informací ze světa termodynamiky — různé procesy. Určitě jste o nich už někdy slyšeli, ale pro zopakování si napíšeme malý seznam:

  • isotermický děj je takový, během kterého zůstává stejná teplota
  • isobarický děj je takový děj, během něhož zůstává konstantní tlak
  • isochodirký děj takový, kdy zůstává konstantní objem
  • isentalpický děj — zůstává zachována entalpie

Kromě těchto tří existují ještě isentropický  děj, kde zůstává zachována entropie. Zatím však nevíme, co to je, nebudu ho tam uvádět[9]A samozřejmě až budete vědět, co to je a jak je definováno, můžete si to tam virtuálně přiřadit. Zbývá však jeden, na který se ještě musíme podívat — děj adiabatický.

Adiabatický děj

Adiabatický děj je takový, během něhož zůstává celkové teplo[10]pozor, nokoliv teplota!! děje konstantní. Samozřejmě se může měnit leccos ostatního, včetně teploty, ale teplo systému je konstantní. Jak je to možné?

Můžeme náš testovací systém třeba dokonale (či co nejdokonaleji) odizolovat od okolního světa. Důležité je, že žádné teplo nejde ani dovnitř, ani ven. Můžeme tedy tvrdit, že \(\mathrm{d}q = 0\). Podívejme se ještě jednou na vztah:

$$\mathrm{d}u=\mathrm{d}q-p\mathrm{d}V=C_V\mathrm{d}T$$

Řekli jsme si, že \(\mathrm{d}q=0\), čili můžeme tento člen s klidným svědomím vypustit:

$$\mathrm{d}u={-p}\mathrm{d}V=C_V\mathrm{d}T$$

Tlak \(p\) si můžeme vyjádřit z nám již známého $pV=nRT$:

$$ p=\frac{nRT}{V} $$

A můžeme tedy dosadit:

$$\mathrm{d}u = {-\frac{nRT}{V}}\mathrm{d}V = C_V \mathrm{d}T$$

a po trošku úpravách[11]Jen přeházíme “sem a tam” přes rovnítko různé proměnné tak, aby nám na jedné straně u sebe zbyly diferenciály a proměnné teploty, na druhé objemu. získáme:

$$ {-nR}\frac{\mathrm{d}V}{V}=\frac{C_V\mathrm{d}T}{T} $$

Samozřejmě budeme považovat opět \(n=1\)[12]molární množství látky, takže se to celé zjednoduší na:

$$ {-R}\frac{\mathrm{d}V}{V}=\frac{C_V\mathrm{d}T}{T} $$

Menší už to snad ani nemůže být, máme připraveno na integrování. Integrování je matematická operace inverzní k derivování (a parciálnímu derivování), pokud bude zájem, o těchto metodách zvlášť napíšu článek. Napíšeme tedy:

$$ {-R}\int_{V_1}^{V_2}\frac{\mathrm{d}V}{V} = {C_V}\int_{T_1}^{T_2}\frac{\mathrm{d}T}{T}$$

a zintegrujeme. Funkce \(\frac{1}{x}\) se zintegruje na \(ln(x) +C\), tedy rozintegrované bude:

$$ {-R}\left[\ln(V)\right]_{V_1}^{V_2} = C_V \left[\ln(T)\right]_{T_1}^{T_2}$$

Po dosazení[13]Jak na to se dozvíte v tom slibovaném článku o integrálech, ale když se na to zakoukáte, vymyslíte to 🙂 bude:

$$ {-R}\left(\ln(V_2)-\ln(V_1)\right) = C_V \left( \ln(T_2)-\ln(T_1)\right) $$

Podle pravidel o logaritmování tedy:

$$ {-R}\ln\frac{V_2}{V_1} = C_V \ln \frac{T_2}{T_1}$$

A abychom se zbavili “mínus” před \(R\), stačí si představit, jak by to vypadalo, pokud bych se ho zbavil již výše, než jsem použil pravidla o logaritmování — otočilo by se pouze pořadí, tedy:

$$ {R}\ln\frac{V_1}{V_2} = C_V \ln \frac{T_2}{T_1}$$

Dále použiji pravidla o logaritmování součinu, který se v logaritmu převede na mocninu. Takže vzhůru do toho:

$$ \ln\left(\frac{V_1}{V_2}\right)^{R} = \ln \left( \frac{T_2}{T_1} \right)^{C_V}$$

Pokud se podíváme, je jasné, že aby toto platilo, musí se “vnitřky závorek” mezi sebou rovnat (závorka vpravo a závorka vlevo). Můžeme tedy napsat:

$$ \ln\left(\frac{V_1}{V_2}\right)^{\frac{R}{C_V}} = \ln \left( \frac{T_2}{T_1} \right)$$

A tedy i:

$$\left(\frac{V_1}{V_2}\right)^{\frac{R}{C_V}} =  \frac{T_2}{T_1}$$

Vzpomeňme si nyní na vztah:

$$C_P = C_V + R$$

Není vám to povědomé? 🙂 Z toho přece můžeme snadno vyjádřit \(R\):

$$R = C_P – C_V$$

a tedy (celý vztah podělíme \(C_V\))

$$ \frac{R}{C_V} = \frac{C_P}{C_V} – \frac{C_V}{C_V}$$

A to samozřejmě můžeme pokrátit na

$$ \frac{R}{C_V} = \frac{C_P}{C_V} – 1$$

Abychom si trošku zjednodušili práci (dobře, abych si ji zjednodušil já, nebaví mě psát v \(\LaTeX\)u zlomky 😀 ), nazvu pro teď výraz \(\frac{C_V}{C_P}=\xi\)[14]Tuten paznak se čte jako “ksí”. Pak samozřejmě platí, že:

$$ \frac{R}{C_V} =\xi-1$$

Samozřejmě tedy můžeme původní vztah přepsat jako:

$$\left(\frac{V_1}{V_2}\right)^{\xi-1} =\frac{T_2}{T_1} $$

Vraťme se nyní zpět k rovnici ideálního plynu:

$$ PV = nRT$$

a vyjádřeme si \(T\), položmě \(n=1\) jako před tím:

$$ T = \frac{PV}{R}$$

Dosaďme nyní do nově vzniknuvšího vztahu:

$$\left(\frac{V_1}{V_2}\right)^{\xi-1} =\frac{\frac{P_2V_2}{R}}{\frac{P_1V_1}{R}} $$

Samozřejmě můžeme s klidným svědomím pokrátit \(R\):

$$\left(\frac{V_1}{V_2}\right)^{\xi-1} =\frac{{P_2V_2}}{{P_1V_1}} $$

Nyní se můžeme snadno zbavit \(V_1\) a \(V_2\) — přendáme je na druhou stranu, čili:

$$\frac{V_1}{V_2} \left(\frac{V_1}{V_2}\right)^{\xi-1} =\frac{P_2}{P_1} $$

což samozřejmě přepíšeme na:

$$\left(\frac{V_1}{V_2}\right)^{\xi}=\frac{P_2}{P_1} $$

Z toho snadno vyjádříme:

$$P_1V_1^{\xi}=P_2V_2^{\xi} $$

Vidíme, že pokud se musí rovnat levá a pravá strana rovnice, musí být konstantní obecný výraz \(\left(PV\right)^\xi\).

Zpátky však k entropii!

Nyní, když už rozumíme adiabatickému ději, máme téměř všechny důležité informace k tomu, abychom mohli vyjádřit a pochopit i termín entropie. Začněme se tedy věnovat tepelným procesům, konkrétně tzv. Carnotovu [15]Informace např. zde: http://www-history.mcs.st-andrews.ac.uk/Biographies/Carnot_Sadi.html cyklu[16]Moc hezké informace a interaktivní aplety mají třeba zde: http://hyperphysics.phy-astr.gsu.edu/hbase/thermo/carnot.html.

Carnot si položil jednoduchou otázku: Existuje-li nějaký tepelný zdroj, tak máme-li nějakou možnost vzít nějaký přístroj (obecně tepelný stroj), který je schopen teplo tohoto zdroje převádět na práci, pokud možno 100% efektivně. A ukázalo se, že nikoliv[17]Dnes nám to už může přijít jako samozřejmost, ale stejně po světě běhá spoustu lidí, co si myslí, že vynalezlo perpetum mobile, což jeho existenci přímo jako důsledek tohoto zjištění vyvrací.

Vezmeme-li tedy nějaký tepelný zdroj:

Carnotuv cyklus -- tepelný zdroj

Přidáme stroj, který má toto teplo zpracovávat:

Carnotuv cyklus -- tepelný stroj

Tak se ptáme, jestli existuje takový stroj, který je schopen 100% přenést veškeré teplo na práci, tedy že pracuje se 100% účinností:

Carnotuv cyklus -- existuje takovy stroj

Ukázalo se však, že takový stroj může existovat pouze v ideálních podmínkách, nicméně ty nejsou dosažitelné. Každý takový stroj totiž operuje i se zbytkovým teplem, které je předáváno dál okolí:

Carnotuv cyklus -- zbytkové teplo

Nyní si vše ukažme trošku exaktněji:

Ze “situačního plánku” vidíme, že výstupní práce \(W\) bude rovna rozdílu \(W=Q_1 – Q2\). Víme taktéž, že efektivita nějaké soustavy se dá velmi obecně vyjádřit jako \(\frac{ven}{dovnitř}\). Tedy:

$$\eta = \frac{W}{Q_1} = \frac{Q_1 – Q_2}{Q_1} = 1-\frac{Q_2}{Q_1}$$

A nyní si položmě otázku, kdy může být \(\eta\) rovno jedné — čili 100% účinnost. Buď bychom museli mít nekonečně velké teplo \(Q_1\), abychom minimalizovali zlomek jmenovatelem, anebo bychom museli mít absolutní nulu \(Q_2\), čímž bychom minimalizovali zlomek čitatelem. Druhého jmenovaného jsme přece jen blíže dosáhnout, ale přesto toho nejsme schopni dosáhnout absolutně.

Abychom si však popsali takový proces cyklicky, je potřeba použít tzv. Carnotova cyklu, což je teplený cyklus, kde někdy měníme stavy adiabaticky a někdy isotermicky. To opakujeme pořád dokola a sledujeme vstupy a výstupy, čímž jsme schopni opět spočítat efektivitu takové soustavy.

Představme si tedy znovu náš zelený píst ze začátku článku, kde se budeme snažit vyvolat adiabatické a isotermické změny. Abychom to však vzali trošku “profesionálně”, experimenty si necháme třeba do laboratoře, my si vše popíšeme krásně grafem, konkrétně tzv. PV grafem. Jak písmenka napovídají, \(P\) odpovídá tlaku a \(V\) odpovídá objemu:

pv graf

Vynesme si nyní na ně několik bodů (samozřejmě postupně): Nejdříve začněme nějakým výchozím stavem, nazvěme si ho třeba \(A\):

pv graf -- A

Od tohoto bodu se isotermicky budeme pohybovat k bodu B:

pv graf -- AB

Během tohoto procesu vidíme, že se zvyšuje objem, avšak protože se jedná o isotermický děj, zůstává konstantní teplota, nazvěme ji \(T_1\). Musíme tedy do systému dodávat nějaké teplo, aby byla soustava vyrovnána, což také děláme. Dále přejděme k bodu \(C\), ke kterému se dostaneme adiabatickou cestou (žádné teplo dovnitř ani ven):

 pv graf -- BC2

Protože se pohybujeme po adiabatě, žádné teplo nedodáváme ani nebereme, objem se příliš nemění, ale snižuje se tlak — konáme práci. V další iteraci se dostáváme do bodu \(D\) — opět jako isotermický děj:

pv graf -- CD

No a protože platí totéž, co pro \(AB\) posun, tedy že se mění objem, ale teplota zůstává konstantní, musíme nějaké teplo odevzdávat, čili zde vidíme “vznik” \(Q_2\).  Nakonec nám zbývá poslední adiabatický děj, totiž \(DA\)[18]A ne, není to Dragon Age! 🙂 :

pv graf -- DA

Jsme tedy opět “na začátku” našeho cyklu a ten se pořád dokola opakuje. Vyjádříme-li si nyní z nám již velmi dobře známé rovnice ideálního plynu tlak, dostaneme:

$$ PV = nRT $$

$$ P = \frac{nRT}{V}$$

Dále víme, že \(\mathrm{d}u = \mathrm{d}q – P\mathrm{d}V\), jenže co vyjadřuje \(\mathrm{d}u\)? Vyjadřuje “změnu množství tepla” (či vnitřní energie systému). Když se však na cyklus podíváte, začali jsme v bodě \(A\), a ve stejném jsme vlastně i skončili. Nedodali jsme proto žádnou energii navíc, všechna byla vyzářena v podobě ztrát či tak podobně — můžeme tedy s klidným srdcem položit \(\mathrm{d}u = 0\) a potom už je snadné psát:

$$ 0 = \mathrm{d}q – P\mathrm{d}V$$

$$\mathrm{d}q = P\mathrm{d}V$$

Můžeme integrovat, pro každou teplotu musíme zvlášť:

$$ Q_1 = \int_{V_A}^{V_B} nRT_1 \frac{\mathrm{d}V}{V}=nRT_1\ln\frac{V_B}{V_A}$$

$$ Q_2 = – \int_{V_C}^{V_D} nRT_2 \frac{\mathrm{d}V}{V}=- nRT_2\ln\frac{V_D}{V_C}$$

Minus u \(Q_2\) značí, že teplo “dáváme ven”, tzn. ubývá (a proto mínus). Dříve jsme si vyjádřili, že \(\eta\), tedy účinnost systému, se dá zapsat jako:

$$ \eta = 1-\frac{Q2}{Q1}$$

A nezbývá, než dosadit nově zjištěná “kvé”:

$$ \eta = 1-\frac{nRT_2\ln\frac{V_C}{V_D}}{nRT_1\ln\frac{V_B}{V_A}} = 1 – \frac{T_2\ln\frac{V_C}{V_D}}{T_1\ln\frac{V_B}{V_A}}$$

Jak to zjednodušit? Dokažme, že část zlomku, kde porovnáváme logaritmy, je konstantní, konkrétně je rovna jedné.

Víme už, že:

$$ \frac{T_2}{T_1} = \left(\frac{V_1}{V_2}\right)^{\xi-1}$$

A po přeházení proměnných tedy:

$$T_2V_2^{\xi-1} = T_1V_1^{\xi-1}$$

Z grafu Carnotova cyklu můžeme dále určit, že pro dané objemy a tedy i krajní body vpravo a vlevo můžeme dát do rovnosti (tohle je trošku těžší krok na představivost, ale podívejte se pořádně na graf, vyplyne to z toho 🙂 ):

Pro body “vpravo”:

$$T_1V_B^{\xi-1} = T_2V_C^{\xi-1}$$

Pro body “vlevo”:

$$ T_1V_A^{\xi-1} = T_2V_D^{\xi-1}$$

Tuto soustavu tedy můžeme přepsat jako:

$$\frac{T_1V_B^{\xi-1}}{T_1V_A^{\xi-1}} = \frac{T_2V_C^{\xi-1}}{T_2V_D^{\xi-1}}$$

Můžeme pokrátit teploty a získáme:

$$\left(\frac{V_B}{V_A}\right)^{\xi-1} = \left(\frac{V_C}{V_D}\right)^{\xi-1}$$

A tedy vidíme, že obsahy závorek musí být stejné, aby rovnost platila. Vrátíme-li se proto k původnímu vzorci pro \(\eta\):

$$ \eta = 1-\frac{nRT_2\ln\frac{V_C}{V_D}}{nRT_1\ln\frac{V_B}{V_A}} = 1 – \frac{T_2\ln\frac{V_C}{V_D}}{T_1\ln\frac{V_B}{V_A}}$$

Vidíme, že můžeme s klidem poměr logaritmů pokrátit, protože se prostě jedná jedné. Zbyde nám tedy:

$$\eta = 1-\frac{Q_2}{Q_1} = 1-\frac{T_2}{T_1}$$

A z toho jasně plyne, že:

$$\frac{Q_2}{Q_1} = \frac{T_2}{T_1}$$

Trošku popřehazujeme písmenka, a získáme:

$$\frac{Q_2}{T_2} = \frac{Q_1}{T_1}$$

kde poměr \(\frac{Q}{T}\) je konstantní a nazveme ho (hurá potlesk) entropie. Tu dále budeme označovat jako \(S\).

Neklesavost entropie

Určitě jste někde (nedivil bych se, kdyby v nějakém sci-fi) slyšeli, že entropie vesmíru stále stoupá. Co si pod tím představit? Proč? Jak? Dokažme si nyní na našem malém experimentu s Carnotovým cyklem a tepelným strojem, co to znamená a kde se něco takového vzalo.

Výše jsme si vyjádřili dva vztahy:

$$ \eta_{max} = 1-\frac{T_2}{T_1}$$

a

$$ \eta_{max} = \frac{W}{Q_1}$$

Není nic lehčího, než je spojit přes \(\eta\) dohromady:

$$\frac{W}{Q_1}=1-\frac{T_2}{T_1}$$

a tedy:

$$ W \leq Q_1 \left(1-\frac{T_2}{T_1}\right)$$

Proč jsem přidal “nerovná se”? Přesně ze stejného důvodu, proč jsem k \(\eta\) přidal index “max” — jedná se totiž o výpočty s maximální účinností, nikoliv absolutní. Proto práce bude vždy maximálně taková, jaká je — případně může být jen nižší.

Dále víme, že \(W = Q_1 – Q_2\). Můžeme tedy psát:

$$ Q_1 – Q_2 \leq Q_1 \left(1-\frac{T_2}{T_1}\right)$$

Roznásobíme:

$$ Q_1 – Q_2 \leq Q_1-\frac{Q_1 T_2}{T_1}$$

a vidíme, že \(Q_1\) můžeme z rovnice s klidnou duší vyhodit:

$$- Q_2 \leq -\frac{Q_1 T_2}{T_1}$$

Otočíme:

$$ Q_2 \geq \frac{Q_1 T_2}{T_1}$$

Přeházíme písmenka:

$$ \frac{Q_2}{T_2} \geq \frac{Q_1}{T_1}$$

A to je vše 🙂 Vidíme, že po skončení procesu bude entropie vždy ne menší, tedy stejná či větší, než před začátkem takového procesu. A to je důvod, proč entropie neustále roste — protože prostě nemůže být menší.

To by pro začátek s termodynamikou stačilo, příště se zase podíváme na nějaké částice, tak se těšte 😉 Zde si též můžete stáhnout mé poznámky k článku, ze kterých jsem vycházel (pokud to po mně přečtete) 🙂

Poznámky pod čarou   [ + ]

1. Další informace kupříkladu na http://fyzika.jreichl.com/main.article/view/581-prvni-termodynamicky-zakon
2. Zde by to chtělo podotknout, že mluvíme samozřejmě o fyzikální práci. Takže pokud jste nezaměstnaní a zhubnete, práci nedostanete 🙂
3. Proč ne tlaku? Tlak je totiž definován pomocí těchto dvou veličin (není to nezávislá veličina). Proto tedypouze teplota a objem.
4. Více informací: http://scienceworld.wolfram.com/physics/Enthalpy.html
5. dále jen TZ1
6. Nevím, jak to lépe přeložit, každopádně další informace o tom zde: http://en.wikipedia.org/wiki/Triple_product_rule.
7. Tzn. jedná se o dokonalý stroj, který převádí tepelnou energii na energii pohybu pístu třeba — sice je to ideální zařízení, ale nám se to teď dost hodí.
8. a již brzy se dostaneme ke slíbené entropii, slibuji 🙂
9. A samozřejmě až budete vědět, co to je a jak je definováno, můžete si to tam virtuálně přiřadit
10. pozor, nokoliv teplota!!
11. Jen přeházíme “sem a tam” přes rovnítko různé proměnné tak, aby nám na jedné straně u sebe zbyly diferenciály a proměnné teploty, na druhé objemu.
12. molární množství látky
13. Jak na to se dozvíte v tom slibovaném článku o integrálech, ale když se na to zakoukáte, vymyslíte to 🙂
14. Tuten paznak se čte jako “ksí”
15. Informace např. zde: http://www-history.mcs.st-andrews.ac.uk/Biographies/Carnot_Sadi.html
16. Moc hezké informace a interaktivní aplety mají třeba zde: http://hyperphysics.phy-astr.gsu.edu/hbase/thermo/carnot.html
17. Dnes nám to už může přijít jako samozřejmost, ale stejně po světě běhá spoustu lidí, co si myslí, že vynalezlo perpetum mobile, což jeho existenci přímo jako důsledek tohoto zjištění vyvrací.
18. A ne, není to Dragon Age! 🙂