Archiv autora: Rudolf Klusal

Polarizace a spin částice (2. část)

Vítám vás u pokračování tématu o polarizaci a spinu částic. V prvním díle jsme zlehka naznačili matematický aparát a obecné principy, v tomto článku jich dále budeme využívat, proto pokud budete potřebovat, velmi doporučuji otevřít si první článek a v případě matematických nejasností zde se na něho odkazovat, mělo by tam být vysvětleno vše důležité.

Co je to spin?

Bohužel, u fyziky malých částic, jak jsme řekli dříve, poměrně slušně selhávají makroskopické představy o principech, stejně tak i jakákoliv snaha vysvětlit, k čemu spin částice připodobnit. Velmi blízce by se dal spin připodobnit jako moment hybnosti částice, ale ne v tom významu, že s ním můžeme zacházet libovolně jak chceme, ve své podstatě se jedná o experimentálně ověřenou hodnotu, která byla “tak nějak” potřeba přidat do co nejcelkovějšího modelu chování částic.[1]Pro další informace rozhodně doporučuji tento popis experimentu: ElektronovySpin.pdf. Říká nám zjednoduše, kolikrát musíme danou částici otočit, aby se nám jevila opět stejně. Pokud máme spin 1, poté musíme částici otočit o celých 360 stupňů, pokud 2, stačí 180 stupňů. Spin dané částice je (jeho velikost) přesně dána a nelze tuto hodnotu změnit. Navíc tyto hodnoty mohou nabývat pouze celočíselných a nebo polovičních násobků \(\hbar\)[2]Redukované planckovy konstanty, tedy \(\hbar=\frac{h}{2\pi}\)., tedy spiny můžeme mít \(\left(1,\frac{1}{2},-\frac{1}{2},-1,\frac{3}{2},\ldots\right)\) a tak podobně.

Směr spinu částice (nikoliv jeho hodnotu) můžeme měnit např. magnetickým polem, kterým částice prochází. Budeme-li se pohybovat v běžných třech osách pohybu (pravolevá, hornodolní a předozadní), můžeme jednoduše spin označit jako horní, dolní, pravý, levý atd. Pro tato označování je zaběhnuté používání písmenek z anglických slov toto popisující, toho se budeme držet i zde — tedy u jako upd jako down atd. Pokud si nyní představíme spin jako rotaci, tato rotace bude mít nějakou osu[3]Opět — osu bude mít pouze v makroskopickém světě, v případě spinu hovořit o ose rotace je chybné.. Stačí nám tedy pro popis spinu jako takového pouze znázornění směru této osy, a to je právě výše zmíněné u nebo d.

Tak nějak asi tušíme, že se spinem to bude velmi podobné jako s polarizací částice. Budeme-li mít např. nějaký experiment, který nám říká, jestli měřená částice má spin u nebo d, pokud do tohoto experimentu pošleme u částici, řekne nám, že máme spin u a naopak. Stejně jako u polarizace, pokud pošleme do experimentu částici, která má spin natočený pod nějakým úhlem, dosáhneme určitého poměru ud v tomto experimentu (při větším počtu částic, třeba 100 částic, tedy získáme třeba 60 % částic s u a 40 % s d.)

Bra-ketovým zápisem (pro oživení doporučuji 1. díl seriálu) tedy můžeme daný spin částice zapsat jako:

$$|p_s\rangle=\alpha|\mathrm{u}\rangle+\beta|\mathrm{d}\rangle$$

Tedy že daný spin \(p_s\) bude součtem amplitud pravděpodobností pro ud. Abychom z amplitudy pravděpodobnosti dostali přímo pravděpodobnost, musíme “umocnit na druhou” — jenže pozor, toto platí pouze pro \(\mathbb{R}\). Pro \(\mathbb{C}\) budeme muset použít součin dvou komplexně konjugovaných čísel, tedy \(\alpha\alpha^*\)[4]Komplexně konjugované číslo, pro zopakování, je číslo, které má stejnou reálnou část, ale opačnou imaginární. Sami vidíme, že u reálných čísel se jedná opravdu o “umocnění na druhou”. Samozřejmě rovnou vidíme, že pravděpodobnosti budou muset být:

$$\alpha\alpha^*+\beta\beta^*=1$$

Také rovnou vidíme následující možnosti[5]vše vztaženo k experimentu, kdy měříme “je to u?:

$$
p_{u}=1|\mathrm{u}\rangle+0|\mathrm{d}\rangle\\
p_{d}=0|\mathrm{u}\rangle+1|\mathrm{d}\rangle\\
p_{r}=\frac{1}{\sqrt{2}}|\mathrm{u}\rangle+\frac{1}{\sqrt{2}}|\mathrm{d}\rangle
$$

Co však značí přímo \(\mathrm{u}\) a \(\mathrm{d}\)? Jedná se o dva ortonormální vektory[6]Velmi podobné ortogonálním, jen mají jednotkovou velikost. Ortogonální vektory nám říkají, že pokud je jeden “něčím”, pak ten druhý je vším jen ne “něčím”, tedy např. pokud jeden vektor popisuje stav u, poté ortogonální popisuje stav přesně ne-u, tedy d 🙂 (Ano, tyto  vektory jsou tedy lineárně nezávislé a tvoří bázi prostoru, ale lineární algebru nechme na jindy.) , velmi podobně jako v případě polarizace. Musíme se ještě podívat na jeden “zvláštní typ” polarizace, tedy kruhovou polarizaci.

Kruhová polarizace

Jak asi víme, světlo je označováno jako elektromagnetické vlnění, což značí přesně to, co to je — obsahuje jak “elektrickou” tak “magnetickou” část. Představíme-li si světelný paprsek, který putuje prostorem nějakým přímým směrem:

Světelný paprsek
Světelný paprsek

Tento světelný paprsek je tvořen dvěma kolmými vlněními — elektrickým a magnetickým. Ty se mohou vyskytovat pouze jako “kolmé” veličiny na směr šíření paprsku, budou se tedy pohybovat v rovině:

Elektromagnateické vlnění se může rozkmitat pouze v této rovině, která je kolmá na směr šíření vlny.
Elektromagnetické vlnění se může rozkmitat pouze v této rovině, která je kolmá na směr šíření vlny.

Vlnění se tedy může rozkmitávat pouze po této plošce. Vlnění elektrické a magnetické je na sebe vzájemně kolmé, tedy:

Kruhova polarizace -- vlnění E & B
Kruhova polarizace — vlnění E & B

Nutno podotknouti, že obrázek je velmi silně mimo proporce, elektrická část vlnění je totiž mnohem silnější než magnetická, ale teď nám jde spíše o zobrazení principu než o správné proporce grafu 🙂

Nicméně k výpočtům samotným. Pokud budeme předpokládat, že \(E\) a \(B\) jsou kolmé a jsou to klasické vlny (sinusovky), označíme-li souřadné osy takto:

Označení os
Označení os

Tedy že vlna se pohybuje po ose \(z\), poté můžeme psát pro intenzity:

$$
E_x=E_{E_{max}}\sin(k\mathbb{\mathrm{z}}+\omega t)\\
E_y=E_{B_{max}}\cos(k\mathbb{\mathrm{z}}+\omega t)
$$

Budeme-li naší rovinou posouvat po ose \(z\), uvidíme, že se nám budou prakticky střídat dvě základní polarizace — tam, kde bude hodnota \(E_E\) maximální, tam bude hodnota \(E_B\) minimální a naopak. Budou se prakticky neustále dohánět, bude to právě vypadat, jako kdyby se vektor polarizace neustále otáčel; proto kruhová polarizace.

Zkusme se nyní podívat na bra-ketový zápis takového jevu a jak vůbec na to. Budeme předpokládat, že pro naši polarizaci bude platit něco jako (předpokládejme, že \(p_{kr}\) bude znamenat “Polarizace kruhová doprava”, tedy ve směru hodinových ručiček, ale pro začátek je to vlastně jedno):

$$|p_{kr}>=\alpha|\mathrm{x}\rangle+\beta|\mathrm{y}\rangle$$

Což by značilo, že musí existovat taková pravděpodobnost, kdy \(\alpha^2+\beta^2=1\). V čem je tady problém? Vidíme, že obě čísla budou kladná, pokud je zvolíme z \(\mathbb{R}\)[7]Protože 2. mocnina čehokoliv z $latex\mathbb{R}$ bude kladné číslo.. Proto musíme začít pokukovat po oblasti $latex\mathbb{C}$, tedy komplexních číslech. Pokud bychom zvolili:

$$1|x\rangle+i|y\rangle$$

Mohli bychom namítat, že to přece nefunguje, protože \(1^2+i^2=1-1=0\neq1\). Jenže! V prvním článku jsme si řekli, že abychom se dostali z pravděpodobnostních amplitud do přímé pravděpodobnosti, musíme nikoliv pouze umocnit, ale vynásobit komplexně konjugovaným číslem, tedy výpočet bude:

$$\alpha\alpha^*+\beta\beta^*=1$$

A to už fungovat bude:

$$1\cdot 1^*+i\cdot i^*=1\cdot 1 + i\cdot (-i) = 2$$

To sice taktéž není \(0\), ale už se blížíme k cíli, musíme pouze nanormovat jednotlivé operandy, stejně jako jsme dělali v prvním článku:

$$
\frac{1}{\sqrt{2}}\frac{1^*}{\sqrt{2}}+\frac{i}{\sqrt{2}}\frac{i^*}{\sqrt{2}}=
\frac{1}{2}+\frac{1}{2}=1
$$

Vektor kruhové polarizace vpravo \(p_{kr+}\) a vlevo \(p_{kr-}\) tedy můžeme napsat jako:

$$
|p_{kr+}\rangle=\begin{pmatrix}\frac{1}{\sqrt{2}}\\\frac{i}{\sqrt{2}}\end{pmatrix}\\
|p_{kr-}\rangle=\begin{pmatrix}\frac{1}{\sqrt{2}}\\\frac{-i}{\sqrt{2}}\end{pmatrix}
$$

Zkusme nyní klasický pokus s částicí s jednou a filtrem s druhou polarizací a ověřme, jestli pro danou polarizaci platí předpokladané, tedy že částice neprojde. Připravme čáscici s polarizací v protisměru hodinových ručiček a přožeňme ji filtrem, který propouští pouze částice s polarizací ve směru hod. ručiček. Uvědomme si taktéž, že původní předpis pro řešení spočívá v použití prvního vektoru v konjugované formě!:

$$
\langle{}p_{kr-}|p_{kr+}\rangle=
\begin{pmatrix}\frac{1}{\sqrt{2}} & \frac{i}{\sqrt{2}}\end{pmatrix}
\begin{pmatrix}\frac{1}{\sqrt{2}}\\\frac{i}{\sqrt{2}}\end{pmatrix}=
\frac{1}{\sqrt{2}}\frac{1}{\sqrt{2}}+\frac{i}{\sqrt{2}}\frac{i}{\sqrt{2}}=
\frac{1}{2}+\frac{-1}{2}=0
$$

Stejně tak, pokud použijeme přesně inverzní zadání, tedy:

$$
\langle{}p_{kr+}|p_{kr-}\rangle=
\begin{pmatrix}\frac{1}{\sqrt{2}} & \frac{-i}{\sqrt{2}}\end{pmatrix}
\begin{pmatrix}\frac{1}{\sqrt{2}}\\\frac{-i}{\sqrt{2}}\end{pmatrix}=
\frac{1}{\sqrt{2}}\frac{1}{\sqrt{2}}+\frac{-i}{\sqrt{2}}\frac{-i}{\sqrt{2}}=
\frac{1}{2}+\frac{(-i)^2}{2}=\frac{1}{2}-\frac{1}{2}=0
$$

Zkusme nyní ještě pokus s kruhově polarizovaným světlem a polarizačním filtrem pod nějakým obecným úhlem \(\phi\):

$$
\langle{}\phi|p_{kr+}\rangle=
\begin{pmatrix}\cos\left(\phi\right) & \sin\left(\phi\right)\end{pmatrix}
\begin{pmatrix}\frac{1}{\sqrt{2}} \\ \frac{i}{\sqrt{2}}\end{pmatrix}=
\cos(\phi)\frac{1}{\sqrt{2}}+\sin(\phi)\frac{i}{\sqrt{2}}
$$

Abychom z tuté pravděpodobnostní amplitudy dostali pravděpodobnost, musíme samozřejmě:

$$
\left(\langle{}\phi|p_{kr+}\rangle\right)^2=
\left(\frac{1}{\sqrt{2}}\cos(\phi)+\frac{i}{\sqrt{2}}\sin(\phi)\right)^2=\\=
\left(\frac{1}{\sqrt{2}}\cos(\phi)+\frac{i}{\sqrt{2}}\sin(\phi)\right)\left(\frac{1}{\sqrt{2}}\cos(\phi)+\frac{-i}{\sqrt{2}}\sin(\phi)\right)=\\=
\left(\frac{1}{2}\cos^2(\phi)-\frac{i^2}{2}\sin^2(\phi)\right)=
\left(\frac{1}{2}\cos^2(\phi)+\frac{1}{2}\sin^2(\phi)\right)=
\frac{1}{2}\left(\cos^2(\phi)+\sin^2(\phi)\right)=\frac{1}{2}
$$

Využijme ještě testu s hermitovským operátorem, který můžeme definovat takto[8]Viz https://www.eng.tau.ac.il/~shtaif/PolarizationClass.pdf.[9]Co to je, jsme řešili v minulém článku.:

$$
\begin{pmatrix}
0 & -i \\
i & 0
\end{pmatrix}
$$

A tedy jestli vyhovuje výrazu:

$$
\begin{pmatrix}
0 & -i \\
i & 0
\end{pmatrix}
\begin{pmatrix}
\frac{1}{\sqrt{2}} \\
\frac{i}{\sqrt{2}}
\end{pmatrix}
=
\lambda
\begin{pmatrix}
\frac{1}{\sqrt{2}} \\
\frac{i}{\sqrt{2}}
\end{pmatrix}
$$

Roznásobíme-li tedy:

$$
\begin{pmatrix}
0 & -i \\
i & 0
\end{pmatrix}
\begin{pmatrix}
\frac{1}{\sqrt{2}} \\
\frac{i}{\sqrt{2}}
\end{pmatrix}
=
\begin{pmatrix}
0\frac{1}{\sqrt{2}} – i\frac{i}{\sqrt{2}} \\
i\frac{1}{\sqrt{2}}+0\frac{i}{\sqrt{2}}
\end{pmatrix}
=
\begin{pmatrix}
\frac{1}{\sqrt{2}} \\
\frac{i}{\sqrt{2}}
\end{pmatrix}
$$

A tedy vidíme, že vlastní vektor odpovídá měřenému a předpokládanému, a tedy \(\lambda=1\).

Třípolarizátorový paradox

Tento paradox[10]Viz http://www.informationphilosopher.com/solutions/experiments/dirac_3-polarizers/[11]Viz http://alienryderflex.com/polarizer/[12]Viz polarize.pdf ukazuje zajímavou věc, která vypadá dost nemyslitelně; vezmeme-li dva polarizátory[13]Polarizační filtry…, které nastavíme kolmo na sebe (jejich roviny polarizace), ukazáali jsme si, že pravděpodobnost průchodu částice je \(0\). Nicméně, zařadíme-li mezi dva takové filtry třetí polarizátor pod nějakým úhlem, např. 45°, bude pravděpodobnost průchodu částice \(P: \left(0;1\right)\). Jak je toto možné? Využijme již známého matematického aparátu.

Víme už, že pravděpodobnost průchodu fotonem polarizačním filtrem o obecném úhlu \(\phi\) je \(p_{45}=\cos^2(\phi)=\cos^2(45)=\frac{1}{2}\). Připravíme-li proto polarizovaný proud částic, který pošleme 1. polarizátorem se stejným úhlem polarizace, tento nám daný paprsek nezmění (v rámci intenzity) a bude neustále \(100\%\) pravděpodobnost, že paprsek projde. Po 2. polarizátoru bude pravděpodobnost poloviční, tedy \(\frac{1}{2}\). No a po třetím, který je opět o oněch 45° otočen, bude pravděpodobnost:

$$
p_{II}=p_{45}\cos^2(45)=\frac{1}{2}\cdot\frac{1}{2}=\frac{1}{4}=25\ \%
$$

Pravděpodobnost průchodu takové částice je tedy \(45\ \%\). Ale pozor! Jde o světlo, které už máme polarizované, pokud do prvního polarizátoru pošleme nějaké obecné nepolarizované světlo, uvidíme, že už po prvním filtru budeme mít mnohem menší pravděpodobnost průchodu částice, konkrétně \(\frac{1}{2}\), pokud tedy bychom měřili nějakou intenzitu mezi vstupujícím světlem a výstupním světlem, dostaneme se ještě na polovinu z oněch \(25\ \%\), tedy na \(12,5\ \%\).

Samozřejmě bychom mohli dopočítat přes vlastní vektor, ale když jsme si už ukázali výstupy z této metody, můžeme jen vhodně zkombinovat výstupy, nicméně však by to vyšlo naprosto stejně 🙂

Definice matic pro výpočet

Stejně jako u polarizace, i zde můžeme využít hermitovských operátorů a dosazovat do rovnice. Polarizace a spin se budou chovat prakticky totožně[14]Až na pár velmi podstatných rozdílů, které si samozřejmě záhy ukážeme. (matematicky), budeme-li detekovat částice s nějakým spinem a do tohoto detektoru budeme posílat částice se spinem jiným či “pod nějakým úhlem”, výsledné výpočty budou téměř stejné[15]Tedy proporčně budou jako \(\cos^2(\phi)\), nicméně lehko odlišné..

Matice, které ve výpočtu používáme se jmenují Pauliho matice[16]Podle fyzika Pauliho, který za svůj vylučovací princip dostal Nobelovu cenu za fyziku. a mají tvar[17]Viz http://planetmath.org/PauliMatrices pro směry up/downright/leftin/out jako:

$$
\mathrm{\hat{H}}_{u/d}=\sigma_z=
\begin{pmatrix}
1  & 0\\
0 & -1\\
\end{pmatrix}\\
\mathrm{\hat{H}}_{r/l}=\sigma_x=
\begin{pmatrix}
0 & 1\\
1 & 0\\
\end{pmatrix}\\
\mathrm{\hat{H}}_{i/o}=\sigma_y=
\begin{pmatrix}
0 & -i\\
i & 0\\
\end{pmatrix}
$$

Vidíte, že jsem označil jednotlivé matice jako \(\sigma_z\) a podobně — jednoduše matice, která má osu \(z\) je označená jako \(\sigma_z\) atd. 🙂 První matice, up/down tedy má osu \(z\) a proto je označená \(\sigma_z\). Podívejme se však na tutu matici trošku podrobněji. Proč jsou zvolené zrovna tyto hodnoty?

Víme, že (chceme, aby…) bude platit:

$$
\begin{pmatrix}
a & b \\
c & d
\end{pmatrix}
\begin{pmatrix}
1 \\ 0
\end{pmatrix}
=
1
\begin{pmatrix}
1\\0
\end{pmatrix}
$$

Z toho můžeme velmi snadno určit neznámou matici (byť to na první pohled nevypadá). Napišme si, co víme, že bude platit za vztahy podle toho, jak bychom matici roznásobovali. První vztah tedy bude:

$$a \cdot 1 + b \cdot 0 = 1 $$

Z toho je naprosto jasně vidět, že ať bude \(b\) cokoliv, \(a\) musí být \(1\), aby byl součet čehokoliv a nuly jednička. Tedy vidíme, že \(a=1\). Pro druhý řádek máme:

$$ c \cdot 1 + b \cdot 0 = 0$$

Tedy vidíme, že \(c=0\). Nojo, ale co teď? 🙂 Pořád nám chybí dva výrazy, tak si pomůžeme tím, že známe dva vlastní vektory pro ud spin, použijeme prostě jen “ten druhý” vlastní vektor (jestli jste první použili ten či onen je jedno, samozřejmě 🙂 ):

$$
\begin{pmatrix}
a & b \\
c & d
\end{pmatrix}
\begin{pmatrix}
0 \\ 1
\end{pmatrix}
=
-1
\begin{pmatrix}
0\\1
\end{pmatrix}
$$

A opět stejným způsobem:

$$ a \cdot 0 + b \cdot 1 = 0$$

Tedy vidíme, že \(b=0\). No a pro poslední možnost:

$$ c \cdot 0 + d \cdot 1 = -1$$

No a tady vidíme, že \(d=-1\). Celková matice je tedy:

$$
\sigma_z
=
\begin{pmatrix}
1 & 0 \\
0 & -1 \\
\end{pmatrix}
$$

A taková matice je Hermitovská (viz předchozí článek).  Stejným způsobem dokážeme odvodit i ostatní matice, samozřejmě tam vždy použijeme trošku jiný trik, ale v principu je to pořád to samé, vyřešit nějak chytře rovnici o 4 neznámých:

$$
\begin{pmatrix}
a & b \\ c & d
\end{pmatrix}
\begin{pmatrix}
\frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{2}}
\end{pmatrix}
=
1
\begin{pmatrix}
\frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{2}}
\end{pmatrix}
$$

$$
\begin{pmatrix}
a & b \\ c & d
\end{pmatrix}
\begin{pmatrix}
\frac{1}{\sqrt{2}} \\ -\frac{1}{\sqrt{2}}
\end{pmatrix}
=
-1
\begin{pmatrix}
\frac{1}{\sqrt{2}} \\ -\frac{1}{\sqrt{2}}
\end{pmatrix}
$$

Pro zjednodušení budu předpokládat, že rovnici s maticemi mohu vynásobit libovolným číslem na obou stranách a rovnost zůstane zachována (chci se prostě zbavit neustálého obludného psaní \(\frac{1}{\sqrt{2}}\)). Mohu tedy říci, že:

$$
\begin{matrix}
a \cdot 1 &+& b \cdot 1 &= &1 \\
c \cdot 1 &+& d \cdot 1 &= &1 \\
a \cdot 1 &-& b \cdot 1 &= &-1 \\
c \cdot 1 &-& d \cdot 1 &= &1
\end{matrix}
$$

Nyní jen jednoduše sečtěme rovnice spolu, hned první a třetí rovnici, vznikne nám \(a+a = 0\), tedy je jasně vidět, že \(a=0\). Poté sečtěme 2. a 4. rovnici, tedy uvidíme \(b+b = 2\), tedy \(b=1\). Když toto vidíme, ve 4. rovnici rovnou vidíme, že \(1-d=1\), tedy \(d = 0\). No a stejně pokud vidíme z 2. rovnice \(c=1\). Tedy matice bude:

$$
\sigma_x
=
\begin{pmatrix}
0 & 1 \\ 1 & 0
\end{pmatrix}
$$

Nakonec se podívejme na výpočet \(\sigma_y\). Víme, že musí platit následující vztahy:

$$
\begin{pmatrix}
a & b \\ c & d
\end{pmatrix}
\begin{pmatrix}
\frac{1}{\sqrt{2}} \\ \frac{i}{\sqrt{2}}
\end{pmatrix}
=
+1
\begin{pmatrix}
\frac{1}{\sqrt{2}} \\ \frac{i}{\sqrt{2}}
\end{pmatrix}
$$

$$
\begin{pmatrix}
a & b \\ c & d
\end{pmatrix}
\begin{pmatrix}
\frac{1}{\sqrt{2}} \\ -\frac{i}{\sqrt{2}}
\end{pmatrix}
=
-1
\begin{pmatrix}
\frac{1}{\sqrt{2}} \\ -\frac{i}{\sqrt{2}}
\end{pmatrix}
$$

Udělejme to stejné, co jsme dělali výše:

$$
\begin{matrix}
a  &+& b i &= &1 \\
c  &+& d i &= &i \\
a &-& b i &= &-1 \\
c &-& d i &= &1
\end{matrix}
$$

Pokud sečteme 1. a 2. rovnici, vidíme, že \(2a = 0\), tedy že \(a=0\). Pokud je \(a=0\), poté musí platit, že \(bi=1\), a tedy \(b=\frac{1}{i}=-i\). Nyní sečtěme 2. a 4. rovnici, vyjde, že \(2c=2i\), tedy \(c=i\). A samozřejmě tím pádem vidíme, že \(d=0\).

Spin obecně v obecném úhlu

Těchto matic můžeme využít při určení obecných pravidel, jak se chová spin, pokud “nevíme, co měříme”, ale prostě “to měříme”. Máme-li však nějakou částici (obecně) a nastavíme-li naše měřící zařízení “do obecného úhlu” vůči spinu této částice (protže netušíme, jak to může dopadnout). Označíme-li tedy obecně nějaký náš vektor \(\mathrm{\mathbb{\vec{u}}}\) jako vektor, poté můžeme psát složkově:

$$
\vec{u}=u_x + u_y + u_z
$$

A protože vektor bude (chceme, aby byl…) jednotkový, poté bude platit pythagoras:

$$
u^2_x+u^2_y+u^2_z=1
$$

Zpět ale k rovnici výše, kde jsem rozepsal pro jednotlivé souřadné osy. Asi vidíte, kam tím mířím a proč jsem tak udělal; vektory prostě lze klasicky lineárně sčítat, no a protože operátory už máme odvozené, můžeme jich rovnou využít v obecném zápisu:

$$
u_x\hat{\sigma_x}+u_y\hat{\sigma_y}+u_z\hat{\sigma_z}=\hat{\sigma_u}
$$

Tuto lineární superpozici snadno vyřešíme, obecně to vypadá takto:

$$
A\begin{pmatrix}a & b \\ c & d\end{pmatrix}+
B\begin{pmatrix}a & b \\ c & d\end{pmatrix}+
C\begin{pmatrix}a & b \\ c & d\end{pmatrix}
=
\begin{pmatrix}
Aa+Ba+Ca & Ab+Bb+Cb \\ Ac+Bc+Cc & Ad+Bd+Cd
\end{pmatrix}
$$

Takže:

$$
\hat\sigma_u =
u_x
\begin{pmatrix}
0 & 1 \\ 1 & 0
\end{pmatrix}
+
u_y
\begin{pmatrix}
0 & -i \\ i & 0
\end{pmatrix}
+
u_z
\begin{pmatrix}
1 & 0 \\ 0 & -1
\end{pmatrix}
=
\begin{pmatrix}
u_z & u_x-iu_y \\
u_x+iu_y & -u_z
\end{pmatrix}
$$

Rovnou z této matice (doufám!) vidíme, že je hermitovská. Proto můžeme \(\hat{\sigma_u}\) použít jako operátor ve známém:

$$
\hat{\sigma_u}\begin{pmatrix}\alpha\\\beta\end{pmatrix}=\lambda\begin{pmatrix}\alpha\\\beta\end{pmatrix}$$

A samozřejmě můžeme psát:

$$
\hat{\sigma_u}\begin{pmatrix}\alpha\\\beta\end{pmatrix}=+1\begin{pmatrix}\alpha\\\beta\end{pmatrix}$$

Nyní si budeme ještě muset lehce pohrát s normalizací vektoru \(\begin{pmatrix}\alpha\\\beta\end{pmatrix}\), protože jinak by nám opět vycházely divné hodtnoty pravděpodobností, typu 400 % a tak. Jak provést tedy normalizaci?

Abychom mohli takovou věc udělat obecně, musíme udělat opět takový malý trik. Není to nic nelegálního, ale hodně nám to zjednoduší práci. Pokud víme, že vlastní vektor bude vypadat tak, jak jsem psal v předchozí větě, stejně tak, pokud vím, že pokud chci, aby byl normalizovaný, bude jednotkový a tím pádem mohu předpokládat, že i nějaký jiný vektor, který místo něho použijeme (substitucí), bude-li jednotkový a bude mít stejné vlastnosti, bude použitelný stejně jako vektor původní. Tedy pokud prohlásíme, že:

$$
\begin{pmatrix}\alpha\\\beta\end{pmatrix}=\begin{pmatrix}1\\\alpha_0\end{pmatrix}
$$

a budeme-li dále pracovat s tímto vektorem, uvidíme, že si dost ulehčíme práci a zpětně se dostaneme tam, kde jsme začali, ale budeme mít vyřešenou normalizaci. Co je tedy tato hodnota \(\alpha_0\)? Pojďme se podívat, jak toto odvodit. Víme, že budeme-li předopkládat, že vektor \(\begin{pmatrix}1\\\alpha_0\end{pmatrix}\) bude normalizován, bude se chovat jako kterékoliv jiné vlastní vektory[18]to neznamená, že je to postačující podmínka takové funkce a bude platit:

$$
\begin{pmatrix}
u_z & u_x-iu_y \\
u_x + iu_y & -u_z
\end{pmatrix}
\begin{pmatrix}
1\\\alpha_0
\end{pmatrix}
=
+1
\begin{pmatrix}
1\\\alpha_0
\end{pmatrix}
$$

Zkusme vytvořit první rovnici:

$$
u_z + \alpha_0(u_x-iu_y) =1
$$

Z toho jasně dokážeme vyjádřit \({}\alpha_0{}\): 🙂

$$
\alpha_0(u_x-iu_y)=1-u_z
\alpha_0=\frac{1-u_z}{u_x-iu_y}
$$

A můžeme dosadit:

$$
\begin{pmatrix}
1\\\alpha_0
\end{pmatrix}
=
\begin{pmatrix}
1\\\frac{1-u_z}{u_x-iu_y}
\end{pmatrix}
$$

Nicméně tento vektor tedy nejspíše pořád nebude (s největší pravděpodobností) normalizován. A s tím si musíme poradit. Musí tedy současně platit dva následující vtazhy:

$$
|\phi\rangle=
\begin{pmatrix}
1\\\alpha_0
\end{pmatrix}
\\
\phi\phi^*=1
$$

Musí tedy platit:

$$
\begin{pmatrix}
1 &\alpha_0
\end{pmatrix}
\begin{pmatrix}
1\\\alpha_0
\end{pmatrix}
=
1
$$

Budeme chvilku předpokládat, že stále “nejsme normalizováni”. Zvolme si za normalizační konstantu například \(\nu\). Potom bude platit, že normalizovaný vztah výše bude vypadat jako:

$$
|\phi\rangle=
\nu\begin{pmatrix}
1\\\alpha_0
\end{pmatrix}
$$

Můžeme tedy psát:

$$
\nu
\begin{pmatrix}
1 & \alpha_0
\end{pmatrix}
\nu
\begin{pmatrix}
1 \\ \alpha_0
\end{pmatrix}
=
1
$$

a to řešit jako

$$
\nu^2
\left(
1+\color{red}{\alpha_0^*}\color{green}{\alpha_0}
\right)
= 1
$$

To vyřešíme (dosadíme za \(\alpha_0\)):

$$
\nu^2
\left[
1+
\color{red}{
\left(
\frac{1-u_z}{u_x+iu_y}
\right)
}
\color{green}{
\left(
\frac{1-u_z}{u_x-iu_y}
\right)
}
\right]
=1
$$

A teď nastane opravdový “hustý trik” 🙂 Víme, nejprve roznásobíme (to trik ještě není):

$$
\nu^2
\left[
1+
\left(
\frac{\left(1-u_z\right)^2}{u_x^2+u_y^2}
\right)
\right]
=1
$$

A nyní nastane velký trik. Víme, že nahoře jsme pro připomenutí psali, že u jednotkového vektoru bude platit pythagorské:

$$
\color{pink}{u_x^2+u_y^2}+u_z^2=1
$$

Barevně máme označenou část, kterou však máme ve jmenovateli! Můžeme tedy místo jmenovatele psát:

$$
u_x^2+u_y^2=1-u_z^2
$$

A to nám (jak vidíte) hodně zjednoduší práci 🙂

$$
\nu^2
\left[
1+
\left(
\frac{\left(1-u_z\right)^2}{1-u_z^2}
\right)
\right]
=1
$$

Nyní můžeme rozložit jmenovatele a zkrátit:

$$
\nu^2
\left[
1+
\left(
\frac{\left(1-u_z\right)^2}{\left(1-u_z\right)\left(1+u_z\right)}
\right)
\right]
=1
$$

$$
\nu^2
\left[
1+
\frac{\left(1-u_z\right)}{\left(1+u_z\right)}
\right]
=1
$$

$$
\nu^2
\left[
\frac{\left(1+u_z\right)}{\left(1+u_z\right)}
+
\frac{\left(1-u_z\right)}{\left(1+u_z\right)}
\right]
=1
$$

$$
\nu^2
\left[
\frac{2}{\left(1+u_z\right)}
\right]
=1
$$

Z toho už snadno odvodíme \(\nu\) jako:

$$
\nu^2=
\frac{1+u_z}{2}
$$

a tedy:

$$
\nu = \sqrt{\frac{1+u_z}{2}}
$$

A tím máme normalizační faktor vyřešený. Jako zkoušku si klidně (můžete sami) dosaďte za \(u_x=1\) a ostatní prvky dejte nulové, vyjdou vám vlastní vektory, které už jsme používali. Pouze dosaďte do:

$$
|\phi\rangle=
\sqrt{\frac{1+u_z}{2}}
\begin{pmatrix}
1 \\
\frac{1-u_z}{u_x-iu_y}
\end{pmatrix}
$$

Uvidíte, že to bude vycházet 🙂

Tolik asi k normalizaci. Pokud bychom obecně připravili nějakou částici v obecném stavu a úhlu, měřili ji v jiném obecném úhlu, vyjde nám pravděpodobnost \(P=\cos^2\frac{\phi}{2}\) (využijeme při tom výpočtů, které už jsme si tady ukazovali, nic jiného). Tento článek už je poměrně dlouhý, proto ho zde nyní utněme (v nejlepším přestat, že 🙂 ) a příště se věnujme dalším věcem a zákonitostem, které s polarizacemi a spinem souvisejí.

 

Poznámky pod čarou

Poznámky pod čarou
1 Pro další informace rozhodně doporučuji tento popis experimentu: ElektronovySpin.pdf.
2 Redukované planckovy konstanty, tedy \(\hbar=\frac{h}{2\pi}\).
3 Opět — osu bude mít pouze v makroskopickém světě, v případě spinu hovořit o ose rotace je chybné.
4 Komplexně konjugované číslo, pro zopakování, je číslo, které má stejnou reálnou část, ale opačnou imaginární. Sami vidíme, že u reálných čísel se jedná opravdu o “umocnění na druhou”.
5 vše vztaženo k experimentu, kdy měříme “je to u?
6 Velmi podobné ortogonálním, jen mají jednotkovou velikost. Ortogonální vektory nám říkají, že pokud je jeden “něčím”, pak ten druhý je vším jen ne “něčím”, tedy např. pokud jeden vektor popisuje stav u, poté ortogonální popisuje stav přesně ne-u, tedy d 🙂 (Ano, tyto  vektory jsou tedy lineárně nezávislé a tvoří bázi prostoru, ale lineární algebru nechme na jindy.)
7 Protože 2. mocnina čehokoliv z $latex\mathbb{R}$ bude kladné číslo.
8 Viz https://www.eng.tau.ac.il/~shtaif/PolarizationClass.pdf.
9 Co to je, jsme řešili v minulém článku.
10 Viz http://www.informationphilosopher.com/solutions/experiments/dirac_3-polarizers/
11 Viz http://alienryderflex.com/polarizer/
12 Viz polarize.pdf
13 Polarizační filtry…
14 Až na pár velmi podstatných rozdílů, které si samozřejmě záhy ukážeme.
15 Tedy proporčně budou jako \(\cos^2(\phi)\), nicméně lehko odlišné.
16 Podle fyzika Pauliho, který za svůj vylučovací princip dostal Nobelovu cenu za fyziku.
17 Viz http://planetmath.org/PauliMatrices
18 to neznamená, že je to postačující podmínka takové funkce

Polarizace a spin částice (1. část)

V minulém článku o Entropii a termodynamice jsem vám slíbil, že se zase vrátíme zpět k “nějakým částicím”. Nevrátíme se však k nějakým konkrétním, vrátíme se totiž pouze k jedné z jejich vlastností — spinu.

Ohledně spinu existuje takový problém — on se (jako vlastnost) dá jen velmi těžko představit. Můžu samozřejmě používat různých analogií, ale jak si ukážeme, když se trošku ponoříme do problematiky, dost těchto analogií (buďme upřímní — všechny) ukážou dříve či později nějaký zásadní smrtelný problém. Jak už je však zvykem, než se dáme do samých popisů spinů částic a jak s nimi fungovat, musíme si připravit lehké matematické podhoubí, abychom pochopili zákonitosti[1]Protože pokud chceme pochopit spin, musíme pochopit i ten zbytek..

Matematické základy

Budeme hojně využívat matic, vektorůkomplexních čísel. Bližší popis vektorových a maticových základních operací je mimo rozsah článku, v případě, že byste nevěděli “která bije”, o matematických operacích s vektory a maticemi doporučím některý z článků či prezentací volně ležících na internetu:

Primární studium — tedy zjistit jak co funguje:

Další materiály (sekundární studium):

Bohužel je pro pochopení článku bezpodnínečně nutné, abyste alespoň zákaldní operace s vektory znali. Není potřeba žádných “hlubokých” znalostí, ale vysvětlovat co je to vektor či matice je bohužel mimo rozsah tohoto článku.

Nyní tedy jen stručně — jedna ze zákaldních operací, kterou budeme potřebovat, je maticový součin:

$$ \begin{pmatrix}a & b\end{pmatrix} \begin{pmatrix}c\\d\end{pmatrix}=a\cdot c + b \cdot d$$

$$\begin{pmatrix}a_{11} & a_{12} \\ a_{21} & a_{22}\end{pmatrix} \begin{pmatrix}b_1 \\ b_2\end{pmatrix} = \begin{pmatrix}a_{11}b_1 + a_{12}b_2 \\ a_{21}b_1 + a_{22}b_2\end{pmatrix}$$

Ohledně komplexních čísel budeme muset znát pojem komplexně sdružené číslo, což je takové číslo, jehož imaginární složka je převrácená. Označujeme “hvězdičkou”:

$$ X = a + \mathrm{i}b$$

$$ X^{*} = a – \mathrm{i}b$$

Diracova notace, systém bra-ket

Nyní, když víme, co budeme potřebovat jako teoretický základ, můžeme se s chutí vrhnout na to, co slibuje samotný podnadpis, tedy  na tzv. Diracovo[2]či Diracovou, ale to se mi dost příčí notaci, nebo-li systém bra-ket.

Jak jste si zajisté všimli, slovo “bra” a “ket” dohromady v angličtině dají slovo “bra/c/ket” — tedy “závorky” 🙂 Velmi roztomilé. Každopádně systém je tvořen dvěma vektory:

Vektor bra (ano, podprsenka…), který vypadá následovně:

$$\langle{}a | = \begin{pmatrix}a_1 & a_2\end{pmatrix}^*$$

Tedy jedná se o řádkový vektor, kde jsou čísla navíc komplexně sdružená. U reálných hodnot toto samozřejmě nemá vliv (pokud komplexně sdružíte reálné číslo, získáte to samé reálné číslo), nicméně v případě s výpočty v komplexní rovině na to nesmíte zapomenout.

Vektor ket vypadá takto:

$$ |a\rangle = \begin{pmatrix}a_1 \\ a_2\end{pmatrix}$$

Samozřejmě bych mohl zobecnit do \(n\) dimenzí, ale pro zjednodušení teď uvažujme pouze dvě. S více dimenzemi se setkáme později, až se toto budeme snažit prakticky ukázat na polarizaci fotonu a elektronu.

S těmito vektory můžete provádět veškeré operace, na které jste zvyklí od běžných vektorů — např. součet dvou ket vektorů:

$$|a\rangle +|b\rangle= \begin{pmatrix}a_1 \\ a_2\end{pmatrix} + \begin{pmatrix}b_1 \\ b_2\end{pmatrix} = \begin{pmatrix}a_1+b_1\\a_2+b_2\end{pmatrix}$$

Co je pro nás však důležité (z hlediska fyziky), pokud vynásobíme bra vektor vektorem ket. Tedy:

$$\langle{}a|b\rangle$$

Toto můžeme pojmenovat jako skalární součin[3]Pro potřeby tohoto článku budu označovat takto, nicméně skalární součin normálně funguje bez komplexně sdružených čísel, takže toto ve své podstatě není “až tak” běžný skalární součin. Správně bych měl třeba nazývat konjugovaný sk. součin, ale jsem moc líný to psát takto dlouhé — proto odteď budu psát pouze “skalární součin”. Děkuji za pochopení. a velmi dobře ho známe z běžných výpočtů s vektory[4]Pro další informace doporučuji bezvadný zdroj všech možných matematických informací — web MatFyzu :-): http://wiki.matfyz.cz/index.php?title=16._Formalizmus_kvantov%C3%A9_teorie.

Můžeme tedy psát (pro dvourozměrný prostor):

$$\langle{}a|b\rangle = \begin{pmatrix} a_1^* & a_2^* \end{pmatrix} \begin{pmatrix} b_1 \\ b_2 \end{pmatrix} = a_1^*b_1+a_2^*b_2$$

Výsledkem je tedy číslo, nikoliv vektor. Zkusíme-li nyní udělt komplexně sdruženou variantu toho součinu:

$$\langle{}a|b\rangle^* = a_1b_1^* + a_2b_2^*$$

Nyní už asi vidíme, že pokud bych otočil vektory:

$$\langle{}b|a\rangle = a_1b_1^* + a_2b_2^*$$

dostaneme totéž. Můžeme tedy s klidným svědomím psát:

$$\langle{}a|b\rangle = \langle{}b|a\rangle^*$$

Než budeme pokračovat dále, musíme se lehce zaměřit na matice a operace nad nimi. Pro ilustraci použiji 3×3 matice, ale samozřejmě bude fungovat v libovolných dimenzích. Začněme tedy popisem matice — jak jistě víte, matice má hlavní diagonálu:

$$A_{ij} = \begin{pmatrix}a_{11} & … & … \\ … & a_{22} & … \\ …  & … & a_{33}\end{pmatrix}$$

A můžeme z matice udělat matici transponovanou, jednoduše to znamená, že přehodíme (zrcadlově) podle osy hlavní diagonály hodnoty. Jinými slovy přehodíme řádky a sloupce. Značíme indexem \(T\):

$$\begin{pmatrix}a_{11} & a_{12} \\ a_{21} & a_{22}\end{pmatrix}^T = \begin{pmatrix} a_{11} & a_{21} \\ a_{12} & a_{22}\end{pmatrix}$$

Samozřejmě platí, že transponujeme-li dvakrát za sebou stejnou matici, získáme zpět tu první.

Dále je snad samozřejmé, že pokud budeme chtít komplexně sdružené hodnoty z matice, musíme udělat všechny komplexně sdružené hodnoty všech prvků:

$$\begin{pmatrix}a_{11} & a_{12} \\ a_{21} & a_{22}\end{pmatrix}^* = \begin{pmatrix}a_{11}^* & a_{12}^* \\ a_{21}^* & a_{22}^*\end{pmatrix}$$

Samozřejmě můžeme výše uvedené dvě matice “zkombinovat” — tedy transponovat a ještě převést na komplexně sdružené hodnoty. Takovou matici značíme “křížkem” (v angličtině dagger — čili dýka):

$$\begin{pmatrix}a_{11} & a_{12} \\ a_{21} & a_{22}\end{pmatrix}^\dagger = \begin{pmatrix} a_{11}^* & a_{21}^* \\ a_{12}^* & a_{22}^*\end{pmatrix}$$

Nyní prozkoumejme, co se stane, pokud použijeme např. následující matici:

$$\begin{pmatrix}1 & 2+i3 \\ 2-i3 & 4\end{pmatrix}^\dagger$$

Pokud uděláme “křížkovanou matici”, zjistíme, že se bude rovnat sama sobě, tedy:

$$\begin{pmatrix}1 & 2+i3 \\ 2-i3 & 4\end{pmatrix}^\dagger = \begin{pmatrix}1 & 2+i3 \\ 2-i3 & 4\end{pmatrix}$$

Pokud něco takového nastane, můžeme o naší matici tvrdit, že je hermitovská.

Zkusme nyní, co se stane, zkusíme-li vynásobit matici a ket vektor:

$$A|b\rangle=\begin{pmatrix} a_{11} & a_{12} \\ a_{21} & a_{22}\end{pmatrix} \begin{pmatrix} v_1 \\ v_2\end{pmatrix}$$

a dostaneme:

$$A|b\rangle=\begin{pmatrix} a_{11} & a_{12} \\ a_{21} & a_{22}\end{pmatrix} \begin{pmatrix} v_1 \\ v_2\end{pmatrix} = \begin{pmatrix} a_{11}v_1 + a_{12}v_2 \\ a_{21}v_1 + a_{22}v_2 \end{pmatrix}$$

Abychom tady pořád jen nepísmenkovali, zkusme si to ukázat prakticky na příkladu:

$$\begin{pmatrix}1 & 1+i \\ 1-i & 2 \end{pmatrix} \begin{pmatrix}1 \\ 0 \end{pmatrix} = \begin{pmatrix}1 \cdot 1 + (1+i) \cdot 0 \\ (1-i) \cdot 1 + 2 \cdot 0\end{pmatrix} = \begin{pmatrix}1\\ 1-i\end{pmatrix}$$

Zpátky k fyzice

Po krátké cestě do útrob matematiky se opět můžeme vrátit k fyzice a k tomu, k čemu všechny tyto matematické věci využijeme. Po cestě samozřejmě přidáme ještě nějaké další, ale výše uvedené jsou takovou “matematickou startovací čárou” pro pochopení věcí dalších.

Budeme se bavit o polarizaci částic, konkrétně světla, tedy fotonů. Co je to vlastně polarizace? K čemu slouží? Nejjednoduššeji si ji lze představit prostřednictvím obrázku. Mějme nějaký zdroj nepolarizovaného světla — např. žárovku, LED[5]Nikdy prosím nepište LED diodu, to je jazykově špatně., něco takového.

zdroj světlaZ tohoto zdroje se šíří nepolarizované světlo, tzn. že nemá žádnou “polaritu”. Tím je myšleno, že jeho vlny jdou “ve všech směrech” současně. Neplést s nehomogenním světelným zdrojem, což je zdroj, který vysílá světlo “na všech frekvencích”. Světelný zdroj tedy může být polarizovaný homogenní, nepolarizovaný homogenní, polarizovaný nehomogenní a nepolarizovaný nehomogenní.

Abychom takové světlo “zpolarizovali”, potřebujeme nějaký polarizátor, případně polarizační filtr. Polarizační filtr je zařízení, které propustí světlo pouze které má nějakou konkrétní polarizaci. Pro zjednodušení si nyní určeme tři základní směry:

  • doprava doleva se budeme pohybovat po ose \(x\).  Světlo polarizovaní po ose \(x\) bude světlo s horizontální polarizací
  • nahoru dolů se budeme pohybovat po ose \(y\). Světlo takto polarizované bude mít vertikální polarizaci.
  • dopředu a dozadu se nacházíme na ose \(z\). Světlo takto polarizované bude mít taktéž horizontální polarizaci.

Pro zjednodušení však nejdříve budeme uvažovat pouze dva směry, tedy doprava/doleva a nahoru/dolů. Přidejme proto do našeho situačního plánku takový polarizační filtr a pošleme skrz něho paprsek světla:

paprsek

Tento paprsek bude mít po průchodu takovým polarizátorem vertikální polarizaci, tedy bude mít polarizaci po ose \(y\). Pokud bychom nyní zkoušeli, co se s takovým paprskem dále stane, zařadíme-li do něho další polarizátor, zjistíme, že zařadíme-li další vertikální \(y\) polarizátor, světlo neztratí nic ze své intenzity[6]samozřejmě v ideálních podmínkách s ideálními filtry atd. a bude mít intenzitu 100 % intenzity před druhým filtrem:

dvojitá polarizace stejným směrem

Naopak pokud druhý filtr otočíme o 90 °, bude výstupem 0% intenzita — všechno světlo se během sekundární polarizace ztratí:

dvojitá polarizace různým směrem

Pokud budeme s druhým filtrem různě otáčet, dostane se nám různé vělkých intenzit na výstupu takové kaskády; tyto intenzity budou dokonce záviset přímo na rozdílu úhlu těchto filtrů, konrétně faktorem \(\cos^2(\alpha)\). Nicméně zde končí běžný “makroskopický” svět našich dobře nám známých představ.

Když si totiž uvědomíme, že intenzita světla odpovídá \(I = \mathrm{k}E^2\), potom by mohlo vypadat, že s klesající intenzitou bude klesat i energie záření — a tím podle známého \(E=hf\) by měla klesat i frekvence záření. Nicméně to se neděje. A již za okamžik si vysvětlíme proč — jedná se totiž o kvantové jevy, které jsou pro člověka, který je zvyklý na běžné makroskopické jevy, poměrně nepřirozené.

Je nutné nad světlem (byť polarizovaným) uvažovat jako nad proudem částic. Druhý polarizátor nedělá nic jiného, než že propustí ty fotony, které splňují podmínky propuštění a “zamítne” fotony, které nesplňují takové podmínky. Avšak ty fotony, které propustí, těm energii nemění. Nenastává tedy změna energie fotonu, pouze množství fotonů, které se propustí. A to je dost zásadní rozdíl.

Pojďme se nyní podívat, jak funguje světlo jako proud částic. Využijme k tomu výše uvedených dvou polarizačních filtrů. Již jsme si představili braket vektory, nyní je můžeme využít prakticky. Trošku “ze vzduchu” nyní vypustím jeden důležitý vztah — který shodou okolností krásně popisuje kvantové jevy:

$$H|a\rangle=\lambda|a\rangle$$

Rovnice[7]Někdo v tom zajisté uvidí emotikonu vyjadřující předek autobusu 🙂 vyjadřuje, jakým způsobem se chovají částice v mikrosvětě. Zkusme nyní pomocí této rovnice vyjádřiv výše uvedené situace s dvěma polarizačními filtry. Ze začátku budu házet trochu “náhodné” hodnoty do matic, prosím zatím mi důvěřujte, postupně se dostanu i k jejich vyjádření, nyní však chci, abychom se podívali prakticky na využití rovnice.

Co jednotlivé komponenty rovnice znamenají? Nyní jen stručně:

  • \(\langle{}H|\) vyjadřuje matici[8]o které se časem dozvíme, že je Hermitovská, která vyjadřuje nějaké “hodnoty v experimentu”.
  • \(|a\rangle\) je tzv. vlastní vektor, který určuje stav systému.
  • \(\lambda\) je tv. vlastní číslo, které určuje výstup z experimentu.
  • \(|a\rangle\) je opět ten stejný vlastní vektor, jako o několik bodů výše. Všimněme si, že tento vektor je opravdu stejný jako na začátku reakce.

Pokud budeme tedy uvažovat vertikálně polarizované světlo (či proud částic obecně) a přiřadíme následující vektory:

  • horizontální polarizace: \(|x\rangle= \begin{pmatrix}1\\0\end{pmatrix}\)
  • vertikální polarizace: \(|y\rangle= \begin{pmatrix}0\\1\end{pmatrix}\)

Můžeme se ptát následujícím bra-ketovým zápisem:

$$\langle{}x|y\rangle$$

Tedy slovy: Jaká je pravděpodobnostní amplituda, že připravíme-li částici, která bude mít \(y\) polarizaci, projde taková částice filtrem s \(x\) polarizací? Samozřejmě se můžeme ptát pak i obecně na libovolný úhel, ale o tom až později.

Proč však pouze “pravděpodobností amplituda”? Protože abychom získali pravděpodobnost, musíme použít:

$$\langle{}x|y\rangle\langle{}y|x\rangle$$

Nicméně jak jsme ukázali výše, toto se dá zapsat i jako:

$$\langle{}x|y\rangle\langle{}x|y\rangle^*$$

Využijeme tedy komplexně sdružených čísel. Budeme-li však uvažovat pouze reálná čísla, kde je imaginární složka nulová, můžeme pak s klidným svědomím psát, že pravděpodobnost takového jevu je:

$$\langle{}x|y\rangle^2$$

Zpět k praktickému příkladu — jaká je tedy pravděpodobnost, že horizontálně polarizovaná částice projde filtrem s vertikální polarizací?

$$ \langle{}x|y\rangle^2 = \begin{pmatrix}1 & 0\end{pmatrix}^* \begin{pmatrix}0\\1\end{pmatrix} = 0$$

Výpočet tedy odpovídá realitě, protože pro kolmé roviny polarizace částice a polarizačního filtru, je pravděpodobnost opravdu nulová.

Stejně tak zjistíme, že pro stejnou polarizaci částice i směr filtru dostaneme:

$$ \langle{}x|y\rangle^2 = \begin{pmatrix}1 & 0\end{pmatrix}^* \begin{pmatrix}1\\0\end{pmatrix} = 1$$

Čili opět odpovídající stav realitě — v takovém případě máme 100% pravděpodobnost, že taková částice projde.

Vraťme se nyní k našemu (starému známému) \(H|a\rangle=\lambda|a\rangle\).

Nyní opět “vystřelím” do vzduchu a napíšu, jak takové \(H\) vypadá, vysvětlení však přijde později (odvození). Myslím si, že pro pochopení toho, jak to odvodit, je dobré nejdříve vědět, jak tato “věc” funguje. Potom už je odvození otázka chvilky 🙂

Řekněme, že tato Hermitovská matice má tvar \(\begin{pmatrix}1&0\\0&-1\end{pmatrix}\).

Potom, co uděláme \(H|x\rangle=\lambda|x\rangle\)  zjistíme, že:

$$\begin{pmatrix}1 & 0\\0 & -1\end{pmatrix}\begin{pmatrix}1\\0\end{pmatrix}$$

můžeme vyřešit jako:

$$\begin{pmatrix}1 & 0\\0 & -1\end{pmatrix}\begin{pmatrix}1\\0\end{pmatrix}=\begin{pmatrix}1\cdot1 + 0\cdot 0 \\ 0 \cdot 1 – 1 \cdot 0\end{pmatrix} = \begin{pmatrix}1 \\ 0\end{pmatrix}$$

Podíváme-li se na výše uvedenou formuli:

$$\color{blue}H|\color{red}a\rangle=\color{pink}\lambda|\color{red}a\rangle$$

a zapíšeme-li maticově tedy jako:

$$\color{blue}{\begin{pmatrix}1 & 0\\0 & -1\end{pmatrix}}\color{red}{\begin{pmatrix}1\\0\end{pmatrix}}=\color{red}{\begin{pmatrix}1 \\ 0\end{pmatrix}}$$

a tedy pouze doplníme \(\color{pink}\lambda\) a získáme:

$$\color{blue}{\begin{pmatrix}1 & 0\\0 & -1\end{pmatrix}}\color{red}{\begin{pmatrix}1\\0\end{pmatrix}}=\color{pink}\lambda\color{red}{\begin{pmatrix}1 \\ 0\end{pmatrix}}$$

Vidíme, že \(\lambda=1\). Nyní se zkusme podívat, co se stane, pokud použijeme ket \(|y\rangle\):

$$\color{blue}{\begin{pmatrix}1 & 0\\0 & -1\end{pmatrix}}\color{red}{\begin{pmatrix}0\\1\end{pmatrix}}=\color{pink}\lambda\color{red}{\begin{pmatrix}0 \\ 1\end{pmatrix}}$$

Spočítáme-li součin hermitovské matice a ketu na levé straně rovnice, dostaneme:

$$\begin{pmatrix}1 & 0\\0 & -1\end{pmatrix}\begin{pmatrix}0\\1\end{pmatrix}=\begin{pmatrix}1\cdot0 + 0\cdot 1 \\ 0 \cdot 0 – 1 \cdot 1\end{pmatrix} = \begin{pmatrix}0 \\ -1\end{pmatrix}$$

Abychom tedy dostali stejný vlasní vektor vpravo i vlevo, vlastní číslo \(\lambda\) musí být \(\color{pink}{\lambda=-1}\) a tedy:

$$\color{blue}{\begin{pmatrix}1 & 0\\0 & -1\end{pmatrix}}\color{red}{\begin{pmatrix}0\\1\end{pmatrix}}=\color{pink}{-1}\color{red}{\begin{pmatrix}0 \\ 1\end{pmatrix}}$$

Co nám tedy hodnota \(\lambda\) říká? Prakticky si ji můžeme představit jako “krabičku”[9]Prostě blackbox 🙂 , která nám nějakým indikátorem (třeba LED) říká, jestli to, co nastavujeme (stav systému, tedy ket) je v experimentu (zde bra) potvrzeno (\(\lambda\)) či nikoliv.

Polarizace s obecným úhlem

Zkusme se nyní podívat na situaci, kdy máme nějakým směrem (ať už horizontálně či vertikálně) polarizovaný paprdek svěla a proženeme ho polarizátorem, který je natočený nějakým obecným úhlem \(\phi\).

Začněme nejdříve trošku “méně obecnou” variantou, vlastně docela dost konkrétní — nastavme polarizační filtr pod úhlem 45 °. Jenže — vyvstává problém, jak vektorově reprezentovat možnost natočení pod tímto úhlem. Nabízí se (ne až tak špatné) řešení, které má však své drobné úskalí, jež ale velmi záhy překonáme a vyřešíme.

Představme si tedy nyní situaci, kdy máme vertikálně polarizovaný paprsek světla a postavíme před něho polarizátor v úhlu 45 ° “doprava” — tedy jako lomítko “/” 🙂 Jakým způsobem tedy reprezentovat toto “lomítko?” Dalo by se říci (přiblížit se cíli), že pokud je polarizátor pod takovýmto úhlem, je nastaven vlastně “někde akorát mezi” — tedy ani ne moc horizontálně, ale ani ne moc vertikálně.

Mohli bychom tedy zkusit vyslovit hypotézu, že výsledná polarizace bude něco jako součet horizontálního a vertikálního polarizátoru — tedy něco jako \(|x\rangle + |y\rangle\). To je poměrně dobrá myšlenka, ale přivádí nám některá úskalí, která si nyní ukážeme.

Víme, že vlastní vektory jsou vektory[10]Už jen proto, že se tak jmenují, ale hlavně se tak i chovají 🙂 , takže s nimi můžeme dělat i běžné vektorové operace, jako třeba součet:

$$\color{blue}{|x\rangle} + \color{violet}{|y\rangle} =
\color{blue}{\begin{pmatrix} 1 \\ 0 \end{pmatrix}}+\color{violet}{\begin{pmatrix} 0 \\ 1\end{pmatrix}}
=\begin{pmatrix} 1 \\ 1 \end{pmatrix}$$

Nyní však experiment — pokud vezmeme světlo polarizované pod úhlem 45 ° a proženeme ho filrem pod stejným úhlem, musí nám vyjít, že máme opět 100 % světla, která jsme tam vpustili, i na druhé straně, tedy označíme-li takový polarizační filtr jako \(|/\rangle\) a zdroj světla jako \(\langle/|\), dostaneme:

$$\left(|\langle{}/|/\rangle{}|\right)^2=\left(\begin{pmatrix}1 & 1\end{pmatrix}\begin{pmatrix} 1 \\ 1 \end{pmatrix}\right)^2 = 2^2 = 4$$

Čili, jak vidíme, vyjde nám 400% pravděpodobnost, že foton projde. To je sice dost působivé, nicméně potřebovali bychom (tak nějak logicky) dostat, že nám prostě vyjde 100 %. A toho docílíme metodou normalizace.

Nejjednoduššeji bychom řekli, že chceme ze čtyřky udělat jedničku, takže prostě podělíme čtyřmi a máme jedničku — ve své podstatě vlastně ano, ale pokud bychom si chvilku s vektry hráli a zjišťovali, čím vstup podělit, aby na výstupu bylo 4krát menší číslo, přišli bychom na vztah:

$$\frac{|x\rangle + |y\rangle}{\sqrt{2}}$$

Zkusme nyní ověřit:

$$\begin{pmatrix}\frac{1}{\sqrt{2}} & \frac{1}{\sqrt{2}}\end{pmatrix}\begin{pmatrix}\frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{2}}\end{pmatrix}=\frac{1}{\sqrt{2}}\cdot\frac{1}{\sqrt{2}} + \frac{1}{\sqrt{2}}\cdot\frac{1}{\sqrt{2}} = \frac{1}{2} + \frac{1}{2} = 1$$

Skvělé! Takže máme předpis, který pro takovou polarizaci můžeme použít. Zcela intuitivně též odhadneme, jak bude vypadat vzorec pro polarizační filtr o 45 ° na druhou stranu, tedy jako lomítko “\” — vertikální složka (tedy \(|x\rangle\)) zůstane stejná, horizontální složka bude opačná (tedy \(-|y\rangle\)):

$$\frac{|x\rangle – |y\rangle}{\sqrt{2}}=\begin{pmatrix}\frac{1}{\sqrt{2}} \\ -\frac{1}{\sqrt{2}}\end{pmatrix}$$

Nyní tedy zkusme, jak by dopadlo, pokud bychom vzali polarizované světlo ve směru “opačného lomítka \” a pustili ho přes filtr “běžného lomítka /?”  Víme, že výsledek musí být nulový, ověřme proto funkci:

$$
|\left\langle\color{red}/|\color{violet}\setminus\right\rangle|^2=
\left(
\color{red}{\begin{pmatrix}\frac{1}{\sqrt{2}} & \frac{1}{\sqrt{2}}\end{pmatrix}}
\color{violet}{\begin{pmatrix}\frac{1}{\sqrt{2}}\\-\frac{1}{\sqrt{2}}\end{pmatrix}}
\right)^2=
\left(
\color{red}{\frac{1}{\sqrt{2}}}\cdot\color{violet}{\frac{1}{\sqrt{2}}}-
\color{red}{\frac{1}{\sqrt{2}}}\cdot\color{violet}{\frac{1}{\sqrt{2}}}
\right)^2=0
$$

Nyní, když víme, že naše vektory pro zápis polarizačního filtru jsou funkční, můžeme opět stejně, jako jsme měli výše, provést pokus s Hermitovskou maticí[11]tentokrát trochu jinou, později se opravdu dostanu k odvození toho, proč zrovna takovou 🙂 :

$$
H|/\rangle=\lambda|/\rangle
\\
\begin{pmatrix}
0 & 1 \\
1 & 0
\end{pmatrix}
\cdot
\begin{pmatrix}
\frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{2}}
\end{pmatrix}
=
\begin{pmatrix}
\frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{2}}
\end{pmatrix}
=
\lambda\cdot
\begin{pmatrix}
\frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{2}}
\end{pmatrix}
$$

Vidíme tedy, že vlastní vektory se opět rovnají, a tedy \(\lambda=1\) taktéž.

Krátké shrnutí

Shrňme si nyní v krátkosti, jak vypadají jednotlivé vektory pro různé úhly polarizace:

  • Vertikální polarizace, tedy “|” : \(0|x\rangle+1|y\rangle=\begin{pmatrix}0 \\ 1\end{pmatrix}\)
  • Horizontální polarizace, tedy “–” : \(1|x\rangle+0|y\rangle=\begin{pmatrix}1 \\ 0\end{pmatrix}\)
  • Šikmá polarizace “/” : \(\frac{1}{\sqrt{2}}|x\rangle+\frac{1}{\sqrt{2}}|y\rangle=\begin{pmatrix}\frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{2}}\end{pmatrix} \)
  • Šikmá polarizace “\” : \(\frac{1}{\sqrt{2}}|x\rangle-\frac{1}{\sqrt{2}}|y\rangle=\begin{pmatrix}\frac{1}{\sqrt{2}} \\ -\frac{1}{\sqrt{2}}\end{pmatrix} \)[12]Ve své podstatě je téměř jedno, jestli dáte do záporu \(x\) nebo \(y\), protože výsledek bude prakticky stejný — stejně jako je jedno, jestli uděláte při např. vertikální polarizaci opačně \(y\), pro světlo je to jedno 🙂

Možná už je trošku z tohoto shrnutí vidět, co vlastně reprezentují jednotlivá čísla zapsaná v těchto takto zapsaných vlastních vektorech. Jedná se (opět, narazili jsme na to ze začátku textu) o pravděpodobnostní amplitudu, což je neměřitelná veličina, která právě v kvantovém světě popisuje krásně tyto jevy. Pokud umocníme absolutní hodnotu této veličiny na druhou, dostaneme pravděpodobnost, jakou projde částice filtrem právě s takovou pravděpodobnostní amplitudou.

Jak je to tedy s obecným vztahem pro obecný úhel?

Podívejme se nyní na to, jak bychom obecně vyjádřili vlastní vektor pro obecný úhel. Podíváme-li se na běžný graf, kde jsem zakreslil nějaký obecný jednotkový vektor pod úhlem \(\phi\)…

Základní diagram obecného vektoru
Základní diagram obecného vektoru

Dá nám smysl, že tento jednotkový vektor vytkne na ose \(x\) právě \(\cos{\phi}\) a na ose \(y\) právě \(\sin{\phi}\) jednotek těchto os.  Zkusme tedy předpokládat, že bychom mohli tvrdit následující (což vypadá poměrně logicky):

$$
|\phi\rangle=
\begin{pmatrix}
\cos{\phi}\\\sin{\phi}
\end{pmatrix}
=
\cos{\phi}|x\rangle + \sin{\phi}|y\rangle
$$

Stejně jako u všech vektorů, pokud chceme vytvořit kolmý vektor (v tomto případě dokonce ortogonální, tedy takový, který má přesně opačné vlastnosti jako první vektor[13]Či lidově — vše, co je tuto, přesně není tamto 😀 ), uděláme “trik” s prohozením a otočením, tedy obecně vektor \(\begin{pmatrix}x \\ y\end{pmatrix}\) převedeme na \(\begin{pmatrix}y \\ -x\end{pmatrix}\). Nazvěme si tedy náš první vektor kupříkladu \(\phi_{\alpha}\) a náš druhý \(\phi_{\beta}\):

$$
\phi_{\alpha}=
\begin{pmatrix}
\cos{\phi}\\\sin{\phi}
\end{pmatrix}
$$

$$
\phi_{\beta}=
\begin{pmatrix}
\sin{\phi}\\-\cos{\phi}
\end{pmatrix}
$$

Ověřme nyní hypotézu o průchodu dvěma polarizátory (případně hypotézu o průchodu polarizovaných fotonů kolmo orientovaným polarizátorem):

$$
\left\langle \phi_{\alpha}|\phi_{\beta}\right\rangle=
\begin{pmatrix}
\cos{\phi} & \sin{\phi}
\end{pmatrix}
\begin{pmatrix}
\sin{\phi} \\ -\cos{\phi}
\end{pmatrix}
=
\cos{\phi}\sin{\phi}-\sin{\phi}\cos{\phi}
=
0
$$

Tedy potvrzeno 🙂 Zkusme pro jistotu ještě dvě stejnosměrné polarizace:

$$
\left\langle \phi_{\alpha}|\phi_{\alpha}\right\rangle=
\begin{pmatrix}
\cos{\phi} & \sin{\phi}
\end{pmatrix}
\begin{pmatrix}
\cos{\phi} \\ \sin{\phi}
\end{pmatrix}
=
\cos{\phi}\cos{\phi}+\sin{\phi}\sin{\phi}
=
\cos^2{\phi}+\sin^2{\phi}
=
1
$$

Nyní se podívejme, jaká pravděpodobnost průchodu částice bude, pokud připravíme částici s obecnou polarizací pod úhlem \(\phi\) a polarizační filtr nastavíme horizontálně:

$$
\left(
|
\left\langle x | \phi \right\rangle
|
\right)^2
=
\left(
\begin{pmatrix}
1 & 0
\end{pmatrix}
\begin{pmatrix}
\cos{\phi} \\ \sin{\phi}
\end{pmatrix}
\right)^2
=
\left(
1\cdot\cos{\phi} + 0\cdot\sin{\phi}
\right)^2
=
\cos^2{\phi}
$$

No, tak výborně 🙂 Stejným způsobem bychom mohli spočítat pravděpodobnost průchodu, pokud není polarizační filtr nastaven horizontálně, ale vertikálně, vyjde to prostě stejně. Nyní tedy nezbývá než udělat naprosto obecný případ.

Mějme tedy zdroj nějakého světla, který proženeme dvěma polarizačními filtry, každý nastaven pod určitým obecným úhlem, první např. pod úhlem \(\phi_\alpha \) a druhý pod úhlem \(\phi_\beta\). Podrobme naše výpočty tomuto testu. Nejprve tedy připravíme světelný paprsek filtrem \(\phi_\alpha\), poté pokračujeme dále k filtru \(\phi_\beta\):

$$
\left|
\left\langle\beta|\alpha\right\rangle
\right|^2
=
\left(
\begin{pmatrix}
\cos\beta & \sin\beta
\end{pmatrix}
\begin{pmatrix}
\cos\alpha \\ \sin\alpha
\end{pmatrix}
\right)^2
=
\left(
\cos\beta\cos\alpha + \sin\beta\sin\alpha
\right)^2
=
\cos(\alpha-\beta)^2
$$

Možná se budete divit, jak jsem se dostal k poslednímu kroku — je to nějaký vzoreček, stejně jako \(\cos^x+\sin^2x=1\), platí i tento vzoreček 🙂 Dále — proč tam není rozdíl úhlů třeba opačný — opět, je to jedno, protože platí \(\cos{x}=\cos{-x}\).

Tím jsme si tedy potvrdili funkci těchto “stavebních bloků”. Vraťme se nyní na chvilku k původnímu vzorci:

$$ H|a\rangle=\lambda|a\rangle$$

A právě k Hermitovské matici \(\hat{H}\). Výše jsme si ukázali nějaké příklady na tuto matici, nicméně zkusme ji nyní trošku zobecnit. Nejprve napíšu, jak “to s ní vypadá” a poté rozebereme, co se s takovou maticí dá dále dělat 🙂

$$
\hat{H}=
\begin{pmatrix}
\cos2\phi & \sin2\phi \\
\sin2\phi & -\cos2\phi
\end{pmatrix}
$$

Existují dva “vzorečky”, které zde využijeme:

$$\cos2\phi=\cos^2\phi-\sin^2\phi$$

$$\sin2\phi=2\sin\phi\cos\phi$$

Těch zde využijeme a přepíšeme do matice. Pro zjednodušení teď vynechám neustálé psaní \(\phi\) a \(2\phi\):

$$
\hat{H}=
\begin{pmatrix}
\cos2\phi & \sin2\phi \\
\sin2\phi & -\cos2\phi
\end{pmatrix}
=
\begin{pmatrix}
\cos^2-\sin^2 & 2\cos\sin \\
2\cos\sin & \sin^2 – \cos^2
\end{pmatrix}
$$

Použijeme-li tedy předpisu \(\hat{H}|\phi\rangle=\lambda|\phi\rangle\) a použijeme-li v něm nám již známé prvky, dostaneme:

$$
\hat{H}|\phi\rangle=\lambda|\phi\rangle
\\
\begin{pmatrix}
\cos^2-\sin^2 & 2\cos\sin \\
2\cos\sin & \sin^2 – \cos^2
\end{pmatrix}
\begin{pmatrix}
\cos \\ \sin
\end{pmatrix}
=
\lambda
\begin{pmatrix}
\cos \\ \sin
\end{pmatrix}
$$

Mělo by tedy platit, že produkt na levé straně bude stejný jako vektor na pravé straně. Udělejme tedy několik základních algebraických úprav:

$$
\begin{pmatrix}
\cos^2-\sin^2 & 2\sin\cos \\
2\sin\cos & \sin^2-\cos^2
\end{pmatrix}
\begin{pmatrix}
\cos \\ \sin
\end{pmatrix}
=
\begin{pmatrix}
\cos^3-\sin^2\cos+2\sin^2cos \\
2\cos^2\sin + \sin^3 – \cos^2\sin
\end{pmatrix}
= \\ =
\begin{pmatrix}
\cos^3+\sin^2\cos \\
\cos^2\sin + \sin^3
\end{pmatrix}
=
\begin{pmatrix}
\cos\left(\cos^2+\sin^2\right) \\
\sin\left(\cos^2+\sin^2\right)
\end{pmatrix}
=
\begin{pmatrix}
\cos \\
\sin
\end{pmatrix}
$$

Vidíme tedy, že produkt na levé straně je opravdu stejný, jako vektor na straně pravé, vlastní číslo je tedy \(\lambda=1\) 🙂 Stejně tak to bude fungovat i pokud použijeme vektoru ortogonálního, tedy \(\begin{pmatrix}-\sin \\ \cos\end{pmatrix}\), jen samozřejmě vyjde \(\lambda=-1\) dle očekávání — kolmý filtr na rovinu polarizace nepropustí nic.

Další pokračování článku

V dalším pokračování článku, která vydám v nedaleké budoucnosti, se budeme věnovat zvláštnímu typu polarizace, tedy kruhové polarizaci, potom spinu částice a dalším zajímavostem, tak se těšte 🙂

Poznámky pod čarou

Poznámky pod čarou
1 Protože pokud chceme pochopit spin, musíme pochopit i ten zbytek.
2 či Diracovou, ale to se mi dost příčí
3 Pro potřeby tohoto článku budu označovat takto, nicméně skalární součin normálně funguje bez komplexně sdružených čísel, takže toto ve své podstatě není “až tak” běžný skalární součin. Správně bych měl třeba nazývat konjugovaný sk. součin, ale jsem moc líný to psát takto dlouhé — proto odteď budu psát pouze “skalární součin”. Děkuji za pochopení.
4 Pro další informace doporučuji bezvadný zdroj všech možných matematických informací — web MatFyzu :-): http://wiki.matfyz.cz/index.php?title=16._Formalizmus_kvantov%C3%A9_teorie
5 Nikdy prosím nepište LED diodu, to je jazykově špatně.
6 samozřejmě v ideálních podmínkách s ideálními filtry atd.
7 Někdo v tom zajisté uvidí emotikonu vyjadřující předek autobusu 🙂
8 o které se časem dozvíme, že je Hermitovská
9 Prostě blackbox 🙂
10 Už jen proto, že se tak jmenují, ale hlavně se tak i chovají 🙂
11 tentokrát trochu jinou, později se opravdu dostanu k odvození toho, proč zrovna takovou 🙂
12 Ve své podstatě je téměř jedno, jestli dáte do záporu \(x\) nebo \(y\), protože výsledek bude prakticky stejný — stejně jako je jedno, jestli uděláte při např. vertikální polarizaci opačně \(y\), pro světlo je to jedno 🙂
13 Či lidově — vše, co je tuto, přesně není tamto 😀

Temná energie

Abychom se mohli podívat na temnou energii, musíme uvést alespoň pár věcí na pravou míru. Nejprve — co to vůbec taková temná energie je a jakým způsobem vůbec víme, že něco takového s nejvyšší pravděpodobností bude existovat.

Když E. Hubble v roce 1923 rozšířil hranice nám známého vesmíru a potvrdil (pozorováním a měřením vzdáleností), že mlhovina v Andromedě není jen nějaká další mlhovina, ale celá galaxie, která je navíc několikrát větší než naše Galaxie, nutně narazil na pár poznatků, které doslova otřásly dosavadní vědeckou komunitou a přidaly další pilíře poznání vesmíru a tedy i světa kolem nás.

Jedním z těchto pilířů bylo i objevení faktu, že vesmír se rozpíná. Všiml si totiž, že vzdálenější galaxie se od té naší vzdalují rychleji než ty bližší a usoudil z toho, že prostor doslova “vzniká” mezi těmito galaxiemi .

Z tohoto poznání plyne ještě jedna zajímavost — pokud se vesmír rozpíná a budeme-li předpokládat, že tomu tak vždy bylo, zcela logicky musel existovat bod v časoprostoru, kdy vesmír byl nekonečně malý.  K tomuto bodu poznání se dnešní vědci a teoretičtí fyzikové neustále blíží, na základě různých pozorování a měření jsou schopni neustále blíže se přiblížit bodu, kdy byl vesmír pouze tzv. singularitou (anebo byl doopravdy? Někteří totiž tvrdí, že se nejednalo o pravou singularitu, ale pouze o velmi zhuštěný vesmír).

Nyní se již však vrhněme na samotné odvození.

Hubbleova konstanta

Velmi často budeme operovat s tzv. Hubbleovo konstantou, musíme tedy vědět, co to je 🙂 Představme si, že máme třeba balónek, na kterém máme nakresleny tečky[1]jedná se o klasický příklad s populárně naučnou metodou, jak ukázat rozpínání vesmíru, ale použijeme ji jako základ i tady. Když se tento balónek bude roztahovat (tedy nafukovat) a budeme-li předpokládat, že balónek je z dokonale elasticky homogenního materiálu[2]tedy takového, který se rozpíná všude stejně, potom se všechny tečky budou oddalovat naprosto stejně. Udělejme si “grafický” příklad na několika takových tečkách, pro zjednodušení budeme uvažovat pouze jednu souřadnou osu, jako kdybychom tečky nakreslili třeba na gumičku, kterou bychom roztahovali (výsledek by byl samozřejmě stejný):

Grafická reprezentace roztahující se gumičky
Grafická reprezentace roztahující se gumičky

Pokud bychom popsali takto gumičku čísly a začali ji roztahovat, samozřejmě se jednotlivá čísla a proužky od sebe začnou vzdalovat:

Roztahující se gumička
Roztahující se gumička

Jakým způsobem můžeme něco takového vyjádřit matematicky? Jednoduše. Označme si, že vzdálenost \(D\) bude závislá na součinu souřadnic \(\Delta x\) a vzdálenosti mezi těmito souřadnicemi \(a(t)\) [3]časová závislost vzdálenost mezi šouřadnicemi je nutná, protože budeme řešit rozpínání v čase:

$$\begin{equation}\label{\eqref}D = \Delta x \cdot a(t)\end{equation}$$

Zderivujeme-li tento výraz podle času:

$$\frac{\mathrm{d}D}{\mathrm{d}t} = \Delta x \frac{\mathrm{d}a(t)}{\mathrm{d}t}$$

A uděláme-li malý matematický “trik”, tedy že vynásobíme celou rovnici jedničkou (tedy rovnice se nezmění), kde však jednička bude \(\frac{a}{a}\), dostaneme:

$$\frac{\mathrm{d}D}{\mathrm{d}t} = \Delta x \frac{\mathrm{d}a(t)}{\mathrm{d}t} \cdot \frac{a}{a}$$

A vidíme, že některé věci už známe — tedy uvnitř se nám znovu ukázala vzdálenost \(D = \Delta x \cdot a(t)\), kterou si můžeme vyjádřit:

$$\frac{\mathrm{d}D}{\mathrm{d}t} = D \frac{\mathrm{d}a(t)}{a \cdot \mathrm{d}t}$$

Nyní trošku odbočme — abychom se v tom lépe vyznali, zaveďme fyzikální zápis derivace tečkou, tedy že:

$$\frac{\mathrm{d}X}{\mathrm{d}t} = \dot X$$

Výše uvedený vzorec tak můžeme zjednodušit na:

$$\dot D = D \frac{\dot a}{a}$$

A samozřejmě si musíme uvědomit, že \(\dot D = v\) — rychlost, potom:

$$v = D \frac{\dot a}{a}$$

Důležitý je poslední zlomek, tedy \(\frac{\dot a}{a}\) — ten si označme jako \(H\) a je to právě Hubbleova konstanta, tedy:

$$v = D \frac{\dot a}{a}= D H$$

Z toho jasně můžeme vidět vztah: Pokud totiž víme, jakou rychlostí se od sebe vzdalují galaxie ve vesmíru (tedy \(v\)), můžeme jasně říci, jak jsou od sebe vzdáleny, \(D\) 🙂 A samozřejmě i opačně, tedy čím vzdálenější od sebe objekty jsou, tím rychleji se budou pohybovat. Nutno ještě říci, že Hubbleova konstanta \(H\) je takovou konstantou “napůl” — je totiž konstantní všude ve vesmíru v prostoru, ale nikoliv v čase, prostě s časem se mění. Je tedy fixní pouze v prostoru, nikoliv v čase.

Představme si tedy nějaký výsek vesmíru, kde vidíme jednotlivé galaxie[4]ponechme teď stranou, že bychom je nejspíše samotným okem neviděli tak, jak jsou na obrázku reprezentovány tečkami:

Galaxie jako tečky
Galaxie jako tečky

Zvolme si jednu tečku jako “naši Galaxii” a označme ji třeba nějakou barvou:

Naše Galaxie označena červěně
Naše Galaxie označena červěně

Tečku s Galaxií[5]Možná by bylo vhodné dát na pravou míru označování vesmírných objektů, je v tom, myslím si, dost velký nepořádek. Pokud napíši “Galaxie” s velkým “G”, myslím tím naši galaxii, ve které se nachází Sluneční soustava. Pokud se řekne “Mléčná dráha”, jedná se o pruh více viditelných hvězd na noční obloze, tyto termíny se poměrně zhusta zaměňují, celý název je Galaxie v Mléčné dráze, zkráceně Galaxie. Pokud píši “galaxie”, tedy s malým “g”, myslím tím jakákoliv jiná galaxie než Galaxie 🙂 Doufám, že už v tom nebude zmatek. rovnou prohlásím za střed vztažné soustavy, tedy tečka se nikam nebude hýbat a budu ji považovat za takový “nulový bod” se souřadnicemi [0, 0, 0, 0, …] (podle toho, kolik rozměrů budu potřebovat). Vybereme-li si teď libovolnou jinou galaxii a budeme-li měřit vzdálenost od Galaxie, naměříme vzdálenost \(D\).

Vzdálenost a vektor rychlosti
Vzdálenost a vektor rychlosti

Na obrázku vidíme zeleně zobrazenou vzdálenost a fialově vektor rychlosti. Newtonův teorém[6]Newton, Isaac (1687). Philosophiae Naturalis Principia Mathematica. London. pp. Theorem XXXI. nám říká, že na libovolný objekt, který se nachází na povrchu koule, jejímž středem bude naše Galaxie, bude působit gravitace celé hmoty v kouli obsažené a že body a hmota mimo tuto kouli se “anuluje” (gravitačně samozřejmě):

Hmoty, Newtonovy zákony
Hmoty, Newtonovy zákony

Pokud je množství hmota uvnitř koule rovno \(M\), galaxie, kterou měříme má hmotu \(m\), můžeme psát staré známé:

$$F = \kappa \frac{M m}{D^2}$$

A samozřejmě můžeme poté vyjádřit potenciální energii takové galaxie, protože víme, že:

$$E_p = \int_{\infty}^{D} F \mathrm{d}D$$

a tedy můžeme dosadit:

$$E_p = \int_{\infty}^{D} F \mathrm{d}D = \int_{\infty}^{D} \kappa\frac{Mm}{D^2} \mathrm{d}D = -\kappa\frac{Mm}{D}$$

Samozřejmě celková energie \(E\) takové galaxie bude součtem kinetické a potenciální energie:

$$ E = E_k + E_p$$

čili

$$ E = \frac{1}{2}mv^2 -\kappa\frac{Mm}{D}$$

Energie musí zůstat konstantní, protože platí zákon o zachování energie, tedy:

$$ E = \frac{1}{2}mv^2 – \kappa\frac{Mm}{D} = k$$

Trošku si pohrajeme s tímto vzorcem, vynásobíme nejdříve obě strany dvojkou, abychom se zbavili té dvojky vlevo:

$$ E = mv^2 – 2\kappa\frac{Mm}{D} = 2k$$

a podělíme celou rovnici \(m\):

$$ E = v^2 – 2\kappa\frac{M}{D} = \frac{2k}{m} = k$$

a vidíme, že vpravo máme pořád konstantu 🙂 Sice bude jiná, než \(k\) před tím, ale pořád bude konstantní, tedy budeme psát stále \(k\) 😉 Zkusme nyní dosadit dříve ukázané hodnoty, tedy \(D = \Delta x \cdot a(t)\) a \(v = \Delta x \cdot \dot a(t)\) do tohoto vzorce:

$$ \Delta x^2 \cdot \dot a(t)^2 – 2\kappa\frac{M}{\Delta x \cdot a(t)} = k $$

Pokud si uvědomíme, že hustota tělesa či soustavy těles se snadno spočte jako:

$$ \rho  = \frac{M}{V}$$

kde \(\rho\) odpovídá hustotě, \(M\) odpovídá hmotě systému a \(V\) odpovídá objemu. Objem koule (viz dříve, kdy jsem psal o Newtonově gravitačním zákonu) se spočítá samozřejmě jako:

$$V = \frac{4}{3}\pi D^3$$

Můžeme tedy upravit vzorec pro hustotu a vyjádřit \(M\) jako:

$$M = \frac{4}{3} \pi D^3 \rho(t)$$

Protože se \(\rho(t)\) mění v čase (jak se vesmír rozpíná), musíme s ním tak i počítat a uvést ho jako proměnný v čase. Toto \(M\) dosadit do vzorce s konstantou, který jsme odvodili výše, pro připomenutí:

 $$ \Delta x^2 \cdot \dot a(t)^2 – 2\kappa\frac{M}{\Delta x \cdot a(t)} = k $$

Dosadíme-li tedy \(M\) do tohoto vzorce, poté:

 $$ \Delta x^2 \cdot \dot a(t)^2 – 2\kappa\frac{\frac{4}{3}\pi D^3 \rho(t)}{\Delta x \cdot a(t)} = k $$

Rozepíšeme-li zmíněné \(D\) na to, co jsme psali výše, tedy \(D = \Delta x a(t)\), potom dostaneme:

$$ \Delta x^2 \dot a(t)^2 – 2\kappa\frac{\frac{4}{3}\pi {\color{red}{\Delta x^3a(t)^3}} \rho(t)}{\color{red}{\Delta x a(t)}} = k $$

Červeně jsem zvýraznil to, co můžeme zkrátit, proto to zkraťme:

$$ \Delta x^2 \dot a(t)^2 – 2\kappa \frac{4}{3}\pi \Delta x^\color{red}{2} a(t)^\color{red}{2} \rho(t) = k $$

Teď se nelekejte, nastane velký trik. Budeme totiž zjednodušovat. Aby nám dimenzionálně seděly proměnné, muselo by platit, že máme \(\Delta x^2\) vlevo i vpravo, ale vpravo vidíme pouze konstantu. Nicméně protože víme, že to musí dimenzionálně sedět[7]Aby nám rovnice dimenzionálně seděla, musíme mít prostě srovnané dimenze jednotlivých členů. Protože předpokládáme, že to počítáme správně, budeme se muset držet i tohoto zákona. V uvedené rovnici vidíme, že máme srovnané dimenzionálně pouze dva členy, tedy ten s derivací a ten druhý bez derivace. V konstantě tudíž musíme předpokládat, že se nějaký prvek ze stejné dimenze taktéž bude nacházet a tím pádem můžeme pokrátit., víme i, že v té konstantě musí být nějakým způsobem \(\Delta x^2\) obsaženo a můžeme proto \(\Delta x\) pokrátit, tedy:

$$ \color{red}{\Delta x^2} \dot a(t)^2 – \color{green}{2}\kappa \frac{\color{green}{4}}{3}\pi \color{red}{\Delta x^{2}} a(t)^{2} \rho(t) = k $$

$$ \dot a(t)^2 – \kappa \frac{\color{green}{8}}{3}\pi a(t)^{2} \rho(t) = k $$

Zde se \(k\) samozřejmě bude lišit od \(k\) před krácením, ale je to pořád nějaká konstanta, i když je jiná. Co v ní je nás vlastně ani moc v tento moment nezajímá. Zeleně jsem ještě zvýraznil malé zjednodušení.

Nyní můžeme celou rovnici podělit \(a(t)^2\) a dostat tedy:

$$ \frac{\dot a(t)^2}{\color{red}{a(t)^2}} – \kappa \frac{8}{3}\pi\frac{a(t)^{2} \rho(t)}{\color{red}{a(t)^2}} = \frac{k}{\color{red}{a(t)^2}} $$

a dostaneme tak (po přeházení členů):

$$ \color{green}{\frac{\dot a(t)^2}{a(t)^2}} = \color{red}{\frac{8}{3}\pi\kappa \rho(t)} – \color{blue}{\frac{k}{a(t)^2}}$$

Toto je zjednodušená varianta Friedman-Walker-Robertsonovy rovnice[8]Na wiki např.:
https://en.wikipedia.org/wiki/Friedmann%E2%80%93Lema%C3%AEtre%E2%80%93Robertson%E2%80%93Walker_metric
[9]odkaz na PDF s dalšími hrátkami s rovnicemi:
http://www.ita.uni-heidelberg.de/~dullemond/lectures/cosmology_2011/Chapter_4.pdf
[10]Dále už jen FWRr., na které si nyní ukažme další zajímavé souvislosti.

Rozdělme nyní rovnici na 3 části, které jsem zvýraznil v textu barevně. Začněme červeným prvkem \(\frac{8}{3}\pi\kappa\rho(t)\). Co o něm můžeme z hlediska “kladnosti a zápornosti” prohlásit? Všechny členy uvnitř jsou vždy kladné (buď jsou to konstanty, čísla anebo \(\rho(t)\), které je vždy kladné, protože hustota je vždy kladná) — a tedy celý tento červený prvek je vždy kladný.

Nyní se podívejme na modrý člen \(-\frac{k}{a(t)^2}\), kde už to začíná býti trošku zajímavé. Pokud bychom řekli, že konstanta \(-k\)[11]Jinými slovy se touto konstantou označuje tzv. křivost vesmíru bude vždy kladná (ano, i s tím minus), poté to znamená, že součet dvou členů v pravé části rovnice bude vždy kladný a to by znamenalo, že vesmír se bude neustále rozpínat. V levé části rovnice máme totiž Hubbleovu konstantu (na druhou), která nám říká, jak moc se vesmír rozpíná. Protože by toto číslo v čase bylo vždy kladné, znamenalo by to logicky, že by se tak vesmír neustále rozpínal “do nekonečna”. Tento stav označujeme jako tzv. otevřený vesmír. Bude-li naopak konstanta \(-k\) záporná (tedy samotné \(k\) bude kladné), poté by to mohlo znamenat (pokud by byla absolutní hodnota členu větší než toho červeného), že se vesmír v čase smršťuje, tedy tzv. uzavřený vesmír. No a nakonec varianta, kdy se konstanta bude rovnat nule, to znamená, že se sice vesmír rozpíná, ale konverguje asymptoticky k určitému bodu, kdy už se více rozpínat nebude (tento bod se nachází časově v nekonečnu). Této variantě říkáme plochý vesmír.

Pojďme se těmto variantám věnovat trošku detailněji. Vezměme si nějaký úsek vesmíru a pro zjednodušení použijme krychlovou výseč (šlo by to i s kulovou a jakoukoliv jinou, ale chci minimalizovat množství písmenek). Krychle má rozměr strany \(a\) a hmota v ní obsažená je opět \(M\), prostě:

Klasická krychle
Klasická krychle

Víme, že objem krychle \(V = a^3\) a tedy snadno odvodíme, že hustota \(\rho = \frac{M}{a^3}\). Této znalosti můžeme využit a můžeme dosadit do FWRr a dostaneme:

$$ \frac{\dot a(t)^2}{a(t)^2} = \frac{8}{3}\pi\kappa \color{red}{\frac{M}{a(t)^3}} – \frac{k}{a(t)^2}$$

Na základě pozorování a měření je zjištěno, že vesmír se s největší pravděpodobností chová jako plochý, tedy můžeme výraz zjednodušit na:

$$\frac{\dot a(t)^2}{a(t)^2} = \frac{8}{3}\pi\kappa \color{red}{\frac{M}{a(t)^3}}$$

Nyní bychom tedy chtěli vyřešit takovou rovnici pro \(a(t)\), což je dost netriviální záležitost. Nejjednodušší metodou tedy je učinit odhad, který se pokusíme napasovat do našeho výrazu.

Řekněme tedy, že obecně se bude \(a(t)\) rovnat polynomu \(Ct^p\), kde \(C\) je nějaká konstanta, \(t\) označuje čas a \(p\) je obecná mocnina:

$$a(t) = C t^p$$

Ještě si samozřejmě musíme spočítat hodnotu první derivace \(\dot a(t)\), tedy:

$$\dot a(t) = p C t^{p-1}$$

(použil jsem klasická pravidla pro derivování polynomu). Čemu je tedy rovna Hubbleova konstanta?

$$H = \frac{\dot a(t)}{a(t)} = \frac{p\color{red}{C}t^{p-1}}{\color{red}{C}t^p} = \frac{p\color{brown}{t^{p-1}}}{\color{brown}{t^p}}=\frac{p}{\color{brown}{t}}$$

Červeně a poté hnědě jsem zvýraznil krácení ve výrazu. Nyní již můžeme dosadit do FWRr:

$$ \frac{p^2}{t^2} = \frac{8}{3}\pi\kappa \frac{M}{\color{red}{a(t)^3}}$$

Ještě můžeme dosadit za červeně označené \(a(t) = Ct^p\):

$$ \frac{p^2}{t^{\color{blue}2}} = \frac{8}{3}\pi\kappa \frac{M}{C^3t^{\color{blue}{3p}}}$$

Nyní je opět čas oprášit naše známé dimenze — aby nám rovnice seděla, musí nám hlavně sedět dimenze. A co vidíme? Zvýrazněné modré exponenty nám musí sedět, tedy pokud máme na levé straně rovnice \(t^2\), musíme ho mít i na straně pravé. Je tedy jasné, že \(p=\frac{2}{3}\). Můžeme tedy napsat, že \(a(t)=Ct^{\frac{2}{3}}\).

Taková funkce má průběh:

Závislost a na t
Závislost a na t

Jak vidíme z tohoto excelového grafu, průběh funkce je krásně zaoblen a neustále se zpomaluje růst. Tento graf nám ukazuje rozpínání vesmíru, pokud ho uvažujeme jako hmotový. Tedy takový, kde převažuje množství hmoty  (proto jsme počítali s \(M\)). Nicméně ne vždy tomu tak bylo, v prvopočátcích vesmíru vzniklo velké množství hmoty a antihmoty. Pokud dáme k sobě dvě vzájemné antičástice, dokonale anihilují a vznikne foton — tedy se vyzáří “čistá” energie.  Veškerá hmota a antihmota tedy anihilovala a vyzářilo se tak obrovské množství pravděpodobně vysoceenergetických fotonů — a zbylo také malé množství hmoty — hmoty, která je vším, co v dnešním vesmíru pozorujeme. Do důsledku by tak šlo říci, že vše, co jsme a vše co vidíme je jen důsledkem nepatrné asymetrie v prvopočátcích vesmíru 🙂

Představme si tedy znovu náš “krychlový výsek” vesmíru se stranou \(a\), ale tentokrát v něm nebude hmota \(M\), ale fotony. Pro zopakování uvedu, že energii fotonu můžeme vyjádřit jako \(E = h f\), resp. \(E = \frac{hc}{\lambda}\)[12]Viz článek Malý nenásilný úvod do fyziky černých děr na mém hlavním blogu. Pokud se vesmír rozpíná a bude se rozpínat i náš krychlový výsek, bude se i zvětšovat vlnová délka \(\lambda\) takových fotonů, tedy samozřejmě energie takových fotonů bude klesat. Pozorováním tzv. kosmického záření (cosmic microwave background radiation) v pásmu mikrovln (což je o dost jinde, než byly asi původní gamapaprsky) se přesvědčujeme, že tato “radiační” fáze vesmíru nejspíše proběhla. Pozorováním těchto vesmírných paprsků tak vlastně koukáme na “vesmírnou archeologii”, vidíme, co se událo před spoustou miliard let jako pozůstatek kdysi ohromné zářivé energie.

Jak jsme si řekli, energie fotonu \(E\) proporčně odpovídá tedy převrácené hodnotě vlnové délky, tedy \(\frac{1}{\lambda}\), což současně odpovídá zvětšujícím se rozměrům, tedy \(\frac{1}{a}\). Můžeme tedy tvrdit, že:

$$ E = \frac{N}{a}$$

tedy že energie fotonů proporčně (přes konstantu \(N\)) odpovídá takto roměru \(a\). Energetická hustota “zářícího vesmíru” (povšimněte si, že se opět snažíme vyjádřit hustotu) tak bude odpovídat:

$$ \rho_E = \frac{N}{a} \frac{1}{V} = \frac{N}{a} \frac{1}{a^3} = \frac{N}{a^4}$$

Pro připomenutí, hustota hmotného vesmíru byla \(E = \frac{M}{a^3}\). Zkusme si dané dva průběhy graficky načrtnout:

Průběhy funkcí M/a^3 a N/a^4
Průběhy funkcí M/a^3 a N/a^4

Energetickou hustotu můžeme dosadit do FWRr, akorát místo hmotové hustoty dáme právě tuto energetickou:

$$ \frac{\dot a(t)^2}{a(t)^2} = \frac{8}{3}\pi\kappa \frac{N}{a(t)^4}$$

Pokud provedeme stejný odhad jako minule, dostaneme:

$$ \frac{p^2}{t^\color{blue}2} = \frac{8}{3}\pi\kappa \frac{N}{C^4 t^{\color{blue}{4p}}}$$

a aby nám opět seděly dimenze, vidíme, že \(p=\frac{1}{2}\).

Vraťme se nyní ke grafům; načrtněme si, jak by vypadaly průběhy velikostí vesmíru v závislosti na čase. Budeme-li uvažovat čistě radiační vesmír, ten se zpočátku velmi rychle rozpínal (jedná se o 4. mocninu), ale pak už dále “moc neroste”, tedy asi jako takto žlutě obarvený průběh:

Radiační vesmír
Radiační vesmír

Nicméně pokud se podíváte výše na graf \(\rho\) vs \(a\), uvidíte bod, ve kterém se dva průběhy protnou. V tomto momentě začal namísto “radiačního vesmíru”[13]tuty pojmy nemám úplně rád, prostě radiation dominant universematter dominant universe, tedy vesmír s převahou záření a vesmír s převahou hmoty převažovat právě ten hmotový. Měřením bylo zjištěno, že tento stav se stal relativně velmi brzy po vzniku vesmíru, věří se, že někdy kolem 10 000 let po tzv. Velkém třesku.

V tomto momentě tedy začne převažovat hmotový vesmír, který stoupá mnohem rychleji, alespoň zpočátku:

Radiační a hmotový vesmír
Radiační a hmotový vesmír

Takto bychom se po zelené křivce postupně dostávali do stavu, kdy by se rozpínání vesmíru postupně zpomalovalo, nicméně pozorujeme, že tomu tak není, pozorovaný stav je naznačen růžovým průběhem:

Rozpínání vesmíru -- co doopravdy pozorujeme
Rozpínání vesmíru — co doopravdy pozorujeme

A musí tedy nutně existovat nějaká další síla či energie, která toto způsobuje. Pojďme si shrnout základní znalosti, které jsme si odvodili:

  • Pro vesmír s převládající hmotou
    • Hustota: \(\rho = \frac{M}{a^3}\)
    • Vesmír se rozpíná v čase podle: \(a \sim t^{\frac{2}{3}}\)
  • Pro vesmír s převládájícím zářením
    • Hustota záření: \(\rho = \frac{N}{a^4}\)
    • Vesmír se rozpíná v čase podle: \(a \sim t^{\frac{1}{2}}\)

Podívejme se na tuto problematiku ještě z hlediska termodynamiky. Vrhněme se nejdříve na vesmír s převládající hmotou. Pokud si opět uděláme nějakou krychlovou výseč, ve které si představíme galaxie, pro připomenutí obrázek:

Klasická krychle
Klasická krychle

Pak se ptáme, jakým tlakem bude hmota a galaxie působit na desky krychle? Tlak bude nulový, protože galaxie se prostě nechovají jako částice, které skáčí tam a zpět, prostě “tam jsou” a v klidu “nic nedělají”[14]samozřejmě pro zjednodušení. Můžeme tedy psát, že:

$$P = 0$$

Trošku složitější to bude ve vesmíru s převládající radiací. Pro zjednodušení si představme jednodimenzionální pohyb částice (fotonu), který cestuje rychlostí \(c\) mezi krajními body, jejichž vzdálenost je \(L\).

Foton cestuje mezi krajními body.
Foton cestuje mezi krajními body.

Jaký je tlak \(P\) na jednu či druhou krajní pozici? Víme, že tlak se dá vyjádřit jako:

$$ P = \frac{F}{A}$$

kde \(F\) je síla a \(A\) je plocha, na kterou síla působí. Síla na konci dráhy, bude vyjádřena jako změna momentu hybnosti, tedy:

$$ F = \frac{\mathrm{d}p}{\mathrm{d}t}$$

Jak je velké \(\mathrm{d}p\)? Musíme si uvědomit, že se nejedná o pohyb částice, který u hranice zastaví, ale stejnou rychlostí se bude pohybovat na druhou stranu. Změna hybnosi částice tak bude dvojnásobná, tedy \(\mathrm{d}p = 2p\). Jak bude velké \(\mathrm{d}t\)? Čas dostaneme podělením vzdálenosti rychlostí pohybu, tedy \(t=\frac{2L}{c}\) — opět, dvojnásobná vzdálenost, páč částice cestuje tam i zpět. Toto můžeme dosadit do vzorce pro sílu a získáme:

$$ F = \frac{\mathrm{d}p}{\mathrm{d}t} = {\color{red}{2}p} \frac{c}{\color{red}{2}L} = \frac{pc}{L}$$

Ale pozor, výraz \(pc\) už je nám povědomý, jedná se totiž o energii částice \(E = pc\). Můžeme tedy psát:

$$F = \frac{E}{L}$$

Což by krásně fungovalo v jednom rozměru, ale musíme si uvědomit, že máme v našem případě (použili jsme krychli) rozměry 3. Foton tedy může cestovat jak tam a zpět po ose \(x\), \(y\) a nebo i \(z\). Pokud do naší kdychle zakreslím pohyb jednoho nějakého “testovacího” fotonu po ose x, bude to vypadat následovně:

Foton a pohyb v jedné ose
Foton a pohyb v jedné ose

Vyznačil jsem plochu \(\mathrm{d}A\), na kterou bude takový foton působit. Víme, že tlak je:

$$ P = \frac{F}{A}$$

a tedy v našem případě:

$$ P = \frac{F}{L\mathrm{d}A}$$

a co je délka krát plocha? To je objem 🙂 Tedy:

$$ P = \frac{E}{V} = \rho$$

Současně je to i hustota energie \(\rho\), i když ne zcela přesně. Musíme si totiž uvědomit, že foton se pohybuje po komponentech všech os, budeme navíc uvažovat, že zcela náhodně a tedy do všech stejně, bude tedy tlak pouze třetinový:

$$P = \frac{\rho}{3}$$

Můžeme tak zobecnit, že tlak se bude rovnat:

$$ P = w\rho$$

kde \(w\) je právě nějaká konstanta — pro hmotový vesmír bude nulová, pro radiační bude právě tato jedna třetina.

Nyní si představme, že máme píst (hranatý krychlový třeba) s nějakým plynem a umožníme mu, aby se trochu zvětšil objem — prostě tak, jak píst normálně funguje. Tedy víme, že práce takového děje bude:

$$ W = F \mathrm{d}d$$

kde \(d\) je nějaká vzdálenost pohybu pístu. Víme též, že \( F = P A\), tedy můžeme psát, že:

$$ W = P A \mathrm{d}d$$

No a opět — co je součet plochy a dráhy — objem, tedy v našem případě tedy:

$$ W = P \mathrm{d}V$$

No a jak tutu práci částice konají? Tím, že musí nějakou svoji energii obětovat. Energie přímo souvisí s teplotou, tedy můžeme psát, že změna energie vyvolává změnu objemu:

$$ \mathrm{d}E = -P\mathrm{d}V$$

Také víme, že celková energie odpovídá součinu energetické hustoty s objemem:

$$ E = \rho V$$

a tedy že

$$ \mathrm{d}E = \rho \mathrm{d}V + V\mathrm{d}\rho$$

Výše jsme si ukázali, že

$$ \mathrm{d}E = -P\mathrm{d}V$$

a tedy můžeme psát:

$$ \rho \mathrm{d}V + V\mathrm{d}\rho = -P\mathrm{d}V$$

Vyjádříme:

$$ V \mathrm{d}\rho = -(P+\rho)\mathrm{d}V$$

a protože jsme si řekli, že \(P = w\rho\), můžeme dosadit:

$$ V \mathrm{d}\rho = -(w\rho +\rho)\mathrm{d}V$$

$$ V \mathrm{d}\rho = -(w + 1)\rho\mathrm{d}V$$

a tedy můžeme popřehazovat:

$$ \frac{\mathrm{d}\rho}{\rho} = -(w+1)\frac{\mathrm{d}V}{V}$$

Vyřešíme jako logaritmickou rovnici:

$$ \mathrm{d}\log\rho = -(w+1)\mathrm{d}\log V$$

diferenciálů se zbavíme:

$$ \log\rho = -(w+1)\log V$$

$$ \log \rho = \log V^{-(w+1)}$$

a tedy můžeme zpětně odlogaritmovat:

$$ \rho = \frac{C}{V^{(w+1)}}$$

Samozřejmě víme, že \(V = a^3\) a můžeme dosadit:

$$ \rho = \frac{C}{a^{3(w+1)}}$$

 Pokud víme, že pro hmotově převažující vesmír platí, že \(w=0\), potom snadno ověříme, že:

$$ \rho = \frac{C}{a^3}$$

Což je potvrzením toho, co jsme již napsali výše 😉 A samozřejmě i funguje, pokud dosadíme za \(w=\frac{1}{3}\) pro vesmír s převažujícím zářením:

$$ \rho = \frac{C}{a^4}$$

Můžeme dosadit znovu do FWRr (ano, vítej zpět!), tedy:

$$ \frac{\dot a(t)^2}{a(t)^2} = \frac{8}{3}\pi\kappa \rho = \frac{8}{3}\pi\kappa \frac{C}{a^{3(w+1)}}$$

Takže jsme se dostali znovu termodynamickou oklikou tam, kde už jsme byli před tím — ale tentokrát to máme krásně zobecněno a navíc máme možnost hrátek s \(w\). Co by se stalo, pokud bychom \(w=-1\)? 🙂

V jmenovateli bychom na pravé straně bychom dostali dělení “jedničkou” (cokoliv na nultou je jedna) a tedy bychom dostali konstantní výraz!

$$ \frac{\dot a(t)^2}{a(t)^2} = \frac{8}{3}\pi\kappa \frac{C}{a^0} = \frac{8}{3}\pi\kappa \rho_0 $$

Takovou konstantu označujeme \(\rho_0\). Takovéto pravé straně rovnice říkáme kosmologická konstanta a můžeme tedy psát:

$$ \frac{\dot a(t)}{a(t)} = H = \sqrt{\frac{8}{3}\pi\kappa\rho_0} $$

obě strany roznásobíme \(a(t)\) a dostaneme:

$$ \dot a(t) = a(t)\sqrt{\frac{8}{3}\pi\kappa\rho_0} $$

A řešením takové rovnice (diferenciální) je exponenciální funkce:

$$ a = Ce^{\sqrt{\frac{8}{3}\pi\kappa\rho_0}t}$$

A protože je to klasická exponenciální rovnice, která je velmi prudce a neustále rosoucí, i vesmír se rozpíná stále rychleji — což je přesně to, co se doopravdy pozoruje a jak se vesmír jeví, že se chová. Co způsobuje tuto akceleraci? Právě temná energie, což je hypotetická energie vakua a energie, kterou sdílí veškerá hmota.

Vzpomínátel-li na tento obrázek, kde jsme řešili závislost energetické hustoty na rozměrech:

Průběhy funkcí M/a^3 a N/a^4
Průběhy funkcí M/a^3 a N/a^4

Můžeme graf obohoatit ještě o naši kosmologickou konstantu:

Průběhy hustot energií, včetně kosmologické konstanty
Průběhy hustot energií, včetně kosmologické konstanty

A tam vidíme jasně, že nejprve se předběhly grafy radiačního vesmíru a hmotového, ale pak i vesmíru, který se rozpíná pomocí temné energie. A to je přesně to, co jsme v obrázku s rozměry vesmíru v závislosti na čase kreslili:

Rozpínání vesmíru -- co doopravdy pozorujeme
Rozpínání vesmíru — co doopravdy pozorujeme

Co je tato temná enrgie? To vlastně nevíme. Víme jen, jak se projevuje a jaké má vlastnosti. Její původ je nám ale zatím skrytý. Pokud se vesmír takto “urychluje” s rozpínáním, jednou samozřejmě se dostaneme do bodu, kdy se z rychlosti:

$$ v = H D$$

stane jednoduše

$$ c= H D$$

a tedy všechny galaxie a objekty, které budou vzdálenější než \(D\) se pro nás stanou neviditelné, neexistující. V současnosti se uvádí, že velikost pozorovatelného vesmíru je 10–12 miliard světelných let. Tedy už velkou část vesmíru nevidíme. A BUDE HŮŘ! 😀

Užívejte dne a věřím, že vás tento článek obohatil 😉

Poznámky pod čarou

Poznámky pod čarou
1 jedná se o klasický příklad s populárně naučnou metodou, jak ukázat rozpínání vesmíru, ale použijeme ji jako základ i tady
2 tedy takového, který se rozpíná všude stejně
3 časová závislost vzdálenost mezi šouřadnicemi je nutná, protože budeme řešit rozpínání v čase
4 ponechme teď stranou, že bychom je nejspíše samotným okem neviděli
5 Možná by bylo vhodné dát na pravou míru označování vesmírných objektů, je v tom, myslím si, dost velký nepořádek. Pokud napíši “Galaxie” s velkým “G”, myslím tím naši galaxii, ve které se nachází Sluneční soustava. Pokud se řekne “Mléčná dráha”, jedná se o pruh více viditelných hvězd na noční obloze, tyto termíny se poměrně zhusta zaměňují, celý název je Galaxie v Mléčné dráze, zkráceně Galaxie. Pokud píši “galaxie”, tedy s malým “g”, myslím tím jakákoliv jiná galaxie než Galaxie 🙂 Doufám, že už v tom nebude zmatek.
6 Newton, Isaac (1687). Philosophiae Naturalis Principia Mathematica. London. pp. Theorem XXXI.
7 Aby nám rovnice dimenzionálně seděla, musíme mít prostě srovnané dimenze jednotlivých členů. Protože předpokládáme, že to počítáme správně, budeme se muset držet i tohoto zákona. V uvedené rovnici vidíme, že máme srovnané dimenzionálně pouze dva členy, tedy ten s derivací a ten druhý bez derivace. V konstantě tudíž musíme předpokládat, že se nějaký prvek ze stejné dimenze taktéž bude nacházet a tím pádem můžeme pokrátit.
8 Na wiki např.:
https://en.wikipedia.org/wiki/Friedmann%E2%80%93Lema%C3%AEtre%E2%80%93Robertson%E2%80%93Walker_metric
9 odkaz na PDF s dalšími hrátkami s rovnicemi:
http://www.ita.uni-heidelberg.de/~dullemond/lectures/cosmology_2011/Chapter_4.pdf
10 Dále už jen FWRr.
11 Jinými slovy se touto konstantou označuje tzv. křivost vesmíru
12 Viz článek Malý nenásilný úvod do fyziky černých děr na mém hlavním blogu.
13 tuty pojmy nemám úplně rád, prostě radiation dominant universematter dominant universe, tedy vesmír s převahou záření a vesmír s převahou hmoty
14 samozřejmě pro zjednodušení

Motor — jak je to s výkonem a momentem?

Na základě diskuse na Facebooku, kde se kamarád pokoušel pochopit z mých krátkých příspěvků, jak souvisí výkon a kroutivý moment, jsem se raději rozhodl sepsat myšlenky do plnohodnotného (byť krátkého) článku. Zcela věřím, že totiž tento kamarád nebude jediný, kdo má v uvedených pojmech jakousi “mlhu” a potřeboval by je osvětlit.

Výkon, kroutivý moment a jejich význam

Všechny motory máme na světě proto, aby konaly nějakou práci. Práce, uváděná v Joulech, je veličina, která nám popisuje doslova “kolik je toho třeba udělat”. Kupříkladu pokud budeme táhnout 500kilový klavír do 4. patra, tedy zhruba do 20 metrů výšky, budeme potřebovat přibližně (zaokrouhlujme prosím) práci:

$$W=F s = m g s = 500 \cdot 10 \cdot 20 = 100\ \mathrm{kJ}$$

(ke stejnému výsledku bychom došli, kdybychom počítali přes potenciální energii, kde \(W = mgh\), což je vlastně totéž v našem případě 😉 )

Abychom tedy dostali takový klavír do takového 4. patra, potřebujeme někde sehnat práci \(100\ \mathrm{kJ}\). Buď ji vyvineme ručně, kladkami či použijeme nějaký motor. Jenže samozřejmě intuitivně, pokud budeme mít motor, který bude mít “větší páru”, vytáhne nám tam klavír mnohem rychleji než nějaký slaboučký motůrek. Množství toho, jakou “to má páru” se tedy říká výkon a jedná se velmi jednoduše po schopnost provést nějakou práci za průměrný čas. Pokud bychom tedy chtěli náš klavír vytáhnout za 10 vteřin, budeme potřebovat výkon:

$$ P = \frac{W}{t} = \frac{m g s}{t} = \frac{500 \cdot 10 \cdot 20}{10} = 10\ \mathrm{kW}$$

Budeme tedy potřebova motor s výkonem alespoň \(10\ \mathrm{kW}\). Samozřejmě nebudeme uvažovat, že motory nemají 100% účinnost a tak podobně, spíše jde o princip jako takový.

Nicméně — je vám asi jasné, že úplně “nefunguje” jednoduchá zkratka, že pokud vezmu třeba motorek z ostřikovačů a budu s ním zvedat takový klavír, bude mi to trvat třeba 2 hodiny a zvednu ho.  Samozřejmě by to mohlo fungovat, ale je potřeba, aby — byť pomalý — motor uměl vykonávat nějakou sílu, která by byla větší, než síla působící gravitací (tedy aby klavír neklesal, ale stoupal).

Musí být tedy schopen vyvinout určitý moment, kterým by na dané těleso působil (byť pomalu). Jedná se o točivý stroj (motor se otáčí a dělá pořád dokola to samé — zabírá), veličina, která nám popisuje toto silové působení se nazývá kroutivý moment.

Pokud definujeme dráhu, kterou musí obvod točivého stroje (jeho aktivní části) vykonat, aby udělal jednu otáčku, je to klasický obvod:

$$o=\frac{2\pi o}{60}$$

Šedesáti dělíme proto, že otáčky se uvádí v “rpm”, tedy “otáčkách za minutu”. Pokud máte otáčky v otáčkách za sekundu, poté samozřejmě nedělíte 🙂 Práce, jak víme, je silové působení po nějaké dráze, tedy:

$$ W = F s$$

No a pokud víme, že dráha je rovna obvodu:

$$ W = F s = F \frac{2 \pi r}{60}$$

Což je náš vztah pro výkon. Můžeme udělat zkratku, že:

$$M = F r$$

A tedy

$$ W = \frac{2 \pi M o}{60}$$

Daný výkon motoru tedy přímo souvisí s kroutivým momentem, kterým motor na danou “překážku” působí.

Praktické otázky

Vidíme, že výkon motoru je přímo závislý na otáčkách motoru. Zkusme si proto zaexperimentovat s různými průběhy kroutivého momentu a výkonu.

Příklad 1) Plochý “kroutivý moment”:

Průběh kroutivého momentu tedy bude vypadat např. takto:

Vidíme, že motor, který by měl takto rovný průběh, by dosahoval největších výkonů při nejvyšších otáčkách, přičemž by měl stále konstantní kroutivý moment, v našem případě \(100\ \mathrm{Nm}\). Osa výkonu je ve Wattech, tedy vidíme, že kolem 10 000 otáček by měl motor výkon přes 100 kW, což odpovídá zhruba 135 koňským silám.

Žádný motor však nemá takto krásný průběh krouťáku, možná tak v Tesle se přibližují, ale jinak se jedná většinou o nějakou křivku. V technických specifikacích motoru většinou najdete, že máte “maximální krouťák” třeba 110 Nm při 4500 otáčkách. To znamená, že všude jinde je to “méně”. Zkusme si tuto situaci opět načrtnout grafem:

Příklad 2) Motor s reálným krouťákem

 

Zde vidíme zajímavý jev — zatímco kroutivý moment má svůj vrchol zhruba v oněch 5000 otáčkách, výkon má svůj vrchol skoro až v 7000. Tyto charakteristiky jsou právě velmi důležité — čím máte vyšší krouťák ve vyšších otáčkách, tím máte i větší výkon.

Doufám, že je to vše jasné, případně se ozvěte do komentů 😉 A budu rád za sdílení! 😉

Chemtrailisti jsou idioti :-)

Dostal jsem se poměrně omylem k článku pro chemtrailisty a chtěl bych ho rozebrat 🙂

V prvním odstavci se tazatel ptá: “Kolik více důkazů ještě potřebujeme, než bude většina populace ochotna čelit faktu, že jsme práškováni vysoce toxickými látkami, které jsou součástí programu klimatického inženýringu?”

Má odpověď: Stačil by jediný 🙂

motory s vysokým stupněm turbofanu (standardní pro všechny komerční dopravce a všechny armádní tankerové stíhačky) jsou svým designem téměř neschopny produkce kondenzační stopy.

Toto není pravda. Tvorba kondenzační stopy závisí na použité technologii pouze okrajově, všechny proudové motory tvoří kondenzační stopu v momentě, co vznikne kondenzační ložisko ve vzduchu, který motorem prochází. Což je v každém motoru, protože žádný proudový motor není bez emisí.

 “85% vzduchu, který prochází tímto motorem, není spalováno.

Ano, souhlasím 🙂 Dokonce více, řekl bych, že možná tak 100 % 🙂 Vzuch totiž není v motoru spalován vůbec, pouze kyslík ze vzduchu.

“Sečteno a podtrženo, komerční dopravní letadla jsou vybaveny rozprašovacími tryskami, upevněnými na pylonu, přímo v jedné přímce s přítlakovým proudem stíhačkového motoru. “

Totálně nesmyslná věta, vůbec ji nechápu 🙂

Poté se v článku vyskytuje hromada fotografií letadel a jejich motorů, které vypadají naprosto normálně, vidíme klasické odtrhové de-ice hrany, výfuky, klapky a ovládací plochy na křídlech.

Nic víc tam nevidím, jen spousta blábolů od duševně nemocných lidí. Lidí, kteří mají volební právo. Lidí, kteří mohou chodit mezi námi a třeba učit naše děti ve škole.

Výška hladiny po vložení kostky ledu do vody

Tento příklad je velmi jednoduchý, nicméně stojí za uvedení:

Zadání (překopírované z Facebooku zní): V nádobě o podstavě s hranami 10 cm a 15 cm je přesně 1 litr vody v kapalném stavu. Do kapaliny je vhozena krychle vodního ledu o hraně 4 cm. Jaká bude výška hladiny ihned potom, co se hladina po vhození ledové kostky ustálí? Jaká bude výška hladiny potom, co se kostka rozpustí? Pro jednoduchost předpokládejme hustotu kapalné vody \(1 \frac{g}{cm^3}\) a ledu \(\frac{9}{10} \frac{g}{cm^3}\), a žádné závislosti objemu na teplotě.

Víme, že objem bude tedy:

$$V = a b v$$

kde \(v\) odpovídá výšce. Z toho snadno určíme:

$$v = \frac{V}{ab}$$

Nyní musíme zjistit vliv vložené kostky. Objem takové kostky je:

$$V = 4^3$$

Podle Archimédova zákona bude plavat a vytlačí množství vody v poměru hustot, tedy vytlačí:

$$V_{vytlaceno}=V_{led} \frac{\rho_{led}}{\rho_{voda}}$$

Tedy výsledná výška bude:

$$v = \frac{V_{vytlaceno}+V}{ab}$$

Dosadíme tedy:

$$v = \frac{V_{led} \frac{\rho_{led}}{\rho_{voda}}+V}{ab}=\frac{4^3\frac{9}{10}+1000}{10 \cdot 15} = 7,051\ \mathrm{cm}$$

Před vytlačením tedy nebyl objem s ledem:

$$v = \frac{V}{ab}=\frac{1000}{10 \cdot 15} = 6,667\ \mathrm{cm}$$

Rozdíl je tedy necelé \(4\ \mathrm{mm}\).

UPDATE: Jsem si všiml, že jsem zadání špatně opsal (celý já), základna je čtvercová o hraně 10 cm — nicméně to není problém, to se snadno dosadí do vzniknuvších vztahů a vyjdou výšky \(10,576\ \mathrm{cm}\) a \(10\ \mathrm{cm}\), tedy rozdíl zrhuba necelých 6 milimetrů 😉

UPDATE 2: Zapomněl jsem ještě na část řešení — jak se změní hladina poté, co se led rozpustí. Logicky — nezmění, hmotnost ledu a hmotnost vody po rozpuštění kostky bude stejná, tedy vytlačí se stejné množství.

Studna a dva klacky

Dostal jsem od instruktora v autoškole velmi zajímavý příklad — pokud ho znáte, tím lépe, ale fakt jsem ho neznal a hodně se mi líbil, zkusil jsem tedy přijít na nějaké řešení 😉 😉 Nakonec mi z toho “vypadlo” něco normálního (tedy reálného), svůj postup tedy uveřejňuji zde.

Mějme následující zadání: Existuje studna neznámé hloubky a průměru, do které hodíme dva klacky; jeden třímetrový, druhý dvoumetrový. Předpokládejme, že jsou “v rovině” a jejich místo setkání je nad dnem studny ve výšce 1 metr. Otázka zní — jaký je průměr takové studny.

Situační obrázek bych navrhl asi takto:

studna
Situační plánek studny

Začal bych asi svojí první myšlenkou, a to sice že řešení se určitě bude dělat nějak přes podobnosti trojúhelníků. Začal jsem tedy zuřivě hledat různé podobnosti, některé mě zavedly do slepých cest (tedy ne, že by si některé trojúhelníky nebyly podobné, ale bylo mi to k ničemu), ale nakonec se jedna cesta zadařila, tu zde i prezentuji 🙂

Ze všeho nejdříve si napíšeme rovnice, ze kterých budeme vycházet. Jedné se o soustavu různě propletených pravoúhlých trojúhelníků. Ze všeho nejdříve si určeme, že celkový průměr \(d\) bude samozřejmě roven:

$$d = d_1+d_2$$

A nyní můžeme pracovat s jednotlivými stranami:

$$\begin{array} aa^2+d^2 & = & 3^2 \\ b^2 + d^2 & = & 2^2\end{array}$$

Tím jsme popsali dva hlavní (velké) trojúhelníky. Nyní popíšeme vztahy v trojúhelníku s naznačenou výškou. Vyjdeme právě z té podobnosti, tedy že:

$$\frac{d_1}{v} = \frac{d}{b}$$

tedy po dosazení \(v=1\) získáme:

$$d_1 = \frac{d}{b}$$

a obdobně

$$d_2 = \frac{d}{a}$$

Vyjádříme si jednu a druhou stranu:

$$d_1=\frac{d}{b}, d_2=\frac{d}{a}$$

a dosadíme do výše uvedené rovnice součtu částí průměru:

$$d=\frac{d}{b}+\frac{d}{a}$$

Z toho vyjádříme jednu či druhou proměnnou, začněme třeba \(a\):

$$\frac{d}{a}=d-\frac{d}{b}=\frac{db-d}{b}$$

z toho tedy:

$$a = \frac{b}{b-1}$$

případně

$$b = \frac{a}{a-1}$$

Toto dosaďme do úplně prvních dvou rovnic pro velké trojúhelníky:

$$d^2+\frac{b^2}{\left(b-1\right)^2}=3^2$$

$$d^2+b^2=2^2$$

Vyjádříme si z druhé rovnice \(d^2\) a dosadíme do první:

$$2^2-b^2+\frac{b^2}{\left(b-1\right)^2}=3^2$$

Převedeme na rozumný tvar a vyřešíme jako rovnici 4. řádu, třeba pomocí Wolframu, to už je jedno (ale můžete zkusit ručně) a vyjdou 4 řešení, z toho 2 komplexní, která rovnou zavrhneme.

$$b_1=0,7009 ; b_2=1,5761$$

Které vybrat? To zatím nevíme, každopádně pokud dosadíme do rovnice pro průměr a odmocníme, vyjdou nám (prozatím) dvě řešení:

$$d_{I}=\sqrt{2^2-b_1^2} = 1,23$$

$$d_{II}=\sqrt{2^2-b_2^2} = 1,87316$$

Musíme vyjádřit tedy stejné rovnice, akorát pro vyjádřené \(b\), tedy:

$$b=\frac{a}{a-1}$$

Stejným postupem jako výše dostaneme rovnici:

$$3^2-a^2+\frac{a^2}{\left(a-1\right)^2}=2^2$$

a ta po vyřešení dá dva reálné kořeny:

$$ a_1=-2,34$$

$$a_2 = 2,7357$$

První rovnou vyhodíme, délky prostě záporné nechceme, držme se toho 🙂 Dosadíme tedy \(a_2\) a vyjde:

$$d=\sqrt{3^2-a_2^2}=1,2312$$

To se tedy shoduje s řešením “z druhé strany” problému — proto tento výsledek prohlásíme za finální. Průměr studny je tedy \(1,23\) metrů.

Jednoduché odvození Schrödingerovy rovnice

S kamarádem Lukášem jsme při čajově-matematicko-fyzikální rozcvičce zjistili, že už si nepamatujeme odvození Schrödingerovy rovnice 🙂 Pamatuji si, že jsme to kdysi ve škole dělali, musel jsem si to tedy oživit — a zde je má varianta toho, jak ji odvodit:

Nejdříve tedy vyjděme ze základních vztahů, jako vždy. Víme, že celková energie se dá popsat jako:

$$ E = E_k + E_p$$

kde \(E_k\) je kinetická a \(E_p\) je potenciální energie. Kinetickou energii můžeme přepsat klasicky jako:

$$ E = \frac{1}{2}mv^2 + E_p$$

a potenciální energii můžeme brát jako obecnou energii, ať už se jedná o energii vzniknuvší působením gravitačního, elektromagnetického či jakého pole; označme si ji dále \(u\). Finální forma tedy zatím budiž:

$$ E = \frac{1}{2}mv^2 + u$$

Dále se musíme podívat na vlnyvlnění jako takové. Vlnu můžeme jednoduše zapsat jako součet goniometrických funkcí v komplexní rovině:

$$ \Psi = \cos(kx-\omega t)+i\sin(kx-\omega t) $$

A exponenciální formě pak:

$$ \Psi = e^{i(kx-\omega t)} $$

Zderivujme dvakrát podle \(x\) a získáme (postupně):

$$ \frac{\partial \Psi}{\mathrm{d}x} = ik \cdot e^{i(kx – \omega t)} = ik \Psi$$

$$\frac{\partial^2 \Psi}{\mathrm{d}x^2}=(ik)^2e^{i(kx-\omega t)} = -k^2\Psi$$

Co je to \(k\)? Pokud si tak označíme “převod” mezi \(f\) a \(\omega\), potom \(k=\frac{2\pi}{\lambda}\) a tedy:

$$p=\frac{h}{\lambda}=\frac{hk}{2\pi}=\hbar k$$

a z toho plyne:

$$ k = \frac{p}{\hbar}$$

Dosadíme do rovnice s druhou derivací:

$$\frac{\partial^2 \Psi}{\mathrm{d}x^2}=-k^2\Psi  =  -\frac{p^2}{\hbar^2}\Psi = \frac{\partial^2\Psi}{\mathrm{d}x^2}$$

Přepíšeme-li si původní rovnici součtu energií: (vycházíme z faktu, že \(p=mv\), tedy \(p^2=m^2v^2\))

$$E = \frac{1}{2}mv^2 + u = \frac{1}{2m}p^2 + u$$

rozšíříme \(\Psi\):

$$E\Psi = \frac{1}{2m}p^2\Psi + u\Psi$$

a vidíme, že člen \(p^2\Psi\) se nám objevil i zde. Není tedy nic jednoduššího, než vytknout a dosadit:

$$E\Psi = \frac{-\hbar^2\partial^2\Psi}{2m\mathrm{d}x^2} + u\Psi$$

A to je tzv. časově nezávislá Schrödingerova rovnice. Časově nezávislá je proto, že se v ní prostě nevyskytuje \(t\), čas. Jak ho tam tedy dostat?

Víme, že \(E=hf\) a tedy:

$$E = hf = h\frac{\omega}{2\pi} = \hbar \omega$$

Vezměme původní vlnovou rovnici a zderivujeme, tentokrát podle \(t\):

$$ \Psi = e^{i(kx-\omega t)} $$

$$ \frac{\partial \Psi}{\mathrm{d}t}=-i\omega\Psi$$

$$E\Psi = -\hbar\omega\Psi$$

Podělíme \(\frac{-i}{k}\):

$$\frac{-i E \Psi}{k} = -i\omega\Psi = \frac{\partial \Psi}{\mathrm{d}t}$$

$$ E\Psi = \frac{\hbar\partial\Psi}{-i\mathrm{d}t}$$

a tedy

$$ \frac{-i\hbar\partial\Psi}{\mathrm{d}t}=E\Psi$$

Toto vzniknuvší \(E\Psi\) dosadíme do časově nezávislé rovnice a získáme:

$$\frac{-i\hbar\partial\Psi}{\mathrm{d}t}=\frac{-i\hbar^2\partial^2\Psi}{2m\mathrm{d}x^2}+u\Psi$$

A to je, vážení čtenáři, tzv. časově závislá Schrödingerova rovnice. 🙂

Níže mé ručně psané poznámky, třeba vám k něčemu budou 😉 😉

Schrodinger 001 Schrodinger 002

Hudba ve 432 vs 440 Hz

Tento článek nedávám ani do doplňkových článků, protože s fyzikou má společného fakt jen minimálně. Rovnou ho tedy dávám do “zábavy”. Nicméně pokud vám tato čísla nic neříkají, nejspíše patříte k té šťastné množině lidí, které průnik s množinou lidí, kteří věří či propagují tento nesmysl, je množina prázdná[1]Prostě jste o tom neslyšeli 🙂 .

O co se tedy jedná? Zastánci této podivné hypotézy říkají, že hudba je při podladění o 8 Hz příznivější tělu a mysli, než pokud se hraje v klasickém ladění. Možná by to však chtělo trošku alespoň fyzikálně zmínit, jak je to vlastně s laděním (když už se tedy máme bavit o fyzice).

Tóny

Asi to každý znáte — tón, zvuk, hluk; tyto termíny se definují snad už na ZŠ, čili nebudu je dlouho rozebírat, jen stručně: tón je na rozdíl od hluku homogenní a periodický, zvuk je množina všeho, do čeho patří i tón, hluk atp.

Jak víte, zvuk je mechanické vlnění nějakého prostředí, v našem případě vzduchu, které tímto přenáší nějakou zvukovou informaci. Tu pak mozek přes periferie (ucho) zpracovává na hudební či zvukový vjem.

Během historie se chápání “hudby” jako soustavy tónů poměrně dost bouřlivě vyvíjelo, nicméně to, že dnes používáme klasické tóniny, na které jsme zvyklí, není jen tak náhodou. Historii přenechám historikům, popíšeme si všechno pěkně fyzikálně.

Základní tón, harmonická, intervaly

Pokud vás zajímá více z hudební teorie, přečtěte si články, kde tyto věci popisuji (či případně články o itervalech) z hudebního hlediska, nicméně nyní pouze fyzikálně:

Jak jsme již řekli, tón je generován nějakým vlněním, v našem případě se omezíme na harmonické vlnění:

$$ f(t) = y = \sin \left(\omega t + \phi \right) $$

Kde \(y\) je aktuální výchylka, \(\omega\) je úhlová frekvence, \(t\) je čas, který do rovnice vstupuje jako parametr a \(\phi\) je fázový posuv. Nicméně pokud bychom si vytvořili např. takovýto tón, který má frekvenci 440 Hz, zněl by poněkud fádně, nezajímavě, nudně:

Krom toho, že tón není ani tak hlasitý a přesto je dost nepříjemný. Aby tón zněl lépe, je zapotřebí smíchat více tónů, nicméně ne jen tak ledabyle a náhodně, je potřeba je smíchat podle nějakých pravidel. Nejjednodušším mícháním je stav, kdy míchám různé “harmonické” frekvence. Co to je harmonická? Zde uvedený tón si můžeme zakreslit např. takto:

Jak vidíte, křivka se neustále opakuje — což je přesně to, co slovo “harmonická” znamená, je totiž periodická (tzn. neustále se opakující). Abychom mohli přidat třeba “druhou harmonickou”, musíme přidat takovou “harmonickou”, která bude mít stejné místo opakování — tedy aby tam, kde se křivka v nule[2]či tam, kam nás fáze posune potkává s osou \(t\), aby se i tam potkávala křivka další harmonické frekvence. Pokud přidáme např. frekvenci 880 Hz, tedy:

Výsledná frekvence bude prostým součtem těchto dvou křivek, tedy:

Sice už to není “sinusovka”, ale vidíme, že je to funkce neustále periodická. Zní nějak takto:

Kontrolní otázka (o další Fidorku!), pokud si tuten souzvuk pustíte, jak vysvětlíte ono “vlnění” zvuku? Proč zvuk nezní stále stejně, ale jako by pulzoval?

Nicméně tímto způsobem můžete přidat hromadu křivek, přidám ještě 220 a 110 Hz:

Vidíme, že křivka začíná být opravdu složitá, ale pořád je periodická, pořád se opakuje. Zní takto:

Nicméně když tento tón slyšíme, pořád je to prostě “takové jalové”. Jak se dosáhne toho, že tóny zní tak nějak lépe?

Zatím jsme totiž míchali pouze násobky harmonické — dvojnásobnou frekvenci, poloviční, čtvrtinovou. Tomuto intervalu mezi tóny se říká oktáva a vyjadřuje přesně to, co jsme si ukázali — dvojnásobek (či půlnásobek) původní frekvence. Pokud tón o frekvenci 440 Hz označíme jako \(a_1\), potom ten o frekvenci 880 Hz bude \(a_2\), frekvence 220 Hz odpovídá \(a\) a 110 potom \(A\) (čteme jako “á malé” a “á velké”).

To je však pořád jen tón A, ale kdo někdy viděl kytaru nebo klavír dobře ví, že je tam poněkud více tónů. Takže jak vzniknou? Začněme s další pěknou matematickou závislostí — čistou kvintou. Že je to kvinta, na to lidé přišli až později, nicméně kvinta má trojkové násobky. Smíchejme proto Náš tón 440 Hz s frekvencí 660 Hz, tedy \(\frac{3}{2}\) z 440 Hz:

Pro další intervaly platí další zákonitosti, nicméně takovýmto různým dělením dostaneme hromadu tónů, které když uspořádáme do našich známých stupnic, dostaneme tzv. Pythagorejské ladění, které tedy vznikne tím, že postupně přidáváme různé kvinty a posouváme je různě o oktávy nahoru a dolů. Nicméně dnešní nástroje nejsou laděny v Pythagorejském ladění, ale tzv. temperovaném, případně koncertním ladění.

Rozdíl mezi těmito laděními je mírně nad rámec fyzikálního článku, každopádně ve stručnosti — lidé si všimli, že pokud mírně posunou některé tóny, klavír bude třeba neustále “trochu rozladěn”, ale zase budou všechny tóny (současně hluboké a vysoké) k sobě ladit lépe. A právě takovému ladění se říká temeprované.

V článku o Fourierově analýze se můžete případně dočíst, jak je to se skládáním prakticky nekonečně mnoha různých frekvencí.

Zpět však k zastáncům “432 hypotézy”. Ti tvrdí, že pokud jako výchozí tón (tzn. vše ostatní je stejné) nepoužiji tón o frekvenci 440 Hz, ale 432 Hz, bude hudba příjemnější (s tím se dá i nedá souhlasit, záleží na skladbě), ale především že bude mít “pozitivní účinky na zdraví jedince”[3]Spíše tedy že “nebude mít negativní” účinky….

S argumenty této čtyři sta třicet dvojkové skupiny se dá poměrně slušně nesouhlasit; už jsem četl různé — od toho, že Mozart či Beethoven používali jiné ladění[4]Aby ne, když to bylo před staletími a moderní ladění se normalizovalo až kolem roku 1940., případně postují různé “pestrobarevné” obrázky s jakožemeditativní tématikou a vzájemně se poplácávají po zádech, jak to všem “čtyři sta čtyřicátníkům” nandali.

Názor si udělejte sami, případně zagooglete, že je to hloupost zjistíte po několika pročtených příspěvcích a studiích, nicméně nyní jen pro srovnání — stejný kousek písničky ve 440Hz ladění (tzn. beze změny) a ten samý kousíček se sníženým laděním (bohužel kvůli autorskému zákonu nemůžu více než 30vteřinovou ukázku):

Původní 440Hz verze:

“Vylepšená” 432Hz verze:

Jak slyšíme, “nějaký” rozdíl tam je. Nicméně vliv těchto změn je podle mého dost sporný. Často též vidíme různé obrázky, které tato skupina lidí posílá:

Je to sice krásné, ale netuším, proč by měla změna frekvence či toho, kde se různé harmonické potkávají, nějak ovlivňovat zdraví. Každopádně k výše uvedenému obrázku ještě pár slov:

Musíme totiž “probrat” ještě jeden typ vlnění, tzv. stojaté vlnění. To je narozdíl od postupného vlnění uvedeno “na místě”. Např. pokud klepnete do struny, ta se rozezní a bude “se vlnit” — stojaté vlnění. Vlna nikam necestuje, vlnové délky odpovídají různým poměrům délky struny. Postupné vlnění je takové, které pozorovatel vnímá jako vlnění až s tím, jak se věc, která se vlní, pohybuje — např. takový zvuk ve vzduchu. Vlny postupně jako kola po hození kamínku do vody cestují směrem od zdroje zvuku a pokud “narazí” na posluchače, ten je uslyší.

Nicméně stojaté vlnění má pár docela zajímavých vlastností — hráči na kytaru třeba ví, že pokud drknou na strunu tzv. flažolet tak, že ji rozezní jen “na půlce”, poté se druhá polovina struny rozezní též, akorát v opačné fázi 😉 Výsledná frekvence tónu bude tedy dvojnásobná, bude tedy o oktávu výše. Ale pokud si zkusíte takto rozeznít strunu třeba jen “o centimetr” vedle, už se tón neozve a vlnění okamžitě ustane.

Pokud bychom nakreslili obrázek toho, jak moc dobře struna zní, pokud v nějakém místě stiskneme strunu, dostaneme diagram, který je velmi podobný právě výše uvedným obrázkům (akorát ty berou osy jak X tak Y, v mém uvedeném případě se strunou by se aplikovala pouze osa X). Obrázky totiž zohledňují vliv prostředí, které celé kmitá — např. pokud jste v malé místnosti bez koberců, určitě slyšíte, že se zvuk tak podivně “nese” a rezonuje. A to přesně souvisí právě se stojatým vlněním — v některých frekvencích se vlny prostě nevyruší a budou znít déle a intenzivněji než v jiných.

Nicméně tato frekvence je naprosto závislá na rozměrech a tvaru místnosti. A stejně tak i výše uvedené obrázky, které mají simulovat vlnění na hladině vody — záleží kromě vstupní frekvence i na rozměrech misky či předmětu, který se vlní a kde toto vlnění zkoumáme.

Kdyby měli lidé své hlavy všechny stejně velké (tedy všichni lidé kdyby měli stejně velkou hlavu), samozřejmě by něco takového mohlo být zajímavé zkoumat. Bohudík tomu tak však není a každý si tak můžeme užívat jiného “vlnění”, které je nám příjemné.

Ohledně vlivu zvuku a frekvencí na tělo v biologickém slova smyslu opět požádám kolegu Lukáše, který se k tématu doufám též někdy vyjádří! 🙂

Poznámky pod čarou

Poznámky pod čarou
1 Prostě jste o tom neslyšeli 🙂
2 či tam, kam nás fáze posune
3 Spíše tedy že “nebude mít negativní” účinky…
4 Aby ne, když to bylo před staletími a moderní ladění se normalizovalo až kolem roku 1940.