A komplex számokon túl

Kvaterniók

A kvaterniók a komplex számokhoz hasonló négydimenziós „számok”, de ezek szorzása már nem kommutatív, ezért nem alkotnak testet, csak ferdetestet. (Az olyan egységelemes gyűrűket, amelyekben minden nemnulla elemnek van multiplikatív inverze ferdetesteknek nevezzük. Egy ferdetest tehát „mindent tud”, amit egy testnek tudnia kell, kivéve a szorzás kommutativitását.) Emiatt a kvaterniókat már nem tekintjük „igazi” számoknak.

   A kvaterniók olyan $a+bi+cj+dk$ alakú formális kifejezések, ahol $a,b,c,d$ valós számok, $i,j,k$ pedig olyan szimbólumok, amelyekre teljesülnek az alábbiak: $$ i^2=j^2=k^2=-1,\qquad ij=k=-ji,~jk=i=-kj,~ki=j=-ik. $$ A kvaterniók halmazát $\mathbb{H}$-val jelöljük.
   A $q_1=a_1+b_1i+c_1j+d_1k$ és $q_2=a_2+b_2i+c_2j+d_2k$ kvaterniók összegét és szorzatát természetes módon definiáljuk: $$ \begin{align*} q_1+q_2 & =(a_1+a_2)+(b_1+b_2) i+(c_1+c_2)j+(d_1+d_2)k,\\ q_1\cdot q_2 & =(a_1a_2-b_1b_2-c_1c_2-d_1d_2 )+(a_1b_2+b_1a_2+c_1d_2-d_1c_2)i\\ & ~~{+(a_1c_2-b_1d_2+c_1a_2+d_1b_2)j}+(a_1d_2+b_1 c_2-c_1b_2+d_1a_2)k. \end{align*} $$
   A fent definiált műveletekkel a kvaterniók ferdetestet alkotnak. Egyúttal $\mathbb{H}$ négydimenziós vektortér is a valós számtest fölött. Következésképp a kvaterniók egy $4$ rangú asszociatív, egységelemes, zérusosztómentes algebrát alkotnak $\mathbb{R}$ fölött.
   Minden szükséges tulajdonság egyszerű, de hosszadalmas számolással ellenőrizhető, csak a multiplikatív inverz igényel némi meggondolást. Egy $q$ kvaternió inverzének kiszámítása egy négy egyenletből álló négyismeretlenes egyenletrendszer megoldására vezet. Ha $q \neq 0$, akkor az egyenletrendszer determinánsa nem nulla, ezért $q^{-1}$ létezik (és egyértelmű). Mindezek azonban egyszerűbbben következnek majd a kvaterniók mátrixos reprezentációjából.
   A komplex számok testére tekinthetünk úgy, hogy a sík pontjaival számolunk. Az összeadás és a kivonás teljesen természetes (koordinátánként végezzük), de a szorzást és az osztást nem lenne könnyű kitalálni, ha nem ismernénk a komplex számokat. William Rowan Hamilton sokat foglalkott azzal a problémával, hogy hogyan lehetne a tér pontjain értelmes szorzást és osztást definiálni úgy, hogy ezek a valós és a komplex számok műveleteinek szokásos tulajdonságait kielégítsék. (Ma már tudjuk, hogy ez nem lehetséges.) 1843. október 16-án a dublini Royal Canal hídján átsétálva hasított belé a felismerés, hogy nem három-, hanem négydimenziós térben kellene gondolkodni. Hamilton a híd kövébe véste felfedezését; a vésés azóta elkopott, de a hídon emléktábla őrzi a jeles esemény emlékét:
A kvaterniók definíciójából könnyű levezetni, hogy a „kőbe vésett” $ijk=-1$ egyenlőség teljesül: $(ij)k=kk=-1$. A másik irány kicsit több számolást igényel (HF). A kvaterniók ferdetestét Hamilton tiszteletére jelöljük $\mathbb{H}$-val.
   A $\{ \pm1,\pm i,\pm j,\pm k\} $ halmaz csoportot alkot a szorzással. Ezt a csoportot kvaterniócsoportnak nevezzük.
$$ \begin{array} [c]{r|rrrrrrrr} \cdot & 1 & -1 & i & -i & j & -j & k & -k\\\hline 1 & 1 & -1 & i & -i & j & -j & k & -k\\ -1 & -1 & 1 & -i & i & -j & j & -k & k\\ i & i & -i & -1 & 1 & k & -k & -j & j\\ -i & -i & i & 1 & -1 & -k & k & j & -j\\ j & j & -j & -k & k & -1 & 1 & i & -i\\ -j & -j & j & k & -k & 1 & -1 & -i & i\\ k & k & -k & j & -j & -i & i & -1 & 1\\ -k & -k & k & -j & j & i & -i & 1 & -1 \end{array} $$
   A $q=a+bi+cj+dk$ kvaternió valós és képzetes része, konjugáltja és abszolút értéke: \begin{align*} \operatorname{Re}(q) & =a,\\ \operatorname{Im}(q) & =bi+cj+dk,\\ \overline{q} & =\operatorname{Re}(q)-\operatorname{Im}( q)=a-bi-cj-dk,\\ |q| & =\sqrt{a^2+b^2+c^2+d^2}. \end{align*}
   A kvaterniók konjugáltja és abszolút értéke rendelkezik a komplex számoknál tanult tulajdonságokkal. Speciálisan $q\in\mathbb{H}\setminus\{0\} $ esetén $q\overline{q}=\overline{q}q=|q|^2\in\mathbb{R}^{+}$, így minden nemnulla kvaternió multiplikatív inverze kiszámolható a komplex számoknál megszokott módon (a nevező konjugáltjával bővítünk): $$ \frac{1}{q}=\frac{\overline{q}}{q\overline{q}}=\frac{\overline{q}}{| q| ^2}. $$
   A $|q_1|^2\cdot|q_2|^2=|q_1q_2|^2$ azonosságból következik, hogy ha $m$ és $n$ előáll négy négyzetszám összegeként akkor $mn$ is előáll így: $$ \begin{align*} m & =|q_1|^2=a_1^2+b_1^2+c_1^2+d_1^2,~n=|q_2|^2=a_2^2+b_2^2+c_2^2+d_2^2\\ & \Downarrow\\ m \cdot n & =|q_1|^2\cdot| q_2|^2=|q_1q_2|^2\\ & = (a_1a_2-b_1b_2-c_1c_2-d_1d_2)^2+(a_1b_2+b_1a_2+c_1d_2-d_1c_2)^2\\ & ~~{+(a_1c_2-b_1d_2+c_1a_2+d_1b_2)}^2+(a_1d_2+b_1c_2-c_1b_2+d_1a_2)^2. \end{align*} $$ Ezt az azonosságot már Euler is tudta, és ezt használva Lagrange bebizonyította, hogy minden természetes szám előáll négy négyzetszám összegeként (persze nem kvaterniókkal, mert azokat csak 70 évvel később „találta fel” Hamilton). A négy négyzetszám tételre az „egész kvaterniók”, vagyis az $a+bi+cj+dk\ (a,b,c,d\in \mathbb{Z})$ alakú kvaterniók gyűrűjének irreducibilis elemeit vizsgálva is lehet bizonyítást adni, hasonlóan a Fermat-féle két négyzetszám tétel Gauss-egészekkel történő bizonyításához.
   A kvaterniók algebrája izomorf az $\mathbb{R}^{4\times4}$ mátrixalgebra egy részalgebrájával az alábbi izomorfizmus mellett: $$ a+bi+cj+dk\mapsto \begin{pmatrix} a & b & c & d\\ -b & a & -d & c\\ -c & d & a & -b\\ -d & -c & b & a \end{pmatrix} $$
   Jelölje $E$ a $4\times 4$-es egységmátrixokt, $I,J,K$ pedig legyenek a következő mátrixok: $$ I = \begin{pmatrix} 0 & 1 & 0 & 0\\ -1 & 0 & 0 & 0\\ 0 & 0 & 0 & -1\\ 0 & 0 & 1 & 0 \end{pmatrix} \qquad J = \begin{pmatrix} 0 & 0 & 1 & 0\\ 0 & 0 & 0 & 1\\ -1 & 0 & 0 & 0\\ 0 & -1 & 0 & 0 \end{pmatrix} \qquad K = \begin{pmatrix} 0 & 0 & 0 & 1\\ 0 & 0 & -1 & 0\\ 0 & 1 & 0 & 0\\ -1 & 0 & 0 & 0 \end{pmatrix} $$ Ezekre a mátrixokra $I^2=J^2=K^2=-E$ és $IJ=K=-JI,~JK=I=-KJ,~KI=J=-IK$ teljesül, és ez elég is a bizonyításhoz, mert a tételben szereplő mátrixok egyértelműen felírhatóak $aE+bI+cJ+dK$ alakban.
   A fenti tétel segítégével könnyebb ellenőrizni, hogy $\mathbb{H}$ ferdetest, pl. a kvaterniók szorzásának asszociativitása visszavezethető a mátrixszorzás asszociativitására, a multiplikatív inverz meghatározása pedig a megfelelő mátrix inverzének kiszámítására. A $q$ kvaternióhoz tartozó mátrix determinánsa $(a^2+b^2+c^2+d^2)^2$; ebből is látszik, hogy minden nemnulla kvaterniónak van reciproka.
   Ha az $i,j,k$ kvaterniókat három egymásra merőleges háromdimenziós egységvektornak tekintjük (úgy, hogy ebben a sorrendben jobbsodrású rendszert alkossanak), akkor a $q=a+bi+cj+dk$ kvaternió valós része és képzetes része egy skalár, illetve egy vektor: $$ \operatorname{Re}(q)=a=:\lambda\in\mathbb{R},\qquad \operatorname{Im}(q)=bi+cj+dk=:\vec{v}\in\mathbb{R}^{3}. $$ Tehát minden kvaternió felfogható egy skalár és egy vektor összegeként. Ebben az alakban egyszerűbben felírható a szorzás képlete:
$$ (\lambda+\vec{v})\cdot(\mu+\vec{w})=( \lambda\mu-\langle \vec{v},\vec{w}\rangle )+( \lambda\vec{w}+\mu\vec{v}+\vec{v}\times\vec{w}). $$
Itt $\langle \vec{v},\vec{w}\rangle$ a $\vec{v}$ és $\vec{w}$ vektorok skaláris szorzata, $\vec{v}\times\vec{w}$ pedig a vektoriális szorzatuk. A vektoriális szorzat irányát megadó jobbkéz-szabály segít az $i,j,k$ kvaterniók páronkénti szorzatainak előjelét is megjegyezni:

Forrás: Wikipedia

A következő példa illusztrálja, hogyan lehet (sőt, érdemes!) a kvaterniók ezen „skalár+vektor” alakú felírásával számolni. A példa egyúttal azt is mutatja, hogy $\mathbb{H}$ „ferdesége” (a szorzás nemkommutativitása) milyen súlyos következményekkel jár: az $x^2+1$ polinomnak végtelen sok gyöke van $\mathbb{H}$-ban!

   Határozzuk meg $-1$ négyzetgyökeit a kvaternióferdetestben.

Keressük a négyzetgyököket a fenti $q=\lambda+\vec{v}$ alakban; ekkor a szorzás képletét alkalmazva $$ q^2=(\lambda^2-\langle \vec{v},\vec{v}\rangle )+(\lambda\vec{v}+\lambda\vec{v}+\vec{v}\times\vec{v})=(\lambda^2-|\vec{v}|^2)+(2\lambda\vec{v}+\vec{0}). $$ Tehát $q^2=-1$ akkor és csak akkor teljesül, ha $\lambda^2-|\vec{v}|^2=-1$ és $2\lambda\vec{v}=\vec{0}$. Az utóbbi egyenlőségből $\lambda=0$ vagy $\vec{v}=\vec{0}$. Ha $\vec{v}=\vec{0}$, akkor $\lambda^2=-1$, ami nem lehetséges, mert $\lambda$ valós szám. Tehát $\lambda=0$, és ekkor $|\vec{v}|^2=1$. Összefoglalva: $-1$ négyzetgyökei $\mathbb{H}$-ban az egységnyi abszolút értékű tisztán képzetes kvaterniók, vagyis a $bi+cj+dk\ (b^2+c^2+d^2=1)$ alakú kvaterniók.

Frobenius tétele

1877-ben bizonyította Ferdinand Georg Frobenius az alábbi tételt, ami mutatja, hogy Hamiltonnak nem véletlenül nem sikerült a háromdimenziós tér pontjain megfelelő szorzást és osztást definiálni. Sőt, a négynél magasabb dimenziós téren sem lehet, tehát Hamilton pontosan ráérzett az egyetlen lehetőségre (a valós és a komplex számok algebráján túl).

   Izomorfia erejéig csak három nemtriviális, végesrangú, zérusosztómentes, asszociatív algebra létezik a valós számok teste fölött:
   Legyen $A$ zérusosztómentes asszociatív algebra $\mathbb{R}$ fölött, és legyen $A$ rangja $n\in \mathbb{N}$. A bizonyítás hosszú lesz; a jobb átláthatóság kedvéért 12 lépésre tagoljuk. Mindig gondoljuk meg, hogy az algebra definíciójában szereplő tucatnyi tulajdonság közül mikor melyiket használjuk, illetve, hogy hol van szükség a zérusosztómentességre és a rang végességére!

Tetszőleges $a \in A$ esetén tekintsük az $a$-val való balról szorzást és az $a$-val való jobbról szorzást, mint $A$ transzformációit: $$ \begin{align*} L_a \colon A \to A, &x \mapsto a \bullet x,\\ R_a \colon A \to A, &x \mapsto x \bullet a. \end{align*} $$

1. lépés: Minden $a\in A \setminus\{0\}$ esetén $L_a$ és $R_a$ bijektív lineáris transzformációja $A$-nak (mint $\mathbb{R}$ fölötti $n$-dimenziós vektortérnek). Csak az $L_a$ leképezéssel foglalkozunk; $R_a$ tulajdonságai hasonlóan igazolhatók.
linearitás $$ \begin{align*} \forall x_1,x_2 \in A \colon \qquad L_a (x_1+x_2) &= a \bullet (x_1+x_2) = a \bullet x_1 + a \bullet x_2 = L_a(x_1)+L_a(x_2),\\ \forall x \in A \ \forall \lambda \in \mathbb{R} \colon \qquad L_a (\lambda \cdot x) &= a \bullet (\lambda \cdot x) = \lambda \cdot (a \bullet x) = \lambda \cdot L_a(x).\\ \end{align*} $$
injektivitás Tfh. $L_a(x_1) = L_a(x_2)$, azaz $a \bullet x_1 = a \bullet x_2$. Átrendezés után azt kapjuk, hogy $a \bullet (x_1 - x_2) = 0$, amiből a zérusosztómentesség miatt $x_1 = x_2$ következik, hiszen feltettül, hogy $a \neq 0$. Ezzel beláttuk, hogy $L_a$ injektív. (Itt $0$ az $A$ algebra additív egységelemét jelöli (amit korábban $z$-vel jelöltünk). Nemsokára belátjuk, hogy $A$ egységelemes, és onnantól már $A$ additív egységeleme valóban meg fog egyezni a nulla valós számmal.)
szürjektivitás Felhasználjuk a lineáris transzformációk dimenziótételét (más néven „rang+nullitás” tételt): $\dim \operatorname{Ker} L_a + \dim \operatorname{Im} L_a = n$. Mivel $L_a$ injektív, magja $\{ 0 \}$, és így a dimenziótétel azt adja, hogy $L_a$ értékkészlete $n$-dimenziós altér $A$-ban, aki maga is $n$-dimenziós vektortér. Ez csak úgy lehetséges, hogy $\operatorname{Im} L_a = A$, tehát $L_a$ valóban szürjektív.
Ha $a \neq 0$, akkor az $L_a$ és $R_a$ leképezéseknek tehát létezik inverze. Az inverz leképezés definíciója szerint minden $b$-re $$ L_a(L^{-1}_a(b)) = a \bullet L^{-1}_a(b) = b, \qquad R_a(R^{-1}_a(b)) = R^{-1}_a(b) \bullet a = b. \qquad\qquad (\ast) $$ Ez az összefüggés lesz a kulcs $A$ egységelemességének és a multiplikatív inverzek létezésének bizonyításához.
2. lépés: Létezik egységelem $A$-ban. Rögzítsünk egy $a$ elemet, és legyen $e = L^{-1}_a(a)$. Ekkor $(\ast)$ szerint $a \bullet e = a \bullet L^{-1}_a(a) = a$, tehát $e$ legalább az $a$ elemre nézve jobb oldali egységelemként viselkedik. Ezt és $(\ast)$-ot használva láthatjuk, hogy $e$ valójában jobb oldali egységelem: minden $b \in A$ esetén $$b \bullet e = (R^{-1}_a(b) \bullet a) \bullet e = R^{-1}_a(b) \bullet (a \bullet e ) = R^{-1}_a(b) \bullet a = b.$$ Hasonlóan találhatunk egy $e'$ bal oldali egységelemet is. Végül $e' \bullet e = e'$ (mert $e$ jobb oldali egységelem) és $e' \bullet e = e$ (mert $e'$ bal oldali egységelem). Tehát $e=e'$, és ez az elem kétoldali egységelem.
3. lépés: Minden nemnulla elemnek létezik inverze $A$-ban, vagyis $A$ ferdetest. Ismét $(\ast)$-ot használjuk: ha $a \neq 0$, akkor $a \bullet L^{-1}_a(e) = e$ (vagyis $L^{-1}_a(e)$ jobb oldali inverze $a$-nak) és $R^{-1}_a(e) \bullet a = e$ (vagyis $R^{-1}_a(e)$ bal oldali inverze $a$-nak). Ezek után elég belátni, hogy a két féloldali inverz megegyezik, ehhez pedig az asszociativitást használjuk: $$L^{-1}_a(e) = e \bullet L^{-1}_a(e) = (R^{-1}_a(e) \bullet a) \bullet L^{-1}_a(e) = R^{-1}_a(e) \bullet (a \bullet L^{-1}_a(e)) = R^{-1}_a(e) \bullet e = R^{-1}_a(e).$$
Az egységelem létezésének köszönhetően a valós számtest beágyazható $A$-ba, ezért mostantól úgy tekintjük, hogy $\mathbb{R}$ részalgebrája $A$-nak, és élünk azzal a jelölésbeli egyszerűsítéssel, amivel már korábban is: $a\bullet b$ helyett csak $a\cdot b$-t vagy $ab$-t írunk a továbbiakban, és az egységelemet ezentúl nem $e$ hanem $1$ jelöli (hiszen ő megegyezik a „beágyazott” $1$-es számmal). Mivel $\mathbb{R} \subseteq A$, van értelme bármely $f \in \mathbb{R}[x]$ polinomba tetszőleges $a\in A$ elemet helyettesíteni. Kihasználva $A$ végesrangúságát, megmutatjuk, hogy $A$ minden eleme gyöke egy nemnulla valós polinomnak, sőt, feltehetjük azt is, hogy ez a polinom irreducibilis. (Testelméletben ezt úgy mondanánk, hogy $A$ minden eleme algebrai $\mathbb{R}$ felett. Itt is érvényes az, hogy a legkisebb fokszámú ilyen polinom irreducibilis; nevezhetnénk ezt az $a$ elem minimálpolinomjának.)
4. lépés: Minden $a\in A$ elemhez létezik olyan $f_a \in \mathbb{R}[x]$ irreducibilis polinom, amelyre $f_a(a) = 0$. Mivel $A$ egy $n$-dimenziós vektortér $\mathbb{R}$ felett, az $1,a,a^2,\ldots,a^n$ vektorrendszer lineárisan függő (ugye?), így léteznek olyan $\lambda_0,\lambda_1,\lambda_2,\ldots,\lambda_n$ valós számok, amelyek nem mind nullák, és $\lambda_0\cdot 1+\lambda_1\cdot a+\lambda_2\cdot a^2+\cdots+\lambda_n\cdot a^n = 0$. Eszerint $a$ gyöke az $f=\lambda_0+\lambda_1x+\lambda_2x^2+\cdots+\lambda_nx^n \in \mathbb{R}[x]\!\setminus\!\{0\}$ polinomnak. (Nem biztos, hogy $\deg f = n$, mert előfordulhat, hogy $\lambda_n = 0$, de $f$-nek van legalább egy nemnulla együtthatója.) Ha $f$ irreducibilis faktorizációja az $\mathbb{R}[x]$ polinomgyűrűben $f=p_1\cdot\ldots\cdot p_r$, akkor $0=f(a)=p_1(a)\cdot\ldots\cdot p_r(a)$. Ebből $A$ zérusosztómentessége miatt következik, hogy $p_m(a)=0$ valamely $m\in \{1,\ldots,r\}$ indexre, és ekkor $f_a:=p_m$ olyan $\mathbb{R}$ felett irreducibilis polinom, amelyre $f_a(a) = 0$.
Tudjuk, hogy egy $\mathbb{R}$ feletti irreducibilis polinom fokszáma legfeljebb kettő lehet. Megmutatjuk, hogy ha $f_a$ elsőfokú, akkor $a$ valós szám (ne feledjük, hogy $\mathbb{R}$ be van ágyazva $A$-ba), ha pedig $f_a$ másodfokú, akkor $a$ „olyasmi”, mint egy komplex szám.
5. lépés: Ha $\deg f_a = 1$, akkor $a\in \mathbb{R}$. Ha $\deg f_a = 2$, akkor $a$ felírható $a = \lambda + \mu j$ alakban, ahol $\lambda, \mu \in \mathbb{R}$, $\mu \neq 0$, a $j \in A$ elemre pedig $j^2 = -1$ teljesül. Ha $f_a$ elsőfokú, akkor ilyen alakú: $f_a=\alpha x + \beta$, ahol $\alpha,\beta \in \mathbb{R}$ és $\alpha\neq0$. Az $f_a(a) = 0$ egyenlőséget átrendezve azt kapjuk, hogy $a = -\beta \cdot \alpha^{-1}$, és ez valóban valós szám, mert $\alpha$ és $\beta$ is azok.

Ha $f_a$ másodfokú, akkor ilyen alakú: $f_a=\alpha x^2 + \beta x +\gamma$, ahol $\alpha,\beta,\gamma \in \mathbb{R}$ és $\alpha\neq0$, továbbá $\delta:=\beta^2-4\alpha\gamma\lt0$ (miért?). A másodfokú egyenlet megoldóképletét alkalmazva (gondoljuk meg, hogy miért alkalmazható!), az $f_a(a) = 0$ egyenlőségből kapjuk, hogy $a = \displaystyle\frac{-\beta+\sqrt{\delta}}{2\alpha}$. Legyen $d=\sqrt{\delta}$; ez egy olyan $A$-beli elem, amelynek négyzete $\delta$. Legyen továbbá $j=\displaystyle\frac{d}{\sqrt{|\delta|}}$; ez egy olyan $A$-beli elem, amelynek négyzete $-1$, ugyanis $j^2=\displaystyle\frac{d^2}{|\delta|}=\displaystyle\frac{\delta}{|\delta|}=-1$ (ugye?). Ezzel máris megkapjuk az $a$ elem kívánt felírását: $$a = \frac{-\beta+\sqrt{\delta}}{2\alpha} = \frac{-\beta}{2\alpha} + \frac{d}{2\alpha} = \underbrace{\ \frac{-\beta}{2\alpha}\ }_{\lambda} + \underbrace{\ \frac{\sqrt{|\delta|}}{2\alpha}\ }_{\mu} \cdot \underbrace{\ \frac{d}{\sqrt{|\delta|}}\ }_{j} = \lambda + \mu j.$$

A fenti lépésben a $j$ elem függhet $a$-tól; láttuk már, hogy pl. $A = \mathbb{H}$ esetén végtelen sok olyan $j \in A$ elem van, amire $j^2 = -1$. Ha minden $a$ esetén $\deg f_a = 1$, akkor $A = \mathbb{R}$, és kész a bizonyítás. Ha nem, akkor vegyünk egy olyan $a \in A$ elemet, amelyre $\deg f_a = 2$, és nevezzük el az ő felírásában szereplő $j$ elemet $i$-nek. (Tehát $i$ egy kiválasztott, rögzített elem $\sqrt{-1}$ különböző $A$-beli értékei közül.) Az $\mathbb{R}(i) : = \{ \alpha + \beta i \mid \alpha, \beta \in \mathbb{R} \}$ halmaz egy $\mathbb{C}$-vel izomorf résztestet alkot $A$-ban. Ha ezt szokás szerint azonosítjuk $\mathbb{C}$-vel, akkor $\mathbb{C} \subseteq A$ teljesül, és ha itt egyenlőség van, akkor készen vagyunk.

Tfh. tehát, hogy $\mathbb{R}(i) \subset A$; mostantól arra „utazunk”, hogy belássuk, hogy $A \cong \mathbb{H}$. A bizonyítás következő néhány lépésében azt derítjük fel, hogy $i$ milyen kölcsönhatásban van $A$ elemeivel; különösen az lesz fontos, hogy $i$ mely elemekkel cserélhető fel, azaz mely $a \in A$ elemekre teljesül $ia=ai$. Ehhez használjuk az alábbi $\xi$ leképezést: $$ \xi \colon A \to A, \; a \mapsto -ixi. $$ Mivel $i^2=-1$, az $i$ elem multiplikatív inverze $-i$, vagyis a $\xi$ leképezést így is írhatnánk: $\xi(a) = i^{-1}ai$. Aki tanult már csoportelméletet, annak ez ismerős lehet: ez nem más, mint az $i$-vel való konjugálás.

6. lépés: A $\xi$ leképezés automorfizmusa az $A$ algebrának. Az 1. lépéssel ellentétben itt nem csupán vektortér-automorfizmusról van szó, hanem algebraautomorfizmusról, tehát a bijektivitás és a linearitás mellett a (korábban $\bullet$-val jelölt) szorzással való felcserélhetőséget is be kell látni.
bijektivitás Könnyen ellenőrizhető, hogy $\xi\circ\xi = \operatorname{id}_A$, vagyis a $\xi$ leképezés saját magának az inverze (következésképp bijekció): $$\forall x \in A \colon \qquad \xi(\xi(x))=\xi(-ixi)=-i(-ixi)i=(-i)^2xi^2=(-1)x(-1)=x.$$
linearitás $$ \begin{align*} \forall x_1,x_2 \in A \colon \qquad \xi(x_1+x_2) &= -i(x_1+x_2)i = -ix_1i + (-ix_2i) = \xi(x_1)+\xi(x_2),\\ \forall x \in A \ \forall \lambda \in \mathbb{R} \colon \qquad -i(\lambda \cdot x)i &= \lambda \cdot (-ixi) = \lambda \cdot \xi(x).\\ \end{align*} $$
szorzással való felcserélhetőség $$\forall x_1,x_2 \in A \colon \qquad \xi(x_1\cdot x_2) = -i(x_1\cdot x_2)i = -ix_1\cdot i(-i)\cdot x_2i = -ix_1i \cdot (-ix_2i) = \xi(x_1)\cdot\xi(x_2).$$
Mivel $\xi$ lineáris transzformációja $A$-nak, mint $\mathbb{R}$ fölötti $n$-dimenziós vektortérnek, érdemes megnézni, hogy mik a sajátértékei és a sajátvektorai. Egy nemnulla $a$ elem akkor sajátvektor $\lambda$ sajátértékkel, ha $\xi(a) = \lambda a$. Könnyen látható, hogy ez akkor és csak akkor teljesül, ha $ai=\lambda ia$. Speciálisan a $\lambda = 1$ sajátértékhez tartozó sajátvektorok (azaz $\xi$ nemzéró fixpontjai) éppen az $i$-vel felcserélhető nemzéró elemek. Szükségünk lesz még a $\lambda = -1$ sajátértékhez tartozó sajátvektorokra is ($\pm 1$-en kívül más sajátérték nincs is, de ezt a tényt nem fogjuk használni). Jelölje $U_1$ és $U_{-1}$ a $\lambda = 1$ és a $\lambda = -1$ sajátátértékekhez tartozó sajátaltereket (a sajátalterekben benne van a nullvektor is, noha azt nem tekintjuk sajátvektornak!): $$ \begin{align*} U_1 &= \{ a \in A \mid \xi(a)=a \} = \{ a \in A \mid ia=ai \}, \\ U_{-1} &= \{ a \in A \mid \xi(a)=-a \} = \{ a \in A \mid ia=-ai \}. \end{align*} $$
7. lépés: Az $A$ vektortér az $U_1$ és $U_{-1}$ alterek direkt összege. A direkt összeg definíciója szerint az alábbi két dolgot kell belátni.
$A = U_1+U_{-1}$ Legyen $a \in A$ egy tetszőleges elem, és legyen $u_1 = \displaystyle\frac{a+\xi(a)}{2}$, $u_{-1} = \displaystyle\frac{a-\xi(a)}{2}$. Világos, hogy ekkor $a = u_1 + u_{-1}$, így már csak azt kell igazolni, hogy $\xi(u_1)=u_1$ és $\xi(u_{-1})=-u_{-1}$. Ezek ellenőrizhetőek $\xi$ linearitásása és a korábban látott $\xi\circ\xi = \operatorname{id}_A$ összefüggés segítségével: $$ \begin{align*} \xi(u_1) &= \xi\biggl(\frac{1}{2}a+\frac{1}{2}\xi(a)\biggr) = \frac{1}{2}\xi(a)+\frac{1}{2}\xi(\xi(a)) = \frac{1}{2}\xi(a)+\frac{1}{2}a = u_1, \\ \xi(u_{-1}) &= \xi\biggl(\frac{1}{2}a-\frac{1}{2}\xi(a)\biggr) = \frac{1}{2}\xi(a)-\frac{1}{2}\xi(\xi(a)) = \frac{1}{2}\xi(a)-\frac{1}{2}a = -u_{-1}. \end{align*} $$
$U_1\cap U_{-1} = \{0\}$ Tfh. $u \in U_1$ és $u \in U_{-1}$; ekkor $\xi(u) = u = -u$, azaz $2u=0$. Ebből következik (még a zérusosztómentesség nélkül is!), hogy $u=0$, és ez igazolja, hogy $U_1\cap U_{-1} = \{0\}$.
8. lépés: Két sajátvektor szorzata is sajátvektor, és a két sajátaltér „szorzótáblája” így fest: $$ \begin{array} [c]{c|cccc}% \cdot & U_1 & U_{-1} \\ \hline U_1 & U_1 & U_{-1} \\ U_{-1} & U_{-1} & U_1 \\ \end{array} $$ Az állítást tömörebben így fogalmazhatjuk meg: minden $\lambda,\mu \in \{ -1,1 \}$ esetén, ha $u_\lambda \in U_\lambda$ és $u_\mu \in U_\mu$, akkor $u_\lambda \cdot u_\mu \in U_{\lambda\mu}$. Ez könnyen kijön felhasználva, hogy $\xi$ felcserélhető a szorzással: $$\xi(u_\lambda \cdot u_\mu) = \xi(u_\lambda) \cdot \xi(u_\mu) = \lambda u_\lambda \cdot \mu u_\mu = (\lambda \mu) \cdot (u_\lambda \cdot u_\mu) \implies u_\lambda \cdot u_\mu \in U_{\lambda\mu}.$$
Közeledünk a célhoz (emlékeztetőül: a cél azt belátni, hogy $A \cong \mathbb{H}$); megmutatjuk, hogy $U_1$ a komplex számtest (amit korábban már beágyaztunk $A$-ba), majd ennek segítségével bebizonyítjuk, hogy $A$ rangja $4$.
9. lépés: $U_1 = \mathbb{R}(i)$. Azt kell bizonyítanunk, hogy minden $a \in A$ elemre $a \in \mathbb{R}(i) \iff ia=ai$.
$\implies$ A valós számok felcserélhetőek $i$-vel (miért?), és persze $i$ felcserélhető saját magával is, ezért a valós számokból és $i$-ből „felépíthető” elemek is felcserélhetőek $i$-vel: $i(\lambda + \mu i) = i\lambda + i\mu i = \lambda i + \mu i i = (\lambda + \mu i)i$.
$\impliedby$ Legyen $a$ egy tetszőleges, $i$-vel felcserélhető elem. Ha $a \in \mathbb{R}$, akkor világos, hogy $a \in \mathbb{R}(i)$. Ha $a \notin \mathbb{R}$, akkor az 5. lépés szerint $a$ felírható $a = \lambda + \mu j$ alakban, ahol $\lambda, \mu \in \mathbb{R}$, $\mu \neq 0$ és $j^2 = -1$. Mivel $\lambda$, $\mu^{-1}$ és $a$ mind felcserélhetőek $i$-vel, $j = \mu^{-1}(a-\lambda)$ is felcserélhető vele: $$ij = i\mu^{-1}(a-\lambda) = \mu^{-1}i(a-\lambda) = \mu^{-1} (ia - i\lambda) = \mu^{-1} (ai - \lambda i) = \mu^{-1} (a - \lambda) i = ji.$$ Ebből következik, hogy $(i+j)(i-j)=0$, ugyanis $$(i+j)(i-j) = i^2 - ij + ji - j^2 = i^2 - ij + ij - j^2 = i^2 - j^2 = -1 - (-1) = 0.$$ Felhasználva $A$ zérusosztómentességét, azt kapjuk, hogy $i+j=0$ vagy $i-j=0$, azaz $j=-i$ vagy $j=i$. Mindkét esetben világos, hogy $a = \lambda + \mu j$ az $\mathbb{R}(i)$ halmazban van (ugye?).
10. lépés: Az $A$ algebra rangja $4$. A 7. lépésből tudjuk, hogy $A = U_1 \oplus U_{-1}$, tehát $\dim A = \dim U_1 + \dim U_{-1}$. A 9. lépésben beláttuk, hogy $U_1 = \mathbb{R}(i)$, így $\dim U_1 = 2$ (ugye?). Meg fogjuk mutatni, hogy $U_{-1}$, mint $\mathbb{R}$ fölötti vektortér (nem mint algebra!) izomorf az $U_1$ vektortérrel. E célból rögzítsünk egy tetszőleges nemnulla $u \in U_{-1}$ elemet. Az 1. lépés szerint $L_u$ bijektív lineáris transzformáció. Szorítsuk meg ezt a transzformációt az $U_1$ altérre. Az injektivitás és a linearitás persze teljesül erre a leszűkített leképezésre is, ezért ha teljesül, hogy $L_u(U_1)=U_{-1}$, akkor $L_u$ izomorfizmust létesít az $U_1$ és $U_{-1}$ alterek között.
$L_u(U_1)\subseteq U_{-1}$ Ez nem más, mint a 8. lépésbeli művelettáblázat bal alsó elme: az $U_{-1}$-beli $u$ elemnek bármely $U_1$-beli elemmel vett szorzata $U_{-1}$-ben van.
$L_u(U_1)\supseteq U_{-1}$ Tfh. $b \in U_{-1}$, és legyen $a = u^{-1}b$. Ez az $a$ elem lesz $b$ ősképe az $L_u$ leképezésnél, hiszen $L_u(a) = ua = uu^{-1}b = b$. Célunk megmutatni, hogy $a\in U_1$. Tudjuk, hogy $iu=-ui$, mivel $u \in U_{-1}$. Szorozzunk balról és jobbról is $u$ inverzével: $u^{-1}iuu^{-1}=-u^{-1}uiu^{-1}$, azaz $u^{-1}i=-iu^{-1}$. Ez azt jelenti, hogy $u^{-1} \in U_{-1}$. Ismét a 8. lépést használva (most a művelettáblázat jobb alsó elmét kell nézni) kapjuk, hogy $a=u^{-1}b \in U_1$, hiszen $b$ és $u^{-1}$ is az $U_{-1}$ altérben van. Ezzel bebizonyítottuk, hogy $b = L_u(a) \in L_u(U_1)$.
Mivel $U_{-1}$ és $U_1$ izomorf vektorterek, $\dim U_{-1} = \dim U_1 = 2$, tehát $\dim A = \dim U_1 + \dim U_{-1} = 2+2 =4$.
A kvaternióferdetestben hemzsegnek $-1$ négyzetgyökei. Az utolsó előtti lépésben belátjuk, hogy $A$-ban is rengeteg olyan elem van, aminek a négyzete negatív valós szám, majd ennek segítségével végre célba érünk.
11. lépés: Ha $a \in U_{-1}\!\setminus\!\{0\}$, akkor $a^2 \in \mathbb{R}^-$. Ha $a \in U_{-1}\!\setminus\!\{0\}$, akkor a 8. lépés szerint (meignt a táblázat jobb alsó sarkát kell nézni) $a^2\in U_1$, és így a 9. lépés alapján $a^2=\alpha + \beta i$ alkalmas $\alpha,\beta$ valós számokkal. Az asszociativitásból következik, hogy $a$ felcserélhető $a^2$-tel: $a^2a=(aa)a=a(aa)=aa^2$, tehát $a(\alpha + \beta i)=(\alpha + \beta i)a$. Vonjuk ki mindkét oldalból az $a\alpha=\alpha a$ elemet, és használjuk fel, hogy $\beta$ is felcserélhető $a$-val: $a\beta i = \beta ai =\beta ia$. Az $a \in U_{-1}$ feltevés alapján $ia=-ai$, tehát $\beta ai = \beta ia = -\beta ai$, azaz $2\beta ai =0$. A zérusosztómentesség miatt ebből $\beta=0$ következik, hiszen se $a$ se $i$ nem nulla. Ezzel beláttuk, hogy $a^2 = \alpha$, vagyis $a^2$ valós szám.

Ha $\alpha$ nemnegatív lenne, akkor lenne valós négyzetgyöke, ami (mint minden valós szám) felcserélhető $a$-val. Ezt hasznájuk a következő számolásban: $$(a+\sqrt{\alpha})(a-\sqrt{\alpha}) = a^2 -a\sqrt{\alpha} + \sqrt{\alpha}a -\alpha = a^2 - \alpha =0.$$ A zérusosztómentességnek köszönhetően ebből következik, hogy $a+\sqrt{\alpha} = 0$ vagy $a-\sqrt{\alpha} = 0$, azaz $a=-\sqrt{\alpha}$ vagy $a=\sqrt{\alpha}$. Mindkét esetben azt kaptuk, hogy $a$ valós szám, tehát $a \in \mathbb{R} \subseteq \mathbb{R}(i) = U_1$. Másrészt feltettük, hogy $a \in U_{-1}$, ezért $a \in U_1 \cap U_{-1}$, ami a 7. lépés szerint csak $a=0$ esetén lenne lehetséges, node $a \neq 0$ is fel volt téve. Ezzel beláttuk, hogy $\alpha$ negatív, így $a^2 = \alpha \in \mathbb{R}^-$.

12. lépés: Az $A$ algebra izomorf a kvaterniók algebrájával. Rögzítsünk egy tetszőleges $a \in U_{-1}$ elemet; ekkor az előző lépés szerint $\alpha := a^2 \in \mathbb{R}^-$. Ebből következik, hogy a $j:=\displaystyle\frac{a}{\sqrt{|\alpha|}}$ elemre $j^2=-1$ teljesül (ugye?). Mivel $i\in U_1$ és $j \in U_{-1}$, a 8. lépésből adódik (jobb felső sarok), hogy a $k:=ij$ elem $U_{-1}$-ben van. A $\{j,k\}$ vektorrendszer lineárisan független (ha $j$ és $k=ij$ egymás skalárszorosai lennének, akkor hányadosuk valós szám lenne, de a hányados nem más, mint $i$), tehát bázisa az $U_{-1}$ altérnek (hiszen a 10. lépés bizonyításánál láttuk, hogy $\dim U_{-1} = 2$). Másrészt $\{1,i\}$ nyilván bázisa az $U_1 = \mathbb{R}(i)$ altérnek, így a 7. lépésben igazolt direkt felbontás alapján $\{1,i,j,k\}$ bázisa $A$-nak, azaz $A$ elemei egyértelműen felírhatók $\alpha + \beta i + \gamma j + \delta k \ (\alpha,\beta,\gamma,\delta \in \mathbb{R})$ alakban.

Ezzel már majdnem készen vagyunk; csak azt kellene még ellenőrizni, hogy az $i,j,k$ elemek páronkénti szorzatai úgy alakulnak, ahogy a kvaternióknál. Tudjuk már, hogy $i^2=j^2=-1$ és $k=ij$, továbbá $j \in U_{-1}$ miatt $ji=-ij$. Ebből következik, hogy $$k^2=kk=(ij)(ij)=i(ji)j=i(-ij)i=-iijj=-i^2j^2=-(-1)(-1)=-1.$$ Ez alapján pedig $ijk=kk=-1$ adódik, és ezzel beláttunk mindent, amit Hamilton felvésett a hídra (sőt, kicsivel többet is).

   Hasonlítsuk össze Frobenius tételét a $2$ rangú hiperkomplex rendszereket leíró tétellel. Ott csak az egységelemességet tettük fel, de csak a $2$ rangú algebrákat tudtuk leírni (van végtelen sok magasabb rangú is, például a mátrixalgebrák). Itt a zérusosztómentességet tettük fel (amiből a bizonyítás 2. lépésében kijött az egységelemesség is), de az összes ilyen végesrangú algebrát leírtuk (és csak háromféle van belőlük).

A Cayley-féle oktoniók

A komplex számok és a kvaterniók konstrukciója ugyanannak az általánosabb eljárásnak két speciális esete, amelyet lehet még a kvaterniókon túl is folytatni, de így már egyre kevésbé „szép” algebrákat kapunk.

Legyen $A$ a valós számok, a komplex számok vagy a kvaterniók algebrája, és legyen $A^{\prime}$ az $a+bE$ alakú formális kifejezések halmaza, ahol $E$ egy szimbólum és $a,b\in A$. Az összeadást és a szorzást a következőképpen értelmezzük: $$ \begin{align*} (a+bE)+(c+dE) & =(a+c)+( b+d)E,\\ (a+bE)\cdot(c+dE) & =(ac-\overline {d}b)+(da+b\overline{c})E. \end{align*} $$ Ez az úgynevezett Cayley-Dickson konstrukció, a megkonstruált $A^{\prime}$ algebrát pedig az $A$ algebra megkettőzöttjének nevezzük.

Ha $A=\mathbb{R}$, akkor $A^{\prime}\cong\mathbb{C}$, és ha $A=\mathbb{C}$, akkor $A^{\prime}\cong\mathbb{H}$. A kvaterniók algebrájának megkettőzöttje a Cayley-féle oktoniók algebrája, amely $8$ rangú nemasszociatív, egységelemes, zérusosztómentes algebra $\mathbb{R}$ fölött. Itt az asszociativitás alábbi gyengébb formája, az alternativitás teljesül: $$ a\cdot(a\cdot b)=(a\cdot a)\cdot b,\qquad a\cdot(b\cdot b)=(a\cdot b)\cdot b,\qquad a\cdot(b\cdot a)=(a\cdot b)\cdot a. $$ Ha ismét alkalmazzuk a Cayley-Dickson konstrukciót, akkor egy $16$ rangú egységelemes algebrát kapunk (szedeniók), amely már nem is alternatív, minden nemnulla elemének van inverze, de mégis vannak benne zérusosztók!

A Frobenius-tétel alábbi általánosítása mutatja, hogy ha az asszociativitás helyett csak az alternativitást követeljük meg, akkor is csak egy újabb algebrát kapunk (az oktoniókat) a Frobenius-tételben szereplő $\mathbb{R}$, $\mathbb{C}$ és $\mathbb{H}$ mellett.

   Izomorfia erejéig csak négy nemtriviális, végesrangú, zérusosztómentes, alternatív algebra létezik a valós számok teste fölött:

Végül következzék a fenti tétel egy Hurwitztól származó variánsa, amiben a zérusosztómentesség helyett egy norma létezését követeljük meg (ami az abszolút érték szerepét játssza).

Legyen $A$ egy $\mathbb{R}$ fölötti (nem feltétlenül asszociatív) algebra, és legyen $\langle,\rangle \colon A^2\rightarrow\mathbb{R}$ egy szimmetrikus bilineáris alak: $$ \renewcommand{\arraystretch}{1.3} \begin{array} [c]{rrl} \forall a,b\in A\colon & \langle a,b\rangle = & \!\!\!\!\!\! \langle b,a\rangle ;\\ \forall a,b,c\in A\colon & \langle a+b,c\rangle = & \!\!\!\!\!\! \langle a,c\rangle +\langle b,c\rangle ;\\ \forall a,b\in A~\forall\lambda\in\mathbb{R}\colon & \langle \lambda a,b\rangle = \!\!\!\!\!\! & \lambda\langle a,b\rangle . \end{array} $$ Tegyük fel, hogy az $N(a)=\langle a,a\rangle $ kvadratikus alak pozitív definit: $$ \forall a\in A\colon~\langle a,a\rangle \geq0, \quad\quad\langle a,a\rangle =0\iff a=0. $$ Az $N(a)$ nemnegatív valós számot az $a$ elem normájának nevezzük. A norma multiplikatív, ha $$ \forall a,b\in A\colon~N(ab)=N(a)N(b). $$

   Izomorfia erejéig csak négy olyan egységelemes algebra létezik a valós számok teste fölött, ami rendelkezik egy, a fentiekben definiált multiplikatív normával:

Ennek a tételnek egy érdekes következménye, hogy a négyzetszámok összegeként előálló számok szorzatát négyzetszámok összegeként felíró Euler-azonossághoz hasonló azonosságból nagyon kevés van.

   Csak $n=1,2,4,8$ esetén létezik $$ \bigl( x_1^2+\cdots+x_n^2 \bigr) \cdot \bigl( y_1^2+\cdots+y_n^2 \bigr) =z_1^2+\cdots+z_n^2 $$ alakú azonosság, ahol mindegyik $z_{i}$ egy $\sum c_{ij}x_{i}y_{j}$ alakú kifejezés. (Az $n=8$ esetben a Degen-azonosságot kapjuk.)