Schönheit als strukturierte kognitive Arbeit — der vollständige mathematische Kern

Dies ist die wissenschaftliche Ebene von TITI, geschrieben für Leser, die das tatsächliche Regelwerk und keine Slogans suchen. Sie formuliert den ästhetischen Kern der Engine so, wie das Werk auch alles andere veröffentlicht: in voller Länge, mit ihren Formeln und mit einem expliziten Rahmen für das, was sie beansprucht und was nicht. Die zentrale These ist eine Neubetrachtung. Schönheit wird nicht als statische, skalare Eigenschaft eines Objekts behandelt. Sie wird modelliert als die strukturierte kognitive Arbeit, die von einem objektinduzierten Potenzialfeld auf das prädiktive Modell des Betrachters entlang einer Trajektorie auf einer Informationsmannigfaltigkeit unter beschränkter Dissipation und Phasenkohärenz geleistet wird. Das Modell wird als kohärenter theoretischer Rahmen und diagnostisches Instrument präsentiert — nicht als bewiesenes physikalisches Gesetz des Gehirns. Sein Zweck ist operationaler Natur: ästhetische Erfahrung in messbare Designhypothesen zu übersetzen — kognitiver Aufwand, strukturiertes Geheimnis, Phasenabgleich, interpretative Kapazität und der Wert der Trajektorie selbst.

Ontologie: Objekt, Subjekt und ein Pfad durch den Modellraum

Ein ästhetisches Objekt — ein Bild, ein Musikstück, ein Interface, ein Gebäude, ein Markensystem, selbst eine mathematische Formel — wird niemals an sich als schön bewertet. Stattdessen induziert das Objekt ein Feld auf dem Raum der internen prädiktiven Modelle des Betrachters. Das Subjekt wird nicht als fester Präferenzvektor dargestellt, sondern als prädiktives kognitives System mit internen Modellzuständen. Ein Modellzustand ist ein Punkt auf einer Mannigfaltigkeit,

m(t)\in\mathcal{M}

und die ästhetische Erfahrung ist eine Trajektorie dieses Zustands, während der Betrachter mit dem Objekt interagiert:

\gamma(t):[0,T]\to\mathcal{M},\qquad \gamma(0)=m_{0},\ \ \gamma(T)=m_{T}

Dies ist der erste und tragende Schritt: Der ästhetische Wert ist eine Eigenschaft des Pfades, den das Modell des Betrachters zurücklegt, nicht des Objekts allein.

Die Informationsmannigfaltigkeit und die Fisher-Rao-Metrik

Die internen Modelle des Betrachters werden als parametrische Verteilungsfamilie aufgefasst, sodass der Modellraum die natürliche Geometrie der Statistik in sich trägt. Die Metrik ist die Fisher-Informationsmatrix:

g_{ij}(\theta)=\mathbb{E}_{x\sim p(x\mid\theta)}\!\left[\frac{\partial\log p(x\mid\theta)}{\partial\theta_{i}}\,\frac{\partial\log p(x\mid\theta)}{\partial\theta_{j}}\right]

Diese Metrik misst, wie schwer es für den Betrachter ist, nahe beieinander liegende prädiktive Zustände zu unterscheiden. Zustände, die unter der Fisher-Rao-Metrik nah beieinander liegen, können mit geringem kognitivem Aufwand ineinander überführt werden; weit voneinander entfernte Zustände erfordern mehr Arbeit. Die ästhetische Distanz ist daher nicht flach — dieselbe visuelle Differenz kann für einen Betrachter einfach und für einen anderen schwierig sein, weil ihre internen Mannigfaltigkeiten eine unterschiedliche Krümmung aufweisen. Der Abstand zwischen zwei kognitiven Zuständen ist die geodätische Länge:

D_{g}(m_{a},m_{b})=\inf_{\gamma}\int_{0}^{T}\!\sqrt{g_{ij}(\gamma(t))\,\dot{\gamma}^{i}(t)\,\dot{\gamma}^{j}(t)}\;dt

Das objektinduzierte ästhetische Potenzial

Das Objekt induziert ein skalares Potenzialfeld über dem Modellraum. An jedem Modellzustand repräsentiert sein Wert die ungelöste Freie-Energie-Spannung, die prädiktive Abweichung (predictive mismatch) oder das interpretative Potenzial, das das Objekt erzeugt. Es kann mit der variationellen freien Energie des Betrachtermodells relativ zum Objekteingang identifiziert werden:

\Phi_{O}:\mathcal{M}\to\mathbb{R},\qquad \Phi_{O}(m)=\mathcal{F}(O,m)

Dies kollabiert bewusst nicht in das Prinzip der freien Energie (Free Energy Principle). Dieses Prinzip fragt danach, wie ein Organismus die freie Energie minimiert, um die Homöostase aufrechtzuerhalten; hier ist die Frage, wie ein Objekt eine Trajektorie durch die Landschaft der freien Energie so formt, dass der Pfad kognitiv wertvoll, phasenkohärent und nicht trivial aufgelöst ist. Die Engine belohnt nicht die geringstmögliche freie Energie — sie belohnt strukturierte Bewegung durch eine reiche Landschaft. Die Kraft, die das Objekt auf die Interpretation ausübt, ist der metrische Gradient des Potenzials:

F_{\mathrm{aest}}=-\nabla_{g}\Phi_{O},\qquad (\nabla_{g}\Phi)^{i}=g^{ij}\frac{\partial\Phi}{\partial q^{j}}

Ein langweiliges Objekt hat ein flaches, triviales Feld; ein chaotisches Objekt ein inkohärentes; ein Meisterwerk ein tiefes, strukturiertes Feld mit mehreren Attraktoren.

Strukturiertes Geheimnis, abgegrenzt von Rauschen

Überraschung klingt ab — ein vertrautes Meisterwerk würde jeglichen Wert verlieren, wenn Schönheit nur Überraschung wäre. Daher benötigt das Modell eine statische, aber strukturierte Komponente. Da interpretative Ebenen statistisch voneinander abhängig sind, würde eine naive gewichtete Summe zu Doppelzählungen führen; die korrigierte Form nutzt die Entropie-Kettenregel:

H_{\mathrm{mystery}}(O,S)=H(L_{1})+\sum_{i=2}^{n}H\!\bigl(L_{i}\mid L_{i-1},\dots,L_{1}\bigr)

wobei die Interpretationsebenen L_1, L_2, …, L_n kompositionelle, symbolische, kontextuelle, archetypische, kulturelle und höherwertige interpretative Unsicherheit tragen (die Symbole werden als L_i und nicht als H_i geschrieben, um eine Entropie-einer-Entropie-Interpretation zu vermeiden). Jeder bedingte Term fügt nur die strukturierte Unsicherheit hinzu, die verbleibt, nachdem die niedrigeren Ebenen berücksichtigt wurden, sodass nichts doppelt gezählt wird. Das Geheimnis wird scharf vom Rauschen abgegrenzt. Rauschen ist inkompressible Zufälligkeit, die den Aufwand erhöht, ohne eine kohärente Interpretation hinzuzufügen; das Geheimnis ist eine kompressible, aber noch nicht ausgeschöpfte Struktur, die zu weiterer Interpretation einlädt:

H_{\mathrm{mystery}}=H_{\mathrm{total}}-H_{\mathrm{noise}}-H_{\mathrm{resolved}}

Generative interpretative Kapazität

Sei die Menge der stabilen Interpretationen, die ein Objekt in einem Subjekt erzeugt, der Interpretationsraum, wobei jede stabile Interpretation ein Attraktor der kognitiven Dynamik des Betrachters ist. Ein naives Verhältnis von Interpretationsvolumen zu Generatorkomplexität divergiert, wenn der Generator trivial ist — was fälschlicherweise zufällige Assoziationsauslöser unendlich wertvoll erscheinen lässt. Die regularisierte Form behebt dies und belohnt kohärente Reichhaltigkeit:

\mathrm{GIC}^{*}(O,S)=\frac{\mathrm{Vol}\bigl(\Omega(O,S)\bigr)\cdot \mathrm{Coh}(\Omega)}{K_{\mathrm{gen}}(O)+\varepsilon}

Die Terme in diesem Verhältnis sind benannt, aber noch nicht festgelegt: Das Interpretationsvolumen Vol(Ω) und die Generatorkomplexität K_gen — ob als Kolmogorov-Komplexität, Beschreibungs-/Implementierungslänge, Komponentenanzahl oder als Abhängigkeitsgraphen-Maß realisiert — müssen noch je Medium operationalisiert werden. So wie es dasteht, ist das Verhältnis eine wohldefinierte Hypothese, kein fertiger Schätzer; der abschließende Rahmen hält diese Unterscheidung explizit aufrecht.

Der Kohärenzfaktor bestraft eine Explosion zufälliger Assoziationen: Ein hoher Wert erfordert viele Interpretationen und eine strukturierte Kohärenz zwischen ihnen, nicht viele unzusammenhängende Assoziationen. Er wird durch eine charakteristische Interpretationsdistanz-Skala τ normiert, sodass der Exponent ist dimensionslos, wobei der Mittelwert über alle Paare stabiler Interpretationen gebildet wird:

\mathrm{Coh}(\Omega)=\exp\!\left(-\frac{1}{\tau}\,\mathbb{E}_{i,j}\bigl[D_{g}(x_{i}^{*},x_{j}^{*})\bigr]\right),\qquad \mathbb{E}_{i,j}[\,\cdot\,]=\frac{1}{\mathrm{Vol}(\Omega)^{2}}\int_{\Omega}\!\int_{\Omega}(\cdot)\,d\mu(x_{i}^{*})\,d\mu(x_{j}^{*})

Phasenkohärenz — Timing, wo Timing existiert

Jedes dynamische ästhetische Merkmal wird als komplexes Amplituden- und Phasensignal geschrieben. Phase ist keine Metapher: Sie wird nur dort zugelassen, wo echtes Timing, Rhythmus oder Oszillation existiert — Musik, Animations-Timing, Scroll-Rhythmus, sakkadisches Timing, Interaktionslatenz, Einblende-Timing, Aufmerksamkeitszyklen.

z_{k}(t)=A_{k}(t)\,e^{i\theta_{k}(t)}

Unter Darstellung der dynamischen Zustände von Objekt und Subjekt in einem Hilbert-Raum ist die normierte Phasenkohärenz ihre beschränkte Ausrichtung über das Skalarprodukt:

\mathrm{PC}(O,S,t)=\frac{\bigl|\langle z_{O}(t),z_{S}(t)\rangle\bigr|}{\lVert z_{O}(t)\rVert\,\lVert z_{S}(t)\rVert},\qquad 0\le \mathrm{PC}\le 1

Für dynamische Systeme misst dies den tatsächlichen zeitlichen Abgleich — in einem Interface bedeutet eine hohe Phasenkohärenz, dass Bewegung, Einblendung und Reaktion exakt dann eintreffen, wenn die Aufmerksamkeit des Nutzers bereit ist, sie aufzunehmen. Für ein statisches Artefakt wird die Phase nicht direkt angewendet: Sie fließt nur über die vom Artefakt induzierte Trajektorie der Aufmerksamkeit ein — die Reihenfolge, in der das Auge die Komposition liest und sich ihre Ebenen im Laufe der Zeit entfalten. Wo eine solche Aufmerksamkeitssequenzierung nicht messbar ist, wird die Phasenkohärenz durch strukturelle Ausrichtung ersetzt, anstatt sie auf ein Standbild zu zwingen.

Die Hamilton-Formulierung

Mit der kognitiven Modellposition als verallgemeinerter Koordinate ist der verallgemeinerte kognitive Impuls die durch die lokale Krümmung der Mannigfaltigkeit gewichtete Geschwindigkeit — sodass eine kleine konzeptionelle Bewegung in einer stark gekrümmten Region einen großen Impuls tragen kann:

p_{i}=g_{ij}(q)\,\dot{q}^{j}

Die kinetische kognitive Energie ist die Energie der Modellbewegung — hohe Werte entsprechen einer schnellen Restrukturierung der Prädiktionen des Betrachters. Es ist dieselbe Energie, auf zwei äquivalente Weisen geschrieben: mit der Metrik, die auf Geschwindigkeiten wirkt (kovariant g_{ij}), und — nach dem Absenken der Geschwindigkeit zum oben genannten konjugierten Impuls — mit der inversen Metrik, die auf Impulse wirkt (kontravariant g^{ij}). Der hochgestellte Index in der Impulsform hebt genau den tiefgestellten Index in p_i auf:

T(q,\dot{q})=\tfrac{1}{2}\,g_{ij}(q)\,\dot{q}^{i}\dot{q}^{j}\qquad\text{(velocity form, covariant metric)}

T(q,p)=\tfrac{1}{2}\,g^{ij}(q)\,p_{i}\,p_{j}\qquad\text{(momentum form, inverse metric)}

Das ästhetische Potenzial verbindet das Objektfeld mit Geheimnis und Phasenkohärenz; die negativen Vorzeichen bedeuten, dass ein hohes Geheimnis und eine hohe Phasenkohärenz attraktive Senken erzeugen, die die Kognition in eine tiefere Beschäftigung ziehen:

V(q,O,S)=\Phi_{O}(q)-\kappa\,H_{\mathrm{mystery}}(O,S,q)-\rho\,\mathrm{PC}(O,S,q)

Der ästhetische Hamilton-Operator ist die Summe aus kinetischen und potenziellen Termen — die diagnostische Energie des ästhetischen Zustands:

\mathcal{H}_{\mathrm{aest}}(q,p)=\tfrac{1}{2}\,g^{ij}(q)\,p_{i}p_{j}+\Phi_{O}(q)-\kappa\,H_{\mathrm{mystery}}(O,S,q)-\rho\,\mathrm{PC}(O,S,q)

Im idealen, nicht-dissipativen Fall folgt die Dynamik den Hamiltonschen Bewegungsgleichungen; dies ist die Idealisierung reiner Kontemplation ohne Ermüdung und ohne Störung:

\dot{q}^{i}=\frac{\partial\mathcal{H}_{\mathrm{aest}}}{\partial p_{i}},\qquad \dot{p}_{i}=-\frac{\partial\mathcal{H}_{\mathrm{aest}}}{\partial q^{i}}

Die offene, dissipative Bilanz — die zentrale Bilanzgleichung

Reale Kognition ist nicht ideal. Die Einführung einer dissipativen Aufwandsrate und eines strukturierten Eingangsflusses verwandelt das System in ein offenes, das von der Bilanzgleichung für offene Systeme im Herzen des Modells geregelt wird (eine Analogie zu einer thermodynamischen Bilanz, kein Anspruch auf physikalische Thermodynamik):

\frac{d\mathcal{H}_{\mathrm{aest}}}{dt}=-\lambda\,C(t)+\mathcal{I}_{\mathrm{input}}(t)

Schönheit bleibt bestehen, wenn das Objekt genügend strukturierten Input liefert, um die kognitive Dissipation auszugleichen, ohne die Kohärenz zu überfordern. Aus dieser einzigen Bilanz ergeben sich die kognitiven Regime als Einzelfälle.

Kognitive Regime

Langeweile ist nicht Vertrautheit; sie ist ein dissipatives Ungleichgewicht — das Objekt hört auf, die Kosten der Aufmerksamkeit zu decken, und die Trajektorie kollabiert in ein triviales Minimum:

\mathcal{I}_{\mathrm{input}}(t)<\lambda\,C(t)\ \Rightarrow\ \dot{q}\to 0,\ p\to 0,\ H_{\mathrm{mystery}}\to 0

Überlastung ist nicht hohe Komplexität allein; sie ist der Verlust kohärenter Interpretation — zu viele Informationen zu schnell, der Betrachter kann sich nicht phasenmäßig synchronisieren (phase-lock), Interpretationen destabilisieren sich:

\mathcal{I}_{\mathrm{input}}(t)\gg\lambda\,C(t)\ \Rightarrow\ \mathrm{PC}\to 0,\ \mathrm{Coh}(\Omega)\to 0

Ästhetischer Flow ist eine ausgewogene Dynamik offener Systeme: Input und Aufwand im Gleichgewicht, das Geheimnis bleibt strukturiert, die Phasenkohärenz ist hoch, der Betrachter wird im ästhetischen Feld gehalten. Dauerhafte Schönheit ist dasselbe Gleichgewicht, das wiederholter Betrachtung standhält — sie überdauert nicht, weil sie endlose Überraschungen erzeugt, sondern weil sie ein stabiles, strukturiertes Geheimnis und eine kohärente interpretative Kapazität bewahrt:

\frac{d\mathcal{H}_{\mathrm{aest}}}{dt}\approx 0,\qquad H_{\mathrm{mystery}}>0,\ \ \mathrm{PC}\to 1,\ \ \mathrm{GIC}^{*}\gg 0

Das vollständige ästhetische Wirkungsfunktional

Fasst man die Terme zusammen, ist der realisierte ästhetische Wert über ein Wahrnehmungsintervall die trajektorienintegrierte kognitive Arbeit, multipliziert mit der kohärenten interpretativen Kapazität:

\mathcal{B}_{v2.6}[\gamma]=\mathrm{GIC}^{*}(O,S)\int_{0}^{T}\!\left[\alpha\!\left(-\frac{d\Phi_{O}(\gamma(t))}{dt}\right)+\beta\,\frac{H_{\mathrm{mystery}}(O,S,t)}{T_{\mathrm{char}}}+\eta\,\nu_{\mathrm{res}}\,\mathrm{PC}(O,S,t)-\lambda\,C(t)\right]dt

Jeder Term trägt eine Dimension, die sich in eine Informationsflussrate auflöst (Nats pro Sekunde): der Potenzialfluss-Term, die Freisetzungsrate des strukturierten Geheimnisses, die Phasenkohärenz-Abtastrate gegenüber der kognitiven Aufwandsrate. Das Integral ist die gesamte ästhetische Arbeit in Nats; der Multiplikator für die interpretative Kapazität ist dimensionslos.

Term	Bedeutung	Technische Messgröße
$\Phi_{O}$	Objektinduziertes Prädiktions-Abweichungsfeld	Rate der Modellaktualisierung über Artefaktzustände
$H_{\mathrm{mystery}}$	Strukturierte, unaufgelöste Interpretationstiefe	Unaufgelöste semantische Tiefe, die eine fortgesetzte Beschäftigung belohnt
$\mathrm{PC}$	Zeitliche Abstimmung der Objekt- und Subjektdynamik	Abstimmung von UI-Bewegung/Einblendung auf das Nutzerverhalten
$\lambda C(t)$	Kognitiver Aufwand / Dissipation	Latenz, Zögern, Zurückspringen (Backtracking), Überlastung
$\mathrm{GIC}^{*}$	Kohärente interpretative Kapazität pro Komplexität	Kapazität für eine stabile Erkundung (Journey) pro Implementierungskomplexität

Was diese Mathematik beansprucht und was nicht

Was beansprucht werden kann

Was beansprucht werden kann: Ein kohänzenter formaler Rahmen, der die ästhetische Erfahrung in messbare Designhypothesen übersetzt — kognitiver Aufwand, strukturiertes Geheimnis, Phasenabgleich, interpretative Kapazität und Trajektorienwert —, modelliert als trajektorienintegrierte kognitive Arbeit auf einer Fisher-Rao-Informationsmannigfaltigkeit, mit einem diagnostischen Hamilton-Operator, einer offenen dissipativen Bilanzgleichung und falsifizierbaren kognitiven Regimen (Langeweile, Überlastung, Flow, dauerhafte Schönheit).

Was nicht beansprucht werden kann

Was nicht beansprucht werden kann: Dass dies ein gemessenes physikalisches Gesetz des Gehirns ist, oder dass der ästhetische Hamilton-Operator eine physikalische Erhaltungsgröße darstellt, oder dass das Modell heute bereits vollständig als Rechenwerk spezifiziert ist. Es handelt sich um eine formale diagnostische Invariante zur Modellierung kognitiver ästhetischer Dynamiken, nicht um ein bewiesenes Erhaltungsgesetz.

Die explizite Grenze

Die explizite Grenze: Das Framework benennt die Kräfte und Bilanzen, spezifiziert aber noch nicht vollständig, wie jede einzelne zu MESSEN ist. Das Objektpotenzial Φ_O, der kognitive Aufwand C(t), der Eingangsfluss I_input(t), das Rauschen und die aufgelösten Entropien, die Generatorkomplexität K_gen, der Interpretationsraum Ω sowie die Konstanten ν_res und T_char werden als schätzbare Observablen dargelegt, noch nicht als feste Operatoren mit Einheiten und Verfahren. Ob jede dieser Größen allein aus der Telemetrie ableitbar ist oder Instrumente wie Eye-Tracking erfordert, ist eine offene Forschungsfrage — und wird als solche deklariert. Bis diese Operatoren fest definiert sind, handelt es sich um ein Modellierungs-Framework, nicht um ein fertiges Rechenwerk.

Warum in voller Länge veröffentlicht

Warum es dennoch in voller Länge veröffentlicht wird: Ein kohärenter theoretischer Rahmen, dargelegt mit seinen Formeln und seinen Grenzen, ist der wissenschaftliche Redlichkeitsvertrag der wissenschaftlichen Ebene — die Marketingebene sagt, was TITI tut; diese Ebene erklärt, warum es so strukturiert ist, wie es ist, und wo seine Beweiskraft heute endet.

Die prägnanteste Kernaussage des Modells: Schönheit ist die trajektorienintegrierte kognitive Arbeit, die durch ein objektinduziertes Informationspotenzialfeld erzeugt wird, multipliziert mit der kohärenten interpretativen Kapazität und begrenzt durch Phasenabgleich und kognitive Dissipation.

Referenzen

Amari, S. & Nagaoka, H. — Methods of Information Geometry (Fisher-Rao-Metrik, statistische Mannigfaltigkeiten) — https://doi.org/10.1090/mmono/191
Friston, K. — The free-energy principle: a unified brain theory? (variationelle freie Energie) — https://doi.org/10.1038/nrn2787
Itti, L. & Baldi, P. — Bayesian surprise attracts human attention (Überraschung und Aufmerksamkeit) — https://doi.org/10.1016/j.visres.2008.09.007