構造化された認知ワークとしての美 — 数学的コアの全容

これは TITI の科学的レイヤーであり、スローガンではなく実際のメカニズムを求める読者のために書かれている。当エンジンの審美的コアを、他のすべての仕様公開と同様に、数式を交え、その主張することと主張しないことの明示的な枠組みとともに、完全に公開する。中心となる主張は、フレーミングの再構築である。 美は、対象の静的なスカラー特性としては扱われない。それは、有界な散逸と位相コヒーレンスの下、情報多様体(information manifold)上の軌道に沿って、観察者の予測モデルに対して対象誘起ポテンシャル場が実行する、構造化された認知ワークとしてモデル化される。このモデルは、脳の実証された物理法則としてではなく、一貫した理論的枠組みおよび診断器具として提示される。その目的は操作可能(operational)にすること、すなわち審美的体験を、認知コスト、構造化された謎(structured mystery)、位相アライメント(phase alignment)、解釈容量(interpretive capacity)、そして軌道自体の価値といった、測定可能なデザイン仮説へと変換することである。

存在論:対象、主体、およびモデル空間を充たす経路

審美的対象(画像、音楽、インターフェース、建築、ブランドシステム、あるいは数学公式すらも)が、それ自体として「美しい」とスコアリングされることはない。代わりに、対象は観察者の内部予測モデルの空間上に場を誘起する。主体は固定された嗜好ベクトルとしてではなく、内部モデル状態を持つ予測的な認知システムとして表現される。モデル状態は多様体上の点であり、

審美的体験とは、観察者が対象と関わっている間の、その状態の軌道(trajectory)である:

これが最初の、および最も重要な足場となるステップである。審美的価値とは、対象単独の属性ではなく、観察者のモデルが移動する経路(path)の属性なのだ。

情報多様体と Fisher-Rao メトリック

観察者の内部モデルは分布のパラメトリック族とみなされるため、モデル空間は統計学の自然な幾何学を備えている。そのメトリック(計量)は Fisher 情報行列である:

このメトリックは、観察者にとって近傍の予測状態を区別することがどれほど困難であるかを測定する。Fisher-Rao メトリックにおいて互いに近い状態間は、低い認知コストで移行可能である。一方、遠く離れた状態間への移行は、より多くのワークを必要とする。したがって、審美的な距離は平坦ではない。観察者の内部多様体(manifold)が異なる曲率を持っているため、同一の視覚的差異であっても、ある観察者にとっては容易であり、別の観察者にとっては困難になり得る。2つの認知状態間の距離は、測地線の長さ(geodesic length)となる:

対象が誘起する審美的ポテンシャル

対象は、モデル空間上にスカラーポテンシャル場を誘起する。各モデル状態におけるその値は、対象が創り出す未解決の自由エネルギーテンション、予測の不整合、または解釈のポテンシャルを表す。これは、対象の入力に対する観察者モデルの変分自由エネルギー(variational free energy)と同定することができる:

これは意図的に、自由エネルギー原理(Free Energy Principle)へと収束させない。同原理は、生物がホメオスタシスを維持するためにどのように自由エネルギーを最小化するかを問うものである。対してここでの問いは、対象が自由エネルギーのランドスケープを通じてどのように軌道を形成し、その経路が認知的に価値があり、位相コヒーレントであり、かつ自明な形で解決されないようにするかである。当エンジンは、可能な限り低い自由エネルギーに報酬を与えるのではない。豊かなランドスケープを横断する構造化された移動に報酬を与えるのである。対象が解釈に及ぼす力は、ポテンシャルのメトリック勾配(metric gradient)である:

退屈な対象は浅く自明な場を持ち、混沌とした対象はインコヒーレントな場を持つ。そして傑作は、深く、構造化された、マルチアトラクターな場を持つ。

ノイズと区別された構造化された謎

「驚き」は減衰する。もし美が単なる驚きにすぎないならば、見慣れた傑作はその価値をすべて失ってしまうだろう。そのため、モデルには静的でありながら構造化されたコンポーネントが必要となる。解釈のレイヤーは統計的に依存しているため、単純な加重和を適用すると二重カウントが生じる。そこで、修正された形式ではエントロピーの連鎖律(entropy chain rule)を使用する:

ここで、解釈レイヤー L_1, L_2, …, L_n は、構成的、象徴的、文脈的、原型(アーキタイプ)的、文化的、および高次の解釈的不確実性を担う(エントロピーのエントロピーという解釈を避けるため、記号は H_i ではなく L_i と表記される)。各条件付きの項は、下位レイヤーが考慮された後に残された構造化された不確実性のみを追加するため、二重カウントは発生しない。謎(mystery)は、ノイズ(noise)とは明確に区別される。ノイズは、一貫した解釈を加えることなくコストのみを増大させる非圧縮性のランダム性である。対して謎は、さらなる解釈を誘う、圧縮可能だがいまだ汲み尽くされていない構造である:

生成解釈容量

対象が主体の中に生成する安定した解釈の集合を解釈空間とし、個々の安定した解釈を観察者の認知ダイナミクスのアトラクターとする。ジェネレーターが自明である場合、ジェネレーターの複雑さに対する解釈の体積の単純な比は発散してしまい、ランダムな連想のトリガーが誤って無限の価値を持つように見えてしまう。正則化された形式はこれを修正し、コヒーレントな(首尾一貫した)豊かさに報酬を与える:

この比における各項は命名されているのみで、まだ厳密に固定されてはいない。解釈の体積である Vol(Ω) とジェネレーターの複雑さ K_gen(コルモゴロフ複雑性、記述/実装の長さ、コンポーネント数、あるいは依存グラフの尺度として具現化されるかどうかにかかわらず)は、メディアごとに操作可能(operationalize)にする必要がある。記述されている通り、この比は適切に定式化された仮説(well-formed hypothesis)であり、完成された推定量(estimator)ではない。末尾のフレームで、その区別を明示し続けている。

コヒーレンス因子は、無秩序な連想の爆発に対してペナルティを課す。高い価値を得るには、多くの解釈が存在すること、かつそれらの間に構造化されたコヒーレンスが存在することが要求され、無関係な連想が多数あるだけでは不十分である。これは、指数が無次元となるよう特徴的な解釈距離スケール τ によって正規化され、安定した解釈のすべてのペアについて平均が取られる:

位相コヒーレンス — タイミングが存在する場所における、タイミング

各動的な審美的特徴は、複素数の振幅および位相信号として記述される。位相は比喩ではない。それが認められるのは、真のタイミング、リズム、または振動が存在する場所(音楽、アニメーションのタイミング、スクロールのリズム、サッカードのタイミング、インタラクションのレイテンシ、表示のタイミング、注意のサイクルなど)に限られる。

対象と主体の動的状態を Hilbert 空間で表現すると、正規化された位相コヒーレンスは、それらの有界な内積のアライメントとなる:

動的システムにおいて、これは実際のタイミングの整合を測定する。インターフェースにおいては、高い位相コヒーレンスは、モーション、表示、およびレスポンスが、ユーザーの注意がそれらを受け取る準備が整ったまさにその瞬間に到達することを意味する。静的な成果物(artifact)に対して、位相は直接適用されることはない。それは成果物が誘起する注意の軌道、すなわち目が構図を読み取る順序や、時間の経過とともにレイヤーが展開していくプロセスを通じてのみ導入される。そのような注意のシーケンス(順序付け)が測定不可能な場合、位相コヒーレンスは静止画に無理に適用されるのではなく、構造的アライメントに置き換えられる。

ハミルトニアン定式化

認知モデルの位置を一般化座標とすると、一般化された認知運動量は、多様体の局所的な曲率によって重み付けられた速度となる。そのため、曲率の高い領域における小さな概念的移動は、大きな運動量を持つ可能性がある:

運動認知エネルギー(kinetic cognitive energy)はモデル移動のエネルギーであり、その高い値は観察者の予測の急速な再構築に対応する。これは、2つの等価な方法で記述される同一のエネルギーである。一方は速度に作用するメトリック(共変 g_{ij})を用いる方法、もう一方は速度を上記の共役運動量へと下げた後、運動量に作用するメトリック(反変 g^{ij})を用いる方法である。運動量形式における上付きインデックスは、まさに p_i における下付きインデックスを相殺するものである:

審美的ポテンシャルは、対象の場と、謎、および位相コヒーレンスを結合する。負の符号は、高い謎と高い位相コヒーレンスが認知をより深い関与へと引き込む引力的な井戸(attractive wells)を創り出すことを意味する:

審美的 Hamiltonian は運動項とポテンシャル項の和であり、審美的状態の診断用エネルギーである:

散逸のない理想的なケースでは、ダイナミクスは Hamilton の方程式に従う。これは、疲労も妨害もない純粋な瞑想・観照状態の理想化である:

開いた散逸バランス — 中心バランス方程式

現実の認知は理想的ではない。散逸的なコスト率と構造化された入力フラックスを導入することで、システムは開かれたものへと変わり、モデルの核心にある開いたシステムのバランス方程式によって支配される(これは熱力学的なバランスとのアナロジーであり、物理的な熱力学そのものを主張するものではない):

美が持続するのは、対象がコヒーレンスを圧倒することなく、認知の散逸を補償するのに十分な構造化された入力を提供する場合である。この単一のバランスから、各種の認知レジーム(状態領域)が事例として導かれる。

認知レジーム

退屈(Boredom)とは、見慣れていることではない。それは散逸的な不均衡である。対象が注意のコストに見合う価値の提供を停止し、軌道が自明な極小値へと崩壊した状態を指す:

過負荷(Overload)とは、単に複雑さが高いことではない。それは一貫した解釈の喪失である。あまりにも多くの情報が急速に押し寄せ、観察者が位相ロック(phase-lock)できず、解釈が不安定化した状態である:

審美的フロー(Aesthetic flow)とは、バランスの取れた開いたシステムのダイナミクスである。入力とコストが均衡し、謎は依然として構造化され、位相コヒーレンスが高く、観察者が審美的な場に引き留められている状態である。永続的な美(Durable beauty)は、繰り返しの曝露に耐え抜く同様のバランスである。それが持続するのは、果てしない驚きを生み出し続けるからではなく、安定した構造化された謎とコヒーレントな解釈容量を維持しているからである:

審美的作用汎関数の全容

各項をまとめると、ある知覚区間において実現される審美的価値は、軌道積分された認知ワークにコヒーレントな解釈容量を乗じたものとなる:

各項は、情報フラックス率(1秒あたりの nats)へと分解される次元を持つ。すなわち、ポテンシャルフロー項、構造化された謎の放出率、位相コヒーレンスのサンプリング率が、認知コスト率に対比される。積分は nats 単位の総審美的ワークとなり、解釈容量の乗数は無次元である。

意味エンジニアリング上の観測可能量
対象誘起予測不整合場成果物状態に応じたモデル更新率
構造化された未解決の解釈の深ささらなる読み込みを促す未解決のセマンティック(意味論的)な深さ
対象と主体のダイナミクスのタイミング調整(アライメント)UIのモーション/表示とユーザー行動とのアライメント
認知コスト / 散逸レイテンシ、躊躇、バックトラッキング、過負荷
複雑さに対するコヒーレントな解釈容量実装の複雑さに対する安定した遷移(ジャーニー)容量

この数学が主張すること、および主張しないこと

主張し得ること

主張し得ること:審美的体験を測定可能なデザイン仮説(認知コスト、構造化された謎、位相アライメント、解釈容量、および軌道の価値)へと翻訳する、一貫した形式的枠組み。これは Fisher-Rao 情報多様体上の軌道積分された認知ワークとしてモデル化され、診断用 Hamiltonian、開いた散逸バランス方程式、および反証可能な認知レジーム(退屈、過負荷、フロー、永続的な美)を備えている。

主張し得ないこと

主張し得ないこと:これが脳の実測された物理法則であること、審美的 Hamiltonian が保存された物理量であること、あるいはモデルが現在、計算機として完全に規定されていること。これは認知的な審美ダイナミクスをモデル化するための形式的な診断的不変量であり、証明された保存則ではない。

明示的な限界

明示的な限界:当枠組みは力とバランスを定義しているが、それぞれの測定(MEASURE)方法をいまだ完全には規定していない。対象ポテンシャル Φ_O、認知コスト C(t), 入力フラックス I_input(t)、ノイズと解決されたエントロピー、ジェネレーターの複雑さ K_gen、解釈空間 Ω、および定数 ν_res、T_char は、推定可能な観測可能量として述べられているのみであり、単位や手順を伴う固定されたオペレーター(演算子)としては規定されていない。それぞれがテレメトリのみから回収可能か、あるいはアイトラッキングなどの測定機器を必要とするかは、未解決の研究境界であり、そのように明記されている。これらのオペレーターが固定されるまでは、本モデルはモデリングの枠組みであり、完成された計算機ではない。

全容を公開する理由

それでも全容を公開する理由:数式とその限界を伴って提示された、一貫した理論的枠組みは、科学レイヤーにおける「科学的誠実性の契約」である。マーケティングレイヤーが TITI の行うことを語るのに対し、このレイヤーはなぜそれがこのように構造化されているのか、および現時点でそのエビデンスがどこで途切れているのかを語る。

本モデルの最も凝縮された要約:美とは、対象によって誘起される情報ポテンシャル場から生じる、軌道積分された認知ワークであり、コヒーレントな解釈容量が乗じられ、位相アライメントと認知の散逸によって制約されるものである。

参考文献

  1. Amari, S. & Nagaoka, H. — Methods of Information Geometry (Fisher-Rao メトリック、統計多様体) — https://doi.org/10.1090/mmono/191
  2. Friston, K. — The free-energy principle: a unified brain theory? (変分自由エネルギー) — https://doi.org/10.1038/nrn2787
  3. Itti, L. & Baldi, P. — Bayesian surprise attracts human attention (驚きと注意) — https://doi.org/10.1016/j.visres.2008.09.007

唯一のインターフェース

常駐チャットに話しかける

こんにちは — titi です。何を作りたいか教えてください。ほんの数語で大丈夫です。

それを本物の、テスト済みで、公開されたサイトにします。

本番環境で実証済みのエンジン