Cái đẹp dưới dạng công nhận thức có cấu trúc — cốt lõi toán học đầy đủ

Đây là tầng khoa học của TITI, được viết cho độc giả muốn tìm hiểu cơ chế thực sự chứ không phải một khẩu hiệu. Nó trình bày cốt lõi thẩm mỹ của công cụ theo cách mà nhà máy công bố mọi thứ khác: đầy đủ, đi kèm các công thức và một khuôn khổ rõ ràng cho những gì nó khẳng định và những gì không. Khẳng định trung tâm là một sự tái định hình. Cái đẹp không được xem như một thuộc tính vô hướng tĩnh của một đối tượng. Nó được mô hình hóa dưới dạng công nhận thức có cấu trúc được thực hiện bởi một trường thế năng do đối tượng tạo ra tác động lên mô hình dự đoán của người quan sát, dọc theo một quỹ đạo trên đa tạp thông tin, dưới sự tiêu tán có giới hạn và tính mạch lạc pha. Mô hình được trình bày như một khuôn khổ lý thuyết nhất quán và một công cụ chẩn đoán — chứ không phải một định luật vật lý đã được chứng minh của não bộ. Mục đích của nó mang tính vận hành: chuyển đổi trải nghiệm thẩm mỹ thành các giả thuyết thiết kế có thể đo lường được — chi phí nhận thức, sự bí ẩn có cấu trúc, sự căn chỉnh pha, khả năng diễn giải, và giá trị của chính quỹ đạo đó.

Bản thể luận: đối tượng, chủ thể, và một con đường xuyên qua không gian mô hình

Một đối tượng thẩm mỹ — một bức ảnh, một bản nhạc, một giao diện, một tòa nhà, một hệ thống thương hiệu, hay thậm chí là một công thức toán học — không bao giờ được đánh giá là đẹp tự thân. Thay vào đó, đối tượng tạo ra một trường lực trên không gian các mô hình dự đoán nội tại của người quan sát. Chủ thể được thể hiện không phải là một vectơ sở thích cố định, mà là một hệ thống nhận thức dự đoán với các trạng thái mô hình nội tại. Một trạng thái mô hình là một điểm trên một đa tạp,

và trải nghiệm thẩm mỹ là một quỹ đạo của trạng thái đó khi người quan sát tương tác với đối tượng:

Đây là bước đi đầu tiên và mang tính chịu lực: giá trị thẩm mỹ là một thuộc tính của con đường mà mô hình của người quan sát đi qua, chứ không thuộc về riêng đối tượng.

Đa tạp thông tin và mêtric Fisher-Rao

Các mô hình nội tại của người quan sát được xem là một họ phân phối có tham số, do đó không gian mô hình mang hình học tự nhiên của thống kê. Mêtric ở đây là ma trận thông tin Fisher:

Mêtric này đo lường mức độ khó khăn của người quan sát trong việc phân biệt các trạng thái dự đoán lân cận. Các trạng thái gần nhau theo mêtric Fisher-Rao có thể dịch chuyển qua lại với chi phí nhận thức thấp; các trạng thái xa nhau đòi hỏi nhiều công sức hơn. Do đó, khoảng cách thẩm mỹ không phẳng — cùng một sự khác biệt thị giác có thể dễ dàng với người quan sát này nhưng lại khó khăn với người quan sát khác vì đa tạp nội tại của họ có độ cong khác nhau. Khoảng cách giữa hai trạng thái nhận thức là độ dài đường trắc địa:

Thế năng thẩm mỹ do đối tượng tạo ra

Đối tượng tạo ra một trường thế năng vô hướng trên không gian mô hình. Tại mỗi trạng thái mô hình, giá trị của nó đại diện cho sức căng năng lượng tự do chưa được giải quyết, sự bất tương thích dự đoán, hoặc tiềm năng diễn giải mà đối tượng tạo ra. Nó có thể được đồng nhất với năng lượng tự do biến phân của mô hình người quan sát đối với đầu vào từ đối tượng:

Điều này được cố ý thiết kế để không suy sụp thành Nguyên lý Năng lượng Tự do. Nguyên lý đó đặt câu hỏi làm thế nào một sinh vật tối thiểu hóa năng lượng tự do để duy trì cân bằng nội môi; ở đây, câu hỏi là làm thế nào một đối tượng định hình một quỹ đạo qua địa hình năng lượng tự do sao cho con đường đó có giá trị về mặt nhận thức, mạch lạc pha, và không được giải quyết một cách tầm thường. Công cụ không thưởng cho mức năng lượng tự do thấp nhất có thể — nó thưởng cho sự chuyển động có cấu trúc qua một địa hình phong phú. Lực mà đối tượng tác động lên sự diễn giải là gradient mêtric của thế năng:

Một đối tượng nhàm chán có một trường nông và tầm thường; một đối tượng hỗn loạn có một trường không mạch lạc; một kiệt tác có một trường sâu, có cấu trúc và đa điểm hút.

Sự bí ẩn có cấu trúc, phân biệt với nhiễu

Sự ngạc nhiên sẽ suy giảm — một kiệt tác quen thuộc sẽ mất đi mọi giá trị nếu cái đẹp chỉ là sự ngạc nhiên. Vì vậy, mô hình cần một thành phần tĩnh nhưng có cấu trúc. Bởi vì các tầng diễn giải phụ thuộc lẫn nhau về mặt thống kê, một tổng trọng số ngây thơ sẽ dẫn đến việc tính trùng hai lần; dạng hiệu chỉnh sử dụng quy tắc chuỗi entropy:

trong đó các tầng diễn giải L_1, L_2, …, L_n mang tính không chắc chắn về bố cục, biểu tượng, ngữ cảnh, nguyên mẫu, văn hóa và diễn giải bậc cao (các ký hiệu được viết là L_i, không phải H_i, để tránh cách đọc hiểu nhầm là entropy của một entropy). Mỗi số hạng có điều kiện chỉ cộng thêm phần không chắc chắn có cấu trúc còn lại sau khi các tầng thấp hơn đã được tính đến, vì vậy không có gì bị tính trùng. Sự bí ẩn được phân tách rõ rệt với nhiễu. Nhiễu là sự ngẫu nhiên không thể nén được làm tăng chi phí mà không thêm vào diễn giải mạch lạc; sự bí ẩn là cấu trúc có thể nén được nhưng chưa bị khai thác hết, mời gọi sự diễn giải sâu hơn:

Khánh năng diễn giải mang tính tạo sinh

Giả sử tập hợp các diễn giải ổn định mà một đối tượng tạo ra ở một chủ thể là không gian diễn giải, với mỗi diễn giải ổn định là một điểm hút của động lực học nhận thức của người quan sát. Một tỷ lệ ngây thơ giữa thể tích diễn giải và độ phức tạp của bộ tạo sinh sẽ phân kỳ khi bộ tạo sinh tầm thường — tạo ra ảo tưởng rằng các tác nhân kích thích liên tưởng ngẫu nhiên có giá trị vô hạn. Dạng chính quy hóa sẽ khắc phục điều này và phần thưởng cho sự phong phú mạch lạc:

Các số hạng trong tỷ lệ này đã được đặt tên nhưng chưa được cố định: thể tích diễn giải Vol(Ω) và độ phức tạp bộ tạo sinh K_gen — dù được hiện thực hóa dưới dạng độ phức tạp Kolmogorov, chiều dài mô tả/triển khai, số lượng thành phần, hay một phép đo đồ thị phụ thuộc — vẫn phải được vận hành hóa theo từng phương tiện truyền dẫn. Như đã viết, tỷ lệ này là một giả thuyết có cấu trúc chuẩn, không phải là một bộ ước lượng đã hoàn chỉnh; khung khép lại ở cuối bài giữ cho sự phân biệt đó rõ ràng.

Hệ số mạch lạc phạt sự bùng nổ liên tưởng ngẫu nhiên: giá trị cao đòi hỏi nhiều diễn giải tính mạch lạc có cấu trúc giữa chúng, chứ không phải nhiều liên tưởng không liên quan. Nó được chuẩn hóa bởi một thang khoảng cách diễn giải đặc trưng τ để số mũ không có chiều, với trung bình được tính trên tất cả các cặp diễn giải ổn định:

Sự mạch lạc pha — sự định thời, nơi sự định thời tồn tại

Mỗi đặc trưng thẩm mỹ động được viết dưới dạng một tín hiệu biên độ-và-pha phức. Pha ở đây không phải là phép ẩn dụ: nó chỉ được thừa nhận ở những nơi thực sự tồn tại sự định thời, nhịp điệu hoặc dao động thực tế — âm nhạc, thời gian hoạt ảnh, nhịp cuộn trang, thời gian chuyển động mắt, độ trễ tương tác, thời gian hiển thị, các chu kỳ chú ý.

Biểu diễn các trạng thái động của đối tượng và chủ thể trong một không gian Hilbert, sự mạch lạc pha đã chuẩn hóa chính là sự căn chỉnh tích vô hướng có giới hạn của chúng:

Đối với các hệ động lực, điều này đo lường sự căn chỉnh định thời thực tế — trong một giao diện, sự mạch lạc pha cao có nghĩa là chuyển động, hiển thị và phản hồi xuất hiện chính xác khi sự chú ý của người dùng đã sẵn sàng đón nhận chúng. Đối với một tác phẩm tĩnh, pha không được áp dụng trực tiếp: nó chỉ đi vào thông qua quỹ đạo chú ý mà tác phẩm tạo ra — trình tự mắt đọc bố cục và các tầng của nó mở ra theo thời gian. Ở những nơi không thể đo lường chuỗi chú ý như vậy, sự mạch lạc pha được thay thế bằng sự căn chỉnh cấu trúc thay vì gượng ép áp dụng vào một hình ảnh tĩnh.

Dạng thức Hamiltonian

Với vị trí mô hình nhận thức đóng vai trò là tọa độ suy rộng, động lượng nhận thức suy rộng là vận tốc được trọng số hóa bởi độ cong cục bộ của đa tạp — do đó một chuyển động khái niệm nhỏ trong một vùng có độ cong lớn có thể mang một động lượng rất lớn:

Động năng nhận thức là năng lượng của sự chuyển động mô hình — các giá trị cao tương ứng với sự tái cấu trúc nhanh chóng các dự đoán của người quan sát. Đó là cùng một năng lượng được viết theo hai cách tương đương: với mêtric tác động lên vận tốc (hiệp biến g_{ij}), và — sau khi hạ vận tốc xuống động lượng liên hợp ở trên — với mêtric nghịch đảo tác động lên động lượng (nghịch biến g^{ij}). Chỉ số trên trong dạng động lượng chính là thứ hoàn tác chỉ số dưới trong p_i:

Thế năng thẩm mỹ kết hợp trường đối tượng với sự bí ẩn và sự mạch lạc pha; các dấu âm có nghĩa là sự bí ẩn lớn và sự mạch lạc pha cao sẽ tạo ra các hố hấp dẫn thu hút nhận thức vào sự tương tác sâu sắc hơn:

Hamiltonian thẩm mỹ là tổng của các số hạng động năng và thế năng — năng lượng chẩn đoán của trạng thái thẩm mỹ:

Trong trường hợp lý tưởng, không tiêu tán, động lực học tuân theo các phương trình Hamilton; đây là sự lý tưởng hóa của sự chiêm nghiệm thuần túy, không có sự mệt mỏi và không có nhiễu loạn:

Sự cân bằng mở, tiêu tán — phương trình cân bằng trung tâm

Nhận thức thực tế không lý tưởng. Việc đưa vào một tỷ lệ chi phí tiêu tán và một luồng đầu vào có cấu trúc sẽ biến hệ thống thành một hệ mở, được điều chỉnh bởi phương trình cân bằng hệ mở ở trung tâm của mô hình (một sự tương tự với cân bằng nhiệt động lực học, chứ không phải một khẳng định về nhiệt động lực học vật lý):

Cái đẹp tồn tại khi đối tượng cung cấp đủ đầu vào có cấu trúc để bù đắp cho sự tiêu tán nhận thức mà không áp đảo sự mạch lạc. Từ sự cân bằng duy nhất này, các chế độ nhận thức sẽ rút ra như các trường hợp cụ thể.

Các chế độ nhận thức

Sự nhàm chán không phải là sự quen thuộc; đó là sự mất cân bằng tiêu tán — đối tượng ngừng chi trả cho chi phí chú ý và quỹ đạo sụp đổ vào một điểm cực tiểu tầm thường:

Sự quá tải không chỉ đơn thuần là độ phức tạp cao; đó là sự mất đi diễn giải mạch lạc — quá nhiều thông tin quá nhanh, người quan sát không thể khóa pha, các diễn giải mất ổn định:

Trạng thái trôi chảy thẩm mỹ là động lực học hệ mở cân bằng: đầu vào và chi phí ở trạng thái cân bằng, sự bí ẩn vẫn có cấu trúc, sự mạch lạc pha cao, người quan sát được giữ bên trong trường thẩm mỹ. Cái đẹp bền vững là cùng một sự cân bằng vượt qua được sự tiếp xúc lặp đi lặp lại — nó kéo dài không phải vì nó tạo ra sự ngạc nhiên vô tận mà vì nó nắm giữ sự bí ẩn có cấu trúc ổn định và khả năng diễn giải mạch lạc:

Phiếm hàm tác dụng thẩm mỹ đầy đủ

Thu gom các số hạng lại, giá trị thẩm mỹ được thực hiện trong một khoảng thời gian nhận thức là công nhận thức tích phân theo quỹ đạo, nhân với khả năng diễn giải mạch lạc:

Mỗi số hạng mang một thứ nguyên quy về tốc độ luồng thông tin (nat trên giây): số hạng dòng thế năng, tốc độ giải phóng sự bí ẩn có cấu trúc, tốc độ lấy mẫu sự mạch lạc pha, đối trọng với tốc độ chi phí nhận thức. Tích phân này là tổng công thẩm mỹ tính bằng nat; hệ số nhân khả năng diễn giải là không thứ nguyên.

số hạngý nghĩađại lượng kỹ thuật quan sát được
trường bất tương thích dự đoán do đối tượng tạo ratốc độ cập nhật mô hình trên các trạng thái của tác phẩm
chiều sâu diễn giải có cấu trúc, chưa được giải quyếtchiều sâu ngữ nghĩa chưa được giải quyết thúc đẩy việc tìm hiểu thêm
sự căn chỉnh định thời của động lực học đối tượng và chủ thểsự căn chỉnh của chuyển động/hiển thị UI với hành vi người dùng
chi phí / tiêu tán nhận thứcđộ trễ, sự ngập ngừng, quay lui, quá tải
khả năng diễn giải mạch lạc trên mỗi đơn vị độ phức tạpkhả năng hành trình ổn định trên mỗi đơn vị độ phức tạp triển khai

Những gì toán học này khẳng định, và những gì không

Có thể khẳng định

Những gì có thể được khẳng định: một khuôn khổ hình thức nhất quán chuyển đổi trải nghiệm thẩm mỹ thành các giả thuyết thiết kế có thể đo lường được — chi phí nhận thức, sự bí ẩn có cấu trúc, sự căn chỉnh pha, khả năng diễn giải và giá trị quỹ đạo — được mô hình hóa dưới dạng công nhận thức tích phân theo quỹ đạo trên một đa tạp thông tin Fisher-Rao, với một Hamiltonian chẩn đoán, một phương trình cân bằng hệ mở tiêu tán, và các chế độ nhận thức có thể kiểm chứng bác bỏ (nhàm chán, quá tải, trôi chảy, cái đẹp bền vững).

Không thể khẳng định

Những gì không thể được khẳng định: rằng đây là một định luật vật lý đã được đo lường của não bộ, hoặc Hamiltonian thẩm mỹ là một đại lượng vật lý bảo toàn, hoặc mô hình này hiện đã được chỉ định đầy đủ như một bộ máy tính toán. Nó là một bất biến chẩn đoán hình thức để mô hình hóa động lực học thẩm mỹ nhận thức, không phải là một định luật bảo toàn đã được chứng minh.

Giới hạn rõ ràng

Giới hạn rõ ràng: khuôn khổ này gọi tên các lực và sự cân bằng nhưng chưa chỉ định đầy đủ cách ĐO LƯỜNG từng yếu tố đó. Thế năng đối tượng Φ_O, chi phí nhận thức C(t), luồng đầu vào I_input(t), các entropy nhiễu và entropy đã giải quyết, độ phức tạp bộ tạo sinh K_gen, không gian diễn giải Ω, và các hằng số ν_res và T_char được trình bày dưới dạng các đại lượng quan sát có thể ước lượng được, chứ chưa phải là các toán tử cố định với các đơn vị và quy trình cụ thể. Việc mỗi yếu tố có thể phục hồi từ riêng dữ liệu đo từ xa hay cần đến các thiết bị như theo dõi mắt là một ranh giới nghiên cứu còn bỏ ngỏ — và được tuyên bố như vậy. Cho đến khi các toán tử đó được xác định rõ ràng, đây vẫn là một khuôn khổ mô hình hóa, chưa phải là một bộ máy tính toán hoàn chỉnh.

Tại sao công bố đầy đủ

Tại sao nó vẫn được công bố đầy đủ: một khuôn khổ lý thuyết nhất quán, được trình bày cùng các công thức và ranh giới của nó, là bản hợp đồng về tính trung thực khoa học của tầng khoa học — tầng tiếp thị nói về những gì TITI làm; tầng này giải thích tại sao nó được cấu trúc như vậy, và bằng chứng của nó dừng lại ở đâu ở thời điểm hiện tại.

Phát biểu cô đọng mạnh mẽ nhất của mô hình: cái đẹp là công nhận thức tích phân theo quỹ đạo được tạo ra bởi một trường thế năng thông tin do đối tượng tạo ra, nhân với khả năng diễn giải mạch lạc và bị ràng buộc bởi sự căn chỉnh pha và sự tiêu tán nhận thức.

Tài liệu tham khảo

  1. Amari, S. & Nagaoka, H. — Methods of Information Geometry (mêtric Fisher-Rao, đa tạp thống kê) — https://doi.org/10.1090/mmono/191
  2. Friston, K. — The free-energy principle: a unified brain theory? (năng lượng tự do biến phân) — https://doi.org/10.1038/nrn2787
  3. Itti, L. & Baldi, P. — Bayesian surprise attracts human attention (sự ngạc nhiên và chú ý) — https://doi.org/10.1016/j.visres.2008.09.007

Giao diện duy nhất

Trò chuyện với hộp thoại tích hợp

Chào — tôi là titi. Hãy cho tôi biết bạn muốn tạo gì; chỉ vài từ là đủ.

Tôi sẽ biến nó thành một trang web thật, đã kiểm thử và đã triển khai.

Engine đã được chứng minh hiệu quả trong môi trường thực tế