aha · 它是怎么算的

把"懂你"摊开来给你看

推荐算法不是魔法,是可以看懂的计算。这一页用大白话,把 aha 背后那套美学推荐一步步写出来——每个能拨动的地方,数字都会当场重算。

STEP 01

先把一幅画,变成一串数字

计算机看不懂"美",但能看懂数字。所以第一步:把每幅画拆成几条可量化的审美坐标——明暗、冷暖、动静(由画面的饱和度、对比度、色彩丰富度算出)、年代,以及它的母题。下面是馆里一幅真实作品,被拆成的数字:

真实样本 · 实时读自数据

一幅画 = 审美空间里的一个点。119 幅画,就是 119 个点,铺成一张"审美地图"。

STEP 02

你每心动一幅画,系统就把那幅画的数字,平均进你的画像里——这串平均值,就是"你的审美质心"(你最常被什么样的画打动)。同时它记下你的不确定度(还没摸准的程度):看得越多、越一致,不确定度越低,"口味清晰度"越高。

你的质心 = 心动过的画的平均
口味清晰度 = 1 − 不确定度 (看得越多越清楚)

这就是为什么越逛越准——质心在动,清晰度在涨。你在「美学实验室」右边看到的那张地图,中间那颗发光的点,就是它。

STEP 03 · 核心

大多数算法会推离你质心最近的画。但最近的 = 你早看腻的 = 不会有"原来如此"。aha 优化的是另一个东西——一个写得出来的奖励函数:

推荐分 = α·Aha + γ·安静 + δ·信息 + β·成长 − 重复 − 疲劳

其中最关键的 Aha(顿悟) 来自一条"倒 U 曲线":一幅画离你太近=无聊,太远=无感,不远不近、刚好在你"惊奇甜点"上的那一幅,顿悟值最高。这是真实的审美心理学(Wundt 曲线)。拨一拨,看它怎么算:

倒 U 惊奇曲线 · 拖动即重算

这幅画离你 d0.45

你的惊奇带 d*0.42

这幅画的顿悟值 Aha =0.00

另外三项也都好懂:安静=画面别太"吵"、节奏别忽起忽落;信息=专挑"还没摸准你"的方向去试探(所以越问越准);成长=偶尔带你去一个没去过、却挨着你的审美邻域。

STEP 04

① 召回

从 119 幅里,多路并行各捞一批:视觉相近 / 图谱邻居 / 同母题 / 惊奇带。几百缩到几十。

② 打分

给每一张算上面那个"推荐分",逐项算清楚(你在活体演示里看到的就是这些数)。

③ 重排

排好后再调:去掉太雷同的、压住太"吵"的、留一点惊喜,最后端给你。

这几个项各占多少,是可调的。拨一拨权重,看同一批画的"总分"怎么变:

奖励权重计算器 · 拖动即重算(样本画:Aha .72 / 安静 .90 / 信息 .30 / 成长 .55)

α 顿悟1.00

γ 安静0.60

δ 信息0.50

β 成长0.35

这张样本画的最终推荐分 =0.00

STEP 05

逛的时候,目标是顿悟(上面那套)。但"测评"时,目标变成最快把你测清楚——所以它会专挑最能区分你的画来问、用二选一隔离单条轴、并且测到清楚为止(不是固定张数)。这就是为什么十几张就够,而且不会拿一堆雷同的画浪费你。

同一个引擎,逛时最大化"顿悟",测时最大化"信息"。一体两面。

STEP 06

目前这些数字,是从像素(颜色、对比、构图)估出来的"代理"。真正的深度,要靠一套专业的艺术知识图谱标注——把"再现↔表现、世界模型、画外音"这些更高级的维度喂进来。通路已经留好,数据一进,这些曲线就会算得更准、更懂你。诚实地说:这是它的天花板,也是它接下来要长的地方。