推荐算法不是魔法,是可以看懂的计算。这一页用大白话,把 aha 背后那套美学推荐一步步写出来——每个能拨动的地方,数字都会当场重算。
计算机看不懂"美",但能看懂数字。所以第一步:把每幅画拆成几条可量化的审美坐标——明暗、冷暖、动静(由画面的饱和度、对比度、色彩丰富度算出)、年代,以及它的母题。下面是馆里一幅真实作品,被拆成的数字:
一幅画 = 审美空间里的一个点。119 幅画,就是 119 个点,铺成一张"审美地图"。
你每心动一幅画,系统就把那幅画的数字,平均进你的画像里——这串平均值,就是"你的审美质心"(你最常被什么样的画打动)。同时它记下你的不确定度(还没摸准的程度):看得越多、越一致,不确定度越低,"口味清晰度"越高。
这就是为什么越逛越准——质心在动,清晰度在涨。你在「美学实验室」右边看到的那张地图,中间那颗发光的点,就是它。
大多数算法会推离你质心最近的画。但最近的 = 你早看腻的 = 不会有"原来如此"。aha 优化的是另一个东西——一个写得出来的奖励函数:
其中最关键的 Aha(顿悟) 来自一条"倒 U 曲线":一幅画离你太近=无聊,太远=无感,不远不近、刚好在你"惊奇甜点"上的那一幅,顿悟值最高。这是真实的审美心理学(Wundt 曲线)。拨一拨,看它怎么算:
另外三项也都好懂:安静=画面别太"吵"、节奏别忽起忽落;信息=专挑"还没摸准你"的方向去试探(所以越问越准);成长=偶尔带你去一个没去过、却挨着你的审美邻域。
这几个项各占多少,是可调的。拨一拨权重,看同一批画的"总分"怎么变:
逛的时候,目标是顿悟(上面那套)。但"测评"时,目标变成最快把你测清楚——所以它会专挑最能区分你的画来问、用二选一隔离单条轴、并且测到清楚为止(不是固定张数)。这就是为什么十几张就够,而且不会拿一堆雷同的画浪费你。
同一个引擎,逛时最大化"顿悟",测时最大化"信息"。一体两面。
目前这些数字,是从像素(颜色、对比、构图)估出来的"代理"。真正的深度,要靠一套专业的艺术知识图谱标注——把"再现↔表现、世界模型、画外音"这些更高级的维度喂进来。通路已经留好,数据一进,这些曲线就会算得更准、更懂你。诚实地说:这是它的天花板,也是它接下来要长的地方。