深算院 × 白云美湾
单原料美白效果
智能预测模型

阶段性成果汇报

2026.06

/ 01
KEY TAKEAWAY02 / 12
结论
模型验证通过
POC 五项达标,模型已具备投入使用的条件。
0.823

预测精度 R²

达标 > 0.70

0.945

排序准确性

达标 > 0.80

±4.6%

平均偏差 MAE

5/5

POC 标准达标

结论02
BACKGROUND03 / 12
问题
我们在解决什么问题
输入原料 + 浓度,输出美白效果。

现状

配方师凭经验估算浓度和效果 → 打样送实验室 → 等 3-7 天 → 看结果 → 再调整

每次循环至少一周

目标

用实验数据训练模型:输入原料 + 浓度,输出美白效果

原料 + 浓度预测模型Effect 值
问题03
APPROACH04 / 12
方法
先分组 · 再预测
2 参数线性模型超越千参数神经网络。

不同原料的浓度-效果曲线差异巨大。按效果强度分组后,组内用简单共享线性模型即可。

A 组 · 高效

1

最大效果 ≥ 50%

珈芙宝 68.8%

B 组 · 中效

4

效果 15%–50%

预测最可靠群体

C 组 · 低效

9+1

效果 < 15%

平均仅 3.5%

方法04
PERFORMANCE05 / 12
表现
模型表现
预测精度 0.82,五项 POC 全部达标。
0.823

预测精度 R²

0.945

排序准确性

0.046

平均偏差

5/5

POC 达标

POC 验证标准

标准阈值实际值
泛化测试排序准确性> 0.750.905 ✓
B 组预测精度> 0.700.823 ✓
B 组排序准确性> 0.800.945 ✓
分组 vs 全局≥ 2/33/3 ✓
跨组排序正确率> 70%80% ✓

分组 vs 全局模型

指标全局分组
预测精度0.4870.833
排序准确性0.8930.900
平均偏差0.0570.052
表现05
CLASSIFICATION06 / 12
分类
15 种原料分类结果
15 种原料只有 5 种有效——不分类就无法建模。

A 组 · 高效

1

珈芙宝

68.8% · 趋势 1.000

样本不足,需补充

B 组 · 中效

4
α-熊果苷42.3%
大米发酵滤液45.8%
SkinActive MG43.0%
植源灵韵水29.8%

C 组 · 低效

9+1

平均仅 3.5%

+ 凝血酸(待判定)

分类06
HIGHLIGHT 0107 / 12
泛化能力
新原料也能预测
同一组内的新原料,无需重新训练即可预测。

从 B 组藏起一种原料,用剩余三种训练,再预测被藏起的原料。

4 种原料泛化测试

被藏起的原料排序准确性
SkinActive MG0.976
植源灵韵·三叶赋活水0.929
α-熊果苷0.905
大米发酵滤液0.810
平均0.905
0.905

平均排序准确性

达标阈值 > 0.75

泛化能力07
HIGHLIGHT 0208 / 12
稳健性
数据越多越稳
数据从 8 种扩到 15 种,模型指标完全不变。
0.000

B 组指标变化

8 → 15 种

0

A/B 组新成员

新增 7 种归 C 组

2→3

分组 vs 全局

胜出项提升

15

总测试原料

1+4+9+1

「新增的原料不会影响已有组别——分组模型具备组外免疫特性。无论后续新增多少原料,只要正确分组,现有模型的预测质量就不会受到干扰。」

稳健性08
WARNING09 / 11
实验数据质量
模型预测的可靠性取决于实验数据的质量。

后续实验需统一标准:8 个浓度点、15 条鱼/点、每批设独立对照组

注意09
ROADMAP10 / 10
下一步
下一步计划
补齐高效数据、统一实验标准后即可全面部署。

补充高效原料数据

建议补充 377、光甘草定等已知高效成分

目标:高效 50% · 中效 40% · 低效 10%

统一实验标准

8 个浓度点 · 15 条鱼/点 · 每批独立对照组

扩展更多品类

方法框架可复用到保湿、抗皱、舒缓等品类

每品类 8-15 种即可建模

下一步10