白云美湾 × 深圳计算科学研究院 · AI 配方 · 第一阶段
阶段性成果汇报
基于 15 种原料 · 两轮迭代验证 · 五项 POC 全部达标
2026.06
利用斑马鱼黑色素沉着实验数据,构建 f(原料, 浓度)→ 美白效果的预测模型,为配方研发提供数据驱动的决策支持。
三个核心目标
预测已有原料效果
对已有原料在不同浓度下的美白效果进行预测
评估新增原料潜力
快速评估新增原料的效果潜力与最优浓度范围
原料效力排序
为不同原料之间的效力排序提供客观依据
15
种原料完整验证
8 → 15 种数据扩充
5/5
POC 五项标准
全部达标 · 两轮迭代验证
美白效果的可量化指标,模型预测的核心依据
量化原料的美白效果,基于斑马鱼黑色素沉着实验数据计算。值越高代表美白效果越强,模型通过学习原料的 Effect 值与浓度的关系进行预测。
| Effect 值 | 含义 |
|---|---|
| ≥ 0.5 | 黑色素信号降低约 50%,美白效果显著 |
| ≈ 0 | 无变化,原料在测试浓度下无美白效果 |
| < 0 | 黑色素信号增加,原料可能有反效果 |
| 组别 | 最大美白效果 | 趋势一致性 | 含义 |
|---|---|---|---|
| A 组 · 高效 | ≥ 50% | ≥ 0.8 | 效果强 · 浓度-效果关系清晰 |
| B 组 · 中效 | 15% – 50% | ≥ 0.6 | 效果中等 · 趋势可预测 |
| C 组 · 低效/无效 | < 15% | — | 测试范围内无显著效果 |
B 组模型仅使用「浓度」一个变量,不依赖原料身份——新原料归入 B 组后无需重新训练即可预测。
B 组 4 种原料浓度-效果曲线 + 组内共享模型拟合线
用一个模型拟合所有原料
6 种模型(线性回归、多项式、随机森林、XGBoost、MLP 神经网络等)统一建模
预测精度 R² ≈ 0.70,排序准确性 > 0.74
发现的瓶颈:原料异质性——不同原料的浓度-效果曲线差异巨大,一个模型无法同时拟合所有。
按效果强度分组,组内共享简单模型
B 组最优模型:仅 2 个参数的线性回归(y = 0.139x + 0.527)
| 指标 | v2-1 全局 | v2-2 分组 | 提升 |
|---|---|---|---|
| 预测精度 (R²) | 0.698 | 0.823 | +17.9% |
| 排序准确性 | 0.762 | 0.945 | +24.0% |
| 平均偏差 (MAE) | 0.070 | 0.046 | −34.3% |
| 组别 | 数量 | 代表原料 |
|---|---|---|
| A 组 高效 | 1 | 珈芙宝 Redumatte(68.8%·趋势 1.000) |
| B 组 中效 | 4 | α-熊果苷、大米发酵滤液、SkinActive MG、植源灵韵水 |
| C 组 低效/无效 | 9 | 平均仅 3.5%,PURAC HS90 反促色素沉着 |
| 待判定 | 1 | 凝血酸(效果 55.4% 但趋势仅 0.452) |
珈芙宝 Redumatte Multi-Herbs
最大效果 68.8% · 趋势一致性 1.000(完美)
样本不足,建议补充同类高效原料
趋势一致性均 ≥ 0.8,共享相同的浓度-效果模式
预测最可靠的群体 · 泛化测试平均排序 0.905
平均美白效果仅 3.5%,接近于零
+ 凝血酸(待判定)需进一步分析
经过 4 种算法测试,线性模型以最少参数达到最高精度
从 B 组藏起一种原料,用剩余三种训练,再预测被藏起的原料——模拟「遇到全新中效原料」的场景。
| 被藏起的原料 | 排序准确性 | 预测精度 |
|---|---|---|
| SkinActive MG | 0.976 | 0.737 |
| 植源灵韵·三叶赋活水 | 0.929 | 0.484 |
| α-熊果苷 | 0.905 | 0.491 |
| 大米发酵产物滤液 | 0.810 | 0.443 |
| 平均 | 0.905 | 0.539 |
模型学到了通用的「浓度越高,效果越好」规律,在同一组内能可靠预测从未见过的同类原料。
B 组指标变化
8 → 15 种
A/B 组新成员
新增 7 种全部归 C 组
分组 vs 全局
胜出项数量提升
总测试原料
1+4+9+1
「新增的原料不会影响已有组别——分组模型具备组外免疫特性。无论后续新增多少原料,只要正确分组,现有模型的预测质量就不会受到干扰。」
| 浓度点 | 实际排序 | 期望排序 | 结果 |
|---|---|---|---|
| 0.0003125% | A > B > C | A > B > C | ✓ |
| 0.000625% | A > B > C | A > B > C | ✓ |
| 0.00125% | A > C > B | A > B > C | ✗ |
| 0.0025% | A > B > C | A > B > C | ✓ |
| 0.005% | A > B > C | A > B > C | ✓ |
正确率 4/5 = 80%,达标阈值 > 70%
| # | 标准 | 阈值 | 实际 |
|---|---|---|---|
| 1 | 泛化测试平均排序准确性 | > 0.75 | 0.905 |
| 2 | B 组预测精度 | > 0.70 | 0.823 |
| 3 | B 组排序准确性 | > 0.80 | 0.945 |
| 4 | 分组 vs 全局胜出项数 | ≥ 2/3 | 3/3 |
| 5 | 跨组排序正确率 | > 70% | 80% |
5/5 全部达标 ✓
同一种原料,两次实验结论完全反转:低效/无效 → 高效
| 一致性等级 | 原料数 | 占比 |
|---|---|---|
| 高度一致 | 2 | 25% |
| 中等一致 | 1 | 12.5% |
| 差异显著 | 5 | 62.5% |
对照组基线差异:两次实验 CK 信号强度相差约 49%,Effect 计算依赖 CK 归一化
实验条件差异:浓度梯度点数(8 vs 4)、鱼数(15 vs 10)影响结果稳定性
| 场景 | 是否适用 |
|---|---|
| 已有浓度范围内查询预测效果 | ✓ 适用 |
| 同浓度下不同原料排序比较 | ✓ 可靠 |
| 预测全新原料(无实验数据) | ✗ 需先实验定级 |
建议后续实验统一标准:8 个浓度点、15 条鱼/点、每批设独立对照组
建议补充 377、光甘草定等已知高效成分
目标分布:高效 50% · 中效 40% · 低效 10%
当前 A 组仅 1 种原料,样本严重不足
8 个浓度点 · 15 条鱼/点 · 每批独立对照组
消除批次差异对建模的干扰
借助行业专家经验筛选不同效力等级的原料
凝血酸:最大效果 55.4% 已达 A 组标准,但趋势一致性仅 0.452,需进一步实验确认其「突然起效」模式
方法框架可复用到保湿、抗皱、舒缓等品类