第一作者:Takamasa Hashizume

作者单位:University of Tsukuba

发表时间:2024/1

发表期刊:Biotechnology Advances,1区

关键内容:综述类型文章。介绍细胞培养工程中的机器学习技术。总共从实验设计、数据获取、模型构建、培养基预测、验证开发五个方面进行详细的介绍。主要亮点是:对41篇相关文献所用的技术进行了总结。

图1 图2

1. 数据获取

图3

2. 模型构建

图1 图1

3. 培养基预测

类比于模型超参数优化,通过搜索,找到影响模型输出(如细胞浓度或产率)的最重要的成分和最优浓度组合。

  • Brute force approach, 穷举搜索策略,逐一评估所有可能的组合,直到找到最佳结果。
  • Surface plot, 表面图,一种可视化工具,通常用于展示两个变量之间的关系。它生成一个三维图,显示两个变量(例如培养基成分浓度)如何影响模型输出(如细胞浓度或产率)。
    • 在培养基优化过程中,表面图用于对模型进行敏感性分析。通过敏感性分析,可以确定对细胞培养有最大影响的培养基成分。然后保持其他成分的浓度不变,只改变两个主要成分的浓度,生成一个3D表面图,展示这两个变量的不同组合如何影响细胞培养结果。通过观察表面图,可以直观地找到最优浓度组合。
  • Genetic algorithm, GA
  • Particle swarm optimization, PSO

其它方法:贝叶斯优化等。

图6 图7

4. 验证开发

主动学习的过程:

  1. Build the ML model to predict culture results from medium combinations.
  2. Predict the cell culture by inputting the medium compositions.
  3. Select the medium combinations based on the predicted cell culture.
  4. Experimentally validate the selected medium combinations.
  5. Add the experimental results to the learning data.

Steps 1 to 5 are repeateduntil the medium improves the ML model’s prediction accuracy. Even with a small dataset, the medium combinations could be finetunedto achieve high performance.

5. 参考文献

Hashizume T, Ying B W. Challenges in developing cell culture media using machine learning[J]. Biotechnology Advances, 2023: 108293.