因为研究的推进比他想象得要快,短短几天内,基于海昼天基因组的数据集已经建好了,他们可以开始炼丹了。</p>
之所以称之为炼丹,是因为机器学习模型的训练过程,受到超参数的影响。</p>
所谓超参数就是人为预先设定的参数,设得好,模型训练得就快;设得不好,模型可能压根就不收敛。</p>
至于什么是好,什么是不好,只有全知全能老天爷才能知道。</p>
天心最难揣度。</p>
说到底,除了扎实的基础和丰富的经验以外,想要快速训练出一个能用的模型、炼出一个能不把人吃死的丹药,运气最重要。</p>
而炼丹是要时间的,七七四十九天之后,如果这丹药不能用,那么这时间就被完全浪费掉了。</p>
所以,他跟着那帮专业炼丹的人开了大半天的会,讨论了怎样分配有限的炼丹炉。</p>
虽然他听不懂那些高深的特征增广、小样本学习、时间序列预测、给数据驱动模型添加物理约束等理论。但作为一个通识课上学了9个学时,就被要求一个暑假里手撸一个图像识别算法的高材生,他有他自己的想法。</p>
他要用强化学习。</p>
“对于强化学习而言,我们的样本太少了。”哪里都要掺一脚的郑K一如既往地苦着脸说。</p>
“少就少呗,又不是不能用。再说了,我们不是正在用老鼠造模吗?造完了样本就多了。”卢赫不以为然。</p>
“具体思路呢?”郑K忧心忡忡地问。</p>
“跟你们一样。特征是某时间点的基因组,标签是未来的突变位点,然后让单碱基编辑的载着相应向导RNA的CRISPR系统在那里等着,一旦突变了,就立刻给修复。把病扼杀在摇篮里。</p>
非要说有什么不同,第一,我这是黑箱,只能发挥作用,却不知道怎么发挥作用;第二,我这基本算是端到端的、全自动的,人工干预只在定期查基因组和设计CRISPR系统,这部分工作未来也有希望自动化。</p><div id='gc1' class='gcontent1'><script type='text/javascript'>try{ggauto();} catch(ex){}</script>