果然,一切都充满“惊喜”。
迈过那道加大加宽的黄色屏蔽门后,映入眼帘的是四个红色大横幅,上面写着:
头上悬着三把剑:
如何逆转非编码区基因变异进程?
腺病毒究竟如何通过影响非编码RNA影响植物?
倒计时天。
卢赫掐着指头算了算,天差不多是年。
不是还有年吗,怎么还缩水了呢?这可不是什么好消息。
满腹狐疑地经过那套熟悉的复杂流程,他来到了实验室内,明亮的灯光刺得他睁不开眼睛。
这些镶嵌在吊顶上的巨大灯管,散发着一种奇异的色彩。他很久没见到过如此通透的白色了。
适应了光线之后,他发现在一排空荡荡的生物安全柜前站着一个熟悉而陌生的身影,正抬头直视着头顶的灯管,看得很入神。
他悄悄走过去,绕到对方侧面,果然是一张熟悉的脸。
“你又挺过来了?可喜可贺啊。”他忍不住调侃道。即便在知道事情原委之后,他早已对曾经把他给折腾不轻的事情释然了,但面对眼前的枯槁小老头,还是没忍住。
对方没有回应他,依然抬头望着灯,自顾自地说:“看到这些纯白色的灯了吗?多么纯净的颜色。”
“日光灯谁没见过?汞蒸气产生紫外光,紫外光轰击荧光粉后的二级光子,就是纯净的白光。好看舒服但是费电,奢侈!”卢赫忍不住批判。
对方摇了摇头,“这可不是日光灯,而是节能LED。蓝色自发光材料的催化过程被攻克了,全光谱LED已经开始量产。即便维持能源现状,以后所有人也都能拥有灯光自由。”
卢赫不以为然地点了点头。他对这些并不感冒,心里满满都是对年倒计时的疑惑,“门口的标语看到了吧,倒计时只有年,为什么?”
对方把目光投在卢赫脸上,缓缓开口:“因为我从最后一次被编辑,到第一次发病,期间间隔了年多。”
卢赫愣了一下,“我们的基因相似度大概还剩.%,你的现在是多少?”
“时间太久远,我无法考究到我的原始基因组,我目前的基因组和时间间隔最久的一次,相似度是.%。”
“呦呵,那海总您要保重啊,再过几个月,你和最初的你说不定就生殖隔离了!”
对方的脸上飘过一丝无奈,“我正好要找你,我们正在建立数据集,需要我尽可能多的基因组数据。年前你跑到我公司揪下来的我的头发,还有没有?”
卢赫转了转眼珠,“没了,不过我可能还有测序结果,在我家里放着。”
“放哪里了,我让人去取一下。”对方语气惊喜。
“没必要。”卢赫回忆起往事,“我当初从你头发里提了三组基因,分别寄给三个公司测序,其中就有你们公司。你调下数据就行。”
“找过了,没有。可能大停电的时候,损失了。”
卢赫无奈道:“我能先问下你们目前是什么思路吗?你要搞机器学习?那种不可解释的黑箱,有用吗?”
对方点头认可,“没错,我们就是要做机器学习,而且是具备可解释性的小样本机器学习。至于你说的黑箱,就算有些方法是黑箱,但好用就行了。
你们之前用的CRISPR脱靶分析软件,其实就用了这种技术。那是巨硬亚洲研究院前几年的成果。() ()
他们建立了一个大型的数据集,记录了与给定的向导RNA有一项核苷酸不匹配的所有可能的标靶区域里发生的脱靶活动。
然后把数据喂给了一个两个隐藏层的神经网络,训练出了一个可以输出所有潜在脱靶位点的模型。这是一个生成模型,可以得到每个脱靶位点的概率,据此计算脱靶评分。”
“太普通了,这只是实现了一个二线工具,还有没有更惊艳的?”卢赫追问。
“有。
非同源末端连接机制还记得吧?剪刀剪完基因序列后,不管三七二十一直接把断裂的基因给粘起来。
这种方式并不常用,一般都是用同源模板修复。一方面是剪的时候可能剪了不止一个地方,粘的时候却可能只粘了其中一个。另一方面是细胞不乐意了直接就不粘了。
但有团队利用机器学习算法准确地预测到了细胞容易修复的基因位点,并用CRISPR和非同源末端连接治了病。
为了探索具有代表性的人类基因组序列的修复产物,他们设计了一千多个目标位点,特征是向导RNA和靶标基因,标签是非同源末端连接最终起了修复作用位点。
数据喂给了一个看起来结构很复杂的模型,训练结果很是喜人,模型对%的向导RNA的修复位点的预测准确率在%以上。
意味着这些向导RNA和相应靶标基因所对应的疾病,可以用这种方式来治疗。
最终他们治愈了赫曼斯基-普德拉克综合征,一种能凝血不足和白化病的遗传病。体外测试的修复准确率高达%。
这个够惊艳吗?”
卢赫连连点头,“够。这个思路不错,是不是可以用在你身上,特征是某时间点的基因组,标签是未来的变异位点,提前预测变异,在发病前做修复?”
“没错。”对方肯定道。
“可是这种方式,用在你一个人身上好说,其他人呢?万一我们未来都要跟你一样,总不能每个人都建一个模型吧?”
“也不是不可以。不过还是希望未来有别的办法。这个思路已经被提上日程了,底下四层全是测序中心的地盘。”
卢赫露出了难以置信的表情,继而又满怀期待地追问,“也不对啊,我记得我当初给你测序的时候,你突变的位点很多都在编码区的。也许我们和你不一样。”
“没太大差别,前期确实大都在编码区,但后来也往非编码区发展了。
非编码区早就不是最初认知中的“垃圾”区,随着研究的推进,它的重要作用也被逐渐揭示。之所以我年纪越大越严重,很可能就是因为后期突变在了非编码区。
很显然,那里不是可以随意落笔的空白画布,而是地狱的入口,是禁区。”
对方说完,叹了一口气,便又开始仰头看灯,“我的测序结果放在你家哪里?得尽快派人去取,样本本来就不多,数据很珍贵。”
“不用找别人,我自己去吧,我也不确定在不在,在哪里。”
不一会儿,他又从郑K手里弄到了车钥匙,还收到了一连串的嘱咐:
四通八达的隧道只限本市,去外市有一段路要走地上。
除了第号掩体以外,其余的都还没有下移动通讯网络,没法定位,需要熟记地图。
这两天天气不错,风不大,能见度好,路上也没人。但别开太快,路面有沙子,滑。
出去之前,找后勤给车上加点配重。
迈过那道加大加宽的黄色屏蔽门后,映入眼帘的是四个红色大横幅,上面写着:
头上悬着三把剑:
如何逆转非编码区基因变异进程?
腺病毒究竟如何通过影响非编码RNA影响植物?
倒计时天。
卢赫掐着指头算了算,天差不多是年。
不是还有年吗,怎么还缩水了呢?这可不是什么好消息。
满腹狐疑地经过那套熟悉的复杂流程,他来到了实验室内,明亮的灯光刺得他睁不开眼睛。
这些镶嵌在吊顶上的巨大灯管,散发着一种奇异的色彩。他很久没见到过如此通透的白色了。
适应了光线之后,他发现在一排空荡荡的生物安全柜前站着一个熟悉而陌生的身影,正抬头直视着头顶的灯管,看得很入神。
他悄悄走过去,绕到对方侧面,果然是一张熟悉的脸。
“你又挺过来了?可喜可贺啊。”他忍不住调侃道。即便在知道事情原委之后,他早已对曾经把他给折腾不轻的事情释然了,但面对眼前的枯槁小老头,还是没忍住。
对方没有回应他,依然抬头望着灯,自顾自地说:“看到这些纯白色的灯了吗?多么纯净的颜色。”
“日光灯谁没见过?汞蒸气产生紫外光,紫外光轰击荧光粉后的二级光子,就是纯净的白光。好看舒服但是费电,奢侈!”卢赫忍不住批判。
对方摇了摇头,“这可不是日光灯,而是节能LED。蓝色自发光材料的催化过程被攻克了,全光谱LED已经开始量产。即便维持能源现状,以后所有人也都能拥有灯光自由。”
卢赫不以为然地点了点头。他对这些并不感冒,心里满满都是对年倒计时的疑惑,“门口的标语看到了吧,倒计时只有年,为什么?”
对方把目光投在卢赫脸上,缓缓开口:“因为我从最后一次被编辑,到第一次发病,期间间隔了年多。”
卢赫愣了一下,“我们的基因相似度大概还剩.%,你的现在是多少?”
“时间太久远,我无法考究到我的原始基因组,我目前的基因组和时间间隔最久的一次,相似度是.%。”
“呦呵,那海总您要保重啊,再过几个月,你和最初的你说不定就生殖隔离了!”
对方的脸上飘过一丝无奈,“我正好要找你,我们正在建立数据集,需要我尽可能多的基因组数据。年前你跑到我公司揪下来的我的头发,还有没有?”
卢赫转了转眼珠,“没了,不过我可能还有测序结果,在我家里放着。”
“放哪里了,我让人去取一下。”对方语气惊喜。
“没必要。”卢赫回忆起往事,“我当初从你头发里提了三组基因,分别寄给三个公司测序,其中就有你们公司。你调下数据就行。”
“找过了,没有。可能大停电的时候,损失了。”
卢赫无奈道:“我能先问下你们目前是什么思路吗?你要搞机器学习?那种不可解释的黑箱,有用吗?”
对方点头认可,“没错,我们就是要做机器学习,而且是具备可解释性的小样本机器学习。至于你说的黑箱,就算有些方法是黑箱,但好用就行了。
你们之前用的CRISPR脱靶分析软件,其实就用了这种技术。那是巨硬亚洲研究院前几年的成果。() ()
他们建立了一个大型的数据集,记录了与给定的向导RNA有一项核苷酸不匹配的所有可能的标靶区域里发生的脱靶活动。
然后把数据喂给了一个两个隐藏层的神经网络,训练出了一个可以输出所有潜在脱靶位点的模型。这是一个生成模型,可以得到每个脱靶位点的概率,据此计算脱靶评分。”
“太普通了,这只是实现了一个二线工具,还有没有更惊艳的?”卢赫追问。
“有。
非同源末端连接机制还记得吧?剪刀剪完基因序列后,不管三七二十一直接把断裂的基因给粘起来。
这种方式并不常用,一般都是用同源模板修复。一方面是剪的时候可能剪了不止一个地方,粘的时候却可能只粘了其中一个。另一方面是细胞不乐意了直接就不粘了。
但有团队利用机器学习算法准确地预测到了细胞容易修复的基因位点,并用CRISPR和非同源末端连接治了病。
为了探索具有代表性的人类基因组序列的修复产物,他们设计了一千多个目标位点,特征是向导RNA和靶标基因,标签是非同源末端连接最终起了修复作用位点。
数据喂给了一个看起来结构很复杂的模型,训练结果很是喜人,模型对%的向导RNA的修复位点的预测准确率在%以上。
意味着这些向导RNA和相应靶标基因所对应的疾病,可以用这种方式来治疗。
最终他们治愈了赫曼斯基-普德拉克综合征,一种能凝血不足和白化病的遗传病。体外测试的修复准确率高达%。
这个够惊艳吗?”
卢赫连连点头,“够。这个思路不错,是不是可以用在你身上,特征是某时间点的基因组,标签是未来的变异位点,提前预测变异,在发病前做修复?”
“没错。”对方肯定道。
“可是这种方式,用在你一个人身上好说,其他人呢?万一我们未来都要跟你一样,总不能每个人都建一个模型吧?”
“也不是不可以。不过还是希望未来有别的办法。这个思路已经被提上日程了,底下四层全是测序中心的地盘。”
卢赫露出了难以置信的表情,继而又满怀期待地追问,“也不对啊,我记得我当初给你测序的时候,你突变的位点很多都在编码区的。也许我们和你不一样。”
“没太大差别,前期确实大都在编码区,但后来也往非编码区发展了。
非编码区早就不是最初认知中的“垃圾”区,随着研究的推进,它的重要作用也被逐渐揭示。之所以我年纪越大越严重,很可能就是因为后期突变在了非编码区。
很显然,那里不是可以随意落笔的空白画布,而是地狱的入口,是禁区。”
对方说完,叹了一口气,便又开始仰头看灯,“我的测序结果放在你家哪里?得尽快派人去取,样本本来就不多,数据很珍贵。”
“不用找别人,我自己去吧,我也不确定在不在,在哪里。”
不一会儿,他又从郑K手里弄到了车钥匙,还收到了一连串的嘱咐:
四通八达的隧道只限本市,去外市有一段路要走地上。
除了第号掩体以外,其余的都还没有下移动通讯网络,没法定位,需要熟记地图。
这两天天气不错,风不大,能见度好,路上也没人。但别开太快,路面有沙子,滑。
出去之前,找后勤给车上加点配重。