div#pop_ad { opacity: 0; }

在围绕数据所有权,隐私和货币化的激烈争论的时代,一个特定的数据可以说对于个人来是最隐私的:人类基因组。
虽然我们在整个物种的遗传构成中有99.9%的相同,但剩余的0.1%包含代码的独特变化,这些变化被认为会影响我们对某些疾病的倾向,甚至是我们的气质和个性。 这是我们对心脏的一切感染程度的蓝图疾病和老年痴呆症,是嫉妒、鲁莽和焦虑。
2018年提供了充分的例子,说明破坏分子是如何通过恶意使用甚至相对琐碎的数据来做坏事的。对于那些关注保护这种最重要的身份形式的人来说,区块链作为现有基因组数据市场的封闭架构和专有攻击的强大替代品,引起了人们的极大兴趣——承诺为生命代码提供安全和开放的协议。
加密链
将人类基因组测序到与DNA双链螺旋结合的四个“字母”的分子水平是在2003年首次完成的。这个项目耗资37亿美元和13年的计算能力。今天,每个独特的基因组花费1000美元,而且需要几天时间。估计它很快将会只花费100美元。

随着基因组数据驱动的药物设计和靶向治疗的发展,制药和生物技术公司的兴趣有望在未来几年内推动基因组学数据市场的发展,预计到2025年将达到276亿美元的规模。
如果您的Facebook喜欢的数据集和新闻提要已经被认为是一种主要的可货币化的资产,那么随着精准医学和基因编辑的革命逐渐加速,锁定在遗传密码中的价值呈指数级增长。
在过去的一年里,美国新的基因疗法得到了前所未有的批准。一个人从患者的免疫系统中编辑细胞来治疗非霍奇金淋巴瘤;另一种治疗罕见的遗传性视网膜疾病,可导致失明。
然而,这就是问题。
基因组学在现代医学中引发范式转变的无可比拟的潜力依赖于利用大量数据集来建立遗传变异与特征之间的相关性。
生成大型基因组数据的爆炸仍然需要解码生物体的4位,这些障碍不仅是科学的,而且是道德的,社会的和技术的。
对于这个前沿边缘的许多人来说,这正是2008年中本聪传奇的白皮书,以及后来被称为区块链的技术的用武之地。
Cointelegraph与区块链基因组学领域的三位人物进行了交谈以找出原因。

谁拥有你的基因组?复活毛茸茸的猛犸象和枷锁链
对于哈佛大学世界着名的特立独行的遗传学家乔治·丘奇教授而言,实验室内外的技术之间的界限是多孔的。早在1984年就已经联合开创了直接基因组测序技术,他近期最近的志向想攻克的目标包括尝试复活已灭绝的猛犸象,制造防病毒细胞甚至逆转衰老。
他现在已将另一项前沿技术置于基因组学革命的中心:区块链。
去年,乔治·丘奇与哈佛同事丹尼斯格里申和卡迈勒奥布巴德一起 共同创立了区块链创业公司Nebula Genomics。多年来,丘奇一直在努力加速并大规模推动基因组数据的生成。他曾呼吁志愿者为他的非营利性个人基因组计划(PGP)做出贡献。这是一个开放获取的人类基因组数据的“维基百科”,到目前为止汇总了大约10,000个样本。
PGP依靠人们为了追求科学发展而丧失隐私和所有权。正如丘奇在最近的一次采访中所说,他们大多是“特别无私的”,或者是因为家庭经历而加速研究特定疾病的人。
在其他情况下,正如网络安全专家DNABits的Dror Sam Brama告诉Cointelegraph的那样,正是病人自己产生了这些数据而且“病得足以丢掉任何所有权和隐私问题”:“病人来到医疗保健系统并说,‘我们会给你任何你想要的东西,拿走它,我们会同意签署任何文件。只是希望治愈我们,找到治疗方法。’”
挑战在于让其他人都受益。虽然没有人确切知道到目前为止有多少人对其基因组进行了测序,但一些估计显示其大约有一百万。
像星云和DNABits这样的初创公司提出,一个标记化的区块链生态系统可能成为入侵群众的技术转折点。
通过允许人们将他们的基因组货币化并直接向数据购买者出售,Nebula认为其平台可以帮助推动测序成本“降至零甚至为人们提供净利润”。
虽然星云不会直接补贴全基因组测序,但区块链模型允许感兴趣的买家(比如两家制药公司)为某人的序列投入现金,以换取他们的数据。
标记化为开启不同场景提供了灵活性和细粒度的同意。正如Brama所建议的那样,数据所有者可以根据他们已经启用的研究或者在加密通证中报销他们的医疗处方,获得可能开发的任何药物的份额。合同将被公布和散列,并参考区块链上记录的个人同意。
基因组反乌托邦
推动和加速数据生成只是等式的一部分。
星云公司进行了一项调查,结果发现当人们被问及是否会考虑进行基因组测序时,隐私和伦理方面的担忧不仅仅盖过了人们的经济承受能力,而且超过了所有其他因素。在另一项针对13000人的研究中,86%的受访者表示他们担心基因数据的滥用:超过一半的受访者表示对隐私的担忧。
这些担忧并非仅仅建立在好莱坞的反乌托邦90年代科幻小说中。想想电影《卡塔尔》在新生优势热潮中对未来社会的想象。
正如区块链基因组学创业公司DNAtix的联合创始人,首席执行官兼首席技术官Ofer%20Lidsky所说:“一旦你的DNA受到了损害,你就无法改变它。它不像信用卡,你可以取消并收到一个新的信用卡。你的遗传密码终身伴随着你,一旦受到损害,就无法回头了。“
越来越多的数据被截获,市场化,甚至武器化。测序-更不用说共享-鉴于它的奇异性,不可逆转性和寿命,你的基因组可能比许多人愿意采取的更进一步。
DNABits的Brama给了他的网络安全服务说:“其后果很难想象,但在这样一个世界里,人们正在构建像病毒一样的载体,这种病毒会传播到体内的细胞并编辑它们,这很可怕。但事实上,所有的构建因素都已经存在:基因组测序、数据破坏、基因编辑。人们现在正致力于利用体内基因编辑来修复主要的健康状况。但我们应该假设,所有的工具最终也会落入坏人手中。”
他补充道,“我们说的不是仅仅利用一个人一晚上服用GHB或其他药物”——这会影响一个人的余生。
今年4月,在剑桥分析丑闻之后,有消息称,警方侦探在嗜好者的家谱数据库中搜集了个人DNA片段,他们希望这些片段能够帮助解决一个已经冷淡了30多年的谋杀案。
执法部门在访问一个由不知情的公众上传的遗传材料的集中存储库方面没有遇到任何阻力。许多人通过DNA缠结欢呼金州杀手的被捕,其他人则表示相当不安。
这种访问的模糊性超出了法医学的意义。虽然布拉马的反乌托邦也许还有一段路要走,但是今天人们还是担心雇主和保险公司的基因歧视,后者目前只是在法律上被部分禁止。Grishin对此表示赞同,并指出在美国“你可以被剥夺生命保险,因为你的DNA。”
今年5月,美国联邦贸易委员会(U.S.Federal%20Trade%20Commission)对包括23andMe和Ancestry.com在内的流行的消费者基因检测公司展开调查,调查他们处理个人和遗传信息的政策,以及他们如何与第三方共享这些数据。
23andMe和Ancestry.com代表了最近一种所谓的“直接对消费者进行基因检测”的现象,据估计,这种检测在去年已经普及了一倍多。
这些公司使用一种叫做基因分型的更窄的技术,它识别整个基因组64亿个字母之间大约有规律间隔的60万个位置。在有限的情况下,它仍然揭示了固有的个人遗传信息。
这个非常流行的23andMe家庭基因分型套件——阳光般包装成“欢迎光临”——承诺告诉人们从祖先的化妆品到晚上在烦躁的失眠症中度过的可能性。这个套装的价格是99美元。
今年7月,全球第六大制药公司葛兰素史克公司(GlaxoSmithKline)投资3亿美元签订了一份为期四年的协议,以获取23andMe的数据库。据估计,这家检测公司通过销售大约100万种人类基因型产品,获得了1.3亿美元的收入。平均价格约为130美元。相比之下,Facebook从一个活跃用户的数据中产生了大约82美元的总收入。
用于基因组学革命的防战,匿名区块链系统
在这种日益不透明的基因组学数据环境中,私营企业通过其消费者产生的基因型数据货币化,序列数据在专有的集中式孤岛中分散 - 无论是在医疗保健和研究机构的笨拙遗留系统中,还是在私营企业中。
生物技术公司将基因组学引入区块链将允许加速研究所需的循环,同时通过将匿名身份与加密标识符分开来保护这些独特的个人信息。用户可以控制他们的数据,并确切地确定与谁共享以及出于何种目的。反过来,这种访问将在可审计和不可变的分类账上进行跟踪。
Grishin概述了星云的版本,它会对生态系统的不同成员提出不对称的要求。用户可以选择保持匿名,但是经过验证的验证者节点的权限区块链系统将要求使用该网络的数据购买者对其身份完全透明:“如果有人向你伸出手,它不应该只是一个加密网络ID,但应该说这是强生公司的约翰史密斯,他在肿瘤学领域工作。”
Grishin补充说,星云已经尝试使用Blockstack和以太坊(ETH)区块链,但后来决定转向内部原型,考虑到以太网的每秒15次交易容量不足以满足其生态系统需求。
DNABits的Brama也致力于使用一个允许的系统,提出使用“最简单和最强大的区块链形式——即比特币型网络”。
“你使用的发动机越强大,功能越强,表面攻击就越大。”
防止谎言的区块链
据说23andMe存储了大约500万个基因型客户档案,而竞争对手公司Ancestry.com大约有1000万个。对于每个配置文件,他们收集大约300个表型数据点 - 创建调查,旨在找出您(生)在您一生中吸烟的数量,或瑜伽或百忧解是否更有效地控制您的抑郁症。
表型是个体的可观察特征的集合,其由他或她的基因型与其环境的相互作用产生。生成和共享对此数据的访问对于通过变体和性状的相关性解码基因组至关重要。但正如Grishin指出的那样,在很大程度上是自我报告的,大部分现有数据的质量是不确定的,并且在这方面,标记化的基因组学面临着一个障碍:
“如果人们能够将他们的个人基因组数据货币化,那么你可以想象有些人可能会想,'如果我声称有一种罕见的情况,许多制药公司将有兴趣购买我的基因组' - 这只是不一定是真的。基因组的价值很难预测,如果说你有一些罕见的东西,那么你的基因组就会更有价值,这是不正确的。事实上,许多研究需要大量的控制样本才是正常的。”
教育可以帮助人们意识到他们不会通过说谎赚更多的钱,并且中间的基因组可能对买家而言同样有兴趣,而不是一个不寻常的基因组。但Grishin还指出,区块链系统可以提供独特的机制来阻止欺骗,即使在教育失败的情况下:“区块链可以帮助创建表型调查,检测不正确的反应或确定个体参与者试图撒谎的位置。这可以与支持区块链的托管系统结合使用,例如,在您参与调查之前,您必须在托管钱包中存入少量加密货币。”
如果相互矛盾的回答表明有人试图谎报他们的医疗状况,那么他们的存款可以通过区块链系统中比使用法定货币更容易实施的方式被扣留。
2018年:病毒和染色体袭击了区块链
即使只有一小部分人口参与,鉴于机构代码的数据密集性,序列的海啸已经充斥现有的集中存储。
单个基因组的复杂原始数据集可达200千兆字节:2017年6月,美国国立卫生研究院的GenBank据报道含有超过2万亿个碱基序列。中国BGI Genomics公司是世界上最大的生物技术公司之一,同月宣布计划在2017年生产5种新的DNA,每年增加到2020年达到100 petabases。
在他对Cointelegraph的采访中,Lidsky提出分析师不需要原始的200千兆字节数据集,强调初始基因组测序被多次读取“比如30或100次”,以减轻不准确性。一旦结合,他解释说,“序列的大小减少到1.5千兆字节。”这仍然需要大量的压缩才能将它带到区块链。作为参考,截至2018年6月中旬,比特币(BTC)区块链的平均交易量为423千字节。

比特币区块链的平均交易规模,2014-18。资料来源:TradeBlock.com
6月,DNAtix宣布首次使用区块链技术转移完整的染色体 - 特别是IBM的Hyperledger结构。 Lidsky告诉Cointelegraph,该公司今年8月成功实现了99%的DNA压缩率。
就其本身而言,星云设想即使在区块链上,鉴于基因组学的独特敏感性,数据传输也是不必要和不明智的。它建议改为共享数据访问。该解决方案将区块链与高级加密技术和分布式计算方法相结合。正如格里申所述:“您可以在计算机上本地分析您的数据,只需在您的数据上运行应用程序,并采用其他安全措施。例如,通过使用同态加密以加密形式共享数据。”
Grishin解释说,同态技术可以加密数据,但确保它不是“荒谬的” - 创建“在不干扰数据的情况下变换数据的转换”:“数据购买者本身并不获取基础数据,而是计算其加密形式以从中获取结果。因此,代码被转移到数据而不是数据被移动到研究人员。“
加密数据可供所谓的基因组应用程序的开发人员使用 - Nebula,DNAtix和该领域的许多其他新兴创业公司都提议将其作为向用户提供其数据解释的一种方式。它们还可以为研究人员和其他第三方开发人员提供进一步的货币化来源。
但将“外包”基因组解释转化为简单的应用程序?数十年前的医疗保健模式将患者转诊给遗传咨询师,以便克服风险并通过期望进行交流,帮助翻译可能令人困惑的结果,而且往往是可怕的结果。
消费者基因检测公司已经被指责为他们的客户“提供大量数据和答案。”除了满足家谱的好奇心并解释一系列“健康”基因外,23andMe还可以揭示您是否携带可能影响孩子的遗传变异。未来的健康状况 ,截至2017年,甚至被授权披露遗传健康风险,包括乳腺癌和帕金森病。
当涉及到将个人置于黑暗中时,区块链可能不会好得多,面对他们的电脑屏幕的蓝色光芒。 Nebula和DNAtix都在考虑如何将遗传咨询师纳入他们的生态系统,Grishin还建议用户能够“选择”他们是否真的想“知道一切”,或者只想要“可行的”见解,即现代医学可以解决的问题。

区块链和大型制药公司
到2024年,预计全球处方药销售额将达到1.2万亿美元。但是,药品与每天服用药物的数百万人之间的反馈循环仍然面临重大障碍。
药物开发依赖于关联和跟踪医学试验的生命周期,基因检测,处方副作用和与生活方式有关的长期影响;标记化可以激励个人和企业共享跨多个流生成的数据。正如布拉马所述:“生活方式数据来自可穿戴设备,智能手机,智能家居,智能城市,购买,商业互动,社交媒体等。另一个由每个人携带,这就是我们的基因组。第三是医疗保健系统产生的临床和健康状况数据。”
Brama使用了一副卡片的类比来解释区块链如何成为开始将这些数据连接起来的关键,同时保护数据所有者的匿名性。
个人可以在他们的数字钱包中拥有无限数量的唯一地址。走进药店购买一种特定的药物,比如说,维他命C,加盖QR码,就会产生这些地址之一的交易。去看家庭医生可能会对你的电子病历(EMR)做出进一步的诊断,比如流鼻涕。这笔交易介于照顾者和另一个钱包地址之间。
用户可以选择将区块链中不同钱包的交易之间的相关性放在区块链上,并将其公开以供人们对基础数据进行投标。或者,只有当保险公司或研究机构向具有特定交易集的用户做广告时,他们才可以保持关联链并发送证据:“你拿着甲板。你看看卡片,你决定是否说。如果你不说,你可以把它们放在桌子上,让每个人都看到,或者你可以私下表明你确实拥有这些。它真的让你选择和实施。”
生物技术前沿
丘奇教授做了一个类比,认为任何人只要插上密码和锁链空间,都可能敲响警钟,他说:“现在,基因组测序就像上世纪80年代末期的互联网。它就在那里,但是没有人在使用它。”
区块链和基因组研究的先锋可能比以往任何时候都更接近彼此。既然我们细胞中的DNA被理解为终生的信息存储,那么需要一种新的破坏性技术来安全灵活地管理身体代码的互锁网络。
基因组学的出现引发了一些单靠科学无法解决的问题。对于我们所有的受访者来说,区块链可能只是创造公平和透明的所有权和流通手段的关键,这将确保原始生物材料的这些螺旋不会失控。
添加新手交流群:币种分析、每日早晚盘分析
添加助理微信,一对一亲自指导:YoYo8abc