数字化印章NFT:让你的鉴别力成为一种资产

以下文章来源于穹顶数据DOMEDATA ,作者Peter东

[

穹顶数据DOMEDATA .以数据为眼,带你了解数据之间有趣的联结、解读数据背后的意义。

](#)

/pic/2_IR75GHtSpzJwkibUJAIJEq4vBTnrFQ.jpg作者介绍:**Peter东大数据工程师成都大数据产业技术研究院签约作者集智俱乐部常驻作者爱好读书,写作,长跑导语:**一张GIF动图拍出超50万美元,一条推特卖到280万美元,一幅纯数字画以4.6亿元人民币的拍价成交。尽管听上去不可思议,但它们却真实发生。近日,区块链领域掀起的“NFT”( Non-Fungible Token,即非同质化代币)热潮正改变我们在数字领域买卖商品的方式。

01

何为NFT

在古代的书画收藏品中,经常会有图章,有的书画作品,本身的价值有限,但是盖上了名家图章,其价值就会成倍提升。而敲章的行为,也能反映出一个人的鉴赏品味,例如乾隆爷这个敲章狂魔,就毁掉了不少书画。而在数字时代,由知名区块链投资机构 NGC Ventures 创始合伙人陶荣祺于 2018 年初创立X-Order 公司,提出了NFT(Non-fungible token),使用区块链技术,以去中心化的形式,标记原生数字资产所有权

/pic/3_AoGdIp44AcOVKJyCTviaGTRbPbaQ9A.jpg
具体来说,购买某一数字资产(例如艺术品,科研论文,AI模型)的NFT,不是意味着让其他人无法阅读它,而是通过区块链,让所有人都知道购买者花了真金白银,用脚投票支持了该数字资产。艺术家可以利用NFT来创建独一无二的数字艺术品,其具备天然的收藏属性。美国著名遗传学家,哈佛大学教授George Church的个人基因组,也于最近由Nabula公司被铸造成了NFT。个人基因组对应的NFT标签,可以限制分享范围和access 权限,即可以用于可控的授权科学研究,还可以按次收费,计算亲缘关系或者个体特征。例如你有了自己的基因测序结果,可以花一笔钱,和明星比一比,看看是不是有亲缘关系。
02

NFT在学术界的应用

而在学术界,可以通过竞拍论文的NFT,这将使得同行评议变成如同风险投资一般。在由集智俱乐部发起的一次先锋实验中,北京师范大学张江教授2021年的一篇论文[1],成为了首篇被打上NFT戳的论文。NFT能在不改变论文著作权的基础上,为论文添加不可撤销的标记。任何一位通过竞拍获得论文NFT的人,会在这篇论文上留下了自己的印迹。NFT可以按一定比例进行二次交易,当一项研究成果越来越受到重视时,论文NFT价值也随之上升,拥有该论文NFT份额的所有人都将受益。这意味着NFT的竞拍行为,等于用脚投票,表示自己对该研究的支持。 /pic/4_88bqys576VF8Kda2tiaPZCucBxvnbg.jpgNFT竞价页面考虑到当前学术界,评价研究者的标准仍是以论文为核心。而一篇论文的价值,来自其发表期刊的影响因子,因此顶级期刊的编辑和审稿人,就决定了一篇论文的命运。然而基础理论的研究者,往往因为其研究距离应用较远,而无法获得与之付出相对应的回报。而像诸如新冠诊断这样的新兴热门领域,则会在短时间聚集众多跟风的研究者,他们能够用相对不那么严谨的方法学,在高影响力期刊中发表论文,而不在意论文的实用价值。03

NFT给学术界带来的三个改变

假设论文对应NFT的当前价格,而不是发表期刊的影响因子成为论文评价的指标,会给学术圈带来三个改变,首先是单篇评价,每篇论文的价值都可单独被评价,这使得对研究者的评价变得更为公正和客观,不会受到审稿人及编辑个人喜好的影响。二是全周期评价,当前对一篇论文的价值的评估,只有一次,即发表的期刊,之后虽然会根据论文的引用量来进行评估,但这样的评估方式,会导致出现强者越强(即引用越多的论文,越容易被引用),以及自我引用(引用自己或合作者的论文,引用审稿人要求的论文,即使并不是必须的)。然而上述现象不利于研究者持续迭代自身的研究,NFT可以让研究者在只有一个研究方案时,就公开征集初始经费,之后通过不断迭代论文/模型(在这过程中,让相应的NFT升值),逐步筹集进一步研究经费。三是对研究实用价值的重视。当前AI研究者为了追热点,会导致其构建的模型不具有可重复性,从而无法进入商业应用,NFT的出现,使得那些具有潜在商业应用潜力的研究,能够获得更多的关注,而不是那些追逐新概念的示范性或占坑式研究。在学术界,进一步利用NFT的尝试,还包括以下方向,一是通过识别合作撰写的比例,以智能合约的形式,让一篇论文的多位作者,能够从论文的NFT中获益。二是将该论文的NFT收益,按照一定比例分给该论文引用的论文,以此对该论文所基于的研究贡献予以奖励。
04

用NFT让深度学习模型具有可重复性

除了给学术论文打上NFT标签,还可以给人工智能模型打上标签,例如github中项目,整理得出的开放数据集。当前评价机器学习的模型,主要是靠kaggle比赛给出的成绩。但类似的比赛,都是针对一个具体的,静态的,位于封闭环境下的问题,在真实场景下使用机器学习模型,需要的不仅仅是模型本身的预测精确,而是要综合考察模型本身的运行成本,并关注模型的可重复性。/pic/5_ogh8cAiaNBmTPZH4DdIhFz3ld4FpIQ.jpg今年3月在自然机器智能子刊发表的一篇论文[1],指出去年开发的62个针对新冠肺炎的AI算法,都不具有临床价值。类似的情况,并不限于医学领域。而是广泛的出现在深度学习被使用的诸多场景中。之所以大部分机器学习新冠判别模型,都不具备临床价值,是因其存在以下两个问题,首先是算法偏见,这指的是在算法测试,模型训练过程中,存在采样偏差,从而造成不同来源的数据不具有可比性,例如用健康孩子的CT图像来作为未感染新冠者的数据进行训练,就会由于儿童本身的新冠感染率极低,导致算法学到的是如何分辨孩子和成人的CT图片。第二个问题,则是可重复性的缺失,例如只使用部分训练模型的数据,来验证模型的精准程度,这会导致模型可能在特征分布未知的外部数据集上表现不佳。该论文考察的62个模型,49个只进行了内部验证,只有13个使用了外部测试数据集验证模型的准确性。而在引入了NFT机制后,每个人可以评价模型的潜在商业价值,并通过引入市场这只无形之手,汇集众人的智慧。在《超级预测》一书中,作者指出对于诸如谁会获得世界杯冠军这样的预测问题,举办比赛,让大家来花钱下注预测,预测的赚到钱,错了赔钱,通过众人的智慧,其准确度能够超越任何一个相关领域的专家。05

大有潜力的数字化印章

总结来看,NFT支持的数字化资产,不仅能让所有人参与到艺术品的收藏和鉴赏中,还能让学术界带来更为公平合理的评价机制,让AI建模者更加关注模型的可重复性及潜在商业价值。诚然,NFT的机制还存在着诸多不完善之处,需要更多人参与讨论,并针对具体的应用场景细化规则,但这不失为一种极具潜力的革命性技术。
参考文献:1、Common pitfalls and recommendations for using machine learning to detect and prognosticate for COVID-19 using chest radiographs and CT scans

王潜2021-04-22 08:17:13

这个论文nft的项目有链接吗