【原创】有关知识产权和信息开放的讨论

2015-06-09 约 6331 字预计阅读 13 分钟

                    (function(){
                        var cover = "http://mmbiz.qpic.cn/mmbiz/dcEP2tDMibcfUm9rPian5gsvyiaKdtTq9oALCuXEVMzotecpSPx5v66LEQsFribmPLQ73XC1vcy5636qU8PzHdF8Nw/0?wx_fmt=jpeg";
                        var tempImg = document.createElement('img');
                        tempImg.setAttribute('class', 'rich_media_thumb');
                        tempImg.setAttribute('id', 'js_cover');
                        tempImg.setAttribute('data-backsrc', cover);
                        tempImg.setAttribute('src', cover);
                        tempImg.setAttribute('onerror', 'this.parentNode.removeChild(this)');
                        
                        document.getElementById('media').appendChild(tempImg);

                    })();

本文为作者原创，未经书面许可，任何公众号与其他网络平台不得转载。转载需后台留言授权。

特别感谢混沌巡洋舰讨论组诸位贡献的真知灼见，有兴其中观点，想和他们直接交流的朋友请联系我。

问题导论：

许铁：知识产权和信息开放，是一个对学术圈，出版商，以及享受学术成果或者说知识专利的大众都极为有用的话题。我们思考一个简单的问题，在网络发达的时代为什么每个知识的产生者不能自由的把知识成果放在某个网络学术交易平台上？而目前越来越多的免费杂志，则给我们提供了另一个问题，为什么这些杂志向论文的发表者收费，而阅读者却是免费的？知识产权的价值的真正体现又是什么？传播和保护的关系是什么？能否设计一个显示文章真正影响力的评价体系？还是多元的杂志社和数据商的角色是不可替代的？

郭瑞东：知识产权和信息开放的矛盾始终存在。是要保护当前发明者创新者的利益，加高知识产权的壁垒，还是信息开放，要未来的创新者受益于无限制的前人成果了？这是一个值得讨论的权衡，没有非黑即白的解，只有通过复杂的制度设计，以求得俩者的平衡。面对鱼龙混杂的科研成果，是该交由专业编辑去去伪存真，还是依靠大众的群体智慧，去分辨哪些是值得参考的科研，哪些是伪科研？我们如何即能保证不压抑突破性的科研，又能不叫神棍在其中浑水摸鱼，这需要心理学，制度经济学等多学科背景参与制度设计的讨论。机器学习，自然语言处理的发展又会为科研出版界带来哪些挑战与机遇了，处在不同背景，不同职位上的人想必有不同的看法。因此，我们在这里展开跨学科的讨论，以扩展问题的边界，细化问题的定义，如有可能，给出未来适当的方向。

讨论部分：

刘正：我来聊聊学术界的文献知识产权问题。在我看来，现有的学术期刊体系简直是反科学进步的存在，尤其是高昂的期刊发表费和向机构收取的天价订阅费，无功食禄的典范。

我们会想一下，学术期刊最早是怎么来的，最早的学术期刊都是XXletter，即因为曾经的学术讨论是建立在互相通信的基础之上，如果写成公开信发在XXletter上，供学术圈一起看，那效果明显比单独写信要高效，后来继续发展，就成了学术期刊的原型。

所以期刊其实就是19世纪学术圈的Facebook好不好。

现在我们有了论坛BBS，有了知乎，有了微信讨论群，为啥还要用19世纪低效的交流方式来进行知识的分享工作呢！

很多文章充满了各种套话废话，尤其集中在Introduction和summary的部分，很多实验方法学的部分读起来极为拗口，不知所云，实验步骤无法重复。Peer review过程低效浪费充满黑幕。

我设想中未来学术圈的交流方式是类似知乎的存在，每个研究者可以提出一个科学问题，然后自答或邀请专业专家来回答，并给自己的问题或回答贴一个或几个专业标签以便让自己希望的读者看到(使用标签而不是分板块便于细分搜索)，当然有专业素养的职业编辑也会看到自己管的专业类别，把明显不靠谱的答案或问题折叠，并邀请大牛来审核贴出的这个答案每个答案的内容需要简洁直接，直奔要害，这样才会有足够多的人点赞越是大牛，其点赞的加权效果越显著。

明哲：软件上的Open source其实也还没有占据优势，典型的安卓和苹果，苹果发展的更好。就是因为IOS的商业模式更加成熟，对内容创造者更有吸引力。这个本质上就是一个商业模式的问题。学术期刊出版也是一样，在还没有找到一种明显比现有商业模式更优的模式的情况下，是很难出现取代的产品的。现有学术出版的模式，尽管已经很阻碍信息自由的交流了，但是其依然如此强大，不是没有理由的。

学术界还没出现谷歌这样的公司，本质上就是适应信息时代的商业模式还没完善。所以我的观点就是：在学术领域，在找到适合信息时代的商业模式之前，现有的体系是很难打破的。如果要打破现有体系，那么首先就要设计出一种更优的运营模式，免费和开源未必是最优，这个从IT产业的发展就能看出来，现在活的更好，发展更好的产业，都不是由open source来主导的。

过百：我大部分赞同明哲的观点。但需要说明的是，科学联系的社交化会是一个渐进发展的状态，有打破评价体系的信息优势的潜力。

明哲：但是现在已经是不同于过去，学术圈子也不是只有很少几个人。学术跟商业、政治等等已经密不可分。就像管理公司，管理一个几十人的乡镇企业，跟管理几万人的跨国公司是不一样的。成员的数量、外部的环境已经完全不一样

过百：我的理解是，免费不免费的根本原因是。免费往往意味着高成本的时间投入。互联网里，流量是核心资源之一。某种意义上来说，这就是用户用时间的pay。

明哲：学术领域中，核心则是评价体系。包括专家对内容的审核，和对专家学术水准的评价标准

第二点，我说两句关于学术论文的。学术论文因为也分理工，社科，人文等不同方向。就理工而言，也有科学和工程两大类。然而这两类的特点和发文目的有很大的不同。就物理生物这些纯科学另外加上数学，他们有一个发布平台叫arXiv，这个是可以上传并且免费下载的。然而，我们工程上的论文一般不往这上面放。

许铁：万事到头来还归结于个人的利益。信息的输出者需要更快捷更广泛的传播，这本身包含open的必要性，但是如果没有好的产权界定及权威评价，他们就失去了分享和open的动力。

各种杂志由于长期自然形成的传统，给不同的人和不同的学派提供了栖息的平台并提供知识产权的保护，虽然噪声和随机性巨大，却也保护了多样性。我觉得杂志不会消失，而是如何在internet时代提高效率

明哲：出版制度是真心需要改变了，几大出版集团各种买断，造成垄断然后卖高价

所以我感觉需要好一点的商业模式，让各个学术期刊能够长久运营，又不会像现在这样造成信息流通阻塞

刘正：学术圈无压力啊，没人想变革。拿了tenure谁还管这个，熟练了后都不愿意改。

我算是对这帮老头不抱希望了，可以先做一款年轻学者都爱的学术社交产品，等他们影响力随着时间推进后，自然会取代现有的期刊格局

Ænima ：嗯，我想的是，关于学术，大家能社交的部分，和不能社交的部分。

至于商业上的专利，知识产权等，则建议分行业和产品讨论。

刘正：大部分是需要社交的，你觉得是看paper了解作者的思路容易，还是直接听他在线回答你对他研究的问题容易。

发paper不是目的，paper是为了让你的targetaudience看到，理解，用到他们自己的研究中去，互相帮助。

专家点评-徐英祺：

背景阅读 – 关于金色OA与Altmetric ：

不知道大家是否曾经有过这样的想法。例如一个研究所里，有若干个课题组都从事某个一大主题的研究，然后这些课题组的学生，非常希望有人出面建立一个文献库，存放这个主题的所有文章，这样大家就不用重复下载了，因为许多杂志的收费是以下载量计的。这个想法的初衷是好的，替导师和研究所节约经费，但是其实这已经处于了知识产权的灰色地带。研究所的相关人员拒绝了这一提议，最后这些学生只好自己建了一个QQ群，把文章传到这个群里，结果几天时间，群空间就满了。

科学信息的开放趋势我觉得是三个方面，慕课，科学期刊出版方式的改变；科学数据仓储/云工作空间/合作社区的发展。

传统出版，即出版商不向作者收取费用（也有收取费用的），而向订购数据库的用户收取费用，只对这些订购用户的限定IP段开放下载权限。而最近今年兴起的Open Acess（简称OA，开放获取或者开放存缴）杂志越来越多，尤其是金色OA（Gold OA，即完全开放获取）杂志。

金色OA的好处是不言而喻的，它是一种对所有人真正完全自由开放的出版形式。不同于绿色OA，只能免费用于作者和作者单位的存储。比如，现在有很多学校、研究所都建立了自己的机构知识库（Institutional Repository，简称IR），某些机构知识库的内容使用的是传统出版刊物的杂志或者绿色OA的杂志，并且对所有人（有些是对该机构内部IP）都可以阅览下载这些内容，这其实处于了一个知识产权的灰色地带。建立IR的人并没有用这些内容来盈利，只是作为一个存放该机构成果的知识基础设施。但是，这确实破坏了传统出版商的利益，想想看，如果有任何一个人把一篇只对限定人群有购买、阅读权限的文章放到百度文库这样免费阅览、下载的地方，无疑这篇文章对所有人都变成免费了，数据库商也许只将这本杂志内容卖个一个机构，就使得它对其他任何人都免费了。金色OA则不同，出版商的数据库即是这篇文章的存储单元，任何人都可以从这个单元免费获取此文章，而不用从其他第三方途径才能获得免费版。并且任何人都可以将此文章放在自己的一个免费开放的仓储之中，而不用担心侵犯数据库商的权。

OA期刊向作者收取的费用不同于国内杂志和某些国外杂志的版面费。这些杂志不但要收版面费，作者要获得这篇文章，还必须自己购买或者自己所在的机构购买了这本杂志所在的数据库才行，两头被收费。这着实不合理，而且购买的数据库还面临突然大幅度涨价、强制纸本购买、整库打包出售等霸王性条款，着实让很多用户不得不选择其他非正常途径获取需要的数据资源。OA期刊只向作者收费，也是一种运营成本的考虑，是合理的，数据库商也是要赚钱的，它们不是公益组织。作者出钱发表文章也是合理的，科学家想要传播自己的思想，需要学术声望，这其实是一种自我宣传和营销，找个广告商（出版商）替你向全世界宣传宣传，出点钱天经地义。相较传统出版，作者不出钱，出版商也没必要向全世界宣传你，他们收愿意了解你思想的人的钱，把你的思想传播给有限的人，这对真正的科学家其实是一种损失。

OA期刊不是低质量刊物，金色OA期刊要经过同行评审，不是谁交钱多就一定发表，如BMC（BioMed Central）旗下的部分杂志，IF因子也很可观。
目前，很多出版社都在加大OA期刊的比例，有新出版OA期刊与将传统出版期刊转变为OA期刊两种方式。

科学数据仓储/云工作空间/合作社区的发展：

随着云存储技术的发展，云盘已经不局限于一个单纯的个人资料存储功能。而是一个可以进行团队协同工作的空间。例如Figshare，它能够上传多媒体格式的科研数据，与其他所有人自由分享你的第一手实验数据。还有Myexperiment，它在提供实验数据的上下载外，还提供工作流的绘制，这样，别人可以通过简单的工作流示意图，了解你实验的步骤，重复实验，并且用你提供的数据去检验其真实性。以上网站均具有API接口，方便其他应用自由地使用其中的数据，真正实现科学数据的共享。这些平台都是一个很好的非出版商的科研数据交流共享平台，唯一需要付费的也就是花点钱买个会员，扩展些功能和存储空间。但是不付费，依然可以自由免费地向别人传播不少自己的思想，而且还能免费地获取别人自愿分享的知识。所以我认为这类平台是构建完全开放免费型科学数据平台的雏形，首先他的数据形式是多样的，不局限于学术文章这一种形式，你可以只传一张图片、一段音频、视频，一张电子表格……..完全的自由，所有人均能对任何上传的数据进行评论，不局限于几个匿名同行大佬的苛刻评语。因为是自愿共享的，所以涉及知识产权的问题也会比机构知识库（IR）少很多。现在需要加强的就是对用户信息的规范化，用户和用户机构应该实名认证，最好能与ORCID码之类的科研人员识别号绑定，以方便未来用于分析的相关数据的挖掘。

我的个人观点是几乎不可能，除非多国政府和大的全球组织在推动这件事，因为光是建立一个科学数据仓储的经费就是一个天文数字。科学家希望自己的思想得到传播，并且能够得到相应的评价。一个没有任何知名度和影响力的仓储和平台，科学家是不会把自己的成果放在其中的，因为根本没人关注，除了强制性存缴，实在想不出科学家把文章放入其中的可能性。提高知名度的一个方法，就是设计一个被广泛接受的可信的指标评价体系，并将这个体系应用在这些文章上。这就引申出下一个问题——对科学数据（文章/专利等）的评价。

SCI, JCR, ESI, IF因子，H因子这些东西想必大家都听过，H因子比较年轻点，今年也有10岁了。不过很不客气的说，这些都是基于传统的引文分析，说白了就是象牙塔内的这帮人在自high，是这些学术期刊自己内部引来引去的产物，不管算法如何变化，数据的来源总是一个——被学术刊物引用次数，大众对科研的看法在其中没有任何提现。

插句题外话，汤森路透这家数据商是一家有别于其他数据库商的公司。他是做科学文摘和引文的数据库。其旗下的WOS（一般被我们认为是SCI），DII数据库等都是文摘型数据库。这就涉及到一个问题，不过现在貌似也没谁去追究了，就是文摘信息（标题、作者、摘要）其实是文章的一部分，汤森居然拿这些信息去卖钱（WOS是要收费才能用的），这让出版原文的数据商情何以堪，这是不是侵犯了原文出版商的权利？汤森一直在打擦边球，游走在灰色地带，但是SCI握在它手上，IF因子握在它手上，世界上目前最通行的科研成果评价体系的元数据握在它手上（其实也分散在原文出版商手里），所以它可以不出版刊物就能以类似传统出版的买卖方式养活自己。

好了，这种垄断势必导致汤森的东西不便宜。大众们看不下去了，其他数据库商也看不下去了，所以麦克米伦搞出了一家叫Altmetric的公司，专门搞一个叫做Altmetric (Alternative Metrics)的东西。这是个什么东西呢？它其实是一个评分软件，会给每一篇文章进行打分，考虑的指标不仅仅限于学术文章间的引用，还会考虑社交网站转发在内诸多指标。像同属麦克米伦旗下的Nature出版社，以及Wiley在内多家大的出版机构，都在部分的杂志中采用了Altmetric评分，评分会显示在该文章的下载页面，供用户参考其重要性。EBSCO最近收购了PlumX，类似于Altmetric，也是一个多元指标科学影响力评价软件，会考虑下载量、书签收藏量、社交网络转载、学术期刊引用等诸多因素。这些Altmetric应用的出发点都是好的，就是要打破单一数据源的科学成果评价体系，考虑了大众对科学成果的态度。

但是，Altmetric也被诟病得很厉害，除了权重得分配，指标的选择是被讨论最多的。国外的这些Altmetric考虑的社交网站都是我们大陆访问不了的网站，而几乎不考虑我们的微博、微信，这如何让中国大陆的群众信服这个体系指标选择的可信度？更多的问题就来了，考虑了了微博、微信，那考不考虑QQ空间和人人网？考虑了中国大陆的本土社交网站，日本也人多，科技发达，那考不考虑2CH？说的更宽泛一点，考虑了数据库商的下载量，那考不考虑百度文库、道客巴巴这些有违知识产权的途径的下载量？考虑了下载、书签、社交网站，还有什么没考虑进来？…….多元化带来了更多的问题，我们要有所取舍，而取谁舍谁，又是一个公说公有理，婆说婆理的尴尬境地。所以，Altmetric的成型还有很长的路要走。

看到了Altmetric的今天，不难想象，要建立一个令人信服的评价指标体系是非常困难的，如果没有其他基础支撑，比如强行让现有的知名杂志使用这一评价体系，要推广和完善这一体系是很困难的。所以，现在我们陷入了一个先有鸡还是先有蛋的悖论，是先构建一个好的评价体系，然后在打造一个被广泛承认的科研数据存储共享平台，还是反过来，好像难度都非常巨大。所以不得不在向传统低头，以谋求渐进式发展。当然，有了上面提到的云工作空间/合作社区以及Altmetric对存储平台、评价体系的两面夹攻，传统出版商也不得不求变，毕竟，科学数据的趋势是朝着开放化和多元化发展的。

★喜欢这篇文章？

欢迎转发至朋友圈或您的好友。

★对本文有想法？

回到首页，在“发送”栏输入观点。

长按该图片，扫描二维码，即可以一键关注本公众号。

欢迎加小编铁哥个人微信562763765