全球最大公开癌症数据库 SEER 禁止中国用户使用,相关领域研究会遇到哪些问题?如何解决?
先说明,SEER数据库的关闭绝非孤立事件。从NIH生物医学数据库权限收缩,到《禁止与中国合作》的联邦备忘录,美国正将学术交流“武器化”。
SEER的价值在于其数十年积累的癌症流行病学数据——覆盖美国34.6%人口、超千万病例的临床信息,是探索癌症地域分布、治疗差异的核心依据。中国学者过去依赖这些数据完成的成果,每一项都可能因数据断供而搁浅,但美国也不可能独善其身,毕竟癌症防治是全人类的事业,特朗普政府一边高喊“国家安全”,一边把癌症发病率、患者生存率这些本应属于全人类的健康数据,硬生生划入“战略资源”的禁区,他们防中国科研团队的样子,仿佛我们在偷导弹图纸,而不是在研究如何让癌症患者多活两年。
有人问:咱能不能换个IP地址,继续“蹭”数据?
用VPN或代理IP访问SEER数据库?这想法可能有点年轻,那么多网站翻墙就能上,为什么偏偏是SEER现在掀起轩然大波且不说NCI早已将权限验证从IP扩展至机构账户(需绑定.edu或.gov域名邮箱),单是数据调取协议中的法律条款就足够让绕行者“踩雷”。SEER不同于普通网站,其数据使用需签署严格的《研究数据协议》(DSA),声明仅用于非商业科研用途。若通过伪造身份或第三方机构“借壳”访问,轻则触发系统警报封禁账号,重则面临《经济间谍法》指控。
现在唯一靠谱的可以自己登录的方法,是用国外的edu邮箱(一般都需要学校认证)+注册时填写国外的地址+国外IP。
如果要使用SEER数据发文章,根据《AGREEMENT AND TERMS OF USE》中的第七条:7. 禁止向他人披露:授权用户不得向任何其他个人披露数据,也不得允许他人披露数据。所有希望访问该数据的研究团队成员必须单独签署一份SEER研究数据使用协议。
那就要保证作者列表里只有一个(合法的)人接触数据,在论文中清楚说明每位作者的贡献,理论上是可行。毕竟数据来源和处理应当合理,符合科研规范。
不过,话又说回来了,在网络翻墙这件事上,估计中国人的经验是全球前列的。不发文章,只是作为前期研究的话,相信那么多“阿根廷”人早就知道灵活绕开墙壁的方法,甚至假以时日,购物网站上应该也能找到一些身在国外的科研人互助下载,再不行国内自己的数据库还在呢,虽然说代表性差了点数据深度差了点,但数据库正是需要时间来累计迭代的东西,华为芯片制裁的例子还历历在目,而且特朗普政府这一波操作,堪称所有人都得罪了遍——关税让股民钱包缩水,技术封锁让知识分子心凉,知识分子也游行,中产阶级也游行,到底是朝令夕改的草台班子还是不顾全球反对声浪一意孤行,川普的未来我们都等着看。