分类: 每日头条

突发!全球最大最权威公开癌症数据库 禁止中国用户使用

当地时间 4 月 4 日,由国家研究所(NCI,National Cancer Institute)维护的、全球最大、最权威的公开癌症数据库之一 SEER(Surveillance, Epidemiology, and End Results)数据库,已经禁止中国用户使用,此前已经注册过的用户再也无法登录。另据悉,很快英国方面的相关数据库也将禁止用户使用。

4月2日,美国国立卫生研究院(NIH)主任办公室(OD)在网站上发布一份《实施更新:增强NIH受控访问数据的安全措施》文件,称自2025年4月4日起,NIH将禁止位于中国、、伊朗等受关注国家的机构访问NIH受控访问数据存储库和相关数据。

据悉,这些数据存储库和相关数据包括了“型-表型数据库”平台dbGaP、用于大规模基因数据分析的云平台AnVIL等关键数据平台,这些平台拥有全球最核心的人类基因组、表型信息和疾病研究数据,是全球的研究人员长期以来高度依赖的数据库。

此前,美国司法部已经发布了一项最终规则,以实施2024年2月28日第14117号,该行政命令涉及“防止受关注国家访问的大量敏感个人数据和相关数据”、以及“禁止和限制与某些国家或个人的某些数据交易”。美国司法部的最终规则将于2025年4月8日起正式生效。

对于美国突然针对中国等受关注国家和地区关闭核心生物信息数据库平台的做法,中国多位从事基因或肿瘤研究相关领域专家对第一财经记者表示,过去这些平台的数据库对全球的研究人员都免费开放,能促进前沿医学等领域的国际合作。现在美国单方面向中国等国家关闭了数据开放的大门,将对一些重要的前沿领域国际合作项目产生不利影响。

“这意味着中国的很多医学研究要拿到全球核心的数据库难度加大了,这会对科学的发展产生一定的负面影响。”一位生命科学领域从业者对第一财经记者表示。他进一步称,NIH是全球最大的生物医学研究机构,旗下平台数据的覆盖面非常广泛全面。

上述人士进一步称,中国的临床医生已经预料到美国可能会采取此类封锁行动,因此一些肿瘤领域的临床专家早在三五年前就呼吁要建立中国自己的数据库,但这一过程也面临挑战。“一个是经费方面的问题,另一个是管理方面的问题。”他表示,“国内现在很多数据仍然相当分散,一些医院拥有自己的小样本生物数据库,但没有一个共享的机制,国内迄今为止也没有建立诸如肿瘤生物样本的大数据库平台。”

一位美国高校神经科学研究员对第一财经记者表示:“对于今后还想用NIH数据库的中国项目而言,比如个别涉及人类遗传学方面的研究,美国最新的封锁措施会有一定的影响,但也并不是所有的医学研究都需要用到这些数据,因此整体而言的影响也有限。”

当地时间4月4日,由美国国家癌症研究所(NCI,National Cancer Institute)维护的、全球最大、最权威的公开癌症数据库之一 SEER(Surveillance, Epidemiology, and End Results)数据库,已经禁止中国用户使用,此前已经注册过的用户再也无法登录。另据悉,很快英国方面的相关数据库也将禁止中国用户使用。

图| SEER禁止中国用户登录的页面显示(来源:资料图)

SEER在一封回复给用户的邮件中表示:“如果您最近失去了对 SEER*Stat账户的访问权限,并且无法再登录,请留意最近的政策变化,该变化要求美国国家癌症研究所删除对 SEER数据的访问权限。目前,我们无法恢复您的账户访问权限。为了支持最近的安全指令,国家卫生研究院正在实施技术更新,以加强安全措施,重点是保护国家卫生研究院受控访问数据存储库(CADRS,Controlled Access Data Repository System)提供的数据。具体而言,自2025年4月4日起,国家卫生研究院将禁止特定国家的研究人员和机构访问任何涉及国家卫生研究院 CADRS和相关数据的正在进行中的项目,并将会终止这些项目。这些特定国家包括中国(含香港和澳门)、俄罗斯、伊朗、朝鲜、古巴和委内瑞拉,这符合行政令14,117和28 CFR Part202规定的‘防止受关注国家或受关注人员访问美国敏感个人数据和政府相关数据。’请参见 Guide Notice NOT-OD-25-083以获取更多信息。”

图|上述邮件内容的截图(来源:资料图)

上述邮件所说的行政命令指的是,2024年美国政府曾推出一项名为《关于防止关注国家获取美国公民大量敏感个人数据和美国政府相关数据的行政命令》。这一行政命令禁止或限制包括中国、俄罗斯、伊朗等六个“受关注国家”及相关个人获取美国人敏感数据的交易。其中,个人健康数据与人类基因组数据是重点受限领域。有些讽刺的是,美国政府还在这一行政命令中强调“美国致力于推动开放、全球、可互操作、可靠和安全的互联网”。

(来源:资料图)

那么,此次禁止中国用户使用的 SEER数据库为何如此备受关注?据了解,SEER数据库建立于1973年,数据范围覆盖大约34.6%的美国人口,数据内容包含癌症发病率、患病率、死亡率、治疗和生存率等数据。此前,SEER数据库每年都会发布新数据,研究人员可以免费申请使用。通过使用 SEER数据库的数据,通常将其用于癌症流行病学研究、癌症预后因素分析、医疗政策制定和评估、癌症生存率趋势研究等。

一位业内人士告诉 DeepTech:“国内科技人员对于这一限制是有一些心理准备的,知道早晚会有这么一天,只是不知道什么时候会来而已。美国作为‘领头羊’挑起关税贸易壁垒之后,又开始在科研合作方面更进一步采取保护主义。以前科研人员还有渠道能够进行沟通,从当前形势来看,未来的渠道会越来越少。当前这种限制访问肯定会影响到美国科研人员与中国科研人员的合作。这也再次说明,科学无国界,但是科学家是有祖国的。”

广州大学关跃峰教授告诉 DeepTech,本次事件对于医学数据的对比研究来说,可能会因为数据不足导致研究结论的片面性。国际合作通常要数据共享,在双方脱钩的趋势下,建立合作将越开越难。考虑中国医学领域研究应用 SEER的比例很高,预计短期内对医学研究的冲击会很大,比如癌症流行病学研究通常对数据库非常依赖。

参考资料:https://bidenwhitehouse.archives.gov/briefing-room/presidential-actions/2024/02/28/executive-order-on-preventing-access-to-americans-bulk-sensitive-personal-data-and-united-states-government-related-data-by-countries-of-concern/

来源:第一财经/DeepTech深科技

喜欢、支持,请转发分享↓
赞助商链接