第477章 汇流之间(2/3)
高悦站在投影屏前,面对线上线下一百多位国内外学者,讲解他们的数据标注标准设计思路。会议室里坐满了人,线上参会者的视频小窗密密麻麻。
“……因此,我们在兼容国际通用标准的基础上,增加的七个扩展维度,都基于已发表的、针对龙人群体的基因组学、蛋白质组学和临床研究证据。”高悦切换幻灯片,展示着一篇篇论文的引用和数据支撑,“这不是‘生物民族主义’,而是精准医学的必然要求——人群差异是客观存在的科学问题。”
提问环节,一位线上参会的外国学者举手:“我认同人群差异的重要性。但问题是,你们的标准是否会‘过度细分’?如果每个国家、每个族群都制定自己的标准,全球科研合作的数据整合将变得异常困难。”
本小章还未完,请点击下一页继续阅读后面精彩内容!
高悦从容回应:“这正是我们要强调的:我们的扩展维度是‘可选的’、‘模块化的’。研究者在共享数据时,可以选择只提供核心标准部分,也可以选择同时提供扩展维度数据。这就像建筑的标准构件和定制构件——基础结构通用,特殊需求定制。事实上,我们已经与三家国际数据库初步沟通,他们愿意将我们的扩展维度作为可选插件纳入其系统。这恰恰促进了而不是阻碍了合作。”
另一位国内学者提问:“你们如何保证标注过程的质量一致性?特别是扩展维度,缺乏现成的国际权威指南。”
“我们开发了半自动化的辅助标注工具,并建立了三级审核机制。”高悦展示了一个软件界面,“所有标注员都经过统一培训和考核,每批数据随机抽查,争议案例由专家小组仲裁。整个过程的所有操作日志、审核记录、仲裁依据全部存档可追溯。我们即将发布的第一批数据集,会同步公开所有质量控制文档。”
研讨会持续了三个小时,问题一个接一个,从技术细节到伦理考量,从实际应用到理论意义。高悦和团队成员分工应答,遇到特别专业的问题,孙教授会适时补充。线上评论区里,技术讨论的氛围越来越浓,最初那种质疑的尖锐感逐渐被专业的探究取代。
研讨会结束时,孙教授做了总结:“科学是在争论中前进的。今天讨论的,不仅是几个标注维度,更是在全球化时代,如何平衡科研的普适性与本土需求这个深刻命题。感谢所有参与者的真知灼见。”
会后,高悦查看邮件,发现收到了十几封合作邀请,有希望使用他们数据集的,有提议联合研究特定疾病的,还有国际学术组织邀请他们参与相关标准制定工作组的。那几封最初质疑的邮件作者,也发来了后续邮件,语气缓和了许多,表示“期待看到实际数据质量”。
小陈兴奋地说:“悦姐,我们算是闯过第一关了!”
高悦笑了笑:“这才是开始。标准发布只是拿到了入场券,真正的影响力,要看有多少人用它、信它、改进它。”
她想起父亲的话:路还长,脚踏实地。
周末,高晋家附近的公园。
一家人散步时,高晋问起女儿研讨会的情况。高悦详细讲了讲,最后说:“爸,我有个感觉:其实很多人不是故意要质疑我们,他们只是习惯了现有的游戏规则。当我们试图加入一些新规则时,本能反应是警惕。但只要我们把道理讲透、把证据摆足,很多人是愿意听、甚至愿意合作的。”
“这就是建立信任的过程。”高晋说,“在国际上,在国内,在学术界,都一样。中国发展到现在,很多领域要从‘跟随’转向‘并行’甚至‘引领’,必然会遇到规则适应期和信任构建期。这个过程需要耐心,也需要智慧。”
本章未完,点击下一页继续阅读。