

(文|曾瑞祥 编辑|陈治国 审核|夏静波)11月11日上午,法国国家农业、食品与环境研究院(INRAE)研究主任Claire Nédellec博士应邀来访家庭教师av ,在一综316会议室作了题为“作物育种中的文本知识提取:构建表型数据与语言之间的桥梁”的学术报告。
Claire博士是 MaIAGE 实验室(“从基因组到环境的应用数学与计算机科学”)的 Bibliome 研究组负责人,专注于研究机器学习和自然语言处理技术、结合本体论,从生命科学与农业领域的文本中提取知识。Claire博士的报告首先介绍了在农业与生物多样性研究中,不同数据类型之间的互操作性(interoperability)是当前系统生物学研究的重要挑战。植物研究常常需要整合从表型组学(phenomics)到多组学(omics)等多层次数据,用以建立和解析生物学机制模型。为打通这些相互孤立的数据孤岛,研究者正致力于识别共享资源并设计“互操作枢纽”(interoperability pivots)。这些枢纽主要聚焦于4类核心对象:性状(traits)、种质/品种(germplasms or cultivars)、表型实验(phenotypic experiments)以及文献(literature)——其中,文献被视为知识挖掘的“金矿”。在此基础上,INRAE 等机构开发了 FAIDARE 数据门户,该门户基于 Breeding API(BrAPI) 标准构建,旨在为农作物和森林植物的基因型与表型数据集提供便捷统一的访问途径,从而促进不同数据类型之间的互联与共享。Claire博士展示一个新颖的自然语言处理(Natural Language Processing,NLP)框架,旨在从作物的文本描述中自动提取性状与表型信息,并以小麦作为验证案例讲解。Claire博士最后说明了该框架能将这些文本数据与结构化的实验数据整合到一个统一的知识模型中,最终构建的资源描述框架(Resource Description Framework,RDF),为跨作物育种的异构数据查询提供了一个强大且无缝衔接的解决方案。
参会师生与Claire博士进行了热烈交流,师生们对相关前沿研究有了更深入的了解。
