新闻公告

首页 / 新闻公告 / 最新通知 /

新闻公告

生物医药统计与大模型 | 2025 X智能大会 & 第18届中国R会议

2025-09-19


2025 X 智能大会暨第18届中国R会议将于2025年10月17日至19日在北京会议中心举行。本次会议聚焦大模型技术的前沿进展,及其在各领域的创新探索与实际应用。会议内容涵盖蒙特卡洛视角下的AI革命、扩散大语言模型、多模态理解与生成、Agent形态演变、Agent产业应用、大模型基础理论、AI4Science、具身智能、生物医药统计与大模型、AI赋能健康统计等重要方向。

欢迎访问以下链接或扫描二维码,报名本次会议!

链接:https://www.x-agi.cc/register.html

二维码:


图片

下面为您奉上本次2025 X智能大会 & 第18届中国R会议生物医药统计与大模型会场的介绍。

会场主题

本会场由俞声、王健桥担任主席。会议邀请四位嘉宾聚焦 AI 与医学、药物研发及影像分析的交叉创新,具体内容涵盖大模型驱动的电子病历结构化与医学本体建设、深度学习赋能的药物发现与开发、加速 MRI 脑容积测量的多变量共形预测框架、基于 Meta-Encoder 的多病理基础模型特征融合技术。

会场主席

俞声,清华大学统计与数据科学系长聘副教授,研究方向为医学文本类智能,涵盖自然语言处理、大型语言模型等领域。他与哈佛大学蔡天西教授合作研发的高通量表型提取技术,将疾病表型识别算法开发速度提升千倍,应用于美国国家级精准医学项目及知名医院库建设;主持开发的 “生物医学信息学本体系统” BIOS ,联合发布电子病历处理系统 NILE与中英文结构化大模型 GENIE。俞声获评国家青年拔尖人才,现任 JASA Associate Editor。

王健桥,清华大学统计与数据科学系助理教授、博士生导师。2022年于宾夕法尼亚大学获得生物统计学博士学位,2022年8月至2024年12月于美国哈佛大学生物统计系从事博士后研究。研究方向主要集中在开发稳健及可解释性的高维及超高维统计方法,并应用于复杂结构的大规模基因组数据分析。同时在医学健康领域,与合作者开展深入的跨学科研究,尤其是针对心血管疾病与慢性肾病,综合分析大规模遗传、基因表达与蛋白质组数据,相关成果发表于统计,医学和科学领域顶级期刊。

会场内容

基于大模型的电子病历结构化与医学本体建设

俞声

嘉宾简介:

俞声,清华大学统计与数据科学系长聘副教授。研究方向为医学文本类智能,包括自然语言处理、大型语言模型、知识图谱、搜索引擎、电子病历分析等。俞声与哈佛大学蔡天西教授合作发明的高通量表型提取技术使疾病表型识别算法开发速度提高千倍,应用于“Million Veteran Program”等美国国家级精准医学研究项目以及Mass General Brigham等医院的生物样本库、科研患者注册库建设。俞声主持开发了拥有2210万概念、4602万中英文术语、9985万关系三元组的“生物医学信息学本体系统”BIOS,体量达到美国“统一医学语言系统”UMLS的数倍。俞声与蔡天西教授于2014年发布了电子病历自然语言处理系统NILE,被10个国家和地区的医学研究机构和学者使用;2024年,俞声与蔡天西、Isaac Kohane课题组联合发布中英文电子病历结构化大模型GENIE。俞声获评国家青年拔尖人才,现任JASA Associate Editor。

内容摘要:

电子病历包含患者诊疗过程中的丰富医学信息,通过自动化信息提取并对术语进行标准化,转化为规范的结构化数据,可以为医学研究与临床自动化提供丰富的数据支持、大幅降低人力成本、提高科研数据采集与医院管理效率。然而,真实的临床病历用语高度个性化、存在大量简称和非标准表达,电子病历的结构化、标准化对自然语言处理工具和基础设施都是巨大挑战。本报告将介绍利用大模型中的庞大背景知识,实现电子病历的准确理解,并在其术语抽取的基础上,利用大模型实现大规模数据驱动的医学本体自动化建设。

深度学习赋能的药物发现与开发

符天凡

嘉宾简介:

符天凡,现任南京大学计算机学院副教授,长期从事人工智能赋能的药物发现(AI for Drug)、人工智能赋能的科学发现(AI for Science)方面的研究。他本科硕士毕业于上海交通大学计算机科学与技术系,博士毕业于美国佐治亚理工学院计算机科学与工程系。曾任美国伦斯勒理工学院计算机科学系常任轨道助理教授。2024年12月加入南京大学计算机科学与技术系,入选国家级青年人才项目。他在Nature、Nature Chemical Biology、Nature Machine Intelligence、Nature Scientific Data、Foundations and Trends in Machine Learning、ICML、ICLR、NeurIPS、KDD、TKDE等知名会议和期刊上发表学术论文40余篇。论文被国内外同行广泛引用(谷歌学术引用量达到5000余次),引用者来自斯坦福、麻省理工、哈佛、耶鲁、普林斯顿等国际著名机构,包括中、美、英、加、欧等国/地的20余位科学院/工程院院士和50余位AAAI/ACM/IEEE Fellow。2017年翻译了深度学习(“花书”),销量达50余万册。研究成果应用于多家生物医药企业。他还共同组织了前三届AI for Science研讨会。

内容摘要:

药物设计和开发是一个既漫长又昂贵的过程,涉及从分子发现到临床试验的多个复杂步骤。人工智能(AI)技术展示了巨大的潜力,可以显著加速这一过程并降低成本。在药物发现的初期阶段,目标是识别具备理想药理特性的分子。本报告将深入探讨最新的药物设计方法,包括连续空间深度生成模型和离散空间药物设计路径搜索算法。这些先进的AI工具能够高效地探索化学空间,预测新化合物的活性和安全性,并优化候选药物的设计,以满足特定的治疗需求。进一步讲,在药物开发的后期阶段,重点转向了临床试验,这是评估药物对人体安全性和有效性的重要环节。为了提高临床试验的成功率和效率,本报告将介绍一系列最新的可信赖的方法,包括可解释性、不确定性感知的临床试验设计与预测技术。这些方法不仅能够模拟真实的临床试验过程,还能帮助科学家更好地理解潜在的风险和收益,从而做出更加明智的决策。 

Multivariate Conformal Prediction for Brain Volumetry From Accelerated MRI

Huaqing Jin

嘉宾简介:

Huaqing Jin is an assistant professor in the department of statistic and data science at Tsinghua University. He completed his postdoctoral training at the University of California, San Francisco (UCSF) and earned his PhD degree in statistics from the University of Hong Kong.His research focuses on high-dimensional statistics, change point detection, and Bayesian statistics, with a particular emphasis on applications in neuroimaging data analysis and clinical trials. 

内容摘要:

Accelerated Magnetic Resonance Imaging (MRI) is essential for clinical practice but introduces uncertainty into brain volumetry. We propose a framework combining the semiparametric modelling with Multivariate Conformal Prediction (MCP) to generate statistically-guaranteed prediction sets for brain regions volumes. Our model-agnostic approach provides rigorous uncertainty bounds without making distributional assumptions. Integrating the method with the reconstruction and segmentation algorithms,  a pipeline is developed to construct prediction sets directly from the k-space downsampled MRI measurements. The pipeline is validated on the Alzheimer’s Disease Neuroimaging Initiative (ADNI) dataset, demonstrating its effectiveness. This work provides a practical tool to enhance the reliability of volumetric biomarkers from accelerated MRI scans.

Features fusion or not: harnessing multiple pathological foundation models using Meta-Encoder for downstream tasks fine-tuning

俞章盛

嘉宾简介:

俞章盛,上海交通大学医学院临床研究中心主任,上海交通大学长聘教授、博士生导师,耶鲁大学公共卫生学院生物统计学系客座教授,上海市海外高层次特聘专家,上海市优秀学术带头人。此前,他在密西根大学获得生物统计学博士。他在JAMA, Journal of Hematology and Oncology, Nature Communication,  Biometrika, 等发表论文100余篇,任Statistics in Medicine副主编,Heart Rhythm统计编辑,Pediatric Pulmonology编委。他的统计方法研究包括基于统计及深度学习方法的医疗影像处理与预测模型、生存分析方法、临床试验方法,医学合作研究包括儿童发育,肾脏病,疼痛、肿瘤。

内容摘要:

The emergence of diverse pathological foundation models has empowered computational pathology tasks, including tumor classification, biomarker prediction, and gene expression prediction. However, variations in model architecture and data sources lead to inconsistent downstream performance and complicate centralized training. Specifically, the lack of data sharing makes retraining foundation models with pooled data infeasible. Alternatively, the release of model parameters enables combining multiple models during fine-tuning. Inspired by the meta-analysis method, we propose the Meta-Encoder framework, which integrates features from multiple foundation models to generate a comprehensive representation, improving downstream fine-tuning task performance. Comparative experiments demonstrate that Meta-Encoder is more effective than individual foundation models, with its strengths more pronounced in handling complex tasks. While single models may perform sufficiently well for simple tasks, Meta-Encoder can match or even surpass the best-performing single model, alleviating concerns over model selection. Moderately challenging tasks benefit from Meta-Encoder's concatenation or self-attention strategies, with the latter demonstrating superior performance in more challenging scenarios. For highly complex tasks, such as high-dimensional gene expression prediction, self-attention proves to be the most effective Meta-Encoder strategy, balancing feature integration and computational efficiency. For three patch-level spatial gene expression prediction tasks (HEST-Benchmark, CRC-inhouse, and Her2ST), the self-attentionstrategy improved the Pearson correlation by 38.58%, 26.06%, and 20.39%, respectively, compared to the average performance of three patch-level single models. Similarly, for the TCGA-BRCA, TCGA-NSCLC, and TCGA-CRC WSI-level bulk gene expression prediction tasks, the Pearson correlation increased by 14.36%, 9.27%, and 42.55%, respectively, compared to the average performance of two WSI-level single models. By leveraging multiple pathological foundation models using Meta-Encoder, it can further improve molecular characterization in pathology images to advance precision oncology.

关于会议

本次大会由中国人民大学应用统计科学研究中心、中国人民大学统计学院、统计之都与中国商业统计学会人工智能分会主办,中国人民大学健康大数据研究院协办,并获得明汯投资、宽德投资、Will和Quantverse(数启寰宇)的赞助支持。我们诚挚邀请您来参会,共话智能技术发展前沿!

更多日程信息,详见会议通知:2025 X智能大会 & 第18届中国R会议通知

欢迎进入2025 X智能大会 & 第18届中国R会议官网,获取更多会议信息!

链接:https://www.x-agi.cc/index.html

二维码:

联系方式

公众号:统计之都

会议邮箱:xagi-2025@cosx.org