4月27日,科研处联合医学信息学院举办的第八十一期博士论坛在医学信息学院会议室举行。学院专兼职教师以及部分硕士研究生参加了此次论坛。论坛由医学信息学院副院长叶明全主持。
黎青青博士以“基于机器学习和转录组高通量数据的疾病状态预测研究”为题作学术报告。目前,传统的数据处理算法已不能满足大数据的处理要求,机器学习作为从数据中进行学习的算法可以对不同组学来源(如基因组学、转录组学、蛋白质组学等)的数据进行综合分析。该报告以发表于“Journal of Translational Medicine”的论文“XGBoost-based and tumor-immune characterized gene signature for the prediction of metastatic status in breast cancer”为例,介绍了机器学习算法在疾病分类预测、生物标志物发现、通路分析中的应用。该研究构建了一个准确的、稳健的预测乳腺癌转移情况的基因子集,并使用基于该基因子集的XGBoost模型预测了乳腺癌患者的转移情况,分类预测准确性较之前的研究显著提高。同时,选取的用于分类预测的信息基因数目大幅度减少,有利于进行分子机制研究和应用到临床诊断。
论坛现场
黎青青,女,理学博士。目前主要研究方向生物信息学、计算生物学、多组学高通量测序数据分析等。硕博连读于中国科学技术大学生物物理学专业,获生物学专业博士学位。参与国家自然科学基金项目4项,主持安徽省教育厅高等学校科研计划自然科学重点项目1项、重大疾病非编码RNA转化研究安徽普通高校重点实验室开放课题1项,发表SCI收录期刊论文9篇,其中第一作者/通讯作者5篇。
(梅雅欣、黎青青/文、摄 刘影/审)