药学院和GHDDI开放药物研发资源
刘永生
清华大学/生物与新医药
清华大学人工智能研究院联合RealAI研发并推出“新冠肺炎疫情AI话题分析平台”,帮助用户随时“触手可得”疫情最新变化。
“新冠肺炎疫情AI话题分析平台”通过对多渠道海量媒体信息进行自动抓取采集、识别分析,解决了传统信息检索过程中因消息源头繁杂、消息过多、检索意图不明确而产生的困扰。同时,基于大数据分析和AI建模,自动识别出近期热点话题、新闻追踪和话题导向、地区关注度变化,为用户第一时间推送全网话题最新动态,满足用户对疫情舆情监测的需求,为作出正确舆论引导提供分析依据。
该平台已正式上线“全国热门速递”内容板块,包括“全国热门话题”“热点地区排行”“实时热点话题排行”“最近三天热点排行”“官方发布消息”“关于热点话题的热点信息”等具体模块。该板块基于国家及各省市卫健委与官方媒体平台上的公开发布新闻,结合公众资讯兴趣,实时更新全网最近一天与最近三天的TOP10疫情话题热榜,多维度动态展示公众关注的热门话题与舆论趋势。
在底层算法支持上,该平台基于清华大学人工智能研究院、计算机系推出的WarpLDA主题提取算法研发。基于蒙特卡洛EM算法,WarpLDA在访存效率、并行度方面相比传统的Gibbs采样算法更有优势,可用于上亿级别文本的主题提取。