李涓子,清华大学计算机科学与技术系软件研究所副所长。李涓子于2000年在清华大学获得博士学位,2001年博士后出站后留校工作至今。我的科研工作特点是融合语义Web、文本与社会网络挖掘技术,研究基于语义的内容管理关键技术,并应用于包括新闻、研究者社会网络和Web服务在内的多个领域。主要工作包括:1. 基于语义的内容管理关键技术。在本体映射研究中,提出基于贝叶斯决策的多策略本体映射模型,解决了多种映射策略的融合问题;提出动态选择的多策略本体映射模型,解决了针对不同本体映射任务,动态选择映射策略的问题,并进一步提高了映射精度。研究成果发表在SIGMOD、Journal of Web Semantics(JoWS)和TKDE等国际重要学术期刊和会议上 。据Google Scholar统计,发表在JoWS上的论文被引用73次。在语义标注研究中,针对标注对象所具有的不同特点,研究不同的语义标注方法,提出基于规则、分类模型和序列模型的条件随机场的三类语义标注方法。这些标注方法已经成功应用于研究者个人信息、会议信息和公司信息的语义标注中,取得了良好的应用效果。上述研究工作得到国家自然科学基金和973项目的支持。2. 新闻与社会网络挖掘。在新闻挖掘中,提出基于索引树和命名实体的话题发现和跟踪模型、基于话题的新闻分析模型,研究成果发表在SIGIR 2007,并在SIGKDD 2009上做demo演示;在社会网络挖掘研究中,提出面向专家的研究者社会网络搜索模型,并对专家发现、研究兴趣发现和会议挖掘等问题进行了深入研究。3. 新闻领域XML数据处理应用研究。我是国家标准 “中文新闻信息标识语言(CNML)”(GB/T20092-2006)的第四起草人,并作为项目负责人,承担了CNML标准管理系统的研制任务。目前,该软件部署在新华社文字编辑系统、图片编辑系统、信息部多媒体编辑系统、多媒体数据库、视音频编辑系统、产品生成系统等重要业务系统中,全面满足了技术建设和日常运维的需求。该项目获得“2009年王选新闻科学技术进步二等奖”。