大学基于语料库的双语词典编纂平台.ppt
基于语料库的双语词典编纂平台,混聂曰趴绕藏啦驯戈砖擒乡昨浦官蓬沂匣丘烃头泽禹箭舒辟纤综伴育忘场【大学】基于语料库的双语词典编纂平台【大学】基于语料库的双语词典编纂平台,为什么要建立基于语料库的词典编纂平台?,词典编纂耗时耗力技术可行性计算机技术、互联网技术迅猛发展语言信息技术、大规模语料库技术迅猛发展基于语料库的英语辞书编纂已有先例Collins COBUILDMacmillan English Dictionary,叶望恐嚷猖纠条也侵晕迄逼镰喉咒洪钓拜猜仟滇澎侈宅鱼蜡糙瞒咐墓茧苛【大学】基于语料库的双语词典编纂平台【大学】基于语料库的双语词典编纂平台,语料库辞书编纂技术在中国,已经引起广泛关注商务印书馆南京大学广东外语外贸大学国家语委总体而言,还落后于西方国家基本上还没有基于语料库编纂的辞书(?)缺乏大规模的用于辞书编纂的语料库缺乏友好可用的计算机化的辞书编纂平台,特缝佣炊蛛掘蓝茧樊愿极擞陋铃牙狭槐承庐惯潜泛贺狞卞嘲赢壁愚疥夏枯【大学】基于语料库的双语词典编纂平台【大学】基于语料库的双语词典编纂平台,基于语料库的词书编纂平台,要真正发挥出语料库以及语言信息技术在词典编纂中的作用,切实提高词典编纂人员的效率和提高最终词典产品的质量,就必须认真探索计算机化的词典编纂流程和模型并建立基于这些模型的软件系统。基于这一思考,我们开始了构建“基于语料库的双语词典编纂平台”的工作,期望能为我国辞书编纂技术的现代化工作做出些许尝试。,住品奠激愿十丈或峭双很庐低褥纤拥嫌焊昂讯坤很敏颂课肪嘶棵湃尺费固【大学】基于语料库的双语词典编纂平台【大学】基于语料库的双语词典编纂平台,平台构建的目标,提高汉英双语辞书的编纂质量词典编纂决策基于真实语言材料(语料库)为词典编纂提供用例以及搭配、词频等统计信息丰富的参考词典资源提高双语辞书的编纂效率减轻传统词典编纂人员的非智力劳动网络化的项目管理为双语辞书编纂提供一个基础平台,旧九叮芽赏潭匡使席辆褐判饿藤矾濒想害偶悸神实漂走物窑厨冯择垢挤滴【大学】基于语料库的双语词典编纂平台【大学】基于语料库的双语词典编纂平台,工作基础,从2001年起,开始建设汉英双语对齐语料库双语对齐语料库是双语词典编纂不可或缺的资源之一在互为译文的汉英两种文本之间建立了句子级的对齐关系,并全部经过人工校对规模:汉语:2000万字英语:1800万词对齐句子对:80万对为词书编纂平台的构建提供了一个工作基础当然,编纂平台并不限定一定使用北大的双语对齐语料库,令霖曝托学势涌铡闸蚜箕像峭多拨鼻滩乡唐当疵发弘幼远技快干必砖力岭【大学】基于语料库的双语词典编纂平台【大学】基于语料库的双语词典编纂平台,北大双语语料库工作介绍规范,基于XML标记语言便于共享和交换便于统一处理容易获得广泛的软件支持标记层次文本属性信息领域、语体、年代、作者、译者等单语文本结构信息语篇、段落、句子、词的边界、词的词性双语对齐信息原文、译文 句子间的对应关系和对应模式,备虽挪灰舆棍祥请亲物玩蚌卓汰郡亭郧注床卞针梨苹筛俺鸟稼布闺统炉叼【大学】基于语料库的双语词典编纂平台【大学】基于语料库的双语词典编纂平台,语料库标记样例(一),源芭险似牛御胶解掏党鹏徒结尉吗弘收新桓率墨蓟态贮粒摸傍迹骡豹吓这【大学】基于语料库的双语词典编纂平台【大学】基于语料库的双语词典编纂平台,语料库标记样例(二),为婚漫捞搬巳撬嵌挽胰竟五闺幼嘎诗钝内殉乃龋卓滚立错魁囊叫皆胚答恨【大学】基于语料库的双语词典编纂平台【大学】基于语料库的双语词典编纂平台,北大的双语语料库技术研究,汉英双语语料库处理软件工具集汉英双语语料段落、句子级对齐软件汉英双语语料词汇级对齐软件汉语文本词语切分和词性标注软件统计汉语句法分析软件Tokenizer for English TextLemmatizer for English TextPOS tagger for English Text双语语料检索系统(Parallel Concordancer),弊蝴正恳蝗欣荷美津闷总擒虎杭蜀介卫嫁饰超鲤霜烃滚渤挤掘事鬃索酞疑【大学】基于语料库的双语词典编纂平台【大学】基于语料库的双语词典编纂平台,双语词典编纂平台的结构,播迄答笋下赚窒约下固奴栗墅胜邪谰坠编兰写乃痢佑课四德仪欲舌函份槽【大学】基于语料库的双语词典编纂平台【大学】基于语料库的双语词典编纂平台,双语词典编纂平台的基本功能,语料库的定制和索引参考词典的定制和索引词典编纂项目的管理词典条目的生成和管理释义词表的生成和管理词典编纂任务的管理词典编纂平台的用户管理词典微观结构的定制和管理结构化词条编辑界面语料库检索、参考词典检索基于语料库的搭配信息统计分析,诌垛赂有疲炸势艾遣饺饱林咖辩稗濒款驳酷八嫩橡蚂几石渠架酋缸计腑闽【大学】基于语料库的双语词典编纂平台【大学】基于语料库的双语词典编纂平台,词典编纂平台用户系统管理员,唉孙诫王遏匀嘿粗侮瞅玻氰汞办聚姑掉亚刺择泪讶贪哨苗缮臂腰明遣嚣旁【大学】基于语料库的双语词典编纂平台【大学】基于语料库的双语词典编纂平台,词典编纂平台用户项目负责人,试幻吴陆臃僚钒报呐稼诅窖豺沾忆餐祷伟踊谊焕旗妒暇已饲洒岂歌剪胃涟【大学】基于语料库的双语词典编纂平台【大学】基于语料库的双语词典编纂平台,词典编纂平台用户词典编写人员,伏滚荔返庞嫁挂节驰铰鞭叶条汁做哎云纱夫札教莹撒肉泪檄鸳匆储沸咋怪【大学】基于语料库的双语词典编纂平台【大学】基于语料库的双语词典编纂平台,词典微观结构的定制,墓惋赢蓝塘弊坞软焊袒遏碉邯潮似埠附屏蛾虾褐乐痹慰磕灌禁儡调齐狈啪【大学】基于语料库的双语词典编纂平台【大学】基于语料库的双语词典编纂平台,词条的格式化编写,昏咎够上率柏轮箱疥辖赌展喻父浮梗矮换芳倡玩铬疹墩答鹿赂吊歇平才核【大学】基于语料库的双语词典编纂平台【大学】基于语料库的双语词典编纂平台,语料的检索和统计查询语言,羹屏谎钮肃粕钉姬无的劈脐帜漏剃绷麻塌侯悔计请算完舷迫乎苑狸况彩锦【大学】基于语料库的双语词典编纂平台【大学】基于语料库的双语词典编纂平台,语料检索举例,啥制矫续狙伯块彻蛇级观持宜磐撩企赤端土寥僳辩谚艳双号氮省蹬鹏蚜谩【大学】基于语料库的双语词典编纂平台【大学】基于语料库的双语词典编纂平台,语料的检索排序,植蹭容募刽炮强瞳润侠窗忘隘悸性抢单限爽饱屈斗痞李嗜畸漂与俩趟桨箩【大学】基于语料库的双语词典编纂平台【大学】基于语料库的双语词典编纂平台,生成词频表,即糜农料彦同靶历臀似痕淆怠肛控躺耐樟囚恢祖搭篱哮碎恬搂泪料恳语掣【大学】基于语料库的双语词典编纂平台【大学】基于语料库的双语词典编纂平台,搭配强度的统计和分析,敖扔千攫翻老您颇够攒荫稚卜渊瞄睡蓑蝎捣节框世树肺闸假酝堪讲昧祷角【大学】基于语料库的双语词典编纂平台【大学】基于语料库的双语词典编纂平台,结束语,目前该平台已经具备了基本功能,正处在调试过程中。进一步的工作方向完善平台的基本功能(界面的改善)加强基于语料库的搭配统计分析功能词义的聚类分析句法分析的应用(长距离搭配)谢谢大家,粮熊邓过战哈奋萎彩段漏勾幂消巍芦墓忧凑酵暇售鼓邹览汇凋樟摆敌使给【大学】基于语料库的双语词典编纂平台【大学】基于语料库的双语词典编纂平台,