登录 注册 科学数据库门户
首页 资源列表 资源提供 联盟会员 常见问题 服务公告 联系我们 多模态情感竞赛 科学数据库
EN-CN
服务公告    

      2008年北京奥运会的多语言服务系
 统的研发采用了面向奥运的中英日
  三语语料库(汉英部分)和面向奥运
  的中英日三语语料库进行系统训练。

    中国科学院自动化所的嵌入式语音合

  成系统采用了CASIA汉语疑问句语
  库、CASIA汉语情感语料库、CASIA
  -863语音合成语料库、ASCCD-汉语
  普通话朗读语篇语料库、CADCC-汉
  语普通话自然口语对话语料库等中文
  信息资源作为开发系统的训练语料。

联系方式    
联系人: 孙梦伊 女士
单  位:

北京市 海淀区 中关村东路 95号 邮编:100190
智能化大厦707室,中文语言资源联盟

电  话: 86 10 82544649
E-mail: service@chineseldc.org
中文语言资源联盟简介
  • 中文语言资源联盟,英文译名Chinese Linguistic Data Consortium,缩写为CLDC。 CLDC是由中国中文信息学会语言资源建设和管理工作委员会发起,由中文语言(包括文本、语音、文字等)资源建设和管理领域的科技工作者自愿组成的学术性、公益性、非盈利性的社会团体,其宗旨是团结中文语言资源建设领域的广大科技工作者,建成代表中文信息处理国际水平的、通用的中文语言语音资源库。为中文信息处理等基础研究和应用开发提供支持,促进技术...[详细]
  • 热门资源 更多..
    服务公告 更多..
    新到的资源如下:
    资源检索
    用户手册  

    由于中文信息基础资源库的语料众多,应用的领域也各不相同,使用方法也是各有特点。但是,对于每一个语料库,中文信息基础资源平台都提供标准信息给用户参考。当用户在网页中选中一个自己需要的语料库,点击进入后,页面中会显示该语料库的简介,并且在页面下方包含四项标准内容:
    资源介绍、标注规范、技术文档和实例下载。资源介绍中包含的标准信息有:资源名称、资源简述、单位名称、开发时间、资源规模;
    标注规范中包含的标准信息有:
    资源简介、数据校对规则、标注工具、标注信息、标注规则、标注注意事项;
    技术文档中包含的标准信息有:
    资源名称、资源持有者、资源创建时间、资源建立目的、语料库结构、技术参数、执行标准;实例下载提供语料库规模5%左右的数据作为提供给用户免费下载。

    常见问题 更多
  • 中文语言资源联盟是一个非盈利性组织吗?
  • 中文语言资源联盟是一个独立法人团体吗?
  • 中文语言资源联盟的财务是独立的吗?
  • 中文语言资源联盟的宗旨是什么?
  • 一般用户和中文语言资源联盟会员有什么区别?
  • 版权所有:中国科学院自动化研究所   备案序号:京ICP备14019135号-14

    本数据库由中国科学院十二五信息化建设专项“数据应用环境建设和服务”项目提供支持