bcc语料库检索系统_bcc语料库
本文带来了【bcc语料库检索系统】内容供参考阅读,并对相关内容bcc语料库进行了分析,下面就跟随币王网小编一起了解bcc语料库检索系统bcc语料库。
语料库汇总
1.BCC语料库
北京语言大学的BCC汉语语料库,总字数约 150 亿字,包括:报刊(20 亿)、文学(30 亿)、微博(30 亿)、科技(30 亿)、综合(10 亿)和古汉语(20 亿)等多领域语料。
网址:
网站页面如下图:
2.CCL语料库
北京大学中国语言学研究中心的CCL语料库,包括现代汉语语料库、古代汉语语料库、汉英双语语料库(仅限北大校内用户使用)。
网址:
网站页面如下图:
3.语料库在线
功能强大,除了可以实现语料库检索功能以外,还可分析处理语料。语料库检索包括现代汉语语料库、古代汉语语料库、语料库字词索引。语料分析处理包括:分词和词性标注、汉语拼音标注、字词频率统计。
网址:
网址页面如下:
4.澜科语言科技
澜科语言科技语料库包括汉语教材语料库、全球华语语料库、中小学作文语料库、网页分类新闻语料库。
网址:
网站页面如下:
小rainbow
2019.7.25
北京大学语料库
BCC语料库全称为北京语言大学汉语语料库,由北京语言大学信息科学学院大数据与教育技术研究所开发的BCC汉语语料库,总字数约 150 亿字。
包括:报刊(20 亿)、文学(30 亿)、微博(30 亿)、科技(30 亿)、综合(10 亿)和古汉语(20 亿)等多领域语料,是可以全面反映当今社会语言生活的大规模语料库。
CCL语料库全称为北京大学汉语语言学研究中心语料库,它分为“古代汉语”和“现代汉语”两部分,古代汉语语料库收录了自周朝到民国共 15 个朝代的各种体裁的古代汉语语料 1059 个,现代汉语语料库收录现代报刊、文学作品等汉语语料 1696 个。
作文对译语料库该语料库收集了一些日语学习者(母语包括但不仅限于汉语)的作文,一部分有日语老师批改的痕迹。通过这些作文中反映出来的问题,我们对照自身,有则改之无则勉。
青空文库也是我们会经常用到的一个语料库。它收录了很多在日本国内版权到期或者作者允许公开发行的文学作品。不需要注册,可以直接在线观看。
为什么别人能打开bcc语料库我打不开
可能是浏览器的原因,现在是可以打开的,建议您刷新试试。
BCC汉语语料库,总字数约95亿字,包括:报刊(20亿)、文学(30亿)、综合(19亿)、古汉语(20亿)和对话(6亿,来自微博和影视字幕)等多领域语料,是可以全面反映当今社会语言生活的大规模语料库。与CLL相比,BCC包括文学、报刊、微博、科技、古汉语、学生作文等多个领域,其中报刊、文学、微博、科技、古汉语都有20亿以上的规模,各类别分布相对均衡。
语料库指经科学取样和加工的大规模电子文本库,其中存放的是在语言的实际使用中真实出现过的语言材料。

有关bcc语料库检索系统bcc语料库分享到这里,想要阅读更多相关内容请关注币王网。
本文 原创,转载保留链接!网址:https://licai.bangqike.com/lzs/144752.html
1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。








