THUOCL清华大学开放中文词库
香港
免费 我要科研 数据库 网站网页
THUOCL清华大学开放中文词库

THUOCL(THU Open Chinese Lexicon)是由清华大学自然语言处理与社会人文计算实验室整理推出的一套高质量的中文词库,词表来自主流网站的社会标签、搜索热词、输入法词库等。

标签:

网站介绍


页面预览

THUOCL清华大学开放中文词库

详细介绍

THUOCL(THU Open Chinese Lexicon)是由清华大学自然语言处理与社会人文计算实验室整理推出的一套高质量的中文词库,词表来自主流网站的社会标签、搜索热词、输入法词库等,为自然语言处理等领域提供丰富的词汇资源。网站包含多个领域的中文词表,如 IT、财经、成语、地名、历史名人、诗词、医学、饮食、法律、汽车、动物等。

使用指南

在网站“词库简介”“词库清单”等板块可查看各领域词表的详细介绍,熟悉词库的构成和特点,确定所需词表。若有需要,可点击下载链接进行词表下载。

特点

1.该词库涵盖多个领域的词表。
2.该词库经过多轮人工筛选,词库的准确性较高。

                       

相关导航