项目简介
本项目借助共词分析方法处理从CNKI(中国知网)下载的文献数据,得到文献关键词的层次聚类结果,为研究人员快速把握领域内研究热点和趋势提供便捷工具支持。
项目的主要特性和功能
- 数据预处理:读取CNKI导出的文献数据并进行预处理与清洗。
- 共词分析:计算关键词关联性,生成共词矩阵。
- 层次聚类:运用层次聚类算法对关键词聚类,得到不同研究领域主题分类。
- 参数配置:提供多种配置参数,如停用词、最小词频、聚类数量等,适应不同研究需求。
- 结果输出:输出清晰简洁的关键词聚类结果,便于研究人员理解分析。
安装使用步骤
- 已下载本项目的源码文件。
- 安装依赖库:确保已安装Python及相关依赖库(如
numpy
,pandas
,scikit-learn
等)。 - 配置参数:编辑
config.py
文件,设置输出路径、停用词列表、最小词频等参数。 - 准备数据:将从CNKI导出的文献数据(
.txt
格式)放入/cnki
文件夹中。 - 运行脚本:执行
main.py
脚本,开始数据预处理、共词分析、关键词聚类的过程。 - 查看结果:查看输出的关键词聚类结果,进行分析和解读。
下载地址
点击下载 【提取码: 4003】【解压密码: www.makuang.net】