littlebot
Published on 2025-04-02 / 4 Visits
0

【源码】基于Python的文本信息抽取系统EBoby

项目简介

本项目是一个基于Python的自然语言处理系统,专注于文本信息的抽取。它提供了文本摘要、关键词抽取和实体抽取等功能,通过HTTP接口与用户进行交互,适用于需要从大量文本数据中提取关键信息的场景。

项目的主要特性和功能

主要特性

  • 文本摘要抽取:从长文本中提取关键信息,生成简洁的摘要。
  • 关键词抽取:识别并提取文本中的关键单词或短语。
  • 实体抽取:从文本中抽取人名、地名、机构名等实体信息。
  • HTTP接口:通过HTTP POST请求与系统进行交互,方便集成到其他应用中。

功能细节

  1. 文本摘要抽取
    • 接口URL: /summary
    • 请求方法: POST
    • 请求参数: data(待处理的文本数据),可选参数n(摘要句数)
    • 返回结果: 摘要信息
  2. 关键词抽取
    • 接口URL: /keyWord
    • 请求方法: POST
    • 请求参数: data(待处理的文本数据),可选参数n(返回的关键词个数)
    • 返回结果: 关键词信息
  3. 实体抽取
    • 接口URL: /st
    • 请求方法: POST
    • 请求参数: data(待处理的文本数据)
    • 返回结果: 包含人名、地名、机构名等实体信息的列表

安装使用步骤

安装步骤

  1. 下载源码:将项目源码下载到本地。
  2. 构建Docker镜像(可选): bash cd /home cd eboby docker build -t eboby .
  3. 启动服务: bash docker run -d -v /home/eboby/:/mnt/eboby/ -p 9000:5000 eboby sh /mnt/eboby/app.sh

使用步骤

  1. 发送HTTP请求:使用工具如curl或编程语言中的HTTP库,向系统的接口发送POST请求,请求体中包含待处理的文本数据。 bash curl -i -X POST \ -H "Content-Type:application/json" \ -d '{"data":"七牛云是国内企业级云服务商..."}' \ 'http://ip:9000/summary'
  2. 接收处理结果:服务端处理请求后,返回相应的摘要、关键词或实体信息。

下载地址

点击下载 【提取码: 4003】【解压密码: www.makuang.net】