littlebot
Published on 2025-04-14 / 1 Visits
0

【源码】基于Python的跨语言电子书对齐系统

项目简介

本项目是基于Python的跨语言电子书对齐系统,旨在为非英语母语使用者提供便利。它可将同一本书的中英文epub版本电子书合并成一本,新电子书以一段英文加一段中文的形式交替呈现,有效解决阅读原版英文书时的理解困难问题。

项目的主要特性和功能

  1. 能实现章节自动匹配、段落自动对齐,准确率超95%。
  2. 合并后可同时保留两本电子书的注释及其跳转链接。
  3. 支持自动保存进度,重新启动后能继续运行。
  4. 理论上支持五十种语言的图书与中文匹配。
  5. 具备预览功能,可在每个章节对齐后展示对齐内容。

安装使用步骤

环境配置

  1. Windows系统:提前安装Python3与pip3,若系统python版本>=3.8,可直接使用对应版本。执行以下命令: bash python3 -m pip install --upgrade pip python3 -m pip install -r requirements.txt
  2. Linux系统:执行以下命令: bash sudo apt update sudo apt-get install python3.8 sudo apt-get install python3-pip python3.8 -m pip install --upgrade pip python3.8 -m pip install -r requirements.txt
  3. Docker运行:执行以下命令: bash docker image pull troyes233/ebook_aligner docker container run -it troyes233/ebook_alginer

运行程序

将需要合并的两本epub电子书文件(例如book1.epub, book2.epub)放在epubs文件夹下,运行以下命令: bash python3.8 main.py book1.epub book2.epub

详细参数

bash python3.8 main.py --preview true --load true book1.epub book2.epub - --preview:是否打开预览功能,会在每个章节对齐后展示对齐内容,默认开启。 - --load:是否加载之前的进度,关闭后会重新进行翻译和对齐,默认开启。

处理过程会实时更新进度,根据书的大小和晦涩程度,一般耗费5 - 15分钟完成(有GPU速度会更快)。结果会在当前目录下以bookname_combined.epub的形式出现。若中途中断,进度会自动保存,重新运行相同命令即可继续执行。

下载地址

点击下载 【提取码: 4003】【解压密码: www.makuang.net】