项目简介
本项目是基于Python的跨语言电子书对齐系统,旨在为非英语母语使用者提供便利。它可将同一本书的中英文epub版本电子书合并成一本,新电子书以一段英文加一段中文的形式交替呈现,有效解决阅读原版英文书时的理解困难问题。
项目的主要特性和功能
- 能实现章节自动匹配、段落自动对齐,准确率超95%。
- 合并后可同时保留两本电子书的注释及其跳转链接。
- 支持自动保存进度,重新启动后能继续运行。
- 理论上支持五十种语言的图书与中文匹配。
- 具备预览功能,可在每个章节对齐后展示对齐内容。
安装使用步骤
环境配置
- Windows系统:提前安装Python3与pip3,若系统python版本>=3.8,可直接使用对应版本。执行以下命令:
bash python3 -m pip install --upgrade pip python3 -m pip install -r requirements.txt
- Linux系统:执行以下命令:
bash sudo apt update sudo apt-get install python3.8 sudo apt-get install python3-pip python3.8 -m pip install --upgrade pip python3.8 -m pip install -r requirements.txt
- Docker运行:执行以下命令:
bash docker image pull troyes233/ebook_aligner docker container run -it troyes233/ebook_alginer
运行程序
将需要合并的两本epub电子书文件(例如book1.epub, book2.epub)放在epubs
文件夹下,运行以下命令:
bash
python3.8 main.py book1.epub book2.epub
详细参数
bash
python3.8 main.py --preview true --load true book1.epub book2.epub
- --preview
:是否打开预览功能,会在每个章节对齐后展示对齐内容,默认开启。
- --load
:是否加载之前的进度,关闭后会重新进行翻译和对齐,默认开启。
处理过程会实时更新进度,根据书的大小和晦涩程度,一般耗费5 - 15分钟完成(有GPU速度会更快)。结果会在当前目录下以bookname_combined.epub
的形式出现。若中途中断,进度会自动保存,重新运行相同命令即可继续执行。
下载地址
点击下载 【提取码: 4003】【解压密码: www.makuang.net】