在高强度冲浪,总会看到一些漫画内容不是中文的时候,通常只能等待大佬们进行汉化翻译,或者主动一点利用翻译软件自己进行漫画内容翻译(例如有道词典等OCR翻译),但翻译效果都不是很好。但作为高级程序员(API调用员),我们可以借助图像识别、文字提取等工具+文字翻译来帮助我们实现图片翻译的效果。
在Github
上一整翻找发现了一个开源的翻译图片内文字的工具,亲测效果不错,且开箱即用,下面就来记录一下如何安装和使用把。
安装
首先根据官方文档介绍,需要依赖Python3.8版本及以上,因此我们需要确保自己电脑有安装Python,由于我电脑上已经安装好了,这里就不记录怎么操作了,简单来说就是去官网找到最新稳定版的Python版本,随后一路Next即可。
Python安装路径:Download Python | Python.org
项目本体
确认好Python环境后,就可以开始clone项目了,执行如下操作
1 | // 克隆项目 |
Pytorch
如果一切正常,我们就可以执行下一步Pytorch
的安装了,这是一个Python
语言图像识别通常会用到的框架,可以针对GPU
来进行加速运算。
通常我们电脑都是有NVDIA英伟达的显卡,因此我们通常选择运算平台为CUDA的某个版本,如果没有就只能选择CPU版本了。
PS:CUDA是一种由NVIDIA推出的通用并行计算架构,通过利用GPU的运算能力,大幅提高计算性能。
在我们选择对应的CUDA版本时,可以先看下自己英特尔显卡所支持的版本,以Windows系统为例,在cmd命令行中输入nvidia-smi
,就可以查看到Driver Version
属性了,然后在根据Pytorch官网的版本表比对一下即可。
像我这里的版本是537.42,通过对照表可知所有版本都支持,因此直接选择最新的CUDA11.7版本下载即可。
- 下载路径:PyTorch
- 版本对照表:CUDA 12.2 Release Notes — cuda-toolkit-release-notes 12.2 documentation (nvidia.com)
安装好后可以检测一下是否成功,在python命令行中通过torch.cuda.is_available()
来判断,如果为true则安装正常。
1 | // 进入python命令行 |
测试一下
如果上面安装都正常后,就可以来尝试一下拉,具体的操作方法这里就不水了,可以查看官方文档更加详细,唯一需要注意就是如果你的pytorch为CPU版本,则启动脚本时不要加上--use-cuda
即可,可以看到图片文字效果还是不错的,文字翻译的效果取决于你选择的翻译API,如果有条件可以选择效果更好的GPT、Deepl等API。
1 | // 输出图片会放在项目的result文件夹中 |