共计 752 个字符,预计需要花费 2 分钟才能阅读完成。
【导语】:将图片中的公式变成 LaTeX 格局。
简介
image-to-latex 是一个能将 LaTeX 数学方程的图像映射到 LaTeX 代码的应用程序。
Yuntian Deng 等人在 2016 年提出并尝试了 image-to-markup 的问题。他们通过解析来自 arXiv 的 LaTeX 论文起源,提取了大概 10 万个公式。他们应用 pdflatex 渲染公式并将渲染的 PDF 文件转换为 PNG 格局。在他们的模型中,首先应用 CNN 来提取图像特色。而后应用 RNN 对特色行进行编码。
最初,编码特色由 RNN 解码器应用。该模型共有 948 万个参数。最近,Transformer 在很多语言工作上都超过了 RNN,所以作者在这个问题上进行了新的尝试。
我的项目地址:
https://github.com/kingyiusue…
下载安装
装置
将源代码 clone 到本地文件夹:
git clone https://github.com/kingyiusuen/image-to-latex.git
cd image-to-latex
创立名称为 venv 的虚拟环境,并装置所需的包:
make venv
make install-dev
数据预处理
运行以下命令下载 im2latex 数据集并进行所有预处理,图像裁剪步骤可能须要一个多小时。
python scripts/prepare_data.py
部署
创立 API 以应用经过训练的模型进行预测。应用以下命令启动并运行服务器:
make api
能够通过 http://0.0.0.0:8000/docs 上生成的文档查看 API 的应用办法。
模型架构
运行例子
开源前哨
日常分享热门、乏味和实用的开源我的项目。参加保护 10 万 + Star 的开源技术资源库,包含:Python、Java、C/C++、Go、JS、CSS、Node.js、PHP、.NET 等。
正文完