如何把表格做成源代码_他来了,他来了,文字、表格、公式图片识别神器V0.1测试版...
他來了,他來了,Mathpix拜拜了~~~
文字、表格、公式圖片識別神器V0.1測試版
俺不是標題黨!!!
開發背景
日常工作中經常遇到大量的圖片版文本、表格、公式需要編輯;
用手敲?也太OUT了吧,好歹咱也是個Python全棧。
2018年就開始比較各大廠的文字識別API,
BAT+H,4家的文字識別相差無幾,
表格識別,百度遙遙領先,如果給百度90分,其他3家是不及格的。
很長一段時間,沒有找到能夠替代Mathpix這個歪果產品,
從github找到tensorflow的源代碼,可惜功力不夠,無法逆向。
這不,本已放棄了自己搞公式識別,
采用InftyReader.exe這個日本軟件配合美帝的Mathpix,
勉強可以免費識別日常的工作量。
2020年4月,無意中發現百度終于開放了公式識別的API,
也不知道和我去年在百度的留言是否有關(當時鄙視了一下大廠的AI技術不接地氣)。
開發過程
2020年之前一直在用百度的文字識別API,
當然,只是在Jupyter中僅供自己使用,
也曾想過做成微信小程序,但看著微信小程序中琳瑯滿目的同型產品,
還是果斷的放棄了!
如今百度公式識別的API出來了,竟讓我又燃起做一個小工具的想法,
拿起鍵盤就是個干!
哼哧,哼哧的擼了200來行代碼,測試了十來次,大體可行:
好久不用tkinter做win桌面應用,還是遇到了不少BUG,
不過,相較于后面打包遇到的BUG,前端UI都不是個事,
具體體現在:
1.conda這個奇葩雖然生猛,但是用Pyinstaller打包,一個小小的工具,竟然300M。
2.重新安裝一個版本的Python,新建虛擬環境,結果約到pip不能升級的問題。
3.再次打包,遇到Pyinstaller打包報錯Failed to execute script pyi_rth_pkgres。
4.都懶得改應用的圖標了,測試版就先這樣吧。畢竟它實現了既定的3個識別功能。
下載鏈接:
鏈接:https://pan.baidu.com/s/1N1qu3teQZunA55eCkejGdw 提取碼: saph
BUG參考文檔:
解決Python 3.6使用pip時Unable to locate finder for pip._vendor.distlib的問題?
Pyinstaller打包報錯Failed to execute script pyi_rth_pkgres
總結
以上是生活随笔為你收集整理的如何把表格做成源代码_他来了,他来了,文字、表格、公式图片识别神器V0.1测试版...的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: mysql日期为00_MySQL 8.0
- 下一篇: Node.js Event loop 图