纯干货!文字识别在高德地图数据生产中的演进
前言
豐富準確的地圖數據大大提升了我們在使用高德地圖出行的體驗。相比于傳統的地圖數據采集和制作,高德地圖大量采用了圖像識別技術來進行數據的自動化生產,而其中場景文字識別技術占據了重要位置。商家招牌上的藝術字、LOGO五花八門,文字背景復雜或被遮擋,拍攝的圖像質量差,如此復雜的場景下,如何解決文字識別技術全、準、快的問題?本文分享文字識別技術在高德地圖數據生產中的演進與實踐,介紹了文字識別自研算法的主要發展歷程和框架,以及未來的發展和挑戰。
一 背景
作為一個DAU過億的國民級軟件,高德地圖每天為用戶提供海量的查詢、定位和導航服務。地圖數據的豐富性和準確性決定了用戶體驗。傳統的地圖數據的采集和制作過程,是在數據采集設備實地采集的基礎上,再對采集資料進行人工編輯和上線。這樣的模式下,數據更新慢、加工成本高。為解決這一問題,高德地圖采用圖像識別技術從采集資料中直接識別地圖數據的各項要素,實現用機器代替人工進行數據的自動化生產。通過對現實世界高頻的數據采集,運用圖像算法能力,在海量的采集圖片庫中自動檢測識別出各項地圖要素的內容和位置,構建出實時更新的基礎地圖數據。而基礎地圖數據中最為重要的是POI(Point of Interest)和道路數據,這兩種數據可以構建出高德地圖的底圖,從而承載用戶的行為與商家的動態數據。
圖像識別能力決定了數據自動化生產的效率,其中場景文字識別技術占據了重要位置。不同采集設備的圖像信息都需要通過場景文字識別(Scene Text Recognition,STR)獲得文字信息。這要求我們致力于解決場景文字識別技術全、準、快的問題。在POI業務場景中,識別算法不僅需要盡可能多的識別街邊新開商鋪的文字信息&#
總結
以上是生活随笔為你收集整理的纯干货!文字识别在高德地图数据生产中的演进的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 喜欢产品小师妹?你必须知道的一点产品知识
- 下一篇: Flink从入门到精通100篇(二十一)