关于AI拍照搜题的一些想法
今天一起體驗作業(yè)幫“拍照搜題”功能,從實際產(chǎn)品使用流程中切實感受AI技術(shù) 如何為教育創(chuàng)造更多可能~
??作業(yè)幫是一款以“拍照搜題”為核心功能的在線教育產(chǎn)品,該功能的實現(xiàn)主要運(yùn)用了OCR和深度學(xué)習(xí)技術(shù),故本文圍繞該項功能的體驗,結(jié)合簡要的技術(shù)分析,領(lǐng)略作業(yè)幫化身“AI小叮當(dāng)”的魅力,話不多說,開始本期的旅程吧~
?
可見,作業(yè)幫的主要用戶可分為學(xué)生、家長及老師,其中以學(xué)生群體為主。?
??我們可以很清楚地看到,作業(yè)幫作為一個K12階段相對成功的在線教育產(chǎn)品,依托于人工智能技術(shù)的發(fā)展,為廣大的學(xué)生、家長和老師帶來了便利。
?
#而對于家長而言,作業(yè)幫的拍照搜題幫助他們緩解了自身文化程度不高無法輔導(dǎo)孩子的無力感,同時幫助工作忙的家長節(jié)省了時間,也替經(jīng)濟(jì)條件有限的家長省了錢。
#而對教師用戶而言,作業(yè)幫也為他們價值和利益最大化提供了一個平臺。
#對作業(yè)幫而言,拍照搜題的提出,是迎合AI時代對教育的一種創(chuàng)新,同時為計算機(jī)視覺技術(shù)的落地提供了良好的落地契機(jī),為傳統(tǒng)教育的改革帶來了新的方向。
????算法、技術(shù)可以有千千萬萬種,用戶可能遍布天涯海角,但作為一個產(chǎn)品,尤其是工具類的產(chǎn)品,如果本身核心功能不夠出眾,或在后續(xù)的完善中偏離了核心功能軌道,只有死路一條。而從人工智能發(fā)展的角度來看,算法準(zhǔn)確率的提升和優(yōu)化是一個不均衡的過程。
比如,起步的時候,可能隨便加大訓(xùn)練數(shù)據(jù)數(shù)量或者是調(diào)整學(xué)習(xí)參數(shù)或訓(xùn)練的方式,算法提升的效果就很明顯,因為說到底,所謂的人工智能,還是利用了計算機(jī)超強(qiáng)的存儲及快速暴力求解的能力。
但隨著不斷地推進(jìn),面對的數(shù)據(jù)越來越復(fù)雜、用戶場景越來越多、需求越來越豐富,算法還想提升,哪怕那么一個百分點,都是十分困難的,這也是所有人工智能類產(chǎn)品在迭代進(jìn)程中都會面臨的問題。
但是我們從作業(yè)幫拍照搜題的識別越來越準(zhǔn)確,用戶體驗也越來越好,可以看到作業(yè)幫一直在堅持后臺算法的迭代和優(yōu)化,這種對初衷的堅持是算法之外更可貴的產(chǎn)品精神。
?
從中可見,在拍照的過程中,做出了兩個比較明顯的限制。
第一個是橫屏拍照,保持題目處于圖片的特定區(qū)域,其目的在于減少后續(xù)識別算法處理的難度。其次是對拍攝燈光的要求,因為當(dāng)光線較暗時,圖片不夠清晰,則后期的文字識別會出問題,不利于最終的識別準(zhǔn)確率。
這是用戶體驗和算法準(zhǔn)確性之間的一種權(quán)衡,更人性化的產(chǎn)品設(shè)計提倡,盡量減少對用戶的要求,增加用戶使用的自由性。
然而對于人工智能算法類的產(chǎn)品設(shè)計而言,其準(zhǔn)確率的獲得往往需基于一定的前提,一旦打破這些限制,算法識別的效果可能就會十分差勁,則會帶給用戶更糟糕的影響。
因此,這可能是因為系統(tǒng)基于OCR和深度學(xué)習(xí)的方法,主要對文字切割進(jìn)行處理,但是對圖像特征的處理比較欠缺,所以檢索效果較差。
則上述問題的解決,可通過多種技術(shù)方案融合,應(yīng)對不同用戶場景需求的特定任務(wù)處理,增強(qiáng)算法應(yīng)用的魯棒性,減少算法失靈的情況,這應(yīng)當(dāng)也是未來人工智能產(chǎn)品落地的一個重要關(guān)注點。
最后,還有一個小問題,有時拍攝上傳數(shù)學(xué)類的題目,返回的結(jié)果中可能還包含物理、化學(xué)、英語等結(jié)果,我們將這類錯誤姑且稱之為跨學(xué)科錯誤。
這也是可以理解的,因為算法更關(guān)注于對拍攝題目的文字識別,并在之后以文字特征的相近性作為主要指標(biāo),進(jìn)行搜索結(jié)果返回。如此,只要題目描述和題庫文本更相似就會作為結(jié)果返回,卻忽略題目類別的考慮。
關(guān)于這個問題的解決,或許可以考慮,在識別的過程中,增加類別標(biāo)簽,如拍攝題目上傳之后,可以通過用戶設(shè)定題目類標(biāo)簽。比如:屬于語文、數(shù)學(xué)、英語等,則上傳之后在特定的范圍檢索,這一方面可以提高算法檢索的效率,另一方面也可以減少跨學(xué)科返回的錯誤。
改進(jìn)算法,實現(xiàn)對書面與手寫體的精準(zhǔn)識別也顯得至關(guān)重要。
總結(jié)
以上是生活随笔為你收集整理的关于AI拍照搜题的一些想法的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: unityios开发--加载视频以及加载
- 下一篇: 22套精美的网页按钮图标设计推荐(包括P