“互联网+”大学生创新创业大赛产业命题赛道命题方向分析
圖1 大賽產(chǎn)業(yè)命題賽道部分命題
?????????如圖1所示,產(chǎn)業(yè)命題賽道就好比命題作文,選題都是一些真實(shí)企業(yè)(如華為)提前定好的,參賽選手必須在命題要求的范圍內(nèi)按照要求進(jìn)行準(zhǔn)備。
? ? ? ? 這些命題直觀上令人感覺(jué)到十分前沿,大部分都要求應(yīng)用新技術(shù),如區(qū)塊鏈等,頗具難度。
? ? ? ? 作者對(duì)命題方向的分布十分感興趣,于是爬取了所有命題題目,并對(duì)其進(jìn)行分詞,然后計(jì)算詞頻,并進(jìn)行可視化呈現(xiàn),直觀準(zhǔn)確地獲得了命題方向的大概分布情況。
1 整體思路
?
?圖2 整體思路流程圖
?2 項(xiàng)目實(shí)施
2.1 爬取題目
import requests from lxml import etree import pandas as pd import jieba import matplotlib.pyplot as pltword_list = [] # 用來(lái)儲(chǔ)存分好的詞 stopword_list = [] # 停用詞列表,用來(lái)排除分好的詞中虛詞等無(wú)意義的詞for i in range(8):url = 'https://cy.ncss.cn/mtcontest/mingtilist?pageIndex='+str(i)+'&pageSize=30&companyName=&name='headers={'User-Agent':'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.100 Safari/537.36','Host':'cy.ncss.cn'}text = requests.get(url = url, headers = headers).texthtml = etree.HTML(text)title = html.xpath('//div[@class="cyyq-title"]//text()')? ? ? ? 需要注意的是,目標(biāo)網(wǎng)頁(yè)通過(guò)ajax加載數(shù)據(jù),需要通過(guò)chrome瀏覽器分析出發(fā)送ajax請(qǐng)求后的新url進(jìn)行請(qǐng)求,不然無(wú)法獲得目標(biāo)數(shù)據(jù)。
2.2 分詞操作
for item in title: # 接上面的代碼段for word in jieba.lcut(item,cut_all = False, HMM=True):word_list.append(word) with open('stopword.txt', encoding='utf-8') as f:for line in f.readlines():stopword_list.append(line.strip('\n')) word_list = [w for w in word_list if w not in stopword_list]? ? ? ? 利用jieba庫(kù)進(jìn)行中文分詞,分詞后導(dǎo)入停用詞表刪除無(wú)效的虛詞、標(biāo)點(diǎn)符號(hào)等無(wú)意義詞。
2.3 詞頻統(tǒng)計(jì)
df = pd.DataFrame(word_list) table = pd.DataFrame(df.iloc[:,0].value_counts())? ? ? ? 轉(zhuǎn)化為DataFrame格式,利用其自帶的方法進(jìn)行詞頻統(tǒng)計(jì)。
2.4 畫條形圖
plt.rcParams['font.sans-serif'] = ['SimHei'] plt.rcParams['axes.unicode_minus'] = False plt.bar(range(50),table.iloc[0:50,0].values.tolist(), align='center', color='b') plt.xticks(range(50),table.iloc[0:50,0].index, rotation=45,fontsize=13) plt.xlabel('關(guān)鍵詞',labelpad=10) plt.ylabel('頻次',labelpad=20) plt.title('產(chǎn)業(yè)賽道命題關(guān)鍵詞頻次',pad=30) plt.show()? ? ? ? 最后進(jìn)行可視化操作,以條形圖展現(xiàn)詞頻最高的前五十個(gè)詞。
3 結(jié)果展示
3.1 詞頻最高的前五十個(gè)詞條形圖
圖3??詞頻最高的前五十個(gè)詞條形圖
? ? ? ? 如圖所示,詞頻超過(guò)20頻次的詞分別是智能、智慧、技術(shù)、AI。由此可見產(chǎn)業(yè)命題賽道非常重視技術(shù),尤其是人工智能方向的新技術(shù),現(xiàn)階段具體而言包括但不限于自然語(yǔ)言處理,知識(shí)表現(xiàn),智能搜索,推理,規(guī)劃,機(jī)器學(xué)習(xí),知識(shí)獲取,組合調(diào)度問(wèn)題,感知問(wèn)題,模式識(shí)別,邏輯程序設(shè)計(jì)軟計(jì)算,不精確和不確定的管理,人工生命,神經(jīng)網(wǎng)絡(luò),復(fù)雜系統(tǒng),遺傳算法等。
? ? ? ? 詞頻在10到20之間的詞分別是系統(tǒng)、平臺(tái)、創(chuàng)新、新、設(shè)計(jì)、解決方案、方案、工業(yè)、開發(fā)、識(shí)別、材料。首先,系統(tǒng)、平臺(tái)、解決方案、方案是結(jié)果形式,這說(shuō)明產(chǎn)業(yè)命題賽道大多要求參賽選手最終結(jié)果以這些方式呈現(xiàn)。創(chuàng)新、新是原則要求,說(shuō)明參賽選手最終結(jié)果應(yīng)該要有創(chuàng)新點(diǎn)。設(shè)計(jì)、開發(fā)是方法,指設(shè)計(jì)程序,開發(fā)系統(tǒng)、平臺(tái)等,對(duì)應(yīng)結(jié)果形式。工業(yè)、識(shí)別、材料是方向,其中識(shí)別屬于人工智能技術(shù)中的深度學(xué)習(xí)領(lǐng)域,工業(yè)主要指工業(yè)4.0,主要內(nèi)容一是“智能工廠”,重點(diǎn)研究智能化生產(chǎn)系統(tǒng)及過(guò)程,以及網(wǎng)絡(luò)化分布式生產(chǎn)設(shè)施的實(shí)現(xiàn);二是“智能生產(chǎn)”,主要涉及整個(gè)企業(yè)的生產(chǎn)物流管理、人機(jī)互動(dòng)以及3D技術(shù)在工業(yè)生產(chǎn)過(guò)程中的應(yīng)用等。該計(jì)劃將特別注重吸引中小企業(yè)參與,力圖使中小企業(yè)成為新一代智能化生產(chǎn)技術(shù)的使用者和受益者,同時(shí)也成為先進(jìn)工業(yè)生產(chǎn)技術(shù)的創(chuàng)造者和供應(yīng)者;三是“智能物流”,主要通過(guò)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、物流網(wǎng),整合物流資源,充分發(fā)揮現(xiàn)有物流資源供應(yīng)方的效率,而需求方,則能夠快速獲得服務(wù)匹配,得到物流支持。也指向新技術(shù),重點(diǎn)在于技術(shù)的遷移和應(yīng)用。材料是材料科學(xué)與工程方向,主要研究一是粉末冶金新理論、新技術(shù);二是相圖研究與材料設(shè)計(jì);三是粉末冶金特種新材料;四是有色、稀有金屬材料的合金化理論及新材料開發(fā);五是現(xiàn)代高性能符合材料;六是有色金屬功能材料。 六個(gè)研究方向的共同特色是:研究?jī)?nèi)容隸屬學(xué)科前沿課題和國(guó)際熱點(diǎn)研究課題,具有創(chuàng)新性;緊密結(jié)合國(guó)民經(jīng)濟(jì)建設(shè)主戰(zhàn)場(chǎng),實(shí)用性強(qiáng);每個(gè)研究方向都有國(guó)家級(jí)或省部委級(jí)重點(diǎn)項(xiàng)目的支撐,實(shí)施過(guò)程可靠性高;有一支結(jié)構(gòu)合理的高水平學(xué)術(shù)隊(duì)伍和良好的研究條件,可實(shí)現(xiàn)預(yù)期研究目標(biāo),并具有可持續(xù)發(fā)展的良好前景
? ? ? ? 10以下詞頻較高的詞中,數(shù)據(jù)、云、互聯(lián)網(wǎng)等均體現(xiàn)大賽對(duì)信息技術(shù)的要求。區(qū)塊鏈作為近年來(lái)比較火的領(lǐng)域也榜上有名,此外鄉(xiāng)村振興作為關(guān)鍵詞也占據(jù)一席之地,可以體現(xiàn)國(guó)家政策的作用。而振興鄉(xiāng)村的最有利武器仍然是新技術(shù),因?yàn)樾录夹g(shù)具有高效率,往往成本低。
3.2 詞頻最高的前三十個(gè)詞表格
表1
| 詞頻 | |
| 智能 | 26 |
| 智慧 | 24 |
| 技術(shù) | 23 |
| AI | 20 |
| 系統(tǒng) | 19 |
| 平臺(tái) | 19 |
| 創(chuàng)新 | 18 |
| 新 | 16 |
| 設(shè)計(jì) | 16 |
| 解決方案 | 16 |
| 方案 | 14 |
| 工業(yè) | 11 |
| 開發(fā) | 11 |
| 識(shí)別 | 10 |
| 材料 | 10 |
| 檢測(cè) | 9 |
| 數(shù)據(jù) | 9 |
| 場(chǎng)景 | 8 |
| 云 | 7 |
| 研發(fā) | 7 |
| 互聯(lián)網(wǎng) | 7 |
| 管理 | 7 |
| 鄉(xiāng)村 | 6 |
| 區(qū)塊 | 6 |
| 產(chǎn)業(yè)化 | 6 |
| 鏈 | 6 |
| 能力 | 6 |
| 方向 | 6 |
| 自動(dòng) | 6 |
?
?
總結(jié)
以上是生活随笔為你收集整理的“互联网+”大学生创新创业大赛产业命题赛道命题方向分析的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 电机与运动控制笔记整理(二)——直流调速
- 下一篇: lisp 左手钢筋_CAD左手键与加载过