日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

《大数据、小数据、无数据:网络世界的数据学术》一 3.4 开放学术

發(fā)布時間:2024/4/17 编程问答 93 豆豆
生活随笔 收集整理的這篇文章主要介紹了 《大数据、小数据、无数据:网络世界的数据学术》一 3.4 开放学术 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

3.4 開放學(xué)術(shù)

隨著開放獲取、開放資源、開放數(shù)據(jù)、開放標(biāo)準(zhǔn)、開放知識庫、開放網(wǎng)絡(luò)、開放書目、開放注解等專業(yè)詞匯的出現(xiàn),“開放”列表依舊不斷增加。正如第1章介紹的那樣,開放獲取運(yùn)動從19世紀(jì)70年代進(jìn)行至今。開放獲取研究的發(fā)展旨在提高系統(tǒng)、工具和服務(wù)之間的互操作性機(jī)制。其與分布式計算網(wǎng)絡(luò)技術(shù)的進(jìn)步以及幾乎無所不在的互聯(lián)網(wǎng)接入,共同成就了今天的知識基礎(chǔ)設(shè)施,并將進(jìn)一步推動其發(fā)展。
定義開放學(xué)術(shù)的難度不亞于界定數(shù)據(jù)學(xué)術(shù),開放學(xué)術(shù)幾乎等同于開放科學(xué)。為方便討論,這里的開放學(xué)術(shù)包括開放獲取出版物、開放數(shù)據(jù)、數(shù)據(jù)發(fā)布和數(shù)據(jù)共享相關(guān)的政策和實踐。開放學(xué)術(shù)的目標(biāo)是加快研究速度,鼓勵提出新問題、推動調(diào)查方式創(chuàng)新,減少學(xué)術(shù)詐欺和不端行為,推動技術(shù)和科學(xué)勞動力增長,并利用公共投資推動研究和教育事業(yè)發(fā)展(David,den Besten,and Schroeder 2010;Esanu and Uhlir 2004;Nielsen 2011;Boulton et al. 2012;Uhlir and Schr鰀er 2007)。
但是,開放學(xué)術(shù)這種單一術(shù)語的使用,可能會模糊各開放獲取形式間的本質(zhì)差異。本書的第三項挑戰(zhàn)指出,出版物和數(shù)據(jù)分別在學(xué)術(shù)活動中發(fā)揮著不同作用,以下將進(jìn)一步闡述。開放獲取出版物和開放數(shù)據(jù)目標(biāo)相同,即促進(jìn)信息流動、減少知識資源的使用限制、提高研究實踐透明度。二者的學(xué)術(shù)價值、利益相關(guān)者及其跨環(huán)境、隨時間的可移植性均有所差異。

3.4.1 開放獲取研究成果

1665年第一批期刊出現(xiàn)后,學(xué)術(shù)活動從私人領(lǐng)域的書信和會議形式轉(zhuǎn)變?yōu)楣_傳播方式。讀者可以通過圖書館、書商和個人訂閱途徑獲取書籍、期刊和其他出版物。同時,信件、草稿、手稿和預(yù)印本的私下交換方式依舊存在。
1991年,隨著arXiv的發(fā)布,開放獲取研究成果取得了巨大飛躍。因為出現(xiàn)在萬維網(wǎng)之前,所以arXiv的原始地址為xxx.lanl.gov(Ginsparg 1994,2001)。在此后的20多年間,arXiv已擴(kuò)展到其他科學(xué)領(lǐng)域,從洛斯阿拉莫斯國家實驗室搬到康奈爾大學(xué),并得到成員機(jī)構(gòu)的廣泛支持。其使用量呈指數(shù)形式持續(xù)增長。目前,每月有8000多篇論文上傳到arXiv,且僅2012年的論文下載量就超過了6000萬(ArXiv.org 2013)。
arXiv為今天的開放獲取數(shù)據(jù)提供了三條重要經(jīng)驗。首先,該系統(tǒng)的研究領(lǐng)域為高能物理學(xué),是活躍的預(yù)印本交流文化的產(chǎn)物。它建立在支持親近同事間進(jìn)行信息交換的知識基礎(chǔ)設(shè)施之上,這種基礎(chǔ)設(shè)施叫作無形學(xué)院(invisible colleges)(Crane 1972)。
其次,arXiv改變了物理學(xué)學(xué)術(shù)交流中作者、出版商、圖書館和讀者等利益相關(guān)者之間的關(guān)系,從而擾亂了現(xiàn)有知識基礎(chǔ)設(shè)施。無論國家富裕與否,研究人員和學(xué)生都能在官方發(fā)布出版物之前獲得論文。隨著arXiv的快速發(fā)展和廣泛應(yīng)用,物理學(xué)領(lǐng)域的期刊編輯和出版商除了接受它的存在之外,別無選擇。許多期刊之前不考慮在線發(fā)布論文,因為這樣的發(fā)布構(gòu)成了優(yōu)先出版(prior publication)。今天,許多領(lǐng)域仍有類似政策。
最后,arXiv的成功并沒有很快或很好地遷移到其他領(lǐng)域。雖然其他領(lǐng)域的預(yù)印服務(wù)器規(guī)模和普及量均不斷加大,但沒有一個像arXiv那樣深入學(xué)術(shù)實踐中。arXiv目前已經(jīng)擴(kuò)展到物理、數(shù)學(xué)、天文學(xué)以及其他領(lǐng)域,但其并沒有深入每個領(lǐng)域的每個方面。在一些研究領(lǐng)域中,arXiv的使用無所不在。但在其他領(lǐng)域,它也只是偶爾發(fā)揮作用。
開放獲取出版物在早期經(jīng)驗的基礎(chǔ)上展開。開放獲取雖然是個簡單概念,但由于利益相關(guān)者之間的競爭性,其很容易被誤解。彼得·薩伯(Peter Suber 2012a,4)對該詞的定義最為簡潔:“開放獲取(Open Access,OA)文獻(xiàn)具有數(shù)字化、在線、免費、大部分無版權(quán)和許可限制等特征?!彼_伯隨后又指出,開放獲取研究學(xué)術(shù)文獻(xiàn)和開放獲取其他形式內(nèi)容的操作過程不同。開放獲取文獻(xiàn)的原則之一為作者擁有作品版權(quán),除非或直到該權(quán)利被轉(zhuǎn)移到另一方(如出版商)。另一個原則是,學(xué)者寫研究論文一般都不是為了獲取酬勞。在作品廣泛傳播的同時,學(xué)者自己并不損失任何利益,但大部分其他作者、藝術(shù)家和創(chuàng)造者的收益往往會受到影響。學(xué)者寫研究論文是為了提高影響力,而非收入。因此,他們希望可以盡可能接觸更多讀者以提高自身利益。學(xué)術(shù)研究的資金主要來源于學(xué)術(shù)工資和研究基金。學(xué)者的利益與雇傭、資助學(xué)者的機(jī)構(gòu)的利益相一致,因為他們的出版物也可以從中提高影響力。
開放獲取文獻(xiàn)的實現(xiàn)方式多樣、監(jiān)管模式豐富,同時還有很多別稱(如綠色、黃金、免費、自由等)。這些模式的共同點是均基于上述兩個原則。作者通常會保留公開傳播作品的版權(quán)或許可和作為作品創(chuàng)作者的其他權(quán)利。但一般情況下,對作者有直接收入的學(xué)術(shù)書籍、教科書和其他作品進(jìn)行開放獲取時,也會考慮一些其他問題(Budapest Open Access Initiative 2002;Directory of Open Access Journals 2013;Howard 2013a;Jacobs2006;Laakso and Bj鰎k 2013;Leptin 2012;Pinter 2012;Research Councils UK 2013;Suber 2012a;Van Noorden 2013b;Wickham and Vincent 2013;Wilbanks 2006;Willinsky 2006)。
大約從2005年以來,全世界越來越多的研究機(jī)構(gòu)對其研究人員的期刊出版物實行開放獲取政策,如美國的哈佛大學(xué)、麻省理工學(xué)院、加利福尼亞理工學(xué)院和加利福尼亞大學(xué)(Harvard University 2010;MIT Libraries 2009;Caltech2013a;Office of Scholarly Communication 2013)。一般情況下,開放獲取政策會授予高校非排他性許可,允許其將研究工作通過公共知識庫進(jìn)行傳播。開放獲取出版物在2012年和2013年取得重大進(jìn)展。2012年,英國研究委員會(Research Councils of the United Kingdom,RCUK)宣布,受該機(jī)構(gòu)全部或部分資助的所有同行評審期刊論文和會議論文都將提交到開放獲取期刊上。該政策于2013年4月起生效。由于爭議很大,因此政策中“開放獲取期刊”的定義進(jìn)行了多次修改和解釋?!伴_放獲取期刊”包括專有期、一系列商業(yè)模式以及一些臨時補(bǔ)貼(Research Councils UK 2012a,2012b)。2013年,美國政府行政部門對受聯(lián)邦基金資助的出版物宣布了一項類似政策,即一般遵循由美國國家衛(wèi)生研究院和公共醫(yī)學(xué)中心(the National Institutes of Health and PubMed Central)規(guī)定的專有期和政策(Office of Science and Technology Policy 2013;Holdren 2013b)。歐盟、澳大利亞以及其他國家正在商討類似政策。
各種各樣的政策、商業(yè)模式和出版物類型使學(xué)術(shù)期刊文獻(xiàn)的公開獲取途徑更加豐富。考慮到專有期,一年內(nèi)出版的期刊論文中約一半可以在網(wǎng)上免費獲取,而且這一比例將進(jìn)一步增長(Laakso et al.2011;Van Noorden 2013a)。雖然還有很多細(xì)節(jié)需要進(jìn)一步商榷,但開放獲取期刊論文正逐漸成為一種制度。然而,利益相關(guān)者之間的緊張關(guān)系尚未得到緩解。部分作者依舊在網(wǎng)上發(fā)布不符合開放獲取政策的文章、論文和其他作品,一些出版商對其具有獨家版權(quán)作品的相關(guān)開放獲取政策表示不滿(Howard 2013b;SHERPA/RoMEO 2014)。

3.4.2 開放獲取數(shù)據(jù)

許多資助機(jī)構(gòu)的開放獲取數(shù)據(jù)政策都與開放獲取出版物政策相關(guān)。英國的政策對這種關(guān)系進(jìn)行了清晰闡述(Research Councils UK2012b,1):“根據(jù)政務(wù)透明和開放數(shù)據(jù)總戰(zhàn)略,政府致力于確保已發(fā)表的研究成果可以免費獲取?!庇芯坷硎聲P(guān)于開放獲取期刊的政策要求作者說明如何獲取出版物相關(guān)數(shù)據(jù),但同時承認(rèn)這種做法的復(fù)雜性(Research Councils UK2012b,4):“確保研究人員考慮數(shù)據(jù)獲取問題……但是,本政策并不要求所有數(shù)據(jù)必須公開。聲明指出,如果有足夠理由(如潛在包含參與者身份信息的數(shù)據(jù)具有商業(yè)機(jī)密性和法律敏感性)要求實現(xiàn)數(shù)據(jù)保護(hù)時,可以有例外。”
美國國家衛(wèi)生研究院(National Institutes of Health,NIH)要求把受其資助的出版物存入公共醫(yī)學(xué)中心(PubMed Central),同時需要在項目申請書中加入數(shù)據(jù)管理計劃(Basken2012;National Institutes of Health 2013;PubMed Central 2009;Zerhouni2006)。美國國家科學(xué)基金(National Science Foundation,NSF)對數(shù)據(jù)管理計劃有要求,但對開放獲取出版物沒有要求。然而,隨后美國聯(lián)邦政府發(fā)布的開放獲取出版物相關(guān)政策將同樣適用于NSF、NIH和其他聯(lián)邦機(jī)構(gòu)。這些機(jī)構(gòu)平均每年在研發(fā)上投資1億多美元。該政策將指導(dǎo)每個機(jī)構(gòu)制定出科學(xué)出版物和數(shù)字科學(xué)數(shù)據(jù)的開放獲取計劃(Holdren 2013b;Burwell et al. 2013)。
然而,開放獲取期刊論文和開放數(shù)據(jù)在薩伯(2012a)的兩條原則上均不相同。雖然作者至少最初是期刊論文的版權(quán)所有者,但該事實并不適用于數(shù)據(jù)。正如第9章深入探討的那樣,領(lǐng)域內(nèi)和領(lǐng)域間的數(shù)據(jù)歸屬權(quán)都是很有爭議的話題。該爭議一旦解決,作品“作者”就會擁有某些特定權(quán)利和責(zé)任。大多數(shù)合作都未探討過誰有資格成為數(shù)據(jù)“作者”這一問題(Wallis 2012)。即使將數(shù)據(jù)權(quán)限分配給個人和社區(qū),數(shù)據(jù)相關(guān)權(quán)責(zé)依舊不清晰。許多數(shù)據(jù)形式都是由學(xué)者創(chuàng)造和控制的,但是數(shù)據(jù)所有權(quán)卻是另一回事。某些數(shù)據(jù)形式不可能獲得版權(quán)。研究人員使用的數(shù)據(jù)多來自于其他利益相關(guān)者或公共資源池。人類本身的機(jī)密記錄等數(shù)據(jù)由學(xué)者控制,而無法進(jìn)行發(fā)布。數(shù)據(jù)權(quán)利相關(guān)政策可能因機(jī)構(gòu)、資助機(jī)構(gòu)、合同、管轄權(quán)和其他因素而異。
薩伯的第二個原則指出,學(xué)者寫期刊論文以及其他形式的出版物是為了提高影響力,而非收入。學(xué)者及其用人單位和資助者都有盡可能廣泛傳播出版物的動力。但是,以上兩種情況均不適用于大多數(shù)數(shù)據(jù)。期刊論文經(jīng)處理后傳播給受眾,但數(shù)據(jù)卻很難從學(xué)術(shù)工作過程中提取出來。數(shù)據(jù)發(fā)布通常需要大量投入,而且這種投入量超過了研究和撰寫出版物的行為成本。數(shù)據(jù)可以被視為職業(yè)生涯中積累的寶貴資產(chǎn)。因此,如果有數(shù)據(jù)的話,必須謹(jǐn)慎發(fā)布。
開放獲取數(shù)據(jù)的治理模式剛剛興起,本書將在第4章和第10章對此展開更全面的討論。由第1章中斯托曼的格言可知,英國研究理事會政策中的“freely accessible”一詞似乎更偏向于言論自由的意義,而非免費啤酒的意義。解決任何普遍性問題時,都需要考慮公平性、效率性和可持續(xù)性(Hess and Ostrom 2007a)。目前,只有部分領(lǐng)域通過使用知識庫實現(xiàn)了數(shù)據(jù)的提煉、監(jiān)護(hù)和訪問,解決了公平和效率問題。某些領(lǐng)域中,私人交換就能滿足數(shù)據(jù)需求,而其他領(lǐng)域則求助于研究型圖書館。在上述所有領(lǐng)域中,可持續(xù)性問題依舊尚未解決。一些知識庫有長期資金支持,而其他的只有短期支持。有些為所有人免費提供數(shù)據(jù),而其他的只向為其提供資金的財團(tuán)成員提供數(shù)據(jù)。就像第8章討論的那樣,通過私下交易或研究團(tuán)隊網(wǎng)站發(fā)布方式進(jìn)行的數(shù)據(jù)共享只在短期內(nèi)有效。
因此,開放數(shù)據(jù)與開放獲取學(xué)術(shù)文獻(xiàn)截然不同。各領(lǐng)域至今尚未就數(shù)據(jù)“開放”的涵義達(dá)成一致。彼得·默里-拉斯特(Peter Murray-Rust)和亨利·熱帕(Henry Rzepa)(2004)最早提出的開放數(shù)據(jù)框架涵括了后來的大多數(shù)觀點。作為化學(xué)家,他們更關(guān)注自由訪問以及結(jié)構(gòu)化數(shù)據(jù)的挖掘能力。算法可以通過分子等實體的表示識別出實體結(jié)構(gòu),當(dāng)實體用這種方式進(jìn)行表示時,其就會成為可供挖掘、提取和操縱的數(shù)據(jù),也就更有用。當(dāng)相同分子僅用文本文件中的圖像進(jìn)行表示時,就需要人工識別其結(jié)構(gòu)。在他們看來,開放數(shù)據(jù)是一種“數(shù)據(jù)文件”,其作用在于實現(xiàn)數(shù)據(jù)的機(jī)器可讀和自由訪問。
在開放知識基金會的支持下,默里-拉斯特等人提出了“開放數(shù)據(jù)”簡潔的法律定義:“一段數(shù)據(jù)或內(nèi)容開放是指,在只有或至多滿足標(biāo)準(zhǔn)和(或)授權(quán)要求的條件下,所有人均可免費使用、重用和重新分配它(Open Data Commons 2013)。”商業(yè)環(huán)境中的“開放數(shù)據(jù)”定義更模糊:“開放數(shù)據(jù)—政務(wù)數(shù)據(jù)等機(jī)器可讀信息以及他人可獲得的數(shù)據(jù)(Manyika et al. 2013)?!薄督?jīng)濟(jì)合作與發(fā)展組織關(guān)于公共資金資助的研究數(shù)據(jù)獲取原則與指南》(Organisation for Economic Co-operation and Development 2007)在第13條原則中規(guī)定了開放數(shù)據(jù)的框架,第8章將對這部分進(jìn)行說明。英國皇家學(xué)會的報告《科學(xué):開放的事業(yè)》(Boulton et al. 2012,14)將“開放數(shù)據(jù)”定義為“滿足知識開放標(biāo)準(zhǔn)的數(shù)據(jù)。數(shù)據(jù)必須具有可獲取、可使用、可評估和可識別特征。”生物醫(yī)學(xué)數(shù)據(jù)開放的含義還包括成本效益權(quán)衡、數(shù)據(jù)發(fā)布的觸發(fā)定時機(jī)制、數(shù)據(jù)質(zhì)量確保方式、包含的數(shù)據(jù)范圍、保密性、隱私性、安全性、知識產(chǎn)權(quán)和管轄權(quán)(Boulton et al. 2011)。
開放性可能會加速數(shù)據(jù)創(chuàng)造。比如,開放獲取文本會使文本中的實體成為數(shù)據(jù)。文本挖掘技術(shù)可以對描述特定分子、天體、人、地點、事件或其他實體的所有文章或書籍進(jìn)行定位。從數(shù)據(jù)挖掘角度來看,出版物數(shù)據(jù)庫、數(shù)據(jù)檔案和數(shù)字書籍集合逐漸趨于相似(Bourne et al. 2011;Bourne 2005;Crane 2006; Murray-Rust et al. 2004)。但是,從知識產(chǎn)權(quán)的角度來看,它們卻完全不同,具體將在第4章進(jìn)行探討。
開放數(shù)據(jù)還能夠?qū)⒀芯繉ο蟮谋硎疽暈閿?shù)據(jù),而且與研究對象本身是否公開無關(guān)。研究對象的表示是出版物、數(shù)據(jù)集以及其他內(nèi)容的公開標(biāo)簽或注釋。注釋和參考書目給描述對象賦予了價值,使其更容易被發(fā)現(xiàn)。共享注釋出現(xiàn)于數(shù)字化圖書館研究早期。目前,已經(jīng)產(chǎn)生了多種競爭性的共享注釋方法。同時,也有很多學(xué)者致力于提升注釋系統(tǒng)互操作性的標(biāo)準(zhǔn)化研究(Foster and Moreau 2006;Hunter 2009;Phelps and Wilensky 1997,2000)。ProCite、BiblioLink、RefWorks和EndNote等早期個人參考文獻(xiàn)管理工具,都基于本地存儲文件為單個作者提供服務(wù)。21世紀(jì)10年代初,研究人員開始對網(wǎng)站、圖像、出版物和數(shù)據(jù)進(jìn)行標(biāo)記和注釋,并分享到Delicious和Flickr等社交網(wǎng)絡(luò)上。到21世紀(jì)10年代后期,個人參考文獻(xiàn)和開放注釋逐步融合。Zotero、Mendeley和LibraryThing等其他工具可以共享參考文獻(xiàn)、標(biāo)簽和筆記。由于國家圖書館開始發(fā)布開放使用的編目記錄(Open Bibliography and Open Bibliographic Data 2013),因此開放參考文獻(xiàn)運(yùn)動獲得了巨大飛躍。隨著更多參考文獻(xiàn)記錄逐步公開可用,參考文獻(xiàn)記錄成為待挖掘的數(shù)據(jù)之一。注釋工具帶來了數(shù)據(jù)類型的與日俱增(Agosti and Ferro2007;Das et al. 2009;Kurtz and Bollen 2010;Renear and Palmer 2009;Rodriguez,Bollen,and Van de Sompel 2007)。

3.4.3 開放技術(shù)

40余年來,網(wǎng)絡(luò)技術(shù)逐漸從封閉向開放過渡,而開放學(xué)術(shù)正是其中一部分?;ヂ?lián)網(wǎng)的起源和發(fā)展軌跡在整個過渡中最為傳奇(Abbate 1999;Goldsmith and Wu2006;Kraut et al. 2002;Levien et al. 2005;MacLean 2004;O’Brien 2004;Odlyzko 2000;National Research Council 2001;Zittrain 2005)。人們普遍認(rèn)為,計算機(jī)網(wǎng)絡(luò)是政府出于研究和軍事目的而資助開發(fā)的。從20世紀(jì)60年代末的第一次國際網(wǎng)絡(luò)互聯(lián)到90年代初的政策變化,互聯(lián)網(wǎng)僅通過政府合同供研究、學(xué)術(shù)和軍事團(tuán)隊使用。這種網(wǎng)絡(luò)被稱為國家研究和教育網(wǎng)絡(luò)(National Research and Education Network,NREN)。計算機(jī)系統(tǒng)生命周期過程耗資較多,為了通過網(wǎng)絡(luò)對其實現(xiàn)共享,研究人員對原有的互聯(lián)網(wǎng)功能進(jìn)行了擴(kuò)展,具體包括電子郵件、文件傳輸以及其他類似功能。為進(jìn)一步支持商業(yè)活動、提供參考文獻(xiàn)數(shù)據(jù)庫等新型信息服務(wù),Telenet和Tymnet等并行式商業(yè)化分組交換網(wǎng)絡(luò)開始給私營企業(yè)提供商業(yè)通信(Borgman,Moghdam,and Corbett 1984;Borgman 2000)。
在國家信息基礎(chǔ)設(shè)施標(biāo)準(zhǔn)和全球信息基礎(chǔ)設(shè)施標(biāo)準(zhǔn)影響下,1993~1994年進(jìn)行的政策調(diào)整允許政府和商業(yè)機(jī)構(gòu)進(jìn)行網(wǎng)絡(luò)互聯(lián)。從此,商品互聯(lián)網(wǎng)誕生,通信網(wǎng)絡(luò)也完成了從國有或受保護(hù)系統(tǒng)到商業(yè)運(yùn)營的轉(zhuǎn)變。互聯(lián)網(wǎng)宣稱其為公共和私人實體提供的互聯(lián)和服務(wù)都具有“開放”性。隨著萬維網(wǎng)的首次展示和第一個瀏覽器界面的誕生,網(wǎng)絡(luò)逐漸趨于開放。此后20年中,互聯(lián)網(wǎng)技術(shù)、功能和用戶群體均已遠(yuǎn)遠(yuǎn)超乎最初設(shè)計師的最大想象。但是,新型商業(yè)模式、利益相關(guān)者之間平衡關(guān)系的變遷以及安全和隱私中無法預(yù)見的挑戰(zhàn),均正在推動基礎(chǔ)設(shè)施的再設(shè)計(Borgman 2000;Estrin et al. 2010)。
在開放網(wǎng)絡(luò)中實現(xiàn)數(shù)據(jù)遷移與使已獲取數(shù)據(jù)可用完全不同。只有特定技術(shù)能讀取數(shù)字?jǐn)?shù)據(jù)和數(shù)字表示。數(shù)字?jǐn)?shù)據(jù)集的解釋需要以下內(nèi)容:生成數(shù)據(jù)的硬件,即傳感器網(wǎng)絡(luò)或?qū)嶒炇覚C(jī)器;數(shù)據(jù)編碼或分析軟件,即圖像處理工具或統(tǒng)計工具;以及整合以上內(nèi)容所需的協(xié)議和專業(yè)知識。技術(shù)發(fā)展非常迅速,在研究領(lǐng)域中更是如此。許多儀器產(chǎn)生的數(shù)據(jù)只能用特定軟件讀取。使用或重用數(shù)據(jù)時,需要版本正確的軟件以及可能的其他儀器。許多分析工具具有專有性,因此數(shù)據(jù)分析可能產(chǎn)生特定格式的數(shù)據(jù)集,而這些與數(shù)據(jù)提取時的開放程度無關(guān)。學(xué)者們經(jīng)常自己構(gòu)建工具,編寫代碼來解決臨時問題。雖然這種做法短期內(nèi)有效,但本地代碼和儀器很難進(jìn)行長期維護(hù)。更何況學(xué)者們在解決臨時問題時,很少兼顧軟件工程的工業(yè)標(biāo)準(zhǔn)。本地工具具有靈活性和可適應(yīng)性,缺點是跨站點和跨情景的可移植性差(Easterbrook and Johns 2009;Edwards et al. 2013;Segal2005,2009)。
數(shù)據(jù)、標(biāo)準(zhǔn)和技術(shù)的開放程度會影響數(shù)據(jù)在工具、實驗室和合作伙伴之間以及隨時間的交換能力。標(biāo)準(zhǔn)可能改善社區(qū)內(nèi)的信息流動,但也可能在社區(qū)之間形成信息交流障礙。因為標(biāo)準(zhǔn)可能不成熟或不適當(dāng),從而形成障礙,進(jìn)而阻礙創(chuàng)新。長期以來,系統(tǒng)和服務(wù)的技術(shù)互操作性一直是數(shù)字圖書館和軟件工程努力追求的目標(biāo)?;ゲ僮餍栽试S部分?jǐn)?shù)據(jù)和利益相關(guān)者參與其中,而阻止其他對象進(jìn)入。與技術(shù)本身相比,政策、實踐、標(biāo)準(zhǔn)、商業(yè)模式和既得利益往往是決定互操作性的更重要的因素(Brown and Marsden 2013;Busch 2013;DeNardis 2011;Lampland and Star 2009;Libicki 1995;Palfrey and Gasser 2012)。

總結(jié)

以上是生活随笔為你收集整理的《大数据、小数据、无数据:网络世界的数据学术》一 3.4 开放学术的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。