天池实验室|读取数据集的两种方式
生活随笔
收集整理的這篇文章主要介紹了
天池实验室|读取数据集的两种方式
小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
- 讀取掛載數(shù)據(jù)中的數(shù)據(jù)集
具體代碼如下:?
# 步驟1: !ls datalab/# 步驟2: import os os.chdir('/home/tianchi/datalab/75057') print(os.getcwd())# 步驟3: import pandas as pd import os # 掛載數(shù)據(jù)中的數(shù)據(jù)集讀取 os.chdir('/mnt/file/opensearch/documents/75057') df=pd.read_excel('dataset-1.xlsx',sheet_name='Sheet1') #獲取最大行,最大列 nrows=df.shape[0] ncols=df.columns.size print('Max Rows:'+str(nrows)) print('Max Columns'+str(ncols))核心是路徑的寫法:這里掛載數(shù)據(jù)不能直接找到文件名,需要去找到文件夾,才能找到具體數(shù)據(jù)集文件,所有實(shí)驗(yàn)室的數(shù)據(jù)訪問都在/home/tianchi/tianchilab路徑下?
- 讀取個(gè)人空間中的數(shù)據(jù)集
前提:在個(gè)人空間中新建文件夾:dataset,在該文件夾下上傳數(shù)據(jù)集文件,名稱為:dataset-1.xlsx
具體代碼:
import pandas as pd # 個(gè)人空間中的數(shù)據(jù)集讀取 sExcelFile='/home/tianchi/myspace/dataset/dataset-1.xlsx' df = pd.read_excel(sExcelFile,sheet_name='Sheet1') #獲取最大行,最大列 nrows=df.shape[0] ncols=df.columns.size print('Max Rows:'+str(nrows)) print('Max Columns'+str(ncols))核心是路徑的寫法:/home/tianchi/myspace/dataset/dataset-1.xlsx,個(gè)人空間的數(shù)據(jù)都在/home/tianchi/myspace路徑下
總結(jié)
以上是生活随笔為你收集整理的天池实验室|读取数据集的两种方式的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 实验记录(1)
- 下一篇: visio2013跨线问题