日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

㊙️【教你用python挣零花钱】自动化简历内推,学弟直呼牛逼!!

發布時間:2024/7/23 python 32 豆豆
生活随笔 收集整理的這篇文章主要介紹了 ㊙️【教你用python挣零花钱】自动化简历内推,学弟直呼牛逼!! 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

最近,小編在處理簡歷時,發現大量簡歷需要一個個打開文件,復制姓名、郵箱、電話號碼、學歷等關鍵信息,效率特別低且部分文件無法直接復制。于是,小編便寫了簡歷解析處理的腳本,支持文件格式有:doc,docx,pdf。

ps. 上月戰績,內推400+人,內推成功8人,入職5人,收入8000*2 + 5000*3=31000 元。

{'感謝您的投遞': 331, '簡歷處理中': 19, '簡歷初篩': 5, '本輪通過': 6,?'Offer已發放': 1, '進行中': 2, '拒絕Offer': 3, '接受Offer': 5}?

?

一 準備工作

腳本功能:分析簡歷文本,一鍵內推

輸入:要解析的文件路徑

輸出:解析的內容,包括不限于姓名、郵箱、電話號碼、學歷等信息。

環境準備:python 3.6 、mac(下文中doc轉docx是mac寫法,windows更簡單,導入win32的包即可)

需要導入的包

# encoding: utf-8 import os, sys import docx from pdfminer.pdfparser import PDFParser from pdfminer.pdfdocument import PDFDocument from pdfminer.pdfpage import PDFPage from pdfminer.pdfinterp import PDFResourceManager from pdfminer.pdfinterp import PDFPageInterpreter from pdfminer.layout import LAParams from pdfminer.converter import PDFPageAggregator

二 開始解析

2.1 獲取簡歷文件

def get_files(path):res = []for i in os.listdir(path):# 去掉臨時文件if os.path.isfile(path+i) and '~$' not in i and '.DS' not in i:# 去重 1.doc 和 1.docxif (path+i).split(".")[0] not in str(res):res.append(path+i)return res

2.2 解析PDF

得到res文本后,可以通過正則,匹配出郵箱,手機號,學歷等

def pdf_reader(file):fp = open(file, "rb")# 創建一個與文檔相關聯的解釋器parser = PDFParser(fp)# PDF文檔對象doc = PDFDocument(parser)# 鏈接解釋器和文檔對象parser.set_document(doc)# doc.set_paeser(parser)# 初始化文檔# doc.initialize("")# 創建PDF資源管理器resource = PDFResourceManager()# 參數分析器laparam = LAParams()# 創建一個聚合器device = PDFPageAggregator(resource, laparams=laparam)# 創建PDF頁面解釋器interpreter = PDFPageInterpreter(resource, device)# 使用文檔對象得到頁面集合res = ''for page in PDFPage.create_pages(doc):# 使用頁面解釋器來讀取interpreter.process_page(page)# 使用聚合器來獲取內容layout = device.get_result()for out in layout:if hasattr(out, "get_text"):res = res + '' + out.get_text()return res

2.3 解析word

? ? ? ? 待優化情況:word中如果包含execl,無法解析。

def word_reader(file):try:# docx 直接讀if 'docx' in file:res = ''f = docx.Document(file)for para in f.paragraphs:res = res + '\n' +para.textelse:# 先轉格式doc>docxos.system("textutil -convert docx '%s'"%file)word_reader(file+'x')res = ''f = docx.Document(file+'x')for para in f.paragraphs:res = res + '\n' +para.textreturn resexcept:# print(file, 'read failed')return ''

2.4 完整代碼

# encoding: utf-8 import os, sys import docx from pdfminer.pdfparser import PDFParser from pdfminer.pdfdocument import PDFDocument from pdfminer.pdfpage import PDFPage from pdfminer.pdfinterp import PDFResourceManager from pdfminer.pdfinterp import PDFPageInterpreter from pdfminer.layout import LAParams from pdfminer.converter import PDFPageAggregatordef get_files(path):res = []for i in os.listdir(path):# 去掉臨時文件if os.path.isfile(path+i) and '~$' not in i and '.DS' not in i:# 去重 1.doc 和 1.docxif (path+i).split(".")[0] not in str(res):res.append(path+i)return resdef pdf_reader(file):fp = open(file, "rb")# 創建一個與文檔相關聯的解釋器parser = PDFParser(fp)# PDF文檔對象doc = PDFDocument(parser)# 鏈接解釋器和文檔對象parser.set_document(doc)# doc.set_paeser(parser)# 初始化文檔# doc.initialize("")# 創建PDF資源管理器resource = PDFResourceManager()# 參數分析器laparam = LAParams()# 創建一個聚合器device = PDFPageAggregator(resource, laparams=laparam)# 創建PDF頁面解釋器interpreter = PDFPageInterpreter(resource, device)# 使用文檔對象得到頁面集合res = ''for page in PDFPage.create_pages(doc):# 使用頁面解釋器來讀取interpreter.process_page(page)# 使用聚合器來獲取內容layout = device.get_result()for out in layout:if hasattr(out, "get_text"):res = res + '' + out.get_text()return resdef word_reader(file):try:# docx 直接讀if 'docx' in file:res = ''f = docx.Document(file)for para in f.paragraphs:res = res + '\n' +para.textelse:# 先轉格式doc>docxos.system("textutil -convert docx '%s'"%file)word_reader(file+'x')res = ''f = docx.Document(file+'x')for para in f.paragraphs:res = res + '\n' +para.textreturn resexcept:# print(file, 'read failed')return ''def file_reader(file):if 'doc' in file:res = word_reader(file)elif 'pdf' in file:res = pdf_reader(file)else:res = '不是doc,也不是pdf,文件格式不支持!'return resif __name__ == '__main__':path = "/Users/XXXXX/Mine/XXXXX/"abs_files = get_files(path)print(abs_files)for file in abs_files:file_text = file_reader(file)print(file_text)

三 效果展示

姓名? 工齡? 電話? 學歷背景? 公司背景? 關鍵標簽? 郵箱

??


本期實現:任何格式的簡歷,解析成文本,便于后續篩選優質簡歷。

下期揭曉:簡歷分析,推送到最適合的崗位,包括學歷背景,穩定性,公司背景,擅長技術組件等。

?

我是橋哥,專注分享互聯網黑科技,點贊、收藏不迷路?!!!

?

總結

以上是生活随笔為你收集整理的㊙️【教你用python挣零花钱】自动化简历内推,学弟直呼牛逼!!的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: av男人的天堂av | 91久久中文字幕 | 九色国产 | 日本亲与子乱ay中文 | 欧美午夜理伦三级在线观看 | 欧美爱爱网址 | 在线观看你懂的网站 | 国产亚洲第一页 | 午夜色福利 | 国产精品无码免费播放 | 日韩不卡免费视频 | 大胸美女啪啪 | 91在线在线 | 超碰啪啪| 最新av免费在线观看 | jzzijzzij亚洲成熟少妇 | 自拍av在线 | 中文字av | 国产欧美在线 | 欧美性猛交xxxx乱 | 一区二区成人在线观看 | 韩国美女视频在线观看18 | 日本精品人妻无码免费大全 | 久久久影视 | 毛片网站在线播放 | 91在线看| 精品一区二区三区入口 | 国产亚洲精品久久久久久久久动漫 | 国产理论片在线观看 | 国产女人爽到高潮a毛片 | 综合在线一区 | 天天做天天爱天天操 | 特黄视频 | 美女扒开尿口给男人看 | 黄色的视频网站 | 日韩一级片网站 | 推特裸体gay猛交gay | 久久资源365 | 91精品国产乱码久久久 | 欧美日韩国产一级片 | 日本不卡一区二区三区在线观看 | 国产毛片毛片毛片 | 麻豆网站在线免费观看 | 国产网站入口 | 亚洲人体一区 | 国产超91| 91精品人妻一区二区三区蜜桃欧美 | 色先锋资源网 | 国产女主播在线 | 欧美日韩激情在线一区二区三区 | 小早川怜子久久精品中文字幕 | 天天插美女 | 国产免费一区二区三区最新6 | yy111122少妇光屁股影院 | 久久久久久久久久久久久久免费看 | 亚洲天堂中文字幕 | 国产黄免费 | 国产成人精品一区二区三区 | 精品一区二区三区精华液 | 日韩欧美中文字幕在线视频 | 国产黄色影院 | 亚洲最大的成人网 | 欧美极品在线播放 | 国产干b| 国产麻豆成人传媒免费观看 | 欧美第四页 | 亚洲欧洲日本一区二区三区 | 亚洲第一色网 | 草色噜噜噜av在线观看香蕉 | 岛国午夜视频 | 欧美日韩国产成人精品 | 99视频一区二区 | xx99小雪 | 久久久久久久麻豆 | 91黄免费| 最近中文字幕一区二区 | 日韩不卡av | 黄色激情在线 | 大伊人久久 | 亚洲人人人 | 色综合a| 韩国一级一片高清免费观看 | 无码h肉动漫在线观看 | 级毛片 | 伊人天天 | 久久精品国产精品亚洲色婷婷 | 美女福利视频在线观看 | 黄色激情视频网站 | 手机在线看永久av片免费 | 久热网 | 免费成人黄色网址 | 精品麻豆视频 | 国产毛片a级 | avtt中文字幕 | www.日日操| 中国爆后菊女人的视频 | 91成人免费在线 | 136福利视频导航 | 欧美久久久久久久久 |