日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

CMU 11642 Search Engines - 大纲梳理

發布時間:2025/3/15 编程问答 41 豆豆
生活随笔 收集整理的這篇文章主要介紹了 CMU 11642 Search Engines - 大纲梳理 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

CMU 11642 的課程筆記大綱。涉及了很多算法,詳細見具體的鏈接,代碼就不貼了。歡迎討論,歡迎指正~

Jamie 搜索引擎這門課,還是很有收獲的,課上除了一些基本概念和算法外還有很多最新研究,涵蓋內容非常廣,絕對不止一本書。據 Jamie 講,在 yahoo 等公司搜索部門的學生回來說現在做的工作感覺就是當年做的作業,是否有夸張不知道,然而大家可以感受下。已經過了選課階段,就當給下一屆想選的小盆友一點 workload 信息吧:

  • reading notes。每周有大量的 reading,可能是教材也可能是論文。注意 reading notes 的成績是 binary 的,1 or 0,不要以為在 blackboard 上看到自己是 80 分就以為有了0.8,80分=0分!
  • homework。五次作業完成一個完善的 search engine,語言是 java,大概三四十個類,每次都是在上一次的基礎上進一步改進,所以除了最后一次作業外,你做的每一次作業的 performance 都將深深的影響下一次。如果你發現你的運行時間比 Callen 給的時間要長很多,請務必進行優化。作業不難,通常是讓你實現各種算法,常用的以及某些論文中的,然而評分很嚴,很多 corner case 要注意。
    每次作業完成都有一篇 report,需要做很多實驗(四五十個至少吧,不寫腳本的話感覺可以從天黑做到天亮),并做“深刻”總結,之所以說“深刻”是因為有時候我絞盡腦汁寫的東西得到的評語是 shallow。一把心酸淚。一般來說一天寫算法再一天過全部的 test case,最后做實驗寫 report。
  • exam。期中期末兩次考試,上過 text analytics 的人都知道,Callen 的一貫風格,考試廣度優先,題量大,靠本能,你騰出時間來思考你就輸了,給分低。
  • 但是說了這么多不要怕!!就算考試成績再低你的最后分數也會很好看!!

    關于能不能 hold 住,這么說吧我上學期還選了 Machine learning(11601A),Distributed Systems(95702),以及 Data Structures for Application Programmers(08722),感覺 4 門課老實說大課只能 focus 一到兩門,如果各位還要刷題找工作,還是建議 P/F 或者是 audit 一門。

    然后回到正題,高度總結下,這門課就講了兩個問題,一個是如何準確匹配查詢與文檔,一個是如何快速返回檢索結果,就是?效果 vs 效率?的一個權衡。下面的總結梳理了這門課的重點,其中會涉及很多具體算法,然而這只是簡單的提綱,不能把公式/算法都列出來,具體的可以看下面的鏈接或者看書/講義。透露一點:多數的算法項目里你都需要去實現,而不需要實現的算法,Jamie 也不會輕易放過你,所以你們覺得會在哪里出現呢?

    總結

    以上是生活随笔為你收集整理的CMU 11642 Search Engines - 大纲梳理的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。