Quora cqa问题抓取
生活随笔
收集整理的這篇文章主要介紹了
Quora cqa问题抓取
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
quora是一個比較知名的社區問答網站,對于目前比較流行的cqa問題,通過quora提供的搜索工具來找到相似的問題進而抽取答案。
事實上,quora的搜索大致是根據關鍵詞匹配的。
public class SolveAnswerPage {public List<String> solve(String s){List<String> res = new ArrayList<String>();Document doc = Jsoup.parse(s);Elements answers = doc.select("div.pagedlist_item");System.out.println(answers.size());for(Element answer : answers){res.add(answer.text());System.out.println(answer.text());}return res;} }
1.首先通過給定問題的相似問題搜索頁面,得到排名前面的問題的url鏈接列表
2.根據第一步的url列表,抓取相應問題頁面的answer,并返回抓取結果
總結
以上是生活随笔為你收集整理的Quora cqa问题抓取的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Asp.net 企业建站CMS
- 下一篇: My Seventeenth Page