日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 运维知识 > windows >内容正文

windows

Kernel Memory 入门系列:生成并获取文档摘要

發(fā)布時間:2023/12/29 windows 26 coder
生活随笔 收集整理的這篇文章主要介紹了 Kernel Memory 入门系列:生成并获取文档摘要 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

Kernel Memory 入門系列:生成并獲取文檔摘要

前面在RAG和文檔預處理的流程中,我們得到一個解決方案,可以讓用戶直接獲取最終的問題答案。

但是實際的業(yè)務場景中,仍然存在一些基礎的場景,不需要我們獲取文檔的所有詳情的,而只是了解的文檔的大概信息,得到文章整體的摘要或者總結(jié),此時仍然可以使用Kernel Memory來處理。

生成摘要

我們依然使用Kernel Memory的文件導入方法,不過此時不需要指定默認的處理流程,而只需要指定Summary流程即可。

await memory.ImportDocumentAsync(new Document("doc1")
        .AddFile("file4-SK-Readme.pdf")
        .AddFile("file5-NASA-news.pdf"),
    steps: Constants.PipelineOnlySummary);

其中PipelineOnlySummary 包含了一下步驟:

  1. extract
  2. summarize
  3. gen_embeddings
  4. save_records

相比較默認的流程,僅是將partition變更為了summarize, 但是實際存儲的記錄將不再是源文檔的分片,而是經(jīng)過LLM總結(jié)之后的內(nèi)容摘要。

獲取摘要

獲取的摘要的方法更加直接,使用SearchSummariesAsync方法,通過文檔過濾條件過濾需要獲取文檔摘要即可。

// Fetch the list of summaries. The API returns one summary for each file.
var results = await memory.SearchSummariesAsync(filter: MemoryFilters.ByDocument("doc1"));

// Print the summaries!
foreach (var result in results)
{
    Console.WriteLine($"== {result.SourceName} summary ==\n{result.Partitions.First().Text}\n");
}

檢索生成數(shù)據(jù)

摘要的生成和檢索在Kernel Memory中實際是數(shù)據(jù)類型標記和自定義篩選篩選的過程。

在生成摘要的過程中,將摘要內(nèi)容作為生成內(nèi)容,通過添加__synth:summary標記進行存儲,篩選的時候也是類似。文檔的標記和篩選,將會在后續(xù)【文檔管理】中的詳細講解。

而摘要的檢索的過程SearchSummariesAsync實際上也是調(diào)用SearchSyntheticsAsync過程,指定了__synth:summary標記的段落進行檢索。

同理,生成摘要的過程也可以進行自定義的過程,例如文章分類,關鍵詞提取,實體提取,題圖生成等任何的文章處理流程。后續(xù)也會詳細介紹【自定義流程】的處理。

參考

  • Summarizing documents
  • kernel-memory/service/Abstractions/KernelMemoryExtensions.cs

總結(jié)

以上是生活随笔為你收集整理的Kernel Memory 入门系列:生成并获取文档摘要的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。