Skip to content

v0.2.10版本如何自定义文档嵌入和文档检索逻辑 #3015

Closed Answered by dosubot bot
michaelxu1107 asked this question in Q&A
Discussion options

You must be logged in to vote

🤖

嘿,@michaelxu1107!很高兴再次见到你。期待这次又是怎样的有趣对话呢?👾

是的,Langchain-Chatchat v0.2.10版本支持自定义文档嵌入和文档检索逻辑。您提供的上下文显示了一个Python脚本,该脚本修改了嵌入模型的分词器,以在模型中包含用于嵌入的关键词。这是通过add_keyword_to_modeladd_keyword_to_embedding_model函数完成的。

然而,需要注意的是,从0.3.0版本开始,这个功能被标记为已弃用,如get_keyword_embedding函数中的@deprecated装饰器所示。这意味着这个功能将在未来的版本中被移除,不建议在新项目中使用。

以下是相关代码:

@deprecated(
        since="0.3.0",
        message="自定义关键词 Langchain-Chatchat 0.3.x 重写, 0.2.x中相关功能将废弃",
        removal="0.3.0"
    )
def get_keyword_embedding(bert_model, tokenizer, key_words):
    tokenizer_output = tokenizer(key_words, return_tensors="pt", padding=True, truncation=True)
    input_ids = tokenizer_output['input_ids']
    input_ids = input_ids[:, 1:-1]
…

Replies: 1 comment

Comment options

You must be logged in to vote
0 replies
Answer selected by zRzRzRzRzRzRzR
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Category
Q&A
Labels
None yet
1 participant