chatchat-space · pgliuchen · Mar 20, 2024 · Mar 21, 2024 · Mar 21, 2024 · Mar 21, 2024
diff --git a/requirements.txt b/requirements.txt
@@ -1,7 +1,7 @@
 torch==2.1.2
 torchvision==0.16.2
 torchaudio==2.1.2
-xformers==0.0.23.post1
+# xformers==0.0.23.post1
 transformers==4.37.2
 sentence_transformers==2.2.2
 langchain==0.0.354

diff --git a/requirements_api.txt b/requirements_api.txt
@@ -1,7 +1,7 @@
 torch~=2.1.2
 torchvision~=0.16.2
 torchaudio~=2.1.2
-xformers>=0.0.23.post1
+# xformers>=0.0.23.post1
 transformers==4.37.2
 sentence_transformers==2.2.2
 langchain==0.0.354

diff --git a/server/api.py b/server/api.py
@@ -16,6 +16,7 @@
 from server.chat.search_engine_chat import search_engine_chat
 from server.chat.completion import completion
 from server.chat.feedback import chat_feedback
+from server.customization.chat import kb_chat_with_csv_file
 from server.embeddings_api import embed_texts_endpoint
 from server.llm_api import (list_running_models, list_config_models,
  change_llm_model, stop_llm_model,
@@ -159,6 +160,11 @@ def mount_knowledge_routes(app: FastAPI):
  tags=["Chat"],
  summary="与agent对话")(agent_chat)
 
+ app.post("/customization/chat/kb_chat_with_csv_file",
+ tags=["Chat"],
+ response_model=BaseResponse,
+ summary="使用上传的数据文件，基于现有知识库对话")(kb_chat_with_csv_file)
+
  # Tag: Knowledge Base Management
  app.get("/knowledge_base/list_knowledge_bases",
  tags=["Knowledge Base Management"],

diff --git a/server/customization/__init__.py b/server/customization/__init__.py
diff --git a/server/customization/chat.py b/server/customization/chat.py
@@ -0,0 +1,216 @@
+import codecs
+import csv
+import json
+import re
+from collections import defaultdict
+
+from configs import logger
+from typing import Optional
+from urllib.parse import urlencode
+
+from fastapi import UploadFile, File, Body, Request
+from langchain.chains import LLMChain
+from langchain_core.prompts import ChatPromptTemplate
+
+from configs import VECTOR_SEARCH_TOP_K, SCORE_THRESHOLD, LLM_MODELS, TEMPERATURE
+from server.chat.utils import History
+from server.knowledge_base.kb_doc_api import search_docs
+from server.knowledge_base.kb_service.base import KBServiceFactory
+from server.utils import BaseResponse, get_ChatOpenAI, get_prompt_template, wrap_done, ListResponse
+
+
+# QUERY_TEMPLATE = '当前字段的名称是：{column_name},字段取值是：{column_value}，告诉我其对应的标准字段名称和可能的取值，并通过如下格式返回结果\n' \
+# '标准字段名称:标准字段取值'
+QUERY_TEMPLATE = '根据输入的字段名称和字段取值，根据要求的输出格式返回匹配的标准字段和一个可能的取值。 \n' \
+ '输入格式(JSON)：{"src_column_name": 输入的字段名称, "src_column_value": 输入的字段取值} \n' \
+ '输出格式(JSON)：{"src_column_name": 输入的字段名称, "src_column_value": 输入的字段取值, ' \
+ '"standard_column_name": 输出字段名称, "standard_column_value": 输出字段取值} \n' \
+ '要求：输出的结果能直接用python的json.loads()加载\n' \
+ '输入：{{input_question}}'
+
+QUERY_TEMPLATE_ALL_IN_ONE = '根据输入的字段名称和字段取值，根据要求的输出格式返回匹配的标准字段和一个可能的取值。 \n' \
+ '输入格式(JSON)：[{"src_column_name": 输入的字段名称, "src_column_value": 输入的字段取值}] \n' \
+ '输出格式(JSON)：[{"src_column_name": 输入的字段名称, "src_column_value": 输入的字段取值, ' \
+ '"standard_column_name": 输出字段名称, "standard_column_value": 输出字段取值}] \n' \
+ '注意：1. 输入采用JSON的格式一次输入多个字段 2. 输出要求采用JSON的格式一次返回全部结果 3. 输出的结果能直接用python的json.loads()加载\n' \
+ '输入：{{input_question}}'
+
+
+def kb_chat_with_csv_file(
+ file: UploadFile = File(..., description="上传csv原始数据文件"),
+ knowledge_base_name: str = Body(..., description="知识库名称", examples=["samples"]),
+ top_k: int = Body(VECTOR_SEARCH_TOP_K, description="匹配向量数"),
+ score_threshold: float = Body(SCORE_THRESHOLD,
+ description="知识库匹配相关度阈值，取值范围在0-1之间，"
+ "SCORE越小，相关度越高，"
+ "取到1相当于不筛选，建议设置在0.5左右",
+ ge=0, le=1),
+ model_name: str = Body(LLM_MODELS[0], description="用于问答的LLM 模型名称。"),
+ temperature: float = Body(TEMPERATURE, description="LLM 采样温度", ge=0.0, le=1.0),
+ max_tokens: Optional[int] = Body(
+ None,
+ description="限制LLM生成Token数量，默认None代表模型最大值"
+ ),
+ prompt_name: str = Body(
+ "default",
+ description="使用的prompt模板名称(在configs/prompt_config.py中配置)"
+ ),
+ debug: bool = Body(
+ False, description="是否开启debug模式")
+ ,
+ request: Request = None,
+) -> BaseResponse:
+ """
+ 上传原始数据文件后，使用指定知识库作为Context，进行相似度匹配后执行问答
+ """
+ kb = KBServiceFactory.get_service_by_name(knowledge_base_name)
+ if kb is None:
+ logger.error(f'Can not find {knowledge_base_name}!')
+ return BaseResponse(code=404, msg=f"未找到知识库 {knowledge_base_name}", data=[None])
+
+ # Construct queries from CSV file
+ input_data_dict = read_file(file)
+
+ # Call knowledge base chat one by one to get the answer
+ responses = list()
+ for col_name, col_val in input_data_dict.items():
+ logger.info(f'Start to handle {col_name}...')
+ col_val_list = list(col_val)
+ input_query = {"src_column_name": col_name, "src_column_value": col_val_list[0]}
+
+ query = QUERY_TEMPLATE_ALL_IN_ONE.replace("{{input_question}}", json.dumps(input_query))
+ result = knowledge_base_chat_iterator(
+ knowledge_base_name,
+ score_threshold,
+ query,
+ top_k,
+ max_tokens,
+ model_name,
+ prompt_name,
+ temperature,
+ request
+ )
+ result['answer_json'] = None
+ match_obj = re.search(r'\n\n(```json)?([^`]*)(```)?', result['answer']['text'], re.S)
+ logger.info(f'------[result]-----{result}')
+ if match_obj:
+ logger.info(f'-----[matched]----{match_obj.group(2)}')
+ try:
+ result['answer_json'] = json.loads(match_obj.group(2))
+ except:
+ logger.error(f'json failed to load {match_obj.group(2)}')
+ pass
+ else:
+ try:
+ result['answer_json'] = json.loads(result['answer']['text'])
+ except:
+ logger.error('json failed to load {result["answer"]["text"]}')
+ pass
+ if result['answer_json'] is None:
+ result['answer_json'] = result['answer']['text']
+ response = {
+ 'src_col_name': col_name,
+ 'src_col_value': col_val_list[0],
+ 'result': result if debug is True else result['answer_json']
+ }
+ responses.append(response)
+ logger.info(f'Finish handling {col_name}')
+ logger.info(f'Final data: {responses}')
+ return BaseResponse(data=responses)
+
+
+def read_file(file):
+ """
+ Read csv file and conver to dict as below:
+ col_a: {va1, va2, va3, ...}
+ col_b: {vb1, vb2, vb3, ...}
+ ...: ...
+ """
+ csv_reader = csv.DictReader(codecs.iterdecode(file.file, 'utf-8'))
+ data = defaultdict(set)
+ for row in csv_reader:
+ for k, v in row.items():
+ data[k].add(v)
+ file.file.close()
+ return data
+
+
+def knowledge_base_chat_iterator(
+ knowledge_base_name: str,
+ score_threshold: float,
+ query: str,
+ top_k: int,
+ max_tokens: Optional[int],
+ model_name: str,
+ prompt_name: str,
+ temperature: float,
+ request: Request,
+):
+ """
+ 知识库问答，返回JSON格式的结果
+ {
+ 'answer': "xxxx",
+ 'docs': [source_doc, ...]
+ }
+ """
+ # Load LLM
+ model = get_ChatOpenAI(
+ model_name=model_name,
+ temperature=temperature,
+ max_tokens=max_tokens,
+ )
+
+ # Knowledge Base Search
+ docs = search_docs(query=query,
+ knowledge_base_name=knowledge_base_name,
+ top_k=top_k,
+ score_threshold=score_threshold)
+ context = "\n".join([doc.page_content for doc in docs])
+
+ # Compose prompt based on searching results
+ if len(docs) == 0: # 如果没有找到相关文档，使用empty模板
+ prompt_template = get_prompt_template("knowledge_base_chat", "empty")
+ else:
+ prompt_template = get_prompt_template("knowledge_base_chat", prompt_name)
+ input_msg = History(role="user", content=prompt_template).to_msg_template(False)
+ chat_prompt = ChatPromptTemplate.from_messages([input_msg])
+
+ # Execute LLMChain directly
+ answer = LLMChain(prompt=chat_prompt, llm=model).invoke({"context": context, "question": query})
+
+ # Add original search results into the final answers
+ source_documents = []
+ for inum, doc in enumerate(docs):
+ filename = doc.metadata.get("source")
+ parameters = urlencode({"knowledge_base_name": knowledge_base_name, "file_name": filename})
+ base_url = request.base_url
+ url = f"{base_url}knowledge_base/download_doc?" + parameters
+ text = f"""出处 [{inum + 1}] [{filename}]({url}) \n\n{doc.page_content}\n\n"""
+ source_documents.append(text)
+
+ if len(source_documents) == 0: # 没有找到相关文档
+ source_documents.append(f"<span style='color:red'>未找到相关文档,该回答为大模型自身能力解答！</span>")
+
+ return {
+ "answer": answer,
+ "docs": source_documents
+ }
+
+
+def knowledge_base_chat_iterator_mockup(
+ knowledge_base_name: str,
+ score_threshold: float,
+ query: str,
+ top_k: int,
+ max_tokens: Optional[int],
+ model_name: str,
+ prompt_name: str,
+ temperature: float,
+ request: Request,
+):
+ logger.info(f'{knowledge_base_name}\n{score_threshold}\n{query}\n{top_k}\n{max_tokens}\n{model_name}\n{prompt_name}'
+ f'\n{temperature}\n{request}')
+ return {
+ "answer": "no correct answer",
+ "docs": []
+ }