langchain-ai · davidfant · Apr 8, 2024 · Apr 10, 2024 · Apr 10, 2024 · Apr 10, 2024
diff --git a/libs/langchain-openai/src/chat_models.ts b/libs/langchain-openai/src/chat_models.ts
@@ -12,6 +12,7 @@ import {
  SystemMessageChunk,
  ToolMessage,
  ToolMessageChunk,
+ BaseMessageChunk,
  OpenAIToolCall,
  isAIMessage,
 } from "@langchain/core/messages";
@@ -253,6 +254,7 @@ export interface ChatOpenAICallOptions
  promptIndex?: number;
  response_format?: { type: "json_object" };
  seed?: number;
+ n?: number;
 }
 
 /**
@@ -522,7 +524,7 @@ export class ChatOpenAI<
  max_tokens: this.maxTokens === -1 ? undefined : this.maxTokens,
  logprobs: this.logprobs,
  top_logprobs: this.topLogprobs,
- n: this.n,
+ n: options?.n ?? this.n,
  logit_bias: this.logitBias,
  stop: options?.stop ?? this.stopSequences,
  user: this.user,
@@ -627,6 +629,29 @@ export class ChatOpenAI<
  return this._identifyingParams();
  }
 
+ async batch(
+ inputs: BaseLanguageModelInput[],
+ options?: CallOptions
+ ): Promise<BaseMessageChunk[]> {
+ const promptValues = inputs.map((i) =>
+ BaseChatModel._convertInputToPromptValue(i)
+ );
+
+ const promptValueStrings = promptValues.map((p) => p.toString());
+ if (promptValueStrings.every((p) => p === promptValueStrings[0])) {
+ const result = await this.generatePrompt(
+ [promptValues[0]],
+ { ...options, n: inputs.length } as CallOptions,
+ options?.callbacks
+ );
+ // TODO: Remove cast after figuring out inheritance
+ const chatGenerations = result.generations[0] as ChatGeneration[];
+ return chatGenerations.map((g) => g.message as BaseMessageChunk);
+ } else {
+ return super.batch(inputs, options);
+ }
+ }
+
  /** @ignore */
  async _generate(
  messages: BaseMessage[],

diff --git a/libs/langchain-openai/src/tests/chat_models.int.test.ts b/libs/langchain-openai/src/tests/chat_models.int.test.ts
@@ -99,6 +99,42 @@ test("Test ChatOpenAI tokenUsage with a batch", async () => {
  expect(tokenUsage.promptTokens).toBeGreaterThan(0);
 });
 
+test("Test ChatOpenAI batch sends prompt to API with n option if prompts are the same", async () => {
+ const model = new ChatOpenAI({
+ temperature: 2,
+ modelName: "gpt-3.5-turbo",
+ maxTokens: 10,
+ });
+
+ const generatePromptSpy = jest.spyOn(model, "generatePrompt");
+ const res = await model.batch([
+ [new HumanMessage("Hello!")],
+ [new HumanMessage("Hello!")],
+ ]);
+ console.log(res);
+ expect(res).toHaveLength(2);
+
+ expect(generatePromptSpy).toHaveBeenCalledTimes(1);
+});
+
+test("Test ChatOpenAI batch sends prompt to API in separate requests if prompts are different", async () => {
+ const model = new ChatOpenAI({
+ temperature: 2,
+ modelName: "gpt-3.5-turbo",
+ maxTokens: 10,
+ });
+
+ const generatePromptSpy = jest.spyOn(model, "generatePrompt");
+ const res = await model.batch([
+ [new HumanMessage("Hello!")],
+ [new HumanMessage("Hi")],
+ ]);
+ console.log(res);
+ expect(res).toHaveLength(2);
+
+ expect(generatePromptSpy).toHaveBeenCalledTimes(2);
+});
+
 test("Test ChatOpenAI in streaming mode", async () => {
  let nrNewTokens = 0;
  let streamedCompletion = "";