NLP problem prompt engineering with chain-of-thoughts

В исследовании рассматривается проблема решения арифметических задач при помощи языковых моделей. Предлагается метод chain-of-thoughts, который заключается в подаче промта-подсказки для модели, заставляющей модель проводить промежуточные размышления во время решения задачи. Также предлагается модификация метода self-consistency, предполагающий агрегацию нескольких различных решений задачи для повышения вероятности вывода правильного ответа.

Сетап эксперимента

Модель: Bloom-176B
Датасет: GSM8K
Платформа для работы: Kaggle

Запуск эксперимента

Требуется установка библиотеки petals, это можно сделать командой !pip install -q petals Также потребуются torch, transformers, tqdm. Для этого поможет команда !pip install torch transformers tqdm

Весь код собран в юпитер ноутбуке main.ipynb в папке code.

Результаты

Результаты работы и предложения по дальнейшим продвижениям можно пронаблюдать в юпитер ноутбуке паралльно коду.

К сожеланию, собрать качественные результаты не удалось в связи с высокой загруженностью серверов инференса модели, однако эксперименты будет возможно воспроизвести если развернуть модель на своих серверах.

Трудности в процессе работы

Основной трудностью стала упомянутая выше высокая загруженность инференса. При этом даже при получении доступа время работы модели значительно затрудняет проведение качественных экспериментов.

Помимо данной проблемы возникли трудности при установке библиотеки petals из-за сложных зависимостей, которые она тянет за собой.

Name		Name	Last commit message	Last commit date
Latest commit History 27 Commits
code		code
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

NLP problem prompt engineering with chain-of-thoughts

Сетап эксперимента

Запуск эксперимента

Результаты

Трудности в процессе работы

About

Releases

Packages

Languages

License

TimkaMLG/Chain-of-Thoughts

Folders and files

Latest commit

History

Repository files navigation

NLP problem prompt engineering with chain-of-thoughts

Сетап эксперимента

Запуск эксперимента

Результаты

Трудности в процессе работы

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages