Video Captioning

В задаче Video Captioning (создание текстового описания к видео) модели необходимо проанализировать короткий видеофрагмент и сгенерировать наиболее подходящее текстовое описание на английском языке, которое характеризует события и/или действия, происходящие на видео.

Generated Caption: a woman and her dog on the beach

Решение

Пайплайн работы модели включает в себя следующие этапы: вычисление для входного видео эмбеддингов с помощью CLIP, которые далее пропускаются через MLP адаптер для GPT декодера и декодер предсказывает ответ.

Метрика

Используется метрика BLEU, которая позволяет сравнить эталонный и предсказанный текст. При этом BLEU оценивает не только соответствие отдельных слов, но и n-грамм, содержащихся в тексте. Метрика BLEU была изначально предложена для оценки качества машинного перевода, однако она может применяться в любых задачах, в которых необходимо оценить близость двух текстов (при этом, допуская вариативность текстов-кандидатов, что важно в задаче описания видео).

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
README.md		README.md
config.py		config.py
model.py		model.py
preprocess.ipynb		preprocess.ipynb
train_blip.ipynb		train_blip.ipynb
train_gpt+mlp.ipynb		train_gpt+mlp.ipynb
utils.py		utils.py
validate.ipynb		validate.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Video Captioning

Решение

Метрика

About

Releases

Packages

Languages

KARTASAR/video-captioning

Folders and files

Latest commit

History

Repository files navigation

Video Captioning

Решение

Метрика

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages