Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

What is the GPU version and cuda version? #13

Open
LemonQC opened this issue May 18, 2023 · 14 comments
Open

What is the GPU version and cuda version? #13

LemonQC opened this issue May 18, 2023 · 14 comments

Comments

@LemonQC
Copy link

LemonQC commented May 18, 2023

No description provided.

@yangli18
Copy link
Owner

We used RTX 3090 and V100 GPUs with CUDA 11.

@Mr-Bigworth
Copy link

We used RTX 3090 and V100 GPUs with CUDA 11.

请问四卡v100训练大概多长时间哇

@Mr-Bigworth
Copy link

如果有两卡A100能复现训练过程不

@yangli18
Copy link
Owner

@Mr-Bigworth

We used RTX 3090 and V100 GPUs with CUDA 11.

请问四卡v100训练大概多长时间哇

这个看你的数据集多大,这个工作的训练都还比较快,训练时间应该不用怎么担心。

如果有两卡A100能复现训练过程不

两卡A100应该显存是够用,可以训练的。

@Mr-Bigworth
Copy link

@Mr-Bigworth

We used RTX 3090 and V100 GPUs with CUDA 11.

请问四卡v100训练大概多长时间哇

这个看你的数据集多大,这个工作的训练都还比较快,训练时间应该不用怎么担心。

如果有两卡A100能复现训练过程不

两卡A100应该显存是够用,可以训练的。

谢谢!

@Mr-Bigworth
Copy link

@Mr-Bigworth

We used RTX 3090 and V100 GPUs with CUDA 11.

请问四卡v100训练大概多长时间哇

这个看你的数据集多大,这个工作的训练都还比较快,训练时间应该不用怎么担心。

如果有两卡A100能复现训练过程不

两卡A100应该显存是够用,可以训练的。

您好,我在复现过程中发现十个epoch之后会报显存oom错误,请问可能是什么原因哇。好像两卡40GA100也不太够VLTVG_R50_gref.py的配置。

@Mr-Bigworth
Copy link

Mr-Bigworth commented Jul 29, 2023

@Mr-Bigworth

We used RTX 3090 and V100 GPUs with CUDA 11.

请问四卡v100训练大概多长时间哇

这个看你的数据集多大,这个工作的训练都还比较快,训练时间应该不用怎么担心。

如果有两卡A100能复现训练过程不

两卡A100应该显存是够用,可以训练的。

嗷,好像是freeze_epochs,10个freeze_epochs后会训练bert对么(想请教下那有没有可能在不修改bs的情况下减少显存占用呢)

@yangli18
Copy link
Owner

yangli18 commented Aug 7, 2023

@Mr-Bigworth
可以试试梯度累积,一个大batch分成两份进行梯度求导。

@Mr-Bigworth
Copy link

@Mr-Bigworth 可以试试梯度累积,一个大batch分成两份进行梯度求导。

嗯嗯,谢谢!!后来想办法解决了。

@0000000wmz
Copy link

师兄们好,请问你们都跑到了论文中的精度了嘛?

@arandinglv
Copy link

单张3090可以吗?

@Mr-Bigworth
Copy link

单张3090可以吗?

可以的 用bs32跑 r50可以

@beierdada
Copy link

你好你好呀 我现在也在学习这篇论文,但是referit数据集下载连接失效了,可以麻烦你发一份给我嘛 邮箱是[email protected]

@beierdada
Copy link

单张3090可以吗?

可以的 用bs32跑 r50可以

你好你好呀 我现在也在学习这篇论文,但是referit数据集下载连接失效了,可以麻烦你发一份给我嘛 邮箱是[email protected]

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

6 participants