Máy tính Hưng Danh

RTX A6000 vs RTX 3090 Deep Learning Benchmarks

RTX A6000 vs RTX 3090 Deep Learning Benchmarks được thực hiện bởi Lambda lab. Họ đã sắp xếp các chiếc máy server và workstation với RTX 3090 và RTX A6000 GPU lại với nhau. Trong bài này chúng ta sẽ benchmark tốc độ training của các dòng GPU đứng đầu thị trường hiện nay.

Về việc training image model (convnets) với PyTorch, 1 chiếc RTX A6000 sẽ …

  • Nhanh gần bằng 0.92x RTX 3090 sử dụng độ chính xác 32-bit.*
  • Nhanh hơn RTX 3090 gấp 1.01x sử dụng độ chính xác hỗn hợp.

Về việc training language model (tranformers) với PyTorch, 1 chiếc RTX A6000 sẽ …

  • Nhanh hơn RTX 3090 gấp 1.34x sử dụng độ chính xác 32-bit.
  • Nhanh hơn RTX 3090 gấp 1.34x sử dụng độ chính xác hỗn hợp.

Về việc training image model (convnets) với PyTorch, 8 chiếc RTX A6000 sẽ …

  • Nhanh hơn RTX 3090 gấp 1.13x sử dụng độ chính xác 32-bit.
  • Nhanh hơn RTX 3090 gấp 1.14x sử dụng độ chính xác hỗn hợp.

Về việc training language model (tranformers) với PyTorch, 1 chiếc RTX A6000 sẽ …

  • Nhanh hơn RTX 3090 gấp 1.36x sử dụng độ chính xác 32-bit.
  • Nhanh hơn RTX 3090 gấp 1.33x sử dụng độ chính xác hỗn hợp.

* Trong bài post này, 32-bit được xem là TF32; Độ chính xác hỗn hợp được xem là Automatic Mixed Precision (AMP).

** GPUDirect peer-to-peer (thông qua PCIe) được bật cho RTX A6000, nhưng không hoạt động với những chiếc RTX 3090.

RTX A6000 vs RTX 3090 benchmarks tốc độ training convnets với PyTorch

RTX A6000 vs RTX 3090 Deep Learning Benchmarks
  • Tất cả các thông số đều lấy tốc độ huấn luyện của 1 chiếc RTX 3090 để làm chuẩn.
  • Tốc độ huấn luyện 32-bit của image model với 1 RTX A6000 hơi chậm hơn (0.92x lần) so với 1 chiếc RTX 3090. Tuy nhiên, vì khả năng giao tiếp nhanh hơn giữa các GPU, huấn luyện 32-bit của 4x/8x RTX A6000 nhanh hơn 4x/8x RTX 3090. Tốc độ cũng tương tự với độ chính xác hỗn hợp.
  • Các kết quả ngang nhau ở SSD, RéNt-50, vàn Mask RCNN.
  • Chúng tôi sử dụng tối đa số lượng mẫu dữ liệu trong 1 batch (batch sizes) có thể phù hợp với bộ nhớ của các GPU.

RTX A6000 vs RTX 3090 Benchmarks tốc độ training language model với PyTorch

RTX A6000 vs RTX 3090 Deep Learning Benchmarks
  • Tất cả các thông số đều lấy tốc độ huấn luyện của 1 chiếc RTX 3090 để làm chuẩn.
  • Không giống như image model, ở phần language model, RTX A6000 luôn nhanh hon ít nhất là 1.3x lần so với RTX 3090. Điều này có lẽ nằm ở vấn đề memory; chiếc RTX A6000 được hưởng ưu thế hơn với 24GB RAM ở GPU so với RTX 3090.
  • Các kết quả đều ngang nhau ở Transformer-XL base và Transformer-XL large.
  • Chúng tôi sử dụng tối đa số lượng mẫu dữ liệu trong 1 batch (batch sizes) có thể phù hợp với bộ nhớ của các GPU.

Liên hệ ngay MÁY TÍNH HƯNG DANH để được tư vấn các giải pháp Training AI và Deep Learning 

Tham khảo các giải pháp Workstation TẠI ĐÂY

Trả lời

Địa chỉ email của bạn sẽ không được công bố.