ResourceExhaustedError: OOM जब आवंटन tensor के साथ आकार[32,32,239,239] और प्रकार फ्लोट

Question 1

मैं कोशिश कर रहा हूँ विश्राम करने के लिए सीएनएन छवि मान्यता मॉडल से यह कागज(1 मॉडल) का उपयोग कर विभिन्न छवियों. हालांकि, मॉडल फिटिंग रिटर्न मुझे एक ResourceExhaustedError पर पहली epoch. बैच का आकार पहले से ही काफी छोटे तो मैं अनुमान लगा रहा हूँ के साथ समस्या है मेरे मॉडल परिभाषा जो मैं कॉपी कागज से. किसी भी सलाह के लिए पर परिवर्तन के साथ मॉडल की सराहना की जाएगी । धन्यवाद!

#Load dataset
BATCH_SIZE = 32
IMG_SIZE = (244,244)
train_set = tf.keras.preprocessing.image_dataset_from_directory(
    main_dir, 
    shuffle = True,
    image_size = IMG_SIZE,
    batch_size = BATCH_SIZE)
val_set = tf.keras.preprocessing.image_dataset_from_directory(
    main_dir, 
    shuffle = True, 
    image_size = IMG_SIZE,
    batch_size = BATCH_SIZE)
class_names = train_set.class_names
print(class_names)

#Augment data by flipping image and random rotation
data_augmentation = tf.keras.Sequential([
    tf.keras.layers.experimental.preprocessing.RandomFlip('horizontal'),
    tf.keras.layers.experimental.preprocessing.RandomRotation(0.2),
])

#Model definition 
model = Sequential([
    data_augmentation,
    tf.keras.layers.experimental.preprocessing.Rescaling(1./255),
    Conv2D(filters=64,kernel_size=(4,4), activation='relu'),
    Conv2D(filters=32,kernel_size=(3,3), activation='relu'),
    AveragePooling2D(pool_size=(4,4)),

    Conv2D(filters=32,kernel_size=(3,3), activation='relu'),
    Conv2D(filters=32,kernel_size=(3,3), activation='relu'),
    Conv2D(filters=32,kernel_size=(3,3), activation='relu'),
    AveragePooling2D(pool_size=(2,2)),
    Flatten(),
    
    Dense(256, activation='relu'),
    Dense(256, activation='relu'),
    Dense(128, activation='relu'),
    Dense(128, activation='relu'),
    Dense(128, activation='tanh'),
    Dense(1, activation='softmax')

])

model.compile(optimizer='RMSprop',
              loss=keras.losses.CategoricalCrossentropy(from_logits=True),
              metrics=[keras.metrics.CategoricalAccuracy()])

history = model.fit(train_set,validation_data=val_set, epochs=150)

त्रुटि के बाद फिटिंग मॉडल:

ResourceExhaustedError:  OOM when allocating tensor with shape[32,32,239,239] and type float on /job:localhost/replica:0/task:0/device:GPU:0 by allocator GPU_0_bfc
     [[node gradient_tape/sequential_1/average_pooling2d/AvgPoolGrad (defined at <ipython-input-10-ef749d320491>:1) ]]

nvidia-smi

+-----------------------------------------------------------------------------+
| NVIDIA-SMI 460.91.03    Driver Version: 460.91.03    CUDA Version: 11.2     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  GeForce 940MX       Off  | 00000000:01:00.0 Off |                  N/A |
| N/A   46C    P0    N/A /  N/A |   1938MiB /  2004MiB |      2%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+
                                                                               
+-----------------------------------------------------------------------------+
| Processes:                                                                  |
|  GPU   GI   CI        PID   Type   Process name                  GPU Memory |
|        ID   ID                                                   Usage      |
|=============================================================================|
|    0   N/A  N/A       959      G   /usr/lib/xorg/Xorg                 97MiB |
|    0   N/A  N/A      1270      G   /usr/bin/gnome-shell               25MiB |
|    0   N/A  N/A      4635      G   /usr/lib/firefox/firefox          212MiB |
|    0   N/A  N/A      5843      C   /usr/bin/python3                 1595MiB |
+-----------------------------------------------------------------------------+

Question 2

त्रुटि के कारण होता है अपने GPU स्मृति से बाहर चलाने. यह हो सकता है क्योंकि या तो 1) आप कर रहे हैं लोड हो रहा है बहुत ज्यादा डेटा प्रति epoch के लिए भी अपने GPU, या 2) यदि आप ऐसा करने के लिए पर्याप्त है VRAM, एक और प्रक्रिया भंडार के कुछ स्मृति के बीच epochs. यह हो सकता है, क्योंकि ... बदलेगी देश के भंडार का 100% VRAM के क्रम में. आप कर सकते हैं की राशि को सीमित VRAM सुरक्षित करने के लिए अभी क्या जरूरत है.

import tensorflow as tf
for gpu in tf.config.list_physical_devices("GPU")
    tf.config.experimental.set_memory_growth(gpu, True)

संपादित करें: अपने ग्राफिक्स कार्ड के साथ, मैं काफी कुछ कर रहा हूँ आप पर्याप्त नहीं है VRAM के लिए अपने बैच आकार और इनपुट आकार (तो समस्या 1). आप होना चाहिए कम अपने बैच आकार.

Djinn · Answer 1 · 2021-11-23T17:57:42

त्रुटि के कारण होता है अपने GPU स्मृति से बाहर चलाने. यह हो सकता है क्योंकि या तो 1) आप कर रहे हैं लोड हो रहा है बहुत ज्यादा डेटा प्रति epoch के लिए भी अपने GPU, या 2) यदि आप ऐसा करने के लिए पर्याप्त है VRAM, एक और प्रक्रिया भंडार के कुछ स्मृति के बीच epochs. यह हो सकता है, क्योंकि ... बदलेगी देश के भंडार का 100% VRAM के क्रम में. आप कर सकते हैं की राशि को सीमित VRAM सुरक्षित करने के लिए अभी क्या जरूरत है.

import tensorflow as tf
for gpu in tf.config.list_physical_devices("GPU")
    tf.config.experimental.set_memory_growth(gpu, True)

संपादित करें: अपने ग्राफिक्स कार्ड के साथ, मैं काफी कुछ कर रहा हूँ आप पर्याप्त नहीं है VRAM के लिए अपने बैच आकार और इनपुट आकार (तो समस्या 1). आप होना चाहिए कम अपने बैच आकार.

ResourceExhaustedError: OOM जब आवंटन tensor के साथ आकार[32,32,239,239] और प्रकार फ्लोट

सवाल

सबसे अच्छा जवाब

अन्य भाषाओं में

यह पृष्ठ अन्य भाषाओं में है

इस श्रेणी में लोकप्रिय

लोकप्रिय सवाल इस श्रेणी में