नया करने के लिए NN के. एक सीएनएन प्रशिक्षित किया जा सकता का पता लगाने के लिए एक ही वस्तु में एक छवि है. हालांकि, अगर किसी भी छवि में एक डाटासेट सकता है किसी भी शामिल n # की वस्तुओं. यह करता है नहीं एक समस्या खड़ी करने के लिए CNNs उत्पादन के रूप में घने परत करने के लिए है हो सकता है एक निश्चित आकार? कैसे आप इस समस्या को हल?
उदाहरण के लिए: चलो कहते हैं कि मैं बेतरतीब ढंग से जांचा 2 छवियों के इस सेट से. छवि 1 2 वस्तुओं और छवि 2 में 5 वस्तुओं. Y लेबल के लिए img1 शामिल होगा bounding बॉक्स के लिए निर्देशांक 2 वस्तुओं; y लेबल के लिए img2 शामिल होगा निर्देशांक के लिए 5 वस्तुओं -- बहुत बड़ा y वेक्टर से img1.
एक संभव समाधान है? :
मैं जरूरत को खोजने के लिए छवि के साथ सबसे बड़ा # की वस्तुओं (नामित के रूप में यह मान एम). चलो यह भी कहना है कि एक वस्तु है 4 निर्देशांक. यदि M = 5, मैं की जरूरत है एक वाई के वेक्टर 20. अगर एक छवि है 1 वस्तु, y वेक्टर शामिल होगा 4 गैर-शून्य मान और 16 शून्य मान । 4 गैर-शून्य मान का प्रतिनिधित्व करेंगे निर्देशांक और 16 शून्य मूल्यों का प्रतिनिधित्व करेंगे के निर्देशांक अन्य अस्तित्वहीन वस्तुओं.