मैं एक शुरुआत के साथ अनुसंधान और मदद की जरूरत है के साथ काम. उत्पादन की डमी डेटासेट के साथ dput (वास्तविक सेट वास्तव में बड़ा है):
structure(list(CODE = c(453, 463, 476,
798, 885, 582, 626, 663, 457, 408
), CATEGORY = c("CIG", "BET", "CIG", "CIG", "ARI", "CRR", "ARI", "CIG",
"CIG", "BET"), AMOUNT = c(22, 5, 6, 52, 16, 11, 6, 70, 208, 5),
PRICE = c(5.56, 8.29, 3.89, 3.8, 4.05, 3.99, 3.55, 7.69, 6.75,
5.2), BRAND = c("ROTHMANS", "ALLINO", "MARLBORO", "ROTHMANS", "AURIELO",
"SOLINOS", "CHLEBLO", "MARLBORO", "LD", "SOLINOS"
)), row.names = c(NA, -10L), class = c("tbl_df",
"tbl", "data.frame"))
क्या किया जाना चाहिए: एक स्तंभ होगा जो दिखाने के शेयर में हर ब्रांड के प्रतिशत में जोड़ा जाना चाहिए. पहले मैं क्या किया है है बनाने के लिए एक नया स्तंभ "मान" इस तरह से है:
df$VALUE <- with(df, AMOUNT*PRICE)
अब स्तंभ का हिस्सा बनाया जाना चाहिए में इस तरह के एक तरीका है: योग के मूल्यों से (स्तंभ मान) की एक विशेष ब्रांड में एक विशेष वर्ग से विभाजित राशि के मूल्यों की पूरी श्रेणी. उदाहरण के लिए, "ROTHMANS है" श्रेणी में CIG, मूल्यों की राशि के लिए यह है 319.92, योग के लिए पूरी CIG श्रेणी है 2285,56, तो, शेयर=14%. और यह गणना की जानी चाहिए प्रत्येक मामले में. मुझे लगता है कि dplyr पुस्तकालय उपयुक्त हो सकता है, लेकिन एक समाधान नहीं ढूँढ सकता.