मैं कोशिश कर रहा था करने के लिए प्रक्रिया पूर्व अपने डेटा का उपयोग कर सामान्य बनाने.
# preprocessing
import tensorflow as tf
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np
from tensorflow.keras import layers
from sklearn.compose import make_column_transformer
from sklearn.preprocessing import MinMaxScaler, OneHotEncoder
from sklearn.model_selection import train_test_split
np.set_printoptions(precision=3, suppress=True)
btc_data = pd.read_csv(
"output.csv",
names=["Time", "Open"])
ct = make_column_transformer(
(MinMaxScaler(), ["Time", "Open"]),
(OneHotEncoder(handle_unknown="ignore"), ["Time", "Open"])
)
X_btc = btc_data["Time"]
y_btc = btc_data["Open"]
X_train, X_test, y_train, y_test = train_test_split(X_btc, y_btc, test_size=0.2, random_state=62)
ct.fit(X_train)
X_train_normal = ct.transform(X_train)
X_test_normal = ct.transform(X_test)
कोड चलाता है पर एक Colab नोटबुक है । डाटासेट से है Kaple है और यह संशोधित किया जा करने के लिए का पूरा यूनिक्स टाइमस्टैम्प और एक और स्तंभ के लिए कीमतों Bitcoin के खुले पर उन समय पर. के बाद spliting डेटा और बनाने के एक स्तंभ ट्रांसफार्मर, मैं करने की कोशिश की फिटिंग डेटा. हालांकि, मैं निम्नलिखित त्रुटि मिलती है:
---------------------------------------------------------------------------
IndexError Traceback (most recent call last)
<ipython-input-44-f73622372111> in <module>()
27 print(X_train.shape)
28
---> 29 ct.fit(X_train)
30 X_train_normal = ct.transform(X_train)
31 X_test_normal = ct.transform(X_test)
3 frames
/usr/local/lib/python3.7/dist-packages/sklearn/utils/__init__.py in _get_column_indices(X, key)
387 :func:`_safe_indexing_column`.
388 """
--> 389 n_columns = X.shape[1]
390
391 key_dtype = _determine_key_type(key)
IndexError: tuple index out of range
मैं सोच रहा हूँ अगर यह है एक आकार मुद्दा है, लेकिन एक नोट के रूप में, के X_train डेटा के आकार (2020896,)
.
वहाँ कुछ है मैं के साथ क्या करना है अपने डेटा को ठीक करने के लिए इस त्रुटि है?