⚙️ Scikit-learn Cheat Sheet

📄 Documentação Oficial do Sklearn

# Módulo / Função O que faz Exemplo
1train_test_splitDivide os dados em conjuntos de treino e testeX_train, X_test, y_train, y_test = train_test_split(X, y)
2StandardScaler()Padroniza características (média=0, variância=1)scaler.fit_transform(X_train)
3LabelEncoder()Converte rótulos de texto em números (0, 1, 2...)le.fit_transform(['sim', 'não'])
4OneHotEncoder()Cria variáveis dummy (binárias) para categoriasohe.fit_transform(X[['cor']])
5LinearRegression()Regressão Linear simples ou múltiplamodel = LinearRegression().fit(X, y)
6RandomForestRegressor()Regressão usando florestas aleatóriasrf.fit(X_train, y_train)
7LogisticRegression()Classificação Linear (apesar do nome)clf.fit(X_train, y_train)
8KNeighborsClassifier()Classificação baseada em vizinhos próximos (KNN)knn = KNeighborsClassifier(n_neighbors=3)
9SVC()Máquinas de Vetores de Suporte (Support Vector Machines)svc.fit(X_train, y_train)
10DecisionTreeClassifier()Árvore de Decisão para classificaçãotree.fit(X_train, y_train)
11KMeans()Agrupa dados em K clusters baseados em distânciakmeans = KMeans(n_clusters=3).fit(X)
12.fit(X, y)Treina o modelo com os dados fornecidosmodel.fit(X_train, y_train)
13.predict(X)Faz previsões para novos dadosy_pred = model.predict(X_test)
14.predict_proba(X)Retorna a probabilidade de cada classe (classificadores)model.predict_proba(X_test)
15.score(X, y)Retorna a precisão média do modelomodel.score(X_test, y_test)
16accuracy_score()Calcula a precisão (acertos totais)accuracy_score(y_test, y_pred)
17confusion_matrix()Gera matriz de confusão (Erros Tipo I e II)confusion_matrix(y_test, y_pred)
18classification_report()Relatório com Precision, Recall e F1-Scoreprint(classification_report(y_test, y_pred))
19mean_squared_error()Erro Quadrático Médio (para regressão)mse(y_test, y_pred)
20GridSearchCV()Busca exaustiva pelos melhores hiperparâmetrosgrid.fit(X_train, y_train)
21cross_val_score()Avalia o modelo usando validação cruzadacross_val_score(model, X, y, cv=5)
22Pipeline()Encadeia transformações e modelo final num objeto sóPipeline([('scaler', StandardScaler()), ('svc', SVC())])