📈 StatsModels Cheat Sheet

📉 Site oficial do StatsModels (Documentação)

ID Comando / Função / Parâmetro O que faz Exemplo
1sm.OLS()Regressão Linear por Mínimos Quadrados Ordináriossm.OLS(y, X).fit()
2sm.WLS()Regressão por Mínimos Quadrados Ponderadossm.WLS(y, X, weights=w).fit()
3sm.GLS()Regressão por Mínimos Quadrados Generalizadossm.GLS(y, X, sigma=s).fit()
4sm.RecursiveLS()Mínimos Quadrados Recursivossm.RecursiveLS(y, X).fit()
5sm.QuantReg()Regressão Quantílicasm.QuantReg(y, X).fit(q=0.5)
6sm.Logit()Regressão Logística (Logit)sm.Logit(y, X).fit()
7sm.Probit()Regressão Probitsm.Probit(y, X).fit()
8sm.MNLogit()Regressão Logística Multinomialsm.MNLogit(y, X).fit()
9sm.Poisson()Regressão de Poisson para contagemsm.Poisson(y, X).fit()
10sm.NegativeBinomial()Regressão Binomial Negativasm.NegativeBinomial(y, X).fit()
11sm.GLM()Modelos Lineares Generalizados (Interface)sm.GLM(y, X, family=sm.families.Binomial())
12sm.RLM()Modelos Lineares Robustossm.RLM(y, X).fit()
13sm.tsa.ARIMA()Modelo ARIMA (Autoregressivo, Integrado e Médias Móveis)sm.tsa.ARIMA(df, order=(1,1,1))
14sm.tsa.SARIMAX()Modelo ARIMA Sazonal com Variáveis Exógenassm.tsa.SARIMAX(y, order=(p,d,q), seasonal_order=(P,D,Q,s))
15sm.tsa.ExponentialSmoothing()Suavização Exponencial (Holt-Winters)sm.tsa.ExponentialSmoothing(y, trend='add').fit()
16sm.tsa.seasonal_decompose()Decomposição clássica (tendência, sazonalidade, resíduo)seasonal_decompose(df['valor'], model='additive')
17sm.tsa.stattools.adfuller()Teste Augmented Dickey-Fuller para estacionariedadeadfuller(df['serie'])
18sm.tsa.stattools.kpss()Teste KPSS para estacionariedadekpss(df['serie'])
19sm.graphics.tsaplots.plot_acf()Gráfico de Autocorrelação (ACF)plot_acf(df['serie'])
20sm.graphics.tsaplots.plot_pacf()Gráfico de Autocorrelação Parcial (PACF)plot_pacf(df['serie'])
21sm.tsa.VAR()Vetor Autoregressivo para séries multivariadassm.tsa.VAR(df).fit()
22sm.stats.anova_lm()Tabela ANOVA para modelos linearessm.stats.anova_lm(model)
23sm.stats.ttest_ind()Teste T para duas amostras independentessm.stats.ttest_ind(x1, x2)
24sm.stats.diagnostic.het_breuschpagan()Teste de Breusch-Pagan para heterocedasticidadehet_breuschpagan(resids, X)
25sm.stats.diagnostic.lilliefors()Teste de Lilliefors para normalidadelilliefors(df['col'])
26sm.stats.diagnostic.acorr_ljungbox()Teste Ljung-Box para independência de resíduosacorr_ljungbox(resids)
27sm.stats.stattools.durbin_watson()Estatística de Durbin-Watson para autocorrelaçãodurbin_watson(resids)
28sm.stats.outliers_influence.variance_inflation_factor()Cálculo do VIF para multicolinearidadevariance_inflation_factor(X.values, i)
29smf.ols()Regressão Linear usando fórmulas de stringsmf.ols('y ~ x1 + x2', data=df).fit()
30smf.logit()Regressão Logística usando fórmulassmf.logit('y ~ x1', data=df).fit()
31smf.mixedlm()Modelos Lineares de Efeitos Mistossmf.mixedlm('y ~ x', df, groups=df['grp']).fit()
32model.summary()Exibe relatório estatístico completoresults.summary()
33model.paramsRetorna os coeficientes calculadosresults.params
34model.pvaluesRetorna os p-valores de cada variávelresults.pvalues
35model.rsquaredCoeficiente de Determinação (R²)results.rsquared
36model.residRetorna os resíduos do modeloresults.resid
37model.predict()Gera previsões a partir de novos dadosresults.predict(new_X)
38model.conf_int()Intervalos de confiança dos coeficientesresults.conf_int(alpha=0.05)
39model.aicCritério de Informação de Akaike (AIC)results.aic
40model.bicCritério de Informação Bayesiano (BIC)results.bic
41sm.add_constant()Adiciona coluna de intercepto à matriz XX = sm.add_constant(X)
42sm.datasets.get_rdataset()Carrega datasets clássicos da linguagem Rsm.datasets.get_rdataset('mtcars').data
43sm.graphics.plot_regress_exog()Gráficos diagnósticos de regressãosm.graphics.plot_regress_exog(res, 'x1')
44missing=Parâmetro para lidar com NaNs ('drop', 'raise')sm.OLS(y, X, missing='drop')
45cov_type=Tipo de estimador de matriz de covariância (HC1, HC3)results.fit(cov_type='HC3')
46family=sm.families.Binomial()Distribuição para GLM (Binomial)family=sm.families.Binomial()
47family=sm.families.Gamma()Distribuição para GLM (Gamma)family=sm.families.Gamma()
48family=sm.families.Tweedie()Distribuição para GLM (Tweedie)family=sm.families.Tweedie()
49link=sm.families.links.Log()Função de ligação log para modelos lineareslink=sm.families.links.Log()
50sm.stats.proportion_confint()Intervalo de confiança para proporçõesproportion_confint(count, nobs)
51sm.stats.DescrStatsW()Estatística descritiva com pesossm.stats.DescrStatsW(data, weights=w)
52sm.stats.multicomp.pairwise_tukeyhsd()Teste de Tukey para múltiplas comparaçõespairwise_tukeyhsd(endog, groups)
53sm.graphics.influence_plot()Gráfico de influência e outlierssm.graphics.influence_plot(results)
54sm.graphics.plot_partregress_grid()Gráficos de regressão parcial em gradesm.graphics.plot_partregress_grid(results)
55sm.tsa.filters.hp_filter.hpfilter()Filtro Hodrick-Prescott para tendênciascycle, trend = hpfilter(df)
56sm.tsa.stattools.grangercausalitytests()Teste de Causalidade de Grangergrangercausalitytests(df, maxlag=2)
57sm.stats.power.TTestIndPower()Cálculo de poder estatísticoTTestIndPower().solve_power(...)
58sm.stats.diagnostic.het_white()Teste de White para heterocedasticidadehet_white(resids, X)
59sm.stats.diagnostic.linear_rainbow()Teste Rainbow de linearidadelinear_rainbow(results)
60sm.stats.diagnostic.breaks_hansen()Teste de instabilidade de parâmetros de Hansenbreaks_hansen(results)
61sm.nonparametric.kernel_regression.KernelReg()Regressão por Kernel não paramétricaKernelReg(y, X, var_type='c')
62sm.stats.proportions_ztest()Teste Z para proporçõesproportions_ztest(count, nobs)
63sm.stats.rank_compare_2indep()Compara distribuições de duas amostrasrank_compare_2indep(x, y)
64sm.duration.HazardRegression()Modelos de análise de sobrevivênciaHazardRegression(y, X).fit()
65sm.stats.Mediation()Análise de mediação estatísticaMediation(model_y, model_m, treat, mediator).fit()
66sm.robust.norms.HuberT()Norma Huber para regressão robustasm.RLM(y, X, M=sm.robust.norms.HuberT())
67sm.robust.norms.TukeyBiweight()Norma Tukey Biweight para RLMM=sm.robust.norms.TukeyBiweight()
68sm.stats.multitest.multipletests()Correções para testes múltiplos (Bonferroni, FDR)multipletests(pvals, method='fdr_bh')
69sm.tsa.x13.x13_arima_analysis()Interface para ajuste sazonal X-13ARIMA-SEATSx13_arima_analysis(series)
70sm.graphics.qqplot()Gráfico Quantil-Quantil (Q-Q Plot)sm.graphics.qqplot(resids, line='s')
71sm.stats.diagnostic.compare_cox()Teste de Cox para modelos não-aninhadoscompare_cox(res1, res2)
72sm.stats.diagnostic.compare_j()Teste J para especificação de modeloscompare_j(res1, res2)
73sm.stats.moment_helpers.corr2cov()Converte correlação em covariânciacorr2cov(corr, std)
74sm.stats.sandwich_covariance.cov_hac()Covariância Robusta HACcov_hac(results)
75sm.stats.inter_rater.fleiss_kappa()Kappa de Fleiss para concordânciafleiss_kappa(data)
76sm.multivariate.PCA()Análise de Componentes PrincipaisPCA(df).factors
77sm.multivariate.Factor()Análise FatorialFactor(df).fit()
78sm.multivariate.MANOVA()MANOVA (Multivariate ANOVA)MANOVA(endog, exog).mv_test()
79sm.stats.contingency_tables.Table()Análise de tabelas de contingênciasm.stats.Table(df)
80sm.stats.DescrStatsW().tconfint_mean()IC para a média com pesosd1.tconfint_mean()
81sm.stats.GofStat()Testes de bondade de ajuste (Goodness of fit)GofStat(obs, exp)
82sm.graphics.gofplots.ProbPlot()Cria objetos para plots de probabilidadeProbPlot(data).qqplot()
83sm.iolib.summary2.Summary()Versão alternativa de tabelas de resumoSummary().add_df(df)
84sm.stats.anova.AnovaRM()ANOVA para medidas repetidasAnovaRM(df, 'y', 'id', within=['x']).fit()
85sm.stats.weightstats.CompareMeans()Classe para comparar médias de duas amostrasCompareMeans(d1, d2)
86sm.tsa.seasonal.STL()Decomposição STL (LOESS)STL(df['val']).fit()
87sm.tsa.stattools.ccf()Função de correlação cruzadaccf(x, y)
88sm.tsa.statespace.SARIMAX()Espaço de estados para modelos complexosSARIMAX(y, order=(1,0,1))
89sm.graphics.boxplots.violinplot()Gráfico de violino (estatístico)sm.graphics.violinplot(data)
90sm.stats.diagnostic.normal_ad()Teste de Anderson-Darling para normalidadenormal_ad(resids)
91sm.stats.diagnostic.recursive_olsresiduals()Cálculo de resíduos recursivosrecursive_olsresiduals(results)
92sm.stats.mctools.StatTestMC()Ferramenta para simulações Monte CarloStatTestMC(dist, stat)
93sm.tsa.forecasting.theta.ThetaModel()Modelo de previsão ThetaThetaModel(y).fit()
94sm.graphics.tsaplots.plot_predict()Gráfico de previsões de séries temporaisresults.plot_predict(start, end)
95sm.stats.proportion_effectsize()Tamanho do efeito para proporçõesproportion_effectsize(p1, p2)
96sm.stats.anova.anova_single()ANOVA de fator únicoanova_single(res)
97sm.tsa.ar_model.AutoReg()Modelos Autoregressivos purosAutoReg(y, lags=2).fit()
98sm.stats.outliers_influence.OLSInfluence()Cálculo detalhado de influência e resíduos studentizadosOLSInfluence(results)
99sm.regression.quantile_regression.QuantReg()Variação da regressão quantílicaQuantReg(y, X).fit()
100sm.stats.correlation_tools.FactoredPSDMatrix()Ferramentas para matrizes de correlaçãoFactoredPSDMatrix(m)