🧠 NLTK Cheat Sheet

📄 Documentação Oficial do NLTK

# Comando / Função O que faz Exemplo
1nltk.download()Baixa recursos (corpora, modelos, léxicos)nltk.download('punkt')
2nltk.data.pathLista os diretórios onde o NLTK busca dadosnltk.data.path
3word_tokenize()Divide um texto em uma lista de palavrasword_tokenize("Olá mundo!")
4sent_tokenize()Divide um texto em uma lista de sentençassent_tokenize(texto_longo)
5RegexpTokenizer()Tokenizador baseado em expressões regularestokenizer = RegexpTokenizer('\w+')
6stopwords.words()Lista de palavras vazias (artigos, preposições)stopwords.words('portuguese')
7PorterStemmer()Reduz palavras ao radical (algoritmo Porter)stemmer.stem('running') # run
8SnowballStemmer()Stemmer que suporta vários idiomas (inc. PT)SnowballStemmer('portuguese')
9WordNetLemmatizer()Reduz a palavra à sua forma canônica (lema)lemmatizer.lemmatize('better', pos='a')
10pos_tag()Identifica classes gramaticais (Subst, Adj, etc)nltk.pos_tag(tokens)
11help.upenn_tagset()Explica as siglas das etiquetas (tags)nltk.help.upenn_tagset('NN')
12ne_chunk()Reconhecimento de Entidades Nomeadas (NER)nltk.ne_chunk(tagged_tokens)
13FreqDist()Calcula a distribuição de frequência das palavrasfdist = FreqDist(palavras)
14fdist.most_common()Retorna os N termos mais frequentesfdist.most_common(10)
15Text()Wrapper para realizar buscas no textotext_obj = nltk.Text(tokens)
16text_obj.concordance()Mostra o contexto onde uma palavra aparecetext_obj.concordance('vida')
17text_obj.similar()Encontra palavras usadas em contextos similarestext_obj.similar('amor')
18bigrams() / trigrams()Gera sequências de 2 ou 3 palavras adjacenteslist(bigrams(tokens))
19ngrams()Gera sequências de N palavras adjacenteslist(ngrams(tokens, 4))
20SentimentIntensityAnalyzer()Analisa polaridade (positivo/negativo) - VADERsia.polarity_scores(texto)
21NaiveBayesClassifierClassificador baseado no teorema de BayesNaiveBayesClassifier.train(train_set)
22classify()Classifica uma entrada após o treinamentoclassifier.classify(features)
23nltk.corpus.brownAcessa o Brown Corpus (diversos gêneros)brown.words()
24nltk.corpus.wordnetDicionário léxico para sinônimos e antônimoswordnet.synsets('dog')
25synset.definition()Retorna a definição de um termo no WordNetsyn.definition()