🍲 BeautifulSoup (bs4) Cheat Sheet

📄 Documentação Oficial da BeautifulSoup

# Comando / Método O que faz Exemplo
BeautifulSoup(html, 'html.parser')Cria o objeto soup usando o parser padrão do Pythonsoup = BeautifulSoup(html, 'html.parser')
BeautifulSoup(html, 'lxml')Cria o objeto soup usando o parser LXML (mais rápido)soup = BeautifulSoup(html, 'lxml')
soup.prettify()Formata o HTML com identação para facilitar a leituraprint(soup.prettify())
soup.find()Encontra o primeiro elemento que corresponde aos critériossoup.find('h1')
soup.find_all()Retorna uma lista com todos os elementos encontradossoup.find_all('a')
Busca por IDFiltra elementos pelo atributo idsoup.find(id='main-title')
Busca por Classe (CSS)Filtra elementos pelo atributo class (use class_)soup.find_all('div', class_='content')
Busca por AtributosPassa um dicionário de atributos para a buscasoup.find('input', {'type': 'text'})
soup.select()Busca elementos usando seletores CSS (retorna lista)soup.select('div > ul li.item')
soup.select_one()Busca o primeiro elemento via seletor CSSsoup.select_one('#header .logo')
tag.text / .get_text()Extraira apenas o texto dentro da tag e suas filhasitem.get_text(strip=True)
tag['atributo']Acede ao valor de um atributo específico (como href)link['href']
tag.get('attr')Acede ao atributo de forma segura (retorna None se não existir)tag.get('src')
tag.nameRetorna o nome da tag (ex: 'div', 'p')tag.name
tag.parentAcede à tag pai do elemento atualtag.parent
tag.contentsRetorna uma lista dos filhos diretos da tagtag.contents
tag.find_next_sibling()Encontra o próximo elemento "irmão" no mesmo níveltag.find_next_sibling('p')