My Data Direction: Resumo da Terceira Semana Explorando Ciência de Dados

Analisando conteúdo explícito e popularidade musical com Pandas

Hellouis leitores! Essa semana foi cheia de insights e tabelas musicais! Finalmente concluí o curso de Pandas no Kaggle e, pra colocar os conhecimentos em prática, resolvi seguir o cronograma que o chatGPT tinha montado para a semana.

O dataset escolhido foi um achado lá no próprio Kaggle: Spotify dataset. Ele traz informações sobre gêneros musicais, popularidade das músicas e a presença de conteúdo explícito. Uma combinação que grita: “Analise-me agora!”

O que eu fiz?

Importei e explorei os dados com .head(), .info(), .describe() e afins;
Limpei os dados removendo duplicatas, tratando valores nulos e padronizando os textos;
Apliquei estatísticas básicas para investigar se havia algum padrão entre músicas explícitas e sua popularidade;
Usei .groupby() por gênero e presença de conteúdo explícito para entender melhor os números;
E, claro, criei um gráfico com Matplotlib pra visualizar tudo isso.

Três conclusões que tirei:

No ranking dos tops 10 gêneros musicais mais populares, 8 deles tem a taxa média de Conteúdo Explícito menor ou igual a 30%. Levando em consideração os 20 mais populares, 16 deles estão nessa mesma faixa de referência. O padrão se mantém.
Músicas que apelam para temáticas universais — que envolvem sentimentos de tristeza, alegria, amor —, assim como que podem ser ouvidas por um maior público, tendem a ter mais popularidade. Já músicas que tem como conteúdo principal um nicho específico, onde apenas uma parte das pessoas podem se identificar (gêneros latino, punk, emo, opera, hip-hop, k-pop, anime, entre outros) tendem a ser menos populares.
Apenas quatro gêneros encontram-se em nível de conteúdo explícito acima dos 50% (pop, hardcore, k-pop e hip-hop, em ordem decrescente). É revelador o gênero pop, sendo o segundo mais popular, ser o de maior conteúdo explícito. O hardcore, gênero específico do ramo, fica em segundo.

Sobre o gráfico

O gráfico mostra a relação entre a popularidade e o conteúdo explícito por gênero levando em consideração os dados do dataset.

Terminar esse miniprojeto foi gratificante. Ver os dados contando uma história, fazer perguntas e obter respostas — é como montar um novo álbum, faixa por faixa.

Até mais, datadirectioners!

Panorama Click

Pesquisar este blog