Analisando conteúdo explícito e popularidade musical com Pandas
Hellouis leitores! Essa semana foi cheia de insights e tabelas musicais! Finalmente concluí o curso de Pandas no Kaggle e, pra colocar os conhecimentos em prática, resolvi seguir o cronograma que o chatGPT tinha montado para a semana.
O dataset escolhido foi um achado lá no próprio Kaggle: Spotify dataset. Ele traz informações sobre gêneros musicais, popularidade das músicas e a presença de conteúdo explícito. Uma combinação que grita: “Analise-me agora!”
O que eu fiz?
- Importei e explorei os dados com .head(), .info(), .describe() e afins;
- Limpei os dados removendo duplicatas, tratando valores nulos e padronizando os textos;
- Apliquei estatísticas básicas para investigar se havia algum padrão entre músicas explícitas e sua popularidade;
- Usei .groupby() por gênero e presença de conteúdo explícito para entender melhor os números;
- E, claro, criei um gráfico com Matplotlib pra visualizar tudo isso.
Três conclusões que tirei:
- No ranking dos tops 10 gêneros musicais mais populares, 8 deles tem a taxa média de Conteúdo Explícito menor ou igual a 30%. Levando em consideração os 20 mais populares, 16 deles estão nessa mesma faixa de referência. O padrão se mantém.
- Músicas que apelam para temáticas universais — que envolvem sentimentos de tristeza, alegria, amor —, assim como que podem ser ouvidas por um maior público, tendem a ter mais popularidade. Já músicas que tem como conteúdo principal um nicho específico, onde apenas uma parte das pessoas podem se identificar (gêneros latino, punk, emo, opera, hip-hop, k-pop, anime, entre outros) tendem a ser menos populares.
- Apenas quatro gêneros encontram-se em nível de conteúdo explícito acima dos 50% (pop, hardcore, k-pop e hip-hop, em ordem decrescente). É revelador o gênero pop, sendo o segundo mais popular, ser o de maior conteúdo explícito. O hardcore, gênero específico do ramo, fica em segundo.
Sobre o gráfico
O gráfico mostra a relação entre a popularidade e o conteúdo explícito por gênero levando em consideração os dados do dataset.
Terminar esse miniprojeto foi gratificante. Ver os dados contando uma história, fazer perguntas e obter respostas — é como montar um novo álbum, faixa por faixa.
Até mais, datadirectioners!
Comentários
Postar um comentário
Obrigada pela leitura! <3