DATA SCIENCE NA LUTA CONTRA FAKE NEWS: UM ESTUDO DE CASO
Resumo
A crescente disseminação de notícias falsas nas plataformas digitais tem despertado preocupações significativas, exigindo soluções para sua detecção. Este estudo propõe o desenvolvimento de um algoritmo para identificar notícias falsas, utilizando técnicas de aprendizado de máquina. A pesquisa utiliza o "WELFake_Dataset.csv" do Kaggle como base de dados. Inicialmente, realizou-se a limpeza e pré-processamento dos dados com a biblioteca Pandas, seguido da aplicação da técnica de vetorização TF-IDF e da implementação do algoritmo Naive Bayes Multinomial. Para avaliar a eficácia do modelo, utiliza-se métricas como a curva ROC, matriz de confusão e nuvem de palavras. Os resultados indicam que o algoritmo possui uma capacidade considerável de identificar notícias falsas com precisão. Dessa forma, a pesquisa contribui com as ferramentas que possam mitigar os impactos negativos das fake news.