Análise de sentimento de Twittes

As redes sociais são fontes de dados não estruturados. Nelas podemos encontrar imagens e textos que, analisadas de maneira apropriada, fornecem valiosos insights. Neste projeto utilizamos a API do Twitter para coletar twittes durante o Congresso Americano de Oncologia (ASCO) de 2021.

Foram coletados todos os twittes em inglês que continham "asco", "ASCO" ou "Asco" e armazenados em banco de dados não estruturados (MongoDB). Para obter insights, utilizamos o processamento de linguagem natural (NLP) e avaliamos os sentimentos e as palavras mais frequentes nos twittes publicados. Para os sentimentos utilizamos uma biblioteca pública que disponibiliza o modelo treinado.









Habilidades:

Python
Apache Hadoop
MongoDB