Representação TFIDF - Hadoop MapReduce

Python, Java, Hadoop, Programação para Python

Status do projeto
Concluído
Interessado 1
Publicado em 15 Setembro 2021
Localização O projeto pode ser concluído remotamente
Início O mais breve possível
Entrega 10 Outubro 2021
Orçamento R$100 - R$500
Postado por Gustavo

Descrição do trabalho

Neste projeto, vocês deverão fazer o pré-processamento de uma base de textos utilizando o
framework Hadoop e a abordagem de Map Reduce para calcular o TFIDF de cada palavra.
TFIDF é uma peso (valor) que atribuímos para associar uma palavra com um documento de
forma a representar sua importância.

Trabalhar com uma base de textos de notícias (Disponibilizada).
A base consiste de um único arquivo em que cada linha contém informações de um documento
diferente.

Freelancers interessados

Premium
{{item.displayName}} {{item.displayName}}

{{item.displayDisciplines}}
- {{ item.hourlyRate || '-' }} por hora
- {{item.distance}} km de distância
- {{item.nrSharedConnections}} conexões compartilhadas
Abrir chat

Ainda não há freelancers interessados

Representação TFIDF - Hadoop MapReduce

Descrição do trabalho

Freelancers interessados

{{item.displayName}} {{item.displayName}}

{{item.displayName}} {{item.displayName}}

Recusar

{{item.displayName}}