Representação TFIDF - Hadoop MapReduce

Python, Java, Hadoop, Programação para Python

  • Status do projeto
    Concluído
  • Interessado 1
  • Publicado em
  • Localização O projeto pode ser concluído remotamente
  • Início O mais breve possível
  • Entrega 10 Outubro 2021
  • Orçamento R$100 - R$500
  • Postado por Gustavo

Descrição do trabalho

Neste projeto, vocês deverão fazer o pré-processamento de uma base de textos utilizando o
framework Hadoop e a abordagem de Map Reduce para calcular o TFIDF de cada palavra.
TFIDF é uma peso (valor) que atribuímos para associar uma palavra com um documento de
forma a representar sua importância.

Trabalhar com uma base de textos de notícias (Disponibilizada).
A base consiste de um único arquivo em que cada linha contém informações de um documento
diferente.

Freelancers interessados

  • Premium

    {{item.displayName}} {{item.displayName}}

    {{item.displayDisciplines}}

    • {{ item.hourlyRate || '-' }} por hora
    • {{item.distance}} km de distância
    • {{item.nrSharedConnections}} conexões compartilhadas
P

{{item.displayName}} {{item.displayName}}

{{item.displayDisciplines}}

Ainda não há freelancers interessados

Falha na operação!
Por favor, tente novamente mais tarde. Se o problema persistir, entre em contato com o suporte.
Usamos cookies para melhorar nosso site e sua experiência. Ao continuar a navegar em nosso site, você aceita nossa política de cookies.
Saiba mais