O problema do "cold start" é talvez a desvantagem mais amplamente citada dos sistemas de filtragem colaborativa. Isso ocorre quando um novo usuário (ou até mesmo um novo item) entra no sistema. A falta de histórico de interação do usuário com os itens impede que o sistema avalie a similaridade ou associação do novo usuário com os usuários existentes. Por outro lado, os sistemas baseados em conteúdo são mais hábeis em lidar com novos itens, embora também tenham dificuldades com as recomendações para novos usuários.12



A escassez de dados é um problema significativo que pode prejudicar os sistemas de recomendação colaborativa. Como mencionado, os sistemas de recomendação geralmente carecem de dados sobre as preferências dos usuários para a maioria dos itens no sistema. Isso resulta no fato de que a maior parte do espaço de funcionalidades do sistema está inativa, uma condição denominada sparsidade de dados. Com o aumento da esparsidade de dados, os pontos vetoriais tornam-se tão díspares que os modelos preditivos se tornam menos eficientes em identificar padrões explicativos.13 Essa é uma das razões principais pelas quais a fatoração de matrizes e métodos de fatores latentes, como a decomposição em valores singulares, são muito utilizados na filtragem colaborativa, uma vez que mitigam a esparsidade de dados através da redução de funcionalidades. Outros métodos implementados para resolver esse problema podem envolver os próprios usuários avaliando e fornecendo informações sobre seus interesses, que o sistema pode então usar para filtrar recomendações.