As palavras “conteúdo duplicado” normalmente causam calafrios quando pronunciadas na internet. ‘Nunca fale CONTEÚDO DUPLICADO em voz alta‘. Pessoas sem experiência em SEO usam elas o tempo todo.
A grande maioria nunca parou para ler simples e claras orientações do próprio Google sobre conteúdo duplicado. Assume-se apenas que, se de alguma forma algo aparecer mais de uma vez, asteróides e gafanhotos virão decretar uma maldição eterna ao seu site.
Diante disso, é bem saudável tentar derrubar alguns mitos que correm no boca a boca de quem trabalha com conteúdo. Vamos à eles:
Mito 1#: Conteúdo não-original vai comprometer o rankeamento de todas as páginas do seu domínio
Alguém conhece alguma evidência de que conteúdo não-original atrapalha a classificação de um site, com exceção de casos extremos? Eis o que acontece:
Um novo site entrou no ar, uma preguiçosa empresa de relações públicas copiou o texto da home page e colou em um comunicado de imprensa.
Eles enviam para inúmeros veículos de notícias, criando imediatamente centenas de versões de conteúdos idênticos ao da home page por toda a internet.
Alarmes ensurdecedores disparam pelo Google e seu domínio entra manualmente em uma Lista Negra.
Coisa feia. Uma vez que você participa do projeto, tem responsabilidade se isso acontece. Ainda é possível entrar com um pedido de reconsideração e o domínio pode ser re-indexado. Porém, você não vai querer ter este tipo de emoção e incerteza.
Então, qual foi mesmo o problema?
• Volume: Haviam centenas de instâncias do mesmo texto.
• Tempo: Todo o conteúdo apareceu ao mesmo tempo.
• Contexto: Foi a cópia página inicial em um novo domínio.
Não é nada difícil imaginar como isso acabou marcado como SPAM, certo?
Porém, não é exatamente disto que as pessoas estão falando quando sussurram “CONTEÚDO DUPLICADO“. Eles normalmente estão falando sobre alguns parágrafos de um texto simples em um site bem estabelecido. É preciso de bem mais do que isso para fazer os alarmes altos do Google entrarem em alerta.
Muitos sites e blog bastante populares na internet, incluindo este que você lê, muitas vezes repassam artigos que apareceram pela primeira vez em outros lugares.
É o que chamamos nas aulas de Marketing de Conteúdo, de Curadoria de Conteúdo. Você mostra o conteúdo que você sabe que é relevante para seu público, mesmo sem tê-lo desenvolvido, amplia o alcance do conteúdo original e direciona para quem escreveu.
Não se espera que este conteúdo seja bem ranqueado, ele normalmente serve como alimento diário aos seus seguidores. O mais importante é que isto, apesar de ser menos relevante do que um conteúdo original, não vai prejudicar a credibilidade do seu domínio.
Mito 2#: Web Scrapers ferirão seu site
Um conteudista que ler atentamente o Google Webmasters Tools, certamente terá medo de robôs Scrapers (que varrem o site e clonam todo o conteúdo) e apontam o link para você em busca de relevância.
Na sua reputação, estas páginas de entrada contam, e caso este site que aponta para o seu viole diretrizes do Google, pode jogar seu site para baixo. Para isso é indicado a leitura deste texto sobre conteúdo duplicado, ou este a seguir, sobre como rejeitar links.
Imagine um grande Blog com centenas de milhares de acessos diários. Agora imagine o número de trackbacks recebidos até a hora do almoço de um dia comum. E depois de um final de semana!
Você realmente acredita que existe uma equipe focada tempo integral em rejeitar todas estas ligações ao longo do dia? Não. Eles não ligam! E dormem tranquilamente à noite sem temer o conteúdo duplicado.
O web scraping não vai te ajudar, mas também não deve te prejudicar. Eles simplesmente serão menos relevantes do que você. Pessoalmente não me preocuparia com esse tipo de “raspagem”.
Eles copiarão normalmente todos os links internos, e ocasionalmente você terá até mesmo mais visitas. Como disse anteriormente, seu alcance também cresce em uma Curadoria.
Dica: Denúncia de Scrapers
Na raríssima possibilidade de o Google confundir a versão copiada e esta superar a versão original, existe salvação. Aqui você pode contar tudo para sua mãe reportar o equívoco ao Google. Use o Scraper Report.
Dica: Assine seu conteúdo digitalmente com o Google Autoria (Authorship)
Fazer sua foto aparecer nos resultados de busca não é a única razão para usar o Google Autorship, e se fosse o seu único motivo, seria tarde demais. O Google Authorship é a melhor maneira de provar que você é o autor do conteúdo.
Com isso, cada parte do conteúdo estará ligada somente com UM autor, sem importar quantas vezes aquele conteúdo foi replicado.
Dica: Como agir contra plágio na internet
Existe um abismo de diferença entre conteúdo ‘raspado’ (ou Curado) e violação de Direitos Autorais. Em algumas ocasiões empresas copiam seu conteúdo (quem sabe o site todo) e dizem ser autores.
Plágio é o ato de assinar alguma obra intelectual que contenha algo desenvolvido por outras pessoas. E não é isso que o Scrapers fazem. O plágio é ilegal e é exatamente contra ele que você tem o Copyright em seu rodapé. Se isso acontecer, nem adianta procurar o Google, é melhor acionar seus advogados.
Para lidar com isso, ouça este podcast da Agência Mestre: Plágio na internet: Casos e como combater.
Mito 3#: Republicar seus textos para outros blogs no seu blog penalizarão seu site
Você escreve para diversos sites. É improvável que seu público habitual veja todos os seus textos, por isso é bastante tentador republicá-los em seu próprio site. Caso você tenha como estratégia um site ou blog com conteúdo estritamente original, faça isso pela intenção de agregar valor, não por medo de uma sanção que provavelmente não existirá.
Lembra daquele grande Blog com milhares de acessos? Existe uma boa chance dele te incentivar a republicar seu texto no próprio site algumas semanas depois. Eles têm consciência de que o Google não vai se confundir. É simples, eles apenas pedirão para inserir uma simples tag em HTML no post…
Dica: Use Canonical Tag
A Canonical realmente pode resolver todos os problemas. Se você quer publicar um artigo que saiu anteriormente em outro lugar, basta usar esta linha de código para dizer ao robô do buscados que foi publicada uma versão original àquele texto em outro lugar. Mais uma que o Google Webmasters Tools ensina. Veja um exemplo:
<link rel="canonical" href="http://www.unibuscapecompany.com/url-original.html" />
É isso aí! Basta adicionar a tag e republicar sem medo.
Dica: Escreva o “Evil Twin”
Se no texto original era “Como fazer” (How To) olhe pelo espelho e escreva “Como não fazer“. Baseie-se no mesmo conceito e pesquise, mas use diferentes exemplos e agregue valor. Seu texto “Evil Twin” (irmão gêmeo do mal) será semelhante, mas ninguém poderá dizer que não é original.
Você não vai só evitar uma penalidade, mas pode obter benefícios de SEO. Ambos os textos aparecerão bem ranqueados. Não só você vai evitar uma penalidade, mas você pode obter um benefício SEO.Ambas as mensagens classificar na primeira página de “navegação do site.”
Acalme-se, sem pânico!
Sem exageros, nem pânico desnecessário. Respire fundo e considere:
“Googlebot visita a maioria dos site diariamente. Se ele encontrar uma versão chupinhada de alguma coisa uma semana depois em outro site, ele saberá onde a original apareceu. O Googlebot não vai sentir raiva e te penalizar. Ele simplesmente seguirá em frente. Isto é muito bonito e uma coisa que você precisa saber.”
Lembre-se, o Google tem 2 mil doutores de matemática na equipe. Eles constroem carros que dirigem sozinhos e óculos computadorizados. Eles são muito, muito bons. Você acha que eles vão banir um domínio porque encontraram uma página de texto banal?
Uma enorme porcentagem da internet é conteúdo duplicado. O Google sabe disso. Eles estão separando os originais de cópias desde 1997, muito antes do termo “conteúdo duplicado” tornar-se um chavão em 2005.
Discorda? Tem qualquer evidência conflitante?
Quando falamos em SEO e principalmente sobre conteúdo duplicado é importante procurar por evidências.
Eventualmente se encontra alguém que fez. Andy Crestodina, autor da versão original em inglês deste texto para o blog da Kissmetrics contou este caso: Como experiência foi construído um site com mensagens republicadas por toda parte, literalmente e gradualmente alguns deles começaram a ser indexados. Até que veio nosso amigo Panda e derrubou.
Seria uma penalidade? Ou apenas alguns pontinhos negativos na relevância? Existe diferenças entre uma penalidade (como a temida Lista Negra já mencionada) e uma correção para restaurar a ordem correta das coisas.
Se você tem exemplos reais sobre penalidades relacionadas a conteúdo duplicado, gostaríamos de ouvir. Comente!
Texto traduzido e adaptado do Blog da Kissmetrics.
10 Comments
Creio que este post reúne coisas que aprendi ao longo de 2 anos sobre o assunto,
Uma das características mais marcantes quando se trata de conteúdo duplicado é realmente este falso alarme que os buscadores vão executar o site imediatamente em praça pública, creio que as práticas de curadoria de conteúdo (assim que popularizadas) ainda vão conseguir acalmar muita gente e tornar a internet em um lugar melhor para a base de conhecimento em geral.
Porém, para evitar dores de cabeça e até mesmo melhorar o relacionamento com a fonte original de conteúdo, nada melhor que a boa e velha página de contato.
Ótimo post Renann,
Ótimo artigo, claro e cheio de informações de valor.
Entender ao menos o básico de SEO é quase uma obrigação para quem trabalha na área.
Parabéns Rennan
Muito bom, Muito claro, muito direto e engraçado.
“Contar para sua mãe” hehehe
Muito bom, confesso que acreditava em alguns desses mitos.
Existe uma ação que vejo muitos analistas de SEO fazerem. Eles fazem propostas de guest post para uns 10 ou 20 blogs. O problema é que oferecem o mesmo artigo para todos eles. Certamente que o algoritmo do Google vai identificar que não se tratam de postagens espontâneas, mas de uma campanha de Spam na web. O ideal seria fazer um artigo diferenciado para cada blog que aceitou guest post. Dá trabalho, mas garante melhor qualidade nos conteúdos.
Muito bom Renann, eu era uma das pessoas que acreditavam nesses mitos. Parabéns!
òtimo texto, me esclareceu um mundo de duvidas, que realmente tem pouca informação, principalmente quando a gente ignora os tetos do google(talvez devessem mudar a cor), mas alem de complementar que o google émuito,muito,muito,muito … muito foda em desenvolvimento de tecnologias úteis a seus usurário , pedirei mais um informação, exemplo, via plugin republico meus texto inteiros em varias redes sociais e outro como(blogger) ajudaria usar o canonical mesmo que estes texto mencionassem a origem do original em links simples?
Estou aliviada…. Ótimo texto
Excelente artigo. O canonical quando bem aplicado tem uma enorme influência ainda hoje. Obrigado pelas dicas 😉
eu fiz o seguinte, eu tenho um blog no blogger, estava indo tudo bem, baixei todos arquivos, abri outro blog com dominio propio e subi todos arquivos, e apaguei os arquivos do antigo, ocorre que o google nao desindexou o antigo, e o novo mesmo indexado nao recebe uma visita sequer, isso ja faz 4 meses, 3 mil postagens indexadas nenhuma visita sequer