Um pouco sobre BIG DATA

Big Data

Você Sabe o que é Big Data?


É um termo amplamente utilizado na atualidade que designa o crescimento, a disponibilidade e o uso exponencial de informações estruturadas e não estruturadas.
Segundo Edd Dumbill, colaborador da Forbes, "Big Data são dados que excedem a capacidade de processamento dos sistemas de banco de dados convencionais . Os dados são tão grandes, movem-se tão rápido ou não cabem nas estruturas de dados."



Hoje quase todas as ações humanas se convertem em dados.

Em outras palavras, é um conjunto de tecnologias para captura, armazenamento e análise de grandes volumes de dados.


O aumento de dispositivos móveis conectados à web, além de censores, e dispositivos que geram dados além das aplicações dedicadas ao entretenimento humano, como jogos on-line e redes sociais, home banking, significa um mar de possibilidades até a pouco não explorada, pois eram dados elaborados somente para a interpretação humana.

Em sua edição de 24/02/2012, Rennan Setti através da coluna Digital & Midia Do jornal O Globo acrescenta:

A grande novidade das soluções de Big Data é lidar também com os chamados dados não estruturados, que até então só podiam ser compreendidos por pessoas. São tweets, posts no facebook, vídeos, geolocalização e comportamento de clientes que dependem de contexto para ter sentido.Esses dados não-estruturados representam 85% das informações com as quais as empresas lidam hoje.

Uma das utilizações mais frequentes do Big Data é feita por empresas que utilizam esse recurso para armazenar dados de clientes e, posteriormente, acessá-lo. Isso torna o Big Data importante para o negócio, já que ele é convencional e oferece praticidade e velocidade na recuperação desses dados.




O que caracteriza o Big Data?

As principais características do Big Data são: volume, variedade e velocidade.

-Volume:


O aumento do volume de dados se dá principalmente devido as transações de dados armazenados ao longo dos anos. Esse grande volume de dados criou um problema de armazenamento no passado, mas com os atuais baixos custos de armazenamento isso não é mais um problema.

-Variedade:


Os dados de hoje vem em todos os tipos de formatos. Sejam bancos de dados tradicionais, arquivos de texto, e-mail, medidores e sensores de coleta de dados, vídeo, áudio, dados de ações do mercado e transações financeiras.

-Velocidade:


A velocidade é essencial tanto na produção de dados, quanto no tratamento dos mesmos para atender a demanda.




Problemas com o Big Data





Pense da seguinte maneira: Uma pequena quantidade de dados até pode ser facilmente gerenciada e analisada de forma simples, gerando aceitáveis níveis de inteligência. Afinal de contas, os volumes e componentes difusos analisados não são tão grandes assim. Mas quando os dados ganham novas proporções, crescendo de forma constante, adicionam problemas até então não vivenciados. 

Essa é a visão de Nate Silver. Fundador do site de jornalismo de dados FiveThirtyEight (agora propriedade da ESPN), ele trabalha escavando uma montanha de registros. O executivo falou durante uma conferência promovida pela HP, em Boston, e descreveu os problemas que podem vir junto com big data.

Ocupam muito espaço

Silver diz que mesmo pequenas quantidades de dados podem ser difíceis de gerir, tanto em termos de armazenamento quanto de análise. A lógica sugere que, quanto mais dados as empresas tiverem, mais complexa será a tarefa de geri-los. Você precisará responder perguntas do tipo: Vale comprar equipamentos para guardá-los? Melhor armazenar na nuvem? Com que frequência você precisa acessar esses registros? Como pode lidar com latência?

Trazem perspectivas difusas

Uma questão relativa à grande quantidade de dados é que isso cria polarização e diferentes perspectivas. Vamos dizer que existam dois silos em sua empresa. Parece simples decifrar o que esses dois recipientes contem de maneira macro. Agora, se você está analisando 100 pesquisas, pode haver muitas nuances dentro desses dados. Certamente, já deve ter ouvido que os números dizem o que as pessoas querem ouvir e que, espremidos, podem dizer qualquer coisa. Pois bem, quanto mais dados tiver, mais espaço de manobra existe para respostas imprecisas.

Geram falsos positivos

Silver cita o livro de Daniel Kahneman intitulado “Thinking, Fast and Slow” para apontar o fato de que as pessoas tomam decisões baseadas em um subconjunto de dados a partir do pensamento rápido. A melhor pratica é o “pensamento lento” e a verdadeira racionalização dos dados. Com big data, pensamento rápido (e não analisar dados por completo) pode levar a falsos positivos.

A imensidão é complexa

O especialista usa o termo “encontrar sinal em meio ao barulho”, que seria uma versão um pouco diferente do velho “agulha no palheiro”. Quanto mais dados você tem, mais difícil é encontrar algo de fato valioso naquela montanha.

Nem sempre trazem aquilo que você estava procurando...

Imagine o Google Maps dando-lhe instruções e sugerindo como alternativa uma rota “mais rápida”. Porém, apenas depois de pegar esse caminho descobrirá que ele é esburacado ou sem asfalto. Às vezes, sistemas de big data oferecem atalhos que, na verdade, não são exatamente aquilo que você estaria procurando.




Referências: http://oglobo.globo.com/infograficos/bigdata/
                     http://pt.wikipedia.org/wiki/Big_data
                     http://www.forbes.com/sites/edddumbill/2014/05/07/defining-big-data/
                     http://marketingpordados.com/analise-de-dados/o-que-e-big-data/
                     http://www.techoje.com.br/site/techoje/categoria/detalhe_artigo/1754

         

0 comentários:

Enviar um comentário

Com tecnologia do Blogger.