quarta-feira, 21 de junho de 2017

Big Data e suas possibilidades

1   Introdução

Define-se Big Data como sendo conjuntos de dados extremamente amplos e que, por este motivo, necessitam de ferramentas especialmente preparadas para lidar com grandes volumes, de forma que toda e qualquer informação nestes meios possa ser encontrada, analisada e aproveitada em tempo hábil.
De maneira mais simplista, a ideia também pode ser compreendida como a análise de grandes quantidades de dados para a geração de resultados importantes que, em volumes menores, dificilmente seriam alcançados.
Não é difícil entender o cenário em que o conceito se aplica: trocamos milhões de e-mails por dia; milhares de transações bancárias acontecem no mundo a cada segundo; soluções sofisticadas gerenciam a cadeia de suprimentos de várias fábricas neste exato momento; operadoras registram a todo instante chamadas e tráfego de dados do crescente número de linhas móveis no mundo todo; sistemas de ERP coordenam os setores de inúmeras companhias.
Segundo Empresa EMC (2011) as vantagens competitivas do big data são a capacidade de expansão linear que permite a análise de grandes conjuntos de dados, acesso aos dados com baixa latência acelera a tomada de decisões e in-database analytics permite novos aplicativos de negócios.
Segundo Dyche Apud Computerworld (2013), é evidente que as empresas podem utilizar soluções para acelerar processos de negócios complexos, embora a promessa de inovação seja o verdadeiro fascínio do Big Data para executivos. Eles estão voltando sua atenção – e seus investimentos – para novas tecnologias e habilidades, segundo Cukier e Mayer-Schönberger (2013). Gutierrez (2013) complementa que hoje, as empresas não têm dados suficientes, mas, com eles disponíveis, pode ser que os empregadores não saibam usá-los. O big data não irá acabar com os gerentes ruins. Não são todos os chefes que têm bom senso.
Segundo a IBM (2012) o big data precisa primordialmente de um trabalho automatizado nos processos de captação, ordenação, classificação e organização dessas tão diversas fontes de dados internas e externas relativas ao negócio, realizando o processamento e estruturação desses dados para então integrar apenas o legítimo conhecimento aos sistemas corporativos, e o sucesso das iniciativas não está apenas na grande massa de dados ou na rapidez de processamento, mas na estratégia dos sistemas de informação para criar a combinação de dados mais adequada para cada negócio. Essa é a forma de tornar explícito todo conhecimento tácito sobre o cliente e o mercado, gerando inteligência de negócios que pode trazer vantagem competitiva.
A home page do Estadão (2011) informa que grandes empresas de tecnologia fazem o rastreamento de dados dos usuários, alegando seu uso para melhoria de seus serviços, porém é cada dia mais notável a geração de perfis de comportamento para o direcionamento de produtos, ofertas e campanhas específicas, Mark Zuckerberg, criador do Facebook, realizou o registro de uma patente para uma tecnologia que correlaciona o rastreamento de dados com anúncios em meados de 2011.
Segundo a empresa Cisco (2013) a maior parte das empresas recolhem, armazenam e analisam dados, no entanto, muitas têm dificuldades com os desafios nas vertentes de gestão e TI de Big Data. Por exemplo, enquanto sessenta por cento dos inquiridos no estudo concordam que big data vai ajudar a melhorar as capacidades de decisão e de competitividade, só 28% reportam estarem já a retirar valor estratégico dos seus dados.
Segundo a SAS (2013) apesar da promoção envolvendo o big data, a maioria das organizações ainda não se organizaram para implantar uma estratégia de big data. Líder de mercado em soluções e serviços de inteligência analítica, o SAS e a SourceMedia entrevistaram 339 gestores de TI sobre o uso de tecnologias de gerenciamento de dados em suas organizações. Os resultados mostram que poucas empresas tiram vantagens das informações sobre seus produtos, clientes ou de outras fontes de dados. Segundo W3B (2013) os CIOs pensam em Big Data, vislumbram de imediato os desafios técnicos e as oportunidades geradas a partir dos vastos reservatórios de informação que suas empresas estão coletando e analisando. Mas quando alguns 697 políticos contemplam a mesma situação, suas preocupações se voltam para questões de privacidade, e quais os passos que as empresas estão tomando para proteger as informações pessoais dos consumidores.
Podemos basicamente resumir as características de Big Data em quatro propriedades: (1) dados na ordem de dezenas ou centenas de Terabytes; (2) poder de crescimento elástico horizontal; (3) fácil distribuição dos dados e/ou processamento; e (4) tipos de dados variados, complexos e/ou semiestruturados. A característica de manipulação de dados na ordem (ou maior) de Terabytes envolve, entre outros aspectos, o requisito de alto poder computacional de processamento, manipulação e armazenamento de dados. O poder de crescimento elástico esta relacionado ao fato de que a quantidade de dados pode variar de alguns Megabytes a várias centenas de Terabytes (e vice-versa) em um espaço de tempo relativamente curto, fazendo com que a estrutura de hardware/software demandada tenha que se adaptar, i.e. seja alocada/desalocada sob demanda da aplicação. A distribuição significa que os dados devem ser distribuídos de forma transparente em vários nós de processamento, o que demanda armazenamento e processamento distribuído. E a quarta característica está relacionada a adoção de modelos mais apropriados, flexíveis e eficientes para o armazenamento de tipos de dados complexos, variados e semiestruturados. Vale ressaltar que o modelo relacional tradicional não é o mais adequado para tais propriedades acima citadas pois não possui suficiente flexibilidade para o armazenamento de dados e na evolução do modelo de dados.
O termo ERP vem do inglês Enterprise Resource Planning, ou seja, é um Sistema integrado de gestão empresarial que integra todos os dados e processos de uma organização em um único sistema. Ele é a espinha dorsal dos negócios eletrônicos, uma arquitetura de transações que liga todas as funções de uma empresa, por exemplo, de processamento de pedido de vendas, controle e gerenciamento de estoque, planejamento de produção e distribuição e finanças.

2  Desenvolvimento

Informação é poder, logo, se uma empresa souber como utilizar os dados que tem em mãos, poderá entender como melhorar um produto, como criar uma estratégia de marketing mais eficiente, como cortar gastos, como produzir mais em menos tempo, como evitar o desperdício de recursos, como superar um concorrente, como disponibilizar serviços para a um cliente especial de maneira satisfatória e assim por diante.
A proposta de uma solução de Big Data é a de oferecer uma abordagem ampla no tratamento do aspecto cada vez mais "caótico" dos dados para tornar as referidas aplicações e todas as outras mais eficientes e precisas. Para tanto, o conceito considera não somente grandes quantidades de dados, a velocidade de análise e a disponibilização destes, como também a relação com e entre os volumes.
Imagem 1 – Estas tubulações coloridas são responsáveis por transportar água para dentro e para fora do centro de dados do Google no Oregon. As tubulações azuis fornecem a água fria e as vermelhas retornam a água quente para ser resfriada. (Fonte: Google)

Os 'Cinco Vs' do Big Data
No intuito de deixar a ideia de Big Data mais clara, alguns especialistas passaram a resumir o assunto em aspectos que conseguem descrever satisfatoriamente a base do conceito: os cincos 'Vs' - volume, velocidade e variedade, com os fatores veracidade e valor aparecendo posteriormente.
Volume: São de quantidades de dados realmente grandes, que crescem exponencialmente e que, não raramente, são subutilizados justamente por estarem nestas condições.
Velocidade: Para dar conta de determinados problemas, o tratamento dos dados (obtenção, gravação, atualização, enfim) deve ser feito em tempo hábil - muitas vezes em tempo real. Se o tamanho do banco de dados for um fator limitante, o negócio pode ser prejudicado: imagine, por exemplo, o transtorno que uma operadora de cartão de crédito teria - e causaria - se demorasse horas para aprovar um transação de um cliente pelo fato de o seu sistema de segurança não conseguir analisar rapidamente todos os dados que podem indicar uma fraude.
Variedade: Os volume de dados que temos hoje são consequência também da diversidade de informações. Temos dados em formato estruturados, isto é, armazenados em bancos como PostgreSQL e Oracle, e dados não estruturados oriundos de inúmeras fontes, como documentos, imagens, áudios, vídeos e assim por diante. É necessário saber tratar a variedade como parte de um todo - um tipo de dado pode ser inútil se não for associado a outros.
Veracidade: Não adianta muita coisa lidar com a combinação "volume + velocidade + variedade" se houver dados não confiáveis. É necessário que haja processos que garantam o máximo possível a consistência dos dados. Voltando ao exemplo da operadora de cartão de crédito, imagine o problema que a empresa teria se o seu sistema bloqueasse uma transação genuína por analisar dados não condizentes com a realidade.
Valor: Informação não é só poder, informação também é patrimônio. A combinação "volume + velocidade + variedade + veracidade", além de todo e qualquer outro aspecto que caracteriza uma solução de Big Data, se mostrará inviável se o resultado não trouxer benefícios significativos e que compensem o investimento.
Por que o Big Data é importante?
Lidamos com dados desde os primórdios da humanidade. Acontece que, nos tempos atuais, os avanços computacionais nos permitem guardar, organizar e analisar dados muito mais facilmente e com frequência muito maior.
Este panorama está longe de deixar de ser crescente. Basta imaginar, por exemplo, que vários dispositivos em nossas casas - geladeiras, TVs, lavadoras de roupa, cafeteiras, entre outros - deverão estar conectados à internet em um futuro não muito distante. Esta previsão está dentro do que se conhece como Internet das Coisas.
Se olharmos para o que temos agora, já veremos uma grande mudança em relação às décadas anteriores: tomando como base apenas a internet, pense na quantidade de dados que são gerados diariamente somente nas redes sociais; repare na imensa quantidade de sites na Web; perceba que você é capaz de fazer compras on-line por meio até do seu celular, quando o máximo de informatização que as lojas tinham em um passado não muito distante eram sistemas isolados para gerenciar os seus estabelecimentos físicos.
As tecnologias atuais nos permitiram - e permitem - aumentar exponencialmente a quantidade de informações no mundo e, agora, empresas, governos e outras instituições precisam saber lidar com esta "explosão" de dados. O Big Data se propõe a ajudar nesta tarefa, uma vez que as ferramentas computacionais usadas até então para gestão de dados, por si só, já não podem fazê-lo satisfatoriamente.
A quantidade de dados gerada e armazenada diariamente chegou a tal ponto que, hoje, uma estrutura centralizada de processamento de dados já não faz mais sentido para a maioria absoluta das grandes entidades.
Imagem 2 - Cada um dos racks de servidores do Google tem quatro switches, conectados por um cabo de cor diferente. Mantem essas mesmas cores em todo o centro de dados para que possam saber qual cabo deve ser trocado em caso de falha. (Fonte: Google)
Quem utiliza Big Data?
Big Data afeta organizações em praticamente todas as indústrias. Veja como cada uma pode se beneficiar deste ataque devastador de informações.
O Conceito de Big data já vem sendo explorados dar mais diversas formas, seja nas empresas, mudando o entendimento das necessidades dos clientes pelas analises, seja na saúda ajudando os médicos em diagnósticos, ou seja, para aplicações de uso governamental.
Moraes (2012), relata como a aplicação de Big Data ajudou na campanha de reeleição do presidente norte-americano, Barack Obama, ajudando a orientar voluntários, indicar as melhores formas de arrecadar fundos e apontar quem poderia ser convencido a apoiar a reeleição do presidente. Os responsáveis pela campanha deram prioridade ao uso de Big Data em detrimento da propaganda veiculada na televisão.

 Banco
Com grandes quantidades de informações fluindo partir inúmeras fontes, os bancos são desafiados a encontrar maneiras novas e inovadoras de gerenciar big data. Ao mesmo tempo em que big data é importante para compreender os clientes e aumentar sua satisfação, é igualmente importante para minimizar os riscos e fraudes enquanto mantém uma conformidade regulatória. Big Data traz ótimos insights, mas também exige que as instituições financeiras estejam um passo à frente neste jogo, com análises avançadas.

Governo
Quando as organizações governamentais são capazes de aproveitar e aplicar analytics em big data, elas progridem significativamente quando se trata de gerenciar serviços públicos, lidar com o congestionamento ou a prevenir a criminalidade. Mas, enquanto existem muitas vantagens com o uso de big data, os governos também devem abordar as questões de transparência e privacidade das informações.
Saúde
Registros de pacientes. Planos de tratamento. Informações de prescrição. Quando se trata de cuidados com a saúde, tudo precisa ser feito rapidamente, com precisão e, em alguns casos, com suficiente transparência para satisfazer as regulamentações rigorosas desta indústria. Quando grandes quantidades de dados são geridas de forma eficaz, os prestadores de cuidados de saúde podem descobrir insights escondidos que melhoram o atendimento ao paciente.
Em 2011 o supercomputador da IBM Watson ganhou notoriedade ao ganhar de dois jogadores humanos no programa Jeopardy, um show da TV americana. Esse mesmo Watson utiliza a inteligência artificial com base, em sua nova função, Watson será responsável por analisar históricos médicos, se manter atualizado quanto a pesquisas científicas e ajudar aos doutores da WellPoint a identificarem o que há de errado com seus pacientes. A IBM diz que Watson é capaz de analisar 200 milhões de páginas de dados e responder a qualquer questão com precisão em menos de três segundos.
  
Engenharia
A utilização do Big data possibilita também a construção de cidade de forma integrada conforme Lemos (2013), temos experiências de cidades inteligentes em construção como Songdo, na Coreia do Sul — onde tudo está conectado à Internet e até garrafas pet terão sensores para identificar se os moradores jogam o lixo no cesto de reciclagem correto —, e Masdar, em Abu Dhabi, nos Emirados Árabes — onde painéis de energia solar irão armazenar e gerar eletricidade para toda a cidade, além da implantação de ônibus e carros elétricos. Há também projetos interessantes sendo desenvolvidos em Portugal (PlanIT), na Holanda (Amsterdam Smart City) e no Brasil (em Porto Alegre, no Rio de Janeiro — com o desenvolvimento de sistemas para prever possíveis desastres naturais — e em Belo Horizonte — com o monitoramento da iluminação pública, por meio de sensores que analisam a sua vida útil).
Manufatura
Armados com uma visão que big data pode fornecer, os fabricantes podem aumentar a qualidade e a produção, minimizando o desperdício - processos que são fundamentais no mercado altamente competitivo de hoje. Mais e mais fabricantes estão trabalhando em uma cultura baseada em análise de dados, o que significa que eles podem resolver problemas mais rapidamente e tomar decisões de negócios mais ágeis.
Varejo

A construção de relacionamento com o cliente é fundamental para o setor de varejo - e a melhor maneira de gerenciar este relacionamento é gerenciando big data. Os varejistas precisam saber a melhor maneira de vender aos clientes, a maneira mais eficaz de lidar com transações, e a maneira mais estratégica de aumentar o número de negócios repetidos. Big data permanece no coração de todas essas coisas.

Big Data no Ensino

Educadores armados com uma visão orientada a dados podem ter um impacto significativo sobre os sistemas escolares, estudantes e currículos. Analisando big data, eles podem identificar alunos em risco, assegurar que os estudantes estão progredindo de forma adequada, e podem implementar um sistema melhor de avaliação e apoio aos professores e diretores.

De acordo com o Big Data Business, todo dado é bem-vindo. Das notas que os alunos tiram até os registros de sua vida escolar, tudo isso pode ser transformado em análises possíveis de se cruzar e obter resultados.
Para as escolas do Colorado, nos EUA, por exemplo, os dados são jóia rara. O programa de educação do estado reúne informações sobre seus 860 mil alunos, 2 mil escolas e 178 distritos, e foi apresentado num evento do Instituto de Tecnologia de Massachusetts (MIT) como um projeto significativo no aproveitamento de dados para a melhoria da educação.
O RISE (Relevant Information to Strengthen Education), como é chamado o programa, municia o governo de informações em todas as iniciativas de reforma no setor educacional. Assim eles têm condições de identificar o que funciona, ou não, baseado na sólida informação de números.
A aprendizagem adaptativa também é mais um filho que nasce com a utilização de análise de dados na educação. A ideia é adaptar o material de cada aluno às suas experiências e necessidades. E a personalização, claro, é fundamentada em vários campos de estudo, incluindo a ciência da computação e o cruzamento de dados.

O Futuro do ensino

Segundo o Big Data Business, fato é que a análise de dados na educação é uma realidade que se aproxima aos poucos. Mesmo a passos lentos, principalmente no ensino superior, deve ser aproveitada como oportunidade também de desenvolvimento do negócio educacional, além da melhoria do ensino, como nos exemplos acima.
Big Data possibilita, inclusive, a análise de novos campos de atuação e constante autoavaliação do conteúdo ofertado aos alunos. O futuro nas salas de aula vem aí.

    Referências
Marcos Rodrigues Vieira, Josiel Maimone de Figueiredo, Gustavo Liberatti, Alvaro Fellipe Mendes Viebrantz. Bancos de Dados NoSQL: Conceitos, Ferramentas, Linguagens e Estudos de Casos no Contexto de Big Data.
Simpósio Brasileiro de Banco  de Dados, 2012.
EMC. Homepage da Instituição. Disponível em: . Acesso em: 18 Nov.2016.
MORAES, M. Big Brother Obama. InfoExame, edição de dezembro de 2012.
FOLHA UOL. Homepage da Instituição. Disponível em: . Acesso em: 18 Nov.2016.
IBM. Homepage da Instituição. Disponível em: . Acesso em: 18 Nov.2016.
http://www.sas.com/pt_br/insights/big-data/what-is-big-data.html
http://www.bigdatabusiness.com.br/como-o-big-data-analytics-ajuda-na-educacao-2/
http://www.infowester.com/big-data.php
https://www.google.com/about/datacenters/
https://pt.wikipedia.org/wiki/Sistema_integrado_de_gest%C3%A3o_empresarial

Nenhum comentário:

Postar um comentário