1 Introdução
Define-se
Big Data como sendo conjuntos de dados extremamente amplos e que, por este
motivo, necessitam de ferramentas especialmente preparadas para lidar com
grandes volumes, de forma que toda e qualquer informação nestes meios possa ser
encontrada, analisada e aproveitada em tempo hábil.
De
maneira mais simplista, a ideia também pode ser compreendida como a análise de
grandes quantidades de dados para a geração de resultados importantes que, em
volumes menores, dificilmente seriam alcançados.
Não é
difícil entender o cenário em que o conceito se aplica: trocamos milhões de
e-mails por dia; milhares de transações bancárias acontecem no mundo a cada
segundo; soluções sofisticadas gerenciam a cadeia de suprimentos de várias
fábricas neste exato momento; operadoras registram a todo instante chamadas e
tráfego de dados do crescente número de linhas móveis no mundo todo; sistemas
de ERP coordenam os setores de inúmeras companhias.
Segundo
Empresa EMC (2011) as vantagens competitivas do big data são a capacidade de expansão
linear que permite a análise de grandes conjuntos de dados, acesso aos dados
com baixa latência acelera a tomada de decisões e in-database analytics permite
novos aplicativos de negócios.
Segundo
Dyche Apud Computerworld (2013), é evidente que as empresas podem utilizar
soluções para acelerar processos de negócios complexos, embora a promessa de
inovação seja o verdadeiro fascínio do Big Data para executivos. Eles estão
voltando sua atenção – e seus investimentos – para novas tecnologias e habilidades,
segundo Cukier e Mayer-Schönberger (2013). Gutierrez (2013) complementa que
hoje, as empresas não têm dados suficientes, mas, com eles disponíveis, pode
ser que os empregadores não saibam usá-los. O big data não irá acabar com os
gerentes ruins. Não são todos os chefes que têm bom senso.
Segundo
a IBM (2012) o big data precisa primordialmente de um trabalho automatizado nos
processos de captação, ordenação, classificação e organização dessas tão
diversas fontes de dados internas e externas relativas ao negócio, realizando o
processamento e estruturação desses dados para então integrar apenas o legítimo
conhecimento aos sistemas corporativos, e o sucesso das iniciativas não está
apenas na grande massa de dados ou na rapidez de processamento, mas na estratégia
dos sistemas de informação para criar a combinação de dados mais adequada para
cada negócio. Essa é a forma de tornar explícito todo conhecimento tácito sobre
o cliente e o mercado, gerando inteligência de negócios que pode trazer
vantagem competitiva.
A home
page do Estadão (2011) informa que grandes empresas de tecnologia fazem o
rastreamento de dados dos usuários, alegando seu uso para melhoria de seus
serviços, porém é cada dia mais notável a geração de perfis de comportamento
para o direcionamento de produtos, ofertas e campanhas específicas, Mark
Zuckerberg, criador do Facebook, realizou o registro de uma patente para uma
tecnologia que correlaciona o rastreamento de dados com anúncios em meados de
2011.
Segundo
a empresa Cisco (2013) a maior parte das empresas recolhem, armazenam e
analisam dados, no entanto, muitas têm dificuldades com os desafios nas
vertentes de gestão e TI de Big Data. Por exemplo, enquanto sessenta por cento
dos inquiridos no estudo concordam que big data vai ajudar a melhorar as
capacidades de decisão e de competitividade, só 28% reportam estarem já a
retirar valor estratégico dos seus dados.
Segundo
a SAS (2013) apesar da promoção envolvendo o big data, a maioria das
organizações ainda não se organizaram para implantar uma estratégia de big
data. Líder de mercado em soluções e serviços de inteligência analítica, o SAS
e a SourceMedia entrevistaram 339 gestores de TI sobre o uso de tecnologias de
gerenciamento de dados em suas organizações. Os resultados mostram que poucas
empresas tiram vantagens das informações sobre seus produtos, clientes ou de
outras fontes de dados. Segundo W3B (2013) os CIOs pensam em Big Data,
vislumbram de imediato os desafios técnicos e as oportunidades geradas a partir
dos vastos reservatórios de informação que suas empresas estão coletando e
analisando. Mas quando alguns 697 políticos contemplam a mesma situação, suas
preocupações se voltam para questões de privacidade, e quais os passos que as
empresas estão tomando para proteger as informações pessoais dos consumidores.
Podemos
basicamente resumir as características de Big Data em quatro propriedades: (1)
dados na ordem de dezenas ou centenas de Terabytes; (2) poder de crescimento
elástico horizontal; (3) fácil distribuição dos dados e/ou processamento; e (4)
tipos de dados variados, complexos e/ou semiestruturados. A característica de
manipulação de dados na ordem (ou maior) de Terabytes envolve, entre outros
aspectos, o requisito de alto poder computacional de processamento, manipulação
e armazenamento de dados. O poder de crescimento elástico esta relacionado ao
fato de que a quantidade de dados pode variar de alguns Megabytes a várias
centenas de Terabytes (e vice-versa) em um espaço de tempo relativamente curto,
fazendo com que a estrutura de hardware/software demandada tenha que se
adaptar, i.e. seja alocada/desalocada sob demanda da aplicação. A distribuição
significa que os dados devem ser distribuídos de forma transparente em vários
nós de processamento, o que demanda armazenamento e processamento distribuído.
E a quarta característica está relacionada a adoção de modelos mais
apropriados, flexíveis e eficientes para o armazenamento de tipos de dados
complexos, variados e semiestruturados. Vale ressaltar que o modelo relacional
tradicional não é o mais adequado para tais propriedades acima citadas pois não
possui suficiente flexibilidade para o armazenamento de dados e na evolução do
modelo de dados.
O
termo ERP vem do inglês Enterprise Resource Planning, ou seja, é um Sistema
integrado de gestão empresarial que integra todos os dados e processos de uma
organização em um único sistema. Ele é a espinha dorsal dos negócios
eletrônicos, uma arquitetura de transações que liga todas as funções de uma
empresa, por exemplo, de processamento de pedido de vendas, controle e
gerenciamento de estoque, planejamento de produção e distribuição e finanças.
2 Desenvolvimento
Informação
é poder, logo, se uma empresa souber como utilizar os dados que tem em mãos,
poderá entender como melhorar um produto, como criar uma estratégia de
marketing mais eficiente, como cortar gastos, como produzir mais em menos
tempo, como evitar o desperdício de recursos, como superar um concorrente, como
disponibilizar serviços para a um cliente especial de maneira satisfatória e assim
por diante.
A proposta de uma solução de
Big Data é a de oferecer uma abordagem ampla no tratamento do aspecto cada vez
mais "caótico" dos dados para tornar as referidas aplicações e todas
as outras mais eficientes e precisas. Para tanto, o conceito considera não
somente grandes quantidades de dados, a velocidade de análise e a
disponibilização destes, como também a relação com e entre os volumes.
Imagem
1 – Estas tubulações coloridas são responsáveis por transportar água para
dentro e para fora do centro de dados do Google no Oregon. As tubulações azuis
fornecem a água fria e as vermelhas retornam a água quente para ser resfriada. (Fonte:
Google)
Os
'Cinco Vs' do Big Data
No
intuito de deixar a ideia de Big Data mais clara, alguns especialistas passaram
a resumir o assunto em aspectos que conseguem descrever satisfatoriamente a
base do conceito: os cincos 'Vs' - volume, velocidade e variedade, com os
fatores veracidade e valor aparecendo posteriormente.
Volume: São de quantidades de dados realmente
grandes, que crescem exponencialmente e que, não raramente, são subutilizados
justamente por estarem nestas condições.
Velocidade: Para dar conta de determinados
problemas, o tratamento dos dados (obtenção, gravação, atualização, enfim) deve
ser feito em tempo hábil - muitas vezes em tempo real. Se o tamanho do banco de
dados for um fator limitante, o negócio pode ser prejudicado: imagine, por
exemplo, o transtorno que uma operadora de cartão de crédito teria - e causaria
- se demorasse horas para aprovar um transação de um cliente pelo fato de o seu
sistema de segurança não conseguir analisar rapidamente todos os dados que
podem indicar uma fraude.
Variedade: Os volume de dados que temos hoje são
consequência também da diversidade de informações. Temos dados em formato
estruturados, isto é, armazenados em bancos como PostgreSQL e Oracle, e dados
não estruturados oriundos de inúmeras fontes, como documentos, imagens, áudios,
vídeos e assim por diante. É necessário saber tratar a variedade como parte de
um todo - um tipo de dado pode ser inútil se não for associado a outros.
Veracidade: Não adianta muita coisa lidar com a
combinação "volume + velocidade + variedade" se houver dados não
confiáveis. É necessário que haja processos que garantam o máximo possível a
consistência dos dados. Voltando ao exemplo da operadora de cartão de crédito,
imagine o problema que a empresa teria se o seu sistema bloqueasse uma
transação genuína por analisar dados não condizentes com a realidade.
Valor: Informação não é só poder, informação também
é patrimônio. A combinação "volume + velocidade + variedade +
veracidade", além de todo e qualquer outro aspecto que caracteriza uma
solução de Big Data, se mostrará inviável se o resultado não trouxer benefícios
significativos e que compensem o investimento.
Por que o Big Data é importante?
Lidamos
com dados desde os primórdios da humanidade. Acontece que, nos tempos atuais,
os avanços computacionais nos permitem guardar, organizar e analisar dados
muito mais facilmente e com frequência muito maior.
Este
panorama está longe de deixar de ser crescente. Basta imaginar, por exemplo,
que vários dispositivos em nossas casas - geladeiras, TVs, lavadoras de roupa,
cafeteiras, entre outros - deverão estar conectados à internet em um futuro não
muito distante. Esta previsão está dentro do que se conhece como Internet das Coisas.
Se
olharmos para o que temos agora, já veremos uma grande mudança em relação às
décadas anteriores: tomando como base apenas a internet, pense na quantidade de
dados que são gerados diariamente somente nas redes sociais; repare na imensa
quantidade de sites na Web; perceba que você é capaz de fazer compras on-line
por meio até do seu celular, quando o máximo de informatização que as lojas
tinham em um passado não muito distante eram sistemas isolados para gerenciar
os seus estabelecimentos físicos.
As
tecnologias atuais nos permitiram - e permitem - aumentar exponencialmente a
quantidade de informações no mundo e, agora, empresas, governos e outras
instituições precisam saber lidar com esta "explosão" de dados. O Big
Data se propõe a ajudar nesta tarefa, uma vez que as ferramentas computacionais
usadas até então para gestão de dados, por si só, já não podem fazê-lo
satisfatoriamente.
A
quantidade de dados gerada e armazenada diariamente chegou a tal ponto que,
hoje, uma estrutura centralizada de processamento de dados já não faz mais
sentido para a maioria absoluta das grandes entidades.
Imagem 2 - Cada um dos
racks de servidores do Google tem quatro switches, conectados por um cabo de
cor diferente. Mantem essas mesmas cores em todo o centro de dados para que
possam saber qual cabo deve ser trocado em caso de falha. (Fonte: Google)
Quem utiliza Big Data?
Big Data afeta
organizações em praticamente todas as indústrias. Veja como cada uma pode se
beneficiar deste ataque devastador de informações.
O
Conceito de Big data já vem sendo explorados dar mais diversas formas, seja nas
empresas, mudando o entendimento das necessidades dos clientes pelas analises,
seja na saúda ajudando os médicos em diagnósticos, ou seja, para aplicações de
uso governamental.
Moraes
(2012), relata como a aplicação de Big Data ajudou na campanha de reeleição do
presidente norte-americano, Barack Obama, ajudando a orientar voluntários, indicar
as melhores formas de arrecadar fundos e apontar quem poderia ser convencido a
apoiar a reeleição do presidente. Os responsáveis pela campanha deram
prioridade ao uso de Big Data em detrimento da propaganda veiculada na
televisão.
Banco
Com grandes
quantidades de informações fluindo partir inúmeras fontes, os bancos são
desafiados a encontrar maneiras novas e inovadoras de gerenciar big data. Ao
mesmo tempo em que big data é importante para compreender os clientes e
aumentar sua satisfação, é igualmente importante para minimizar os riscos e
fraudes enquanto mantém uma conformidade regulatória. Big Data traz ótimos
insights, mas também exige que as instituições financeiras estejam um passo à
frente neste jogo, com análises avançadas.
Governo
Quando as
organizações governamentais são capazes de aproveitar e aplicar analytics em
big data, elas progridem significativamente quando se trata de gerenciar
serviços públicos, lidar com o congestionamento ou a prevenir a criminalidade.
Mas, enquanto existem muitas vantagens com o uso de big data, os governos
também devem abordar as questões de transparência e privacidade das
informações.
Saúde
Registros
de pacientes. Planos de tratamento. Informações de prescrição. Quando se trata
de cuidados com a saúde, tudo precisa ser feito rapidamente, com precisão e, em
alguns casos, com suficiente transparência para satisfazer as regulamentações
rigorosas desta indústria. Quando grandes quantidades de dados são geridas de
forma eficaz, os prestadores de cuidados de saúde podem descobrir insights
escondidos que melhoram o atendimento ao paciente.
Em 2011 o
supercomputador da IBM Watson ganhou notoriedade ao ganhar de dois jogadores
humanos no programa Jeopardy, um show da TV americana. Esse mesmo Watson
utiliza a inteligência artificial com base, em sua nova função, Watson será
responsável por analisar históricos médicos, se manter atualizado quanto a
pesquisas científicas e ajudar aos doutores da WellPoint a identificarem o que
há de errado com seus pacientes. A IBM diz que Watson é capaz de analisar 200
milhões de páginas de dados e responder a qualquer questão com precisão em
menos de três segundos.
Engenharia
A
utilização do Big data possibilita também a construção de cidade de forma
integrada conforme Lemos (2013), temos experiências de cidades inteligentes em
construção como Songdo, na Coreia do Sul — onde tudo está conectado à Internet
e até garrafas pet terão sensores para identificar se os moradores jogam o lixo
no cesto de reciclagem correto —, e Masdar, em Abu Dhabi, nos Emirados Árabes —
onde painéis de energia solar irão armazenar e gerar eletricidade para toda a
cidade, além da implantação de ônibus e carros elétricos. Há também projetos
interessantes sendo desenvolvidos em Portugal (PlanIT), na Holanda (Amsterdam
Smart City) e no Brasil (em Porto Alegre, no Rio de Janeiro — com o
desenvolvimento de sistemas para prever possíveis desastres naturais — e em
Belo Horizonte — com o monitoramento da iluminação pública, por meio de
sensores que analisam a sua vida útil).
Manufatura
Armados
com uma visão que big data pode fornecer, os fabricantes podem aumentar a
qualidade e a produção, minimizando o desperdício - processos que são
fundamentais no mercado altamente competitivo de hoje. Mais e mais fabricantes
estão trabalhando em uma cultura baseada em análise de dados, o que significa
que eles podem resolver problemas mais rapidamente e tomar decisões de negócios
mais ágeis.
Varejo
A
construção de relacionamento com o cliente é fundamental para o setor de varejo
- e a melhor maneira de gerenciar este relacionamento é gerenciando big data.
Os varejistas precisam saber a melhor maneira de vender aos clientes, a maneira
mais eficaz de lidar com transações, e a maneira mais estratégica de aumentar o
número de negócios repetidos. Big data permanece no coração de todas essas
coisas.
Big Data no Ensino
Educadores armados com uma visão orientada a dados podem ter um impacto significativo sobre os sistemas escolares, estudantes e currículos. Analisando big data, eles podem identificar alunos em risco, assegurar que os estudantes estão progredindo de forma adequada, e podem implementar um sistema melhor de avaliação e apoio aos professores e diretores.
De acordo com o Big Data Business, todo dado é bem-vindo. Das notas que os alunos tiram até os registros de sua vida escolar, tudo isso pode ser transformado em análises possíveis de se cruzar e obter resultados.
Para as escolas do Colorado, nos EUA, por exemplo, os dados são jóia rara. O programa de educação do estado reúne informações sobre seus 860 mil alunos, 2 mil escolas e 178 distritos, e foi apresentado num evento do Instituto de Tecnologia de Massachusetts (MIT) como um projeto significativo no aproveitamento de dados para a melhoria da educação.
O RISE (Relevant Information to Strengthen Education), como é chamado o programa, municia o governo de informações em todas as iniciativas de reforma no setor educacional. Assim eles têm condições de identificar o que funciona, ou não, baseado na sólida informação de números.
A aprendizagem adaptativa também é mais um filho que nasce com a utilização de análise de dados na educação. A ideia é adaptar o material de cada aluno às suas experiências e necessidades. E a personalização, claro, é fundamentada em vários campos de estudo, incluindo a ciência da computação e o cruzamento de dados.
O Futuro do ensino
Segundo o Big Data Business, fato é que a análise de dados na educação é uma realidade que se aproxima aos poucos. Mesmo a passos lentos, principalmente no ensino superior, deve ser aproveitada como oportunidade também de desenvolvimento do negócio educacional, além da melhoria do ensino, como nos exemplos acima.
Big Data possibilita, inclusive, a análise de novos campos de atuação e constante autoavaliação do conteúdo ofertado aos alunos. O futuro nas salas de aula vem aí.
Referências
Marcos
Rodrigues Vieira, Josiel Maimone de Figueiredo, Gustavo Liberatti, Alvaro
Fellipe Mendes Viebrantz. Bancos de Dados NoSQL: Conceitos, Ferramentas,
Linguagens e Estudos de Casos no Contexto de Big Data.
Simpósio Brasileiro de
Banco de Dados, 2012.
EMC.
Homepage da Instituição. Disponível em: . Acesso em: 18 Nov.2016.
MORAES,
M. Big Brother Obama. InfoExame, edição de dezembro de 2012.
FOLHA
UOL. Homepage da Instituição. Disponível em: . Acesso em: 18 Nov.2016.
IBM.
Homepage da Instituição. Disponível em: . Acesso em: 18 Nov.2016.
http://www.sas.com/pt_br/insights/big-data/what-is-big-data.html
http://www.bigdatabusiness.com.br/como-o-big-data-analytics-ajuda-na-educacao-2/
http://www.infowester.com/big-data.php
https://www.google.com/about/datacenters/
https://pt.wikipedia.org/wiki/Sistema_integrado_de_gest%C3%A3o_empresarial
Nenhum comentário:
Postar um comentário