Últimas notícias

Fique informado
Big Data | Como os cientistas utilizam tantos dados e para quais finalidades?

Big Data | Como os cientistas utilizam tantos dados e para quais finalidades?

16 de janeiro de 2017

O artigo sobre Big data que compartilhamos a seguir escrito Fernando Cymbaluk  | Como cientistas usam dados para prever de epidemias a ataques terroristas, publicado dia 16 de janeiro no UOL, é bom para refletirmos como o Big Data está inserido em nosso cotidiano e como pode nos ajudar. Porém acreditamos que ainda estamos iniciando neste campo do Big Data, porque para que as coisas façam realmente sentido é necessários que se tenha complementaridade das diversas informações e que estas sejam íntegras.

Ai entram os recursos da segurança da informação, que passam desapercebidos por grande parte dos usuários dos dados coletados. Sem integridade das informações podemos cometer erros em grande escala.

Ao ler o artigo fiquei imaginando como poderíamos estar mais adiantados no Brasil em termos de controle de doenças se estivéssemos utilizando o recurso do PEP – Prontuário Eletrônico do Paciente ou o Receituário eletrônico com assinatura digital. Teríamos possibilidade de identificar e controlar com mais rapidez  focos de epidemias como as recentes Zika Vírus e Febre Amarela que assombram o país. Poderíamos atacar o problema na origem como ensinam há muitos séculos os sanitaristas em todo o mundo.

Leia o excelente artigo e imaginem que para cada exemplo o que poderia garantir a integridade dos dados, identificação de origem, temporalidade e todos os outros recursos que tratamos diariamente aqui no Crypto ID. Boa leitura!

Como cientistas usam dados para prever de epidemias a ataques terroristas

 Por Fernando Cymbaluk

Dados são o oráculo dos novos tempos. E quem os decifra são multidões formadas por especialistas e curiosos trabalhando em conjunto. Assim pode ser descrita a pesquisa científica que utiliza Big Data (imenso conjunto de dados armazenados) e a colaboração propiciada pela internet para entender e prever fenômenos que vão de epidemias a ataques terroristas.

O novo método só é possível porque não paramos de deixar rastros quando usamos as tecnologias digitais. Os números que você está gerando ao ler esta reportagem servirão para os jornalistas que a redigiram saberem o alcance que ela teve. Se fossem analisados com bons modelos matemáticos, poderiam indicar para o jornalista quais são os temas e qual o estilo de texto que você mais vai gostar no futuro próximo.

O que você busca no Google, as notícias que você clica, o que você publica nas redes sociais, tudo serve aos pesquisadores de dados.

“O ambiente digital virou um parque de diversões para recombinações de dados em larga escala”, dizem Erik Brynjolfsson e Andrew Mcafee na obra “The Second Machine Age”. E se reduzir as possibilidades de erro é o mais importante em um método científico, a ideia de diluir os erros em bilhões de bits de informações vindas de diversas fontes parece interessante.

O UOL preparou uma lista com exemplos de aplicação desse admirável mundo de números.

Prevendo epidemia de cólera, ebola e zika

Ao acompanhar a propagação da cólera após o terremoto de 2010 no Haiti, Rumi Chunara, pesquisadora da Escola de Medicina de Harvard, descobriu que as publicações feitas no Twitter eram tão precisas quanto os relatórios oficiais de saúde. Com uma diferença: é muito mais rápido detectar e monitorar a propagação da doença quando se utiliza as informações dos tuítes dos internautas.

Assim, mensagens e notícias que circulam na rede social possibilitam “obter uma visão inicial de uma epidemia em evolução”, diz Chunara.

Microreact/Reprodução

A plataforma Microreact usa dados de diversas fontes para mostrar como vírus e bactérias se espalham pelo mundo
Para facilitar previsões de epidemias com o uso de Big Data, pesquisadores criaram o Microreact, uma plataforma de visualização e monitoramento de doenças em tempo real. Desenvolvida pelo Imperial College de Londres, a ferramenta permite que qualquer pesquisador do mundo compartilhe informações mais recentes sobre doenças. Ela já foi utilizada para monitorar surtos de ebola, zika e bactérias resistentes a antibióticos.

Prevendo alta de preços

Exemplos de previsões científicas feitas com seus dados não faltam. Imagine que você vai se mudar para outra cidade e quer comprar uma casa. Provavelmente fará uma pesquisa na internet, com alguns meses de antecedência, buscando no Google ou em um site de imóveis termos como “casa à venda”, “x quartos”, “cidade y”, “bairro z”. O que revelariam essas buscas?

Com base nas buscas de imóveis feitas por internautas é possível saber se os preços irão subir ou descer

Cientistas que usam Big Data fizeram o teste.

Erik Brynjolfsson, diretor da iniciativa de economia digital do MIT (Instituto de Tecnologia de Massachusetts), e Lynn Wu, professor da Universidade da Pensilvânia, pediram ao Google o acesso a dados sobre termos de pesquisa. Com eles em mãos, construíram um modelo estatístico para analisar mudanças no volume dos termos pesquisados. Conseguiram assim prever um aumento de vendas e preços em um bairro dos EUA com meses de antecedência, com erro baixíssimo em relação ao que se verificou na realidade e 24% mais preciso que a estimativa feita pela associação de corretores.

Descobrindo mudanças nas línguas e nas culturas

Para historiadores, linguistas e estudiosos da cultura, livros e documentos históricos são importante objeto de pesquisa. Até meados do século 20, a pesquisa demandava a leitura de milhões de páginas pelo próprio pesquisador. O Google possibilitou uma revolução no método ao digitalizar e disponibilizar mais de 20 milhões de livros publicados ao longo de vários séculos. Os estudos nas mais diversas áreas do campo das ciências sociais e humanas que utilizam Big Data estão sendo chamados de “culturomics”.

Pesquisadores chegaram a descobertas em diferentes áreas após a leitura de 5 milhões de livros digitalizados

Com a ajuda de um robozinho que lia rapidamente esse enorme repositório de palavras, a equipe de Jean-Baptiste Michel e Erez Lieberman Aiden, da Universidade de Harvard, analisou mais de 5 milhões de livros publicados em inglês desde 1800.

A leitura automatizada possibilitou descobrir, dentre outras coisas, que o número de palavras na língua inglesa aumentou em mais de 70% entre 1950 e 2000 e que o interesse pela teoria da evolução, de Charles Darwin, estava em declínio no século 20 até que Watson e Crick descobriram a estrutura do DNA.

Prevendo terrorismo

Robôs de Big Data devem ser uma importante arma no combate ao terrorismo. Antes de plantar uma bomba em Manhattan, que deixou 29 pessoas feridas em setembro passado, Ahmad Khan Rahami clicou em links de vídeos de grupos jihadistas, comprou material para fabricação de bombas no eBay e foi investigado por policiais por outros motivos. Ele era um chamado “lobo solitário”. Robôs que ligassem os pontos e previssem suas ações poderiam ter coibido o ataque antes de ser consumado.

Todos os internautas deixam rastros. Eles podem dar pistas sobre as intenções de um terrorista que age sozinho

“Dados serão o combustível fundamental para a segurança nacional neste século”, disse William Roper, do Departamento de Defesa dos EUA, em uma conferência em Washington.

Um problema do uso de Big Data para prever ataques terroristas é o risco de outro tipo de ataque: à privacidade das pessoas. Como revelou Edward Snowden, programas espiões do governo dos EUA vasculham as vidas dos cidadãos a todo momento. E um desafio para esse combate digital é o de convencer empresas como o Whatsapp a dar acesso aos dados criptografados dos usuários de seus serviços.

Solução colaborativa para prever explosões no Sol

Após 35 anos de pesquisa, a Nasa reconheceu em 2010 que não tinha um bom método para prever o início, a intensidade e a duração de explosões solares. Isso colocava em risco astronautas e satélites, que podiam ser alvo de repentina exposição a partículas solares. A agência espacial dos EUA, então, recorreu à colaboração massiva da internet.

Nasa

Nasa não tinha método para prever explosão solar até conseguir ajuda de curiosos na internet
A Nasa lançou um desafio na Innocentive, uma plataforma colaborativa para resolução de problemas científicos. Ninguém ali precisa ser especialista para baixar dados e propor soluções. E uma multidão de internautas trabalha sobre o problema. Um deles, Bruce Cragin, um engenheiro de rádio frequência aposentado, chegou à solução que permite prever as tais explosões com 8 horas de antecedência e 85% de precisão.

Ele ganhou um prêmio de US$ 30 mil pela ajudinha à gigante da astrofísica.

Um estudo feito sobre as soluções na Innocentive mostra que pessoas com experiência ou formação que não são seja diretamente ligada à área do problema são as mais propensas a apresentar soluções inovadoras.

Crie um bom algoritmo ou devoro-te

Na ciência do Big Data, matemática e estatística são os ingredientes da receita do bolo perfeito. E os cientistas estão sempre buscando boas medidas estatísticas para garantir o mínimo possível de erros. Pesquisadores das universidades de Princeton, Columbia e Harvard se uniram e conseguiram chegar a uma modelo que aumentou a taxa de acerto de previsões feitas em estudos de câncer de mama de 70% para 92%.

A previsão de dados com base em Big Data depende de fórmulas matemáticas e algoritmos confiáveis

O autor principal do estudo é um cientista político. Isso mostra que nesse universo dados sobre células cancerígenas não se diferenciam de dados sobre comportamento de parlamentares em votações no Congresso.

Fonte:UOL