A expressão big data já se tornou bastante difundida no mundo em que vivemos. Mas será que todos sabem o que ela significa? Bem, a tradução literal seria grandes dados e a ideia central que está contida nessa expressão é a de quantidade. As ferramentas de big data permitem coletar e armazenar uma quantidade de informações inimagináveis há três ou quatro décadas. Na verdade, para aqueles que ainda não são tão familiarizados assim com o assunto, mesmo hoje em dia a possibilidade de se armazenar uma quase infinidade de dados continua sendo algo impensável. Mas a verdade é que diariamente a população cria bilhões de informações e registros digitais.
O big data já é uma realidade praticamente universal e tem sido utilizada como instrumento de tomada de decisão em diversas organizações e mesmo por governos. A principal vantagem dessa metodologia é a sua capacidade de prever atitudes ou acontecimentos a partir da frequência de dados relacionados em um determinado contexto. Um exemplo disso é a campanha de prevenção a determinadas doenças a partir das buscas por ela em alguma localidade.
Já o deep data, por sua vez, não é um simples acréscimo ao big data. Não se trata de um mero acúmulo numérico de informações. Como a própria tradução do termo indica, a ideia central dessa tecnologia é a profundidade das informações e não simplesmente a sua quantidade. O big data já permitia a análise de dados relacionados, mas o deep data amplia esse horizonte e permite uma análise muito mais consistente do conteúdo armazenado, na medida em que não se preocupa em coletar o máximo de informações disponíveis, mas sim em armazenar informações específicas num determinado contexto, a partir dos parâmetros utilizados.
Nessa perspectiva, vale frisar a relevância da diferença entre as duas tecnologias. O big data é capaz de coletar muita informação, mas, muitas vezes, informação em excesso e, portanto, inútil ou redundante. Enquanto o deep data se propõe a buscar e armazenar a informação específica, nem em excesso nem em falta.