A internet permite acessar dados abertos sobre diversos assuntos, mas eles nem sempre são facilmente encontrados. Em geral, eles estão espalhados e exigem conhecimento prévio para serem utilizados. É neste contexto que surge a Base dos Dados, um site que cataloga conjuntos de informações públicas elaborados por organizações de todo o mundo.

A Base dos Dados reúne, por exemplo, dados do IBGE (Instituto Brasileiro de Geografia e Estatística), do Inep (Instituto Nacional de Estudos e Pesquisas Educacionais) e do Banco Mundial. Eles são úteis para acadêmicos, jornalistas e a sociedade civil, em geral.

Com cárater colaborativo, o site permite que qualquer pessoa se cadastre e insira as bases de dados que conhece. O objetivo é criar uma referência na busca por bases temáticas, segundo o mestre em economia pela PUC-Rio e aluno de PhD na Northwestern University, Ricardo Dahis.

Ao Tecnoblog, Dahis explicou que teve a ideia de criar a Base dos Dados ao notar que as informações disponíveis na internet estavam muito espalhadas. Ele viu, então, a necessidade de criar uma fonte centralizada que organize as bases existentes.

“Muitas pessoas têm ideias de pesquisa, de reportagens, de aplicativos, mas não sabem por onde começar a busca por dados”, afirma. “O site entra exatamente aí, para informar o que existe, onde baixar, e dar informações gerais sobre a base de dados”.

Dahis espera que a plataforma, ainda em versão beta, ajude pesquisadores, estudantes, desenvolvedores, funcionários públicos e outras pessoas interessadas em transparência e dados abertos. “Todos ganham se houver um aumento da qualidade e quantidade de pesquisa acadêmica, de matérias jornalísticas informadas por dados, de aplicativos usando dados públicos”.

O catálogo da Base dos Dados já conta com conjuntos como o Atlas da Notícia, que oferece informações sobre veículos de comunicação no Brasil, e o Social Connectedness Index, que aproveita as amizades do Facebook para determinar a relação entre diferentes regiões dos Estados Unidos.

O site também reúne dados disponibilizados pelo governo brasileiro, desde o Censo de 1872 até a Avaliação Nacional da Alfabetização. Há, ainda, outras dezenas de bases de dados sobre educação, saúde, cultura, economia, ciência e tecnologia, política e outros.

“Não basta informação existir e estar pública na internet; é preciso um bom mecanismo de busca”, resume Dahis. Segundo ele, a Base dos Dados não mantém cópias dos conjuntos de informações públicas, e sim links que direcionem os usuários para a fonte.

O economista explica que, no momento, o plano é expandir o site com bases verificadas para aumentar a reputação da plataforma. A próxima etapa é buscar financiamento para o projeto, preferencialmente por instituições que contribuam com projetos ligadas a transparência.