A tendência de disseminar selfies e a de avançar com câmeras de segurança sobre o espaço público têm origem comum e uma evolução marcada por marcos tecnológicos compartilhados. Para além destes laços superficiais, interagem numa mistura de dança e luta, que lembra a capoeira e dá o tom da vida psicossocial dominante no planeta.

As aulas da tarde estavam começando quando Nikolas Jacob Cruz desceu de um Uber, entrou na Escola Secundária Marjory Stoneman Douglas e passou a atirar indiscriminadamente contra alunos e professores do primeiro andar. Dezessete mortes e seis minutos depois, parou no Starbucks ao lado para um refrigerante e foi comer no McDonald's, certo de que havia batido o recorde na prova de massacre escolar.

As discussões que seguiram foram dominadas pelos temas do controle sobre a compra de armas – o fuzil utilizado fora comprado legalmente dois anos antes – e sobre o xenofobismo desavergonhado, que Nikolas exibia em suas redes sociais.

Passado um ano e nenhuma ação de impacto nestas duas direções, a discussão mudou de figura. A tragédia de Stoneman Douglas passou ao centro dos debates sobre a implantação de câmeras com reconhecimento facial nas escolas americanas.

Dado o fluxo tradicional da novação tecnológica, que começa nas metrópoles – primariamente, Estados Unidos; secundariamente, China – e dali segue para as suas zonas de influência, de acordo com a pertinência local do tema, é de se considerar que o debate tem grande importância para o Brasil e outros países onde a violência urbana é endêmica e quase não tem rugas.

Lá na terra do antigo Tio Sam – que quando criança eu gostava de imaginar como um primo do Ronald McDonald's – o trombone foi dado pelo New York Times, que recentemente publicou um op-ed (editorial aberto) escrito pelo pai de um aluno da escola secundária de Lockport (Nova Iorque), contra a instalação das câmeras, que ainda não estavam ligadas.

O aparato é parte de um conjunto de tecnologias chamadas de CST (em inglês: crime surveillance tecnologies) e segue um padrão mais amplo em operação na China, Cingapura e outros países, funcionando da seguinte maneira: inicialmente, cria-se um grande banco de dados com registros faciais de todas as pessoas que circulam pela região ou, mais amplamente, com todos os habitantes e visitantes de um país, junto com seus meta-dados (nome, ID, endereço, biometria, etc.). Esta é a parte mais importante e envolve um esforço manual para conseguir imagens atualizadas de suspeitos etc.

Em seguida, este banco de dados é conectado a um software dotado de um tipo de rede neural chamada deep learning, que é treinada para reconhecer pessoas (sobretudo, mas não exclusivamente, a partir de registros em vídeo), mesmo quando suas expressões faciais não batem com os registros.

Se você quiser entender isso de perto, a partir de uma solução gratuita, recomendo que conheça o OpenCV, que o meu pessoal usa na WeMind para outras finalidades, como reconhecer expressões emocionais pela câmera do computador para testes de marca e criação de diagnósticos clínicos.

Na interface em que o administrador do software (polícia, escola, quem for) manipula o funcionamento do sistema, é possível inserir nome, endereço, foto ou vídeo e solicitar identificação ou rastreamento de quem ali aparece.

Conforme uma comparação dá resultado positivo, o sistema dispara uma notificação para que um técnico cheque se a associação é verdadeira e execute uma ação, como acionar a segurança da escola, ou a polícia. Por isso, conceitualmente, câmeras inteligentes e outras CSTs estão na categoria das ferramentas de suporte decisório (abreviadas DSS), por mais que não decidam nada diretamente.

Dado que o envio da notificação é um sinal de que um perigo foi localizado, o sistema não precisa que ninguém registre se acertou ou errou a cada vez que levanta uma suspeita. Seu aprendizado é baseado na observação do comportamento humano que segue e, em tese, chega próximo a 100% após alguns meses de uso.

Os mais conhecidos argumentos contrários a estas câmeras inteligentes dividem-se em específicos e gerais. Entre os primeiros, a grande questão é que os algoritmos de reconhecimento facial são particularmente ruins na identificação de rostos de crianças e adolescentes. Essa discussão ganhou o mundo em 2016, quando o departamento de polícia de Nova Iorque (o tal NYPD, que estampa camisetas azuis de tantos millenials da zona Oeste paulistana e Sul carioca) passou a cruzar fotos de menores suspeitos de pequenas contravenções com registros imprecisos de crimes mais sérios, na expectativa de identificar os suspeitos destes últimos.

O debate que seguiu, entre outras coisas, tem a ver com o fato de que a expansão dos ossos faciais altera rapidamente a fisionomia entre os 10 e os 16 anos, podendo converter crianças e adolescentes inocentes em suspeitos (e vice e versa), com efeitos potencialmente devastadores.

Entre os argumentos do segundo tipo, a questão central é a tendência dos algoritmos de reconhecimento facial de amplificarem a exclusão social em determinada região ou sociedade. Discuti este ponto, bem como a extensão e os limites das estratégias para lidar com ele, neste ensaio aqui: https://bit.ly/2Hb8JeF.

Em meio a estas ressalvas e outras, o mundo está sendo coberto por câmeras de segurança inteligentes e não parece provável que os esforços da opinião pública contrários a esta movimento – que não são poucos, nem são desorganizados – sejam capazes de frear esta tendência.

Na minha opinião, é mais provável que tenhamos um movimento em duas fases, uma primeira rápida, efusiva e notadamente caracterizada pelo excesso; e uma segunda, muito mais longa e tortuosa, onde a acomodação e a parcimônia gradualmente encontrarão espaço, o qual será maior ou menor, de acordo com a tradição de democrática do país ou região.

Esta situação reflete o fato de que o reconhecimento facial não é mero dispositivo de segurança, mas antes um elemento importante na ideologia da revolução cognitiva, o qual precisa ser compreendido desta maneira. Eis a razão de ser deste artigo.

A conflituosa relação entre o selfie e o reconhecimento facial

Em meu último ensaio apresentei a tese de que o selfie é a solução emergente e não planejada para o desafio fundamental do indivíduo (sobretudo o adolescente etário ou mental) que busca aumentar sua influência sem ser explícito neste intento, dado que tal explicitação o igualaria a seus pais e ao status quo de maneira mais ampla, com suas brigas constantes pelo poder econômico e social.

A ideia é que selfies são como etiquetas que o indivíduo cola no mundo de maneira imperialista, enquanto se diz imbuído pela intenção de compartilhar experiências transformadoras. Sua legitimação é dada pelo fato de que as fotos têm jeitão de improvisadas e enfeiam aqueles que ali aparecem (inexistem selfies bem tirados).

Junto com o botão de like e alguns outros dispositivos, o selfie é central para a compreensão da ideologia deste momento cultural da "aldeia global" (leia-se: do mundo urbanizado em quase toda a sua extensão). Um destes dispositivos que não podem ser desprezados é a biometria – conjunto dos registros fisiológicos que oferecemos a partir de nossas impressões digitais, íris, voz e outros tantos. Ela vem promovendo a migração da pessoalidade para a esfera constitucional, dado que esta é mais difícil de ser burlada.

De celulares e fechaduras que são destravados por câmeras, a contas de banco acessadas pela íris ou impressão digital, sem esquecer do processamento de voz, está em curso um processo de eliminação das etapas visíveis dos processos de autenticação, a qual tende a ser positiva para os usuários destes produtos e serviços, já que os artefatos que se interpõem, como senhas ou o plástico do cartão, não trazem nada de útil para quem não faz da inibição de fraudes profissão ou passatempo.

Imagens do rosto são o suprassumo da biometria – não porque sejam especialmente precisas, mas porque funcionam sem que seja necessária a aproximação de um leitor qualquer. Neste sentido, elas são mera ferramenta na caixa das opções biométricas, não contando nada de surpreendente sobre nós mesmos e os tempos em que vivemos.

Acontece que somos dotados de uma forma curiosa de cognição social, chamada teoria da mente (ToM), que nos leva a atribuir estados mentais àqueles que conosco interagem, mesmo quando sabemos que não possuem os atributos que mais nos sensibilizam. Uma evidência disso é que as pessoas tendem a tratar robôs de maneira semelhante a pessoas – vide a onda de violência contra estas estruturas de lata, que exibe padrões análogos à violência contra minorias; outra, é que falamos coisas complexas com cachorros.

Desta tendência irresistível à atribuição intencional, muitos dizem, também nasce o senso de presença que marca as experiências religiosas de todas as matizes – e a sensação de que por traz de cada uma das câmeras de segurança que encontramos – bem como da somatória de todas elas – há uma pessoa, com sua agenda específica de intenções, tal como eternizado pela alegoria do Big Brother, de George Orwell.

Como bem notaram os filósofos estruturalistas do século XX, somos muito ruins em compreender o poder que se manifesta sem conexão direta com agentes determinados.

A projeção da pessoalidade ao sistema de registros é uma realidade prática. Ela leva as pessoas mais sensíveis a julgamentos sociais – como os adolescentes, em geral – a se sentirem tolhidas em suas experiências de liberdade & autonomia e, assim, a se expressarem com menos espontaneidade.

Pouco adianta lembrá-las de que a presença de câmeras não pressupõe alguém do outro lado observando e julgando aquilo que fazem no domínio da lei. A experiência repressiva encadeada é uma função da maneira como muitos dentre nós lidam com o imaginário do chamado palco social que, por sua vez, ao menos em parte é inato.

Pois o ponto de interesse a ter em mente é que o palco da câmera de segurança é a antítese psicossocial daquele em que circulam selfies e outros tokens auto-referentes.

No estágio atual da vida neste planeta, estes dois tipos de registro servem de polos para um forma de relacionamento com o que é comum, encabeçada por tipos que se odeiam e assim se encontram no impulso para fazer valer suas crenças sobre como o mundo social deve funcionar, à revelia do que pensam os outros. Esta conclusão está alinhada a pesquisas sobre o perfil de quem mais aceita e mais se opõe à disseminação das câmeras de vigilância inteligentes (vide: https://bit.ly/2SxxEhP).

É certo que esta relação tem origem superficial, marcada pela mera contiguidade temporal e pelo subsequente fortalecimento comum por avanços tecnológicos generalistas, como a transmissão descomplicada de vídeos de baixa resolução (em termos de linguagem e protocolos, é tudo um grande YouTube).

Também é verdade que suas agendas econômicas sempre foram muito díspares e estrategicamente divergentes: ao passo que redes e mídias sociais se difundiram à sombra de tentativas de geração de relevância na forma de engajamento, as tecnologias CST são o efeito de investimentos calculados de agências governamentais americanas (sobretudo a DARPA e a NSA), em resposta à queda das Torres Gêmeas.

Há, porém, uma ligação mais profunda e relevante entre a lógica da circulação de tokens pessoais e a aceleração na curva de adoção da biometria nos espaços públicos e institucionais. Ainda que as redes sociais permitam que os mais variados grupos de interesse se organizem em torno de suas particularidades, poucas fórmulas relacionais perpassam todos eles. A principal delas lembra uma conversa em que muitos falam, mas poucos se escutam. Exercendo papel central nesta está, justamente, a distribuição de registros auto-referenciados, os quais vêm se consolidando como a principal commodity da nossa era e, mais amplamente, da história da digitalização até aqui.

Apesar dos selfies representarem a faceta mais conhecida, aqui entram também as fotos e vídeos das coisas exclusivas que vimos ou comemos e, claro, os nudes, que ocupam várias casas da parte do tabuleiro que cobre os jardins da intimidade.

A prática de recobrir o mundo digital com estes tokens não é disseminada de maneira indiscriminada pelo mundo. Tanto pelo contrário, ela é impulsionada por pessoas jovens e extrovertidas, a quais são justamente as que mais se capitalizam neste jogo.

A grosso modo, há um quadro dicotômico, em que um grupo mais introvertido, temeroso e menos ligado ao aumento do Clout (impacto digital) sente-se particularmente incomodado com o predomínio do modo de vida influencer. E outro, onde navega este último tipo, que se sente cutucado na alma pela lógica de circulação de imagens baseada em comando e controle.

É a vida psicossocial do planeta organizada como se fôssemos todos democratas ou republicanos.

Para fechar

Em meus ensaios anteriores falei sobre a ideologia californiana e seus representantes mais extremos, os chamados imperialistas do selfie, como elementos centrais da ideologia desta nova fase da vida na aldeia global.

Neste procurei lançar luz sobre o fato de que tais atores sociais não estão dançando sozinhos, mas antes vivem acompanhados de seus pares do mundo do comando e controle, os quais também se organizam sob o império da imagem, ainda que do outro lado do espelho em que o selfie se admira.

Leia também:

A ideologia da revolução cognitiva III: a era do Eu amplificado

A ideologia da revolução cognitiva II: a utopia californiana

A ideologia da revolução cognitiva I: os algoritmos por trás do mundo